스피어만 상관계수 계산기 - 순위 상관

두 데이터셋 간의 스피어만 순위 상관계수 (ρ)를 계산하여, 정규성을 가정하지 않고 단조 관계의 강도와 방향을 측정합니다.

길이가 같은 두 데이터셋을 쉼표로 구분해 입력하세요. 계산기는 각 데이터셋의 순위를 매기고 동순위를 올바르게 처리한 뒤, 순위에 대한 피어슨 공식으로 ρ를 계산합니다.

스피어만 상관계수 계산기 - 순위 상관
두 데이터셋 간의 스피어만 순위 상관계수 (ρ)를 계산하여, 정규성을 가정하지 않고 단조 관계의 강도와 방향을 측정합니다.

쉼표 또는 공백으로 구분한 숫자를 입력하세요

데이터셋 X와 값의 개수가 같아야 합니다

스피어만 상관계수 계산기 소개

스피어만 순위 상관계수는 ρ (rho) 또는 rs로 표기되며, 두 변수 사이의 단조 관계를 측정하는 비모수 지표입니다. 선형 관계를 측정하고 데이터가 정규분포를 따르며 구간 또는 비율 척도로 측정되어야 한다고 가정하는 피어슨 상관과 달리, 스피어만 계수는 데이터 값의 순위를 사용합니다. 따라서 순서형 데이터, 이상치가 있는 데이터, 변수 간 관계가 단조적이지만 반드시 선형은 아닌 모든 상황에 적합합니다. 계산은 세 단계로 진행됩니다. 먼저 각 데이터셋의 순위를 매깁니다. 가장 작은 값은 순위 1, 두 번째로 작은 값은 순위 2를 받는 식입니다. 동순위가 있으면 각 동순위 값은 원래 차지했을 순위들의 평균을 받습니다. 둘째, 각 관측값 쌍에 대해 짝지어진 순위의 차이 dᵢ를 계산합니다. 셋째, ρ를 계산합니다. 동순위가 없는 데이터에서는 고전 공식 ρ = 1 − (6 Σdᵢ²) / (n(n²−1)) 이 정확한 결과를 제공합니다. 동순위가 있는 데이터에서는 이 계산기가 더 일반적인 공식, 즉 순위에 대해 계산한 피어슨 상관을 사용하여 구조적으로 동순위를 올바르게 처리합니다. 계수의 범위는 −1부터 +1까지입니다. +1은 완전한 양의 단조 관계를 뜻하며, 한 변수가 증가할 때마다 다른 변수도 증가합니다. −1은 완전한 음의 단조 관계를 뜻하며, 한 변수가 증가할 때마다 다른 변수는 감소합니다. 0은 단조 관계가 없음을 나타냅니다. 실제로는 절댓값이 0.7을 넘으면 강함, 0.5에서 0.7은 중간, 0.3에서 0.5는 약함, 0.3 미만은 무시 가능으로 보는 경우가 많지만, '유의함'의 기준은 항상 표본 크기와 맥락에 따라 달라집니다. 스피어만 상관은 심리학(선호나 태도 순위), 교육(학급 순위와 시험 점수 비교), 의학(증상 중증도 점수 비교), 생태학(개체수와 서식지 품질), 금융(위험 조정 수익률에 따른 뮤추얼 펀드 순위), 시장 조사(소비자 선호 순위)에서 널리 사용됩니다. 순위가 매겨진 데이터, 순서가 있는 데이터, 비정규 데이터를 다루는 모든 분야에 유용합니다. 중요한 한계가 있습니다. 스피어만의 ρ는 단조 관계만 감지합니다. 관계가 U자형이거나 다른 비단조 형태라면 강한 관계가 있어도 ρ가 0에 가까울 수 있습니다. 이런 경우에는 결과를 올바르게 해석하기 위해 산점도와 다른 시각적 진단을 항상 수치 계수와 함께 확인해야 합니다.

스피어만 상관 예제

서로 다른 상관 강도와 데이터 구조를 보여 주는 네 가지 풀이 예제입니다.

데이터셋ρ해석
X: 10, 20, 30, 40, 50 | Y: 2, 4, 6, 8, 10ρ = 1.0000완전한 양의 단조 관계——두 변수가 항상 함께 증가합니다.
X: 105, 120, 90, 150, 135 | Y: 4.5, 3.2, 5.0, 2.1, 2.9ρ = −1.0000완전한 음의 관계——X와 Y의 순위가 정확히 반대 순서입니다.
X: 1, 2, 3, 4, 5 | Y: 3, 1, 5, 2, 4ρ = 0.3000두 순위 배열 사이에 약한 양의 단조 관계가 있습니다.
X: 8, 9, 10, 10, 12 | Y: 4, 6, 5, 5, 7ρ ≈ 0.6842중간 정도의 양의 상관입니다. 동점 값은 평균 순위로 처리됩니다.

스피어만 상관 계산기 사용 방법

  1. 첫 번째 데이터셋 (X)을 데이터셋 X 필드에 쉼표로 구분한 숫자로 입력합니다.
  2. 두 번째 데이터셋 (Y)을 데이터셋 Y 필드에 입력합니다. 값의 개수는 X와 정확히 같아야 합니다.
  3. 계산을 클릭합니다. 계산기는 두 데이터셋의 순위를 매기고, 동점 값은 평균 순위로 처리하며, 순위에 대한 피어슨 공식으로 ρ를 계산합니다.
  4. 결과 패널에서 ρ 값, 표본 크기, 강도 해석을 확인합니다.
  5. 예제 버튼을 사용해 미리 만들어진 데이터셋을 불러오고, 일반적인 양의 상관, 음의 상관, 무상관 시나리오를 확인합니다.

스피어만 상관 FAQ

스피어만 상관과 피어슨 상관의 차이는 무엇인가요?
피어슨 r은 선형 관계의 강도를 측정하며 두 변수가 정규분포를 따르고 구간 척도로 측정되었다고 가정합니다. 스피어만 ρ는 선형에 한정되지 않는 모든 단조 관계를 측정하며 순위 데이터에 기반하므로 이상치에 강하고 순서형 데이터에도 유효합니다. 정규성 가정이 깨졌거나, 데이터가 순서형이거나, 이상치가 있는 경우 스피어만을 사용하세요.
스피어만 상관에는 최소 표본 크기가 필요한가요?
기술적으로 공식은 n ≥ 2에서 작동하지만, 매우 작은 표본 (n < 5)에서는 계수가 개별 값에 매우 민감하고 유의성 검정의 검정력도 매우 낮습니다. 신뢰할 만한 추정에는 최소 10–15개의 짝지어진 관측값을 권장하며, 공식적인 유의성 검정에는 n ≥ 20이 더 바람직합니다.
계산기는 동점 값을 어떻게 처리하나요?
두 개 이상의 관측값이 같은 값을 가지면, 각 동점 관측값은 원래 차지했을 순위들의 평균을 받습니다. 예를 들어 3번째와 4번째 위치의 값이 모두 같다면 각각 순위 3.5를 받습니다. 그런 다음 계산기는 순위에 대한 피어슨 공식을 사용합니다. 이 공식은 동점이 없을 때 단순 dᵢ² 공식과 대수적으로 같고, 동점이 있을 때도 올바르게 처리합니다.
스피어만 ρ가 0이라는 것은 무엇을 의미하나요?
ρ가 정확히 0이라는 것은 X와 Y의 순위 배열 사이에 단조 관계가 없다는 뜻입니다. 변수가 독립이라는 뜻은 아닙니다. U자형 같은 비단조 관계도 ρ를 0에 가깝게 만들 수 있습니다. 놓친 패턴이 없는지 확인하려면 계수와 함께 데이터를 항상 그래프로 확인하세요.
스피어만 상관을 범주형 데이터에 사용할 수 있나요?
스피어만 상관에는 최소한 순서형 데이터, 즉 의미 있게 순위를 매길 수 있는 데이터가 필요합니다. 색상, 이름, 라벨처럼 순위 개념이 적용되지 않는 명목 범주형 데이터에는 사용할 수 없습니다. 명목 데이터에는 대신 Cramér's V 또는 다른 연관성 지표를 고려하세요.