Tukey HSD 계산기 - ANOVA 사후검정

ANOVA 이후 Tukey의 Honestly Significant Difference 검정을 실행해 어떤 그룹 평균이 유의하게 다른지 확인합니다.

각 그룹의 데이터를 쉼표로 구분해 입력하고, 그룹 수와 유의수준을 선택한 뒤 계산을 클릭하면 ANOVA 표와 모든 쌍별 비교 결과를 볼 수 있습니다.

Tukey HSD 계산기 - ANOVA 사후검정
ANOVA 이후 Tukey의 Honestly Significant Difference 검정을 실행해 어떤 그룹 평균이 유의하게 다른지 확인합니다.

Tukey HSD 검정 소개

Tukey의 Honestly Significant Difference(HSD) 검정은 단일 요인 ANOVA에서 유의한 F 통계량이 나온 뒤 수행하는 널리 쓰이는 사후 절차입니다. ANOVA가 적어도 하나의 그룹 평균이 다른 그룹과 다르다고 알려주면, Tukey HSD는 어떤 평균쌍이 그 차이를 만들어냈는지 정확히 찾아내면서 선택한 α 수준에서 전체 오류율을 통제합니다. 이 검정은 통계학자 John Tukey가 1949년에 개발했으며, 모든 쌍별 비교가 중요할 때 여전히 표준으로 사용됩니다. Bonferroni 보정은 지나치게 보수적일 수 있지만, Tukey 방법은 표본 크기가 같을 때 실험 단위 오류율을 정확히 제어하고, 표본 크기가 다를 때도 근사적으로 제어합니다. 통계적 검정력과 오류 제어의 균형 덕분에 농업, 심리학, 임상시험, 제조업 등에서 세 개 이상의 처리군을 비교할 때 기본 선택으로 많이 사용됩니다. 계산은 단일 요인 ANOVA에서 시작합니다. 모든 관측값으로부터 전체 평균을 구한 다음, 제곱합을 집단 간 변동(각 그룹 평균이 전체 평균에서 얼마나 떨어져 있는지)과 집단 내 변동(개별 값이 그룹 평균 주변에서 얼마나 퍼져 있는지)으로 나눕니다. 각 제곱합을 대응하는 자유도로 나누면 평균제곱이 됩니다. F 통계량은 집단 간 평균제곱을 집단 내 평균제곱으로 나눈 비율로, 값이 클수록 그룹 평균이 실제로 다르다는 뜻입니다. HSD 단계에서는 그룹 수 k와 집단 내 자유도를 사용해 studentized range 분포표에서 임계값 q를 찾습니다. HSD 기준값은 q × √(MS_within / n_harmonic)로 계산되며, n_harmonic은 각 그룹 표본 크기의 조화평균입니다. 두 평균의 절대차가 이 기준값을 넘으면 유의하게 다르다고 판단합니다. 이 계산기는 표본 크기가 서로 다른 2~6개 그룹을 처리하며, 유효 표본 크기로 조화평균을 사용합니다. 결과에는 전체 ANOVA 표와 완전한 쌍별 비교 행렬이 포함됩니다. 일반적인 95% 신뢰수준에는 α=0.05, 더 엄격한 99% 수준에는 α=0.01을 사용합니다。

Tukey HSD 예시

검정이 유의한 그룹 차이를 검출하거나 검출하지 못하는 방식을 보여주는 대표 데이터셋입니다.

그룹판정설명
G1: 23,25,28,30 | G2: 22,24,26,28 | G3: 35,38,40,42G1 vs G3: 유의함; G2 vs G3: 유의함3그룹의 평균(약 38.75)은 1그룹과 2그룹(약 26.5와 약 25)보다 훨씬 높습니다. G3가 포함된 쌍은 HSD 기준값을 초과합니다.
G1: 10,11,12 | G2: 10,12,11 | G3: 11,13,12유의한 차이 없음평균은 11, 11, 12입니다. 집단 내 변동에 비해 차이가 작아 모든 쌍이 HSD 기준값보다 낮습니다.
G1: 5,6,7,8 | G2: 12,14,13,15 | G3: 20,21,22,23 | G4: 30,31,29,32모든 쌍 유의함간격이 일정한 4개 그룹이며 집단 내 산포가 작습니다. alpha=0.05에서 모든 평균 차이가 HSD 기준값을 넘습니다.

Tukey HSD 계산기 사용 방법

  1. 상단의 그룹 선택 버튼으로 그룹 수(2~6)를 선택합니다.
  2. 각 그룹에 해당하는 입력란에 쉼표로 구분된 데이터를 입력합니다.
  3. 유의수준을 선택합니다. alpha=0.05는 일반적인 5% 기준, alpha=0.01은 더 엄격한 1% 기준입니다.
  4. 계산을 클릭해 ANOVA 표(SS, df, MS, F)와 전체 쌍별 비교 표를 확인합니다.
  5. 쌍별 비교 표의 결과 열을 확인하세요. 유의함으로 표시된 쌍은 HSD 기준값을 초과합니다.

Tukey HSD FAQ

언제 Tukey HSD 검정을 사용해야 하나요?
유의한 단일 요인 ANOVA 결과를 얻고, 어떤 그룹 평균이 다른지 알고 싶을 때 사용합니다. 모든 쌍별 비교가 계획되어 있고 전체 오류율을 엄격하게 제어하고 싶을 때 적합합니다.
HSD 기준값은 무엇을 의미하나요?
HSD 기준값은 선택한 alpha 수준에서 통계적으로 유의하다고 판단되는 두 그룹 평균 사이의 최소 절대 차이입니다. 평균 차이가 이 값을 넘는 쌍은 유의하게 다르다고 표시됩니다.
Tukey HSD는 t-검정과 어떻게 다른가요?
쌍별 t-검정은 다중 비교 보정을 하지 않기 때문에 여러 번 수행하면 거짓 양성 가능성이 커집니다. Tukey HSD는 모든 비교에 대한 가족 오류율을 동시에 제어하므로 세 개 이상의 그룹을 검정할 때 더 적절합니다.
Tukey HSD는 표본 크기가 같아야 하나요?
표본 크기가 같으면 정확한 가족 오류율을 얻을 수 있습니다. 표본 크기가 다를 때 이 계산기는 각 그룹 크기의 조화평균을 사용하며, 이는 Tukey-Kramer 방법으로 알려진 좋은 근사입니다.
studentized range 통계량 q는 무엇인가요?
q 통계량은 그룹 평균 범위를 표준오차로 나눈 값입니다. 임계값은 studentized range 분포에서 찾으며, 그룹 수 k와 오차 자유도를 반영합니다.
ANOVA가 유의하지 않으면 어떻게 하나요?
전체 ANOVA의 F 검정이 유의하지 않으면 평균 차이에 대한 통계적 증거가 없으므로 일반적으로 Tukey HSD 같은 사후 검정을 수행하지 않습니다. 유의하지 않은 F를 보고하고 종료하는 것이 표준입니다.