Tukey HSD 계산기 - ANOVA 사후검정
ANOVA 이후 Tukey의 Honestly Significant Difference 검정을 실행해 어떤 그룹 평균이 유의하게 다른지 확인합니다.
각 그룹의 데이터를 쉼표로 구분해 입력하고, 그룹 수와 유의수준을 선택한 뒤 계산을 클릭하면 ANOVA 표와 모든 쌍별 비교 결과를 볼 수 있습니다.
Tukey HSD 계산기 - ANOVA 사후검정
ANOVA 이후 Tukey의 Honestly Significant Difference 검정을 실행해 어떤 그룹 평균이 유의하게 다른지 확인합니다.
Tukey HSD 검정 소개
Tukey의 Honestly Significant Difference(HSD) 검정은 단일 요인 ANOVA에서 유의한 F 통계량이 나온 뒤 수행하는 널리 쓰이는 사후 절차입니다. ANOVA가 적어도 하나의 그룹 평균이 다른 그룹과 다르다고 알려주면, Tukey HSD는 어떤 평균쌍이 그 차이를 만들어냈는지 정확히 찾아내면서 선택한 α 수준에서 전체 오류율을 통제합니다.
이 검정은 통계학자 John Tukey가 1949년에 개발했으며, 모든 쌍별 비교가 중요할 때 여전히 표준으로 사용됩니다. Bonferroni 보정은 지나치게 보수적일 수 있지만, Tukey 방법은 표본 크기가 같을 때 실험 단위 오류율을 정확히 제어하고, 표본 크기가 다를 때도 근사적으로 제어합니다. 통계적 검정력과 오류 제어의 균형 덕분에 농업, 심리학, 임상시험, 제조업 등에서 세 개 이상의 처리군을 비교할 때 기본 선택으로 많이 사용됩니다.
계산은 단일 요인 ANOVA에서 시작합니다. 모든 관측값으로부터 전체 평균을 구한 다음, 제곱합을 집단 간 변동(각 그룹 평균이 전체 평균에서 얼마나 떨어져 있는지)과 집단 내 변동(개별 값이 그룹 평균 주변에서 얼마나 퍼져 있는지)으로 나눕니다. 각 제곱합을 대응하는 자유도로 나누면 평균제곱이 됩니다. F 통계량은 집단 간 평균제곱을 집단 내 평균제곱으로 나눈 비율로, 값이 클수록 그룹 평균이 실제로 다르다는 뜻입니다.
HSD 단계에서는 그룹 수 k와 집단 내 자유도를 사용해 studentized range 분포표에서 임계값 q를 찾습니다. HSD 기준값은 q × √(MS_within / n_harmonic)로 계산되며, n_harmonic은 각 그룹 표본 크기의 조화평균입니다. 두 평균의 절대차가 이 기준값을 넘으면 유의하게 다르다고 판단합니다.
이 계산기는 표본 크기가 서로 다른 2~6개 그룹을 처리하며, 유효 표본 크기로 조화평균을 사용합니다. 결과에는 전체 ANOVA 표와 완전한 쌍별 비교 행렬이 포함됩니다. 일반적인 95% 신뢰수준에는 α=0.05, 더 엄격한 99% 수준에는 α=0.01을 사용합니다。
Tukey HSD 예시
검정이 유의한 그룹 차이를 검출하거나 검출하지 못하는 방식을 보여주는 대표 데이터셋입니다.
| 그룹 | 판정 | 설명 |
|---|---|---|
| G1: 23,25,28,30 | G2: 22,24,26,28 | G3: 35,38,40,42 | G1 vs G3: 유의함; G2 vs G3: 유의함 | 3그룹의 평균(약 38.75)은 1그룹과 2그룹(약 26.5와 약 25)보다 훨씬 높습니다. G3가 포함된 쌍은 HSD 기준값을 초과합니다. |
| G1: 10,11,12 | G2: 10,12,11 | G3: 11,13,12 | 유의한 차이 없음 | 평균은 11, 11, 12입니다. 집단 내 변동에 비해 차이가 작아 모든 쌍이 HSD 기준값보다 낮습니다. |
| G1: 5,6,7,8 | G2: 12,14,13,15 | G3: 20,21,22,23 | G4: 30,31,29,32 | 모든 쌍 유의함 | 간격이 일정한 4개 그룹이며 집단 내 산포가 작습니다. alpha=0.05에서 모든 평균 차이가 HSD 기준값을 넘습니다. |
Tukey HSD 계산기 사용 방법
- 상단의 그룹 선택 버튼으로 그룹 수(2~6)를 선택합니다.
- 각 그룹에 해당하는 입력란에 쉼표로 구분된 데이터를 입력합니다.
- 유의수준을 선택합니다. alpha=0.05는 일반적인 5% 기준, alpha=0.01은 더 엄격한 1% 기준입니다.
- 계산을 클릭해 ANOVA 표(SS, df, MS, F)와 전체 쌍별 비교 표를 확인합니다.
- 쌍별 비교 표의 결과 열을 확인하세요. 유의함으로 표시된 쌍은 HSD 기준값을 초과합니다.
Tukey HSD FAQ
언제 Tukey HSD 검정을 사용해야 하나요?
유의한 단일 요인 ANOVA 결과를 얻고, 어떤 그룹 평균이 다른지 알고 싶을 때 사용합니다. 모든 쌍별 비교가 계획되어 있고 전체 오류율을 엄격하게 제어하고 싶을 때 적합합니다.
HSD 기준값은 무엇을 의미하나요?
HSD 기준값은 선택한 alpha 수준에서 통계적으로 유의하다고 판단되는 두 그룹 평균 사이의 최소 절대 차이입니다. 평균 차이가 이 값을 넘는 쌍은 유의하게 다르다고 표시됩니다.
Tukey HSD는 t-검정과 어떻게 다른가요?
쌍별 t-검정은 다중 비교 보정을 하지 않기 때문에 여러 번 수행하면 거짓 양성 가능성이 커집니다. Tukey HSD는 모든 비교에 대한 가족 오류율을 동시에 제어하므로 세 개 이상의 그룹을 검정할 때 더 적절합니다.
Tukey HSD는 표본 크기가 같아야 하나요?
표본 크기가 같으면 정확한 가족 오류율을 얻을 수 있습니다. 표본 크기가 다를 때 이 계산기는 각 그룹 크기의 조화평균을 사용하며, 이는 Tukey-Kramer 방법으로 알려진 좋은 근사입니다.
studentized range 통계량 q는 무엇인가요?
q 통계량은 그룹 평균 범위를 표준오차로 나눈 값입니다. 임계값은 studentized range 분포에서 찾으며, 그룹 수 k와 오차 자유도를 반영합니다.
ANOVA가 유의하지 않으면 어떻게 하나요?
전체 ANOVA의 F 검정이 유의하지 않으면 평균 차이에 대한 통계적 증거가 없으므로 일반적으로 Tukey HSD 같은 사후 검정을 수행하지 않습니다. 유의하지 않은 F를 보고하고 종료하는 것이 표준입니다.