Tukey HSD計算器 - ANOVA事後檢定
在ANOVA後執行Tukey誠實顯著差異檢定,找出哪些組平均數彼此顯著不同。
為每組輸入以逗號分隔的資料,選擇組數與顯著性水準,然後點擊計算查看ANOVA表與所有兩兩比較結果。
Tukey HSD計算器 - ANOVA事後檢定
在ANOVA後執行Tukey誠實顯著差異檢定,找出哪些組平均數彼此顯著不同。
關於Tukey HSD檢定
Tukey誠實顯著差異(HSD)檢定是一種廣泛使用的事後分析方法,通常在單因子ANOVA得到顯著F統計量後進行。當ANOVA告訴你至少有一組平均數與其他組不同,Tukey HSD就能精準指出究竟是哪些平均數配對造成了這個差異,同時把家族錯誤率控制在所選α水準。
這項檢定由統計學家John Tukey於1949年提出,如今仍是所有兩兩比較都很重要時的標準方法。與Bonferroni校正相比,後者往往過於保守;Tukey方法在樣本數相等時能精確控制實驗整體錯誤率,在樣本數不等時也能提供近似控制。這種統計力與錯誤控制之間的平衡,使它成為比較三個或更多處理組時的預設選擇,適用於農業、心理學、臨床試驗與製造業等領域。
計算首先從單因子ANOVA開始:先由所有觀測值計算總平均,再將平方和分解為組間變異(各組平均數與總平均相差多少)和組內變異(個別數值圍繞組平均數的離散程度)。將每個平方和除以對應自由度即可得到均方。F統計量是組間均方與組內均方之比;較大的F值表示各組平均數確實不同。
在HSD步驟中,依據組數k與組內自由度,從學生化極差分配表查得臨界值q。接著HSD門檻計算為 q × √(MS_within / n_harmonic),其中n_harmonic是各組樣本數的調和平均數。任何一對平均數的絕對差若超過這個門檻,就會被判定為顯著不同。
此計算器支援2到6組且樣本數不等的情況,並使用調和平均數作為有效樣本量。結果包含完整的ANOVA表與完整的兩兩比較矩陣。標準95%信賴水準使用α=0.05,更嚴格的99%水準使用α=0.01。
Tukey HSD範例
展示此檢定如何偵測或未能偵測到顯著組間差異的代表性資料集。
| 各組資料 | 結論 | 說明 |
|---|---|---|
| G1: 23,25,28,30 | G2: 22,24,26,28 | G3: 35,38,40,42 | G1 vs G3: 顯著;G2 vs G3: 顯著 | 第3組平均數(約38.75)明顯高於第1組與第2組(約26.5與約25)。涉及G3的配對都超過了HSD門檻。 |
| G1: 10,11,12 | G2: 10,12,11 | G3: 11,13,12 | 沒有顯著差異 | 平均數分別為11、11和12。相較於組內變異,這些差異很小,因此所有配對都低於HSD門檻。 |
| G1: 5,6,7,8 | G2: 12,14,13,15 | G3: 20,21,22,23 | G4: 30,31,29,32 | 所有配對均顯著 | 四個等距組別,組內散布很小。在alpha=0.05時,每一對平均數差都超過HSD門檻。 |
如何使用Tukey HSD計算器
- 使用計算器上方的組別選擇按鈕選擇組數(2-6組)。
- 在對應輸入欄位中輸入每組以逗號分隔的資料值。
- 選擇顯著性水準:alpha=0.05代表一般使用的5%門檻,alpha=0.01代表更嚴格的1%門檻。
- 點擊計算查看ANOVA表(SS、df、MS、F)以及完整的兩兩比較表。
- 查看兩兩比較表中的結果欄——標記為顯著的配對,其平均數差異超過了HSD門檻。
Tukey HSD常見問題
什麼時候應該使用Tukey HSD檢定?
當你得到顯著的單因子ANOVA結果,並且想找出具體哪些組平均數不同時,就應使用Tukey HSD。它適合所有兩兩比較都已規劃好的情境,並且需要嚴格控制整體錯誤率。
HSD門檻是什麼意思?
HSD門檻是在所選alpha水準下被視為具有統計顯著性的兩個組平均數之間的最小絕對差。任何平均數差超過此值的配對都會被標記為顯著不同。
Tukey HSD與t檢定有什麼不同?
兩兩t檢定不會對多重比較進行校正,因此連續做多個t檢定會增加假陽性的機率。Tukey HSD會同時控制所有比較的家族錯誤率,因此在檢驗三個或更多組時更合適。
Tukey HSD需要樣本數相等嗎?
樣本數相等時可以得到精確的家族錯誤率。對於樣本數不等的情況,本計算器使用各組樣本數的調和平均數,這是一種稱為Tukey-Kramer方法的良好近似。
學生化極差統計量q是什麼?
q統計量是組平均數極差與標準誤之比。臨界值從學生化極差分配中查得,該分配會考慮組數k與誤差自由度。
如果ANOVA不顯著怎麼辦?
如果整體ANOVA的F檢定不顯著,通常就不進行像Tukey HSD這樣的事後檢定,因為沒有統計證據表明任何平均數存在差異。標準做法是報告不顯著的F結果並到此為止。