Wald檢定計算器 - 統計顯著性

執行Wald檢定,判斷參數估計是否具有統計顯著性——輸入β̂、β₀、SE與α即可立即取得結果。

輸入參數估計、假設值、標準誤與顯著水準。計算器會回傳Wald統計量、z值、p值與決策。

Wald檢定計算器 - 統計顯著性
執行Wald檢定,判斷參數估計是否具有統計顯著性——輸入β̂、β₀、SE與α即可立即取得結果。

關於Wald檢定計算器

Wald檢定是一種參數統計檢定,以統計學家Abraham Wald命名。它是極大概似估計中的三種經典假設檢定之一,另外兩種是概似比檢定與得分檢定(拉格朗日乘子檢定)。Wald檢定之所以最常見,是因為它只需要估計值本身及其標準誤——這兩者通常都會由統計軟體直接報告——而不需要完整的概似函數。 Wald檢定的概念很直接。如果參數估計β̂相對於其精確度(由標準誤SE衡量)來說,離假設值β₀很遠,那麼虛無假設H₀: β = β₀就不太可能成立。Wald統計量為W = ((β̂ − β₀) / SE)²,也就是z值的平方。在虛無假設成立且樣本夠大時,W服從自由度為1的卡方分配。等價地,帶符號的z值z = (β̂ − β₀) / SE服從標準常態分配,因此雙尾p值為2 · (1 − Φ(|z|)),其中Φ為標準常態分配的累積分布函數。 p值回答的是:如果虛無假設為真,觀察到目前這樣或更極端的統計量,其機率是多少?較小的p值(通常低於顯著水準α,常設為0.05或0.01)提供反對H₀的證據。當p < α時,結果稱為具有統計顯著性,我們拒絕虛無假設。當p ≥ α時,我們不拒絕它——這不代表H₀為真,只是證據不足,無法得出參數不同於β₀的結論。 Wald檢定在應用統計中非常普遍。在線性迴歸與邏輯迴歸中,每個係數所報告的t統計量本質上就是Wald z值,對應的p值用來檢驗該係數是否顯著不同於零。在計量經濟學中,Wald檢定用於同時檢驗多個係數的聯合假設(透過矩陣代數的延伸)。在存活分析中,它可檢驗某個共變數是否能顯著預測風險率。在遺傳學中,全基因體關聯研究會使用Wald型統計量檢驗數百萬個單核苷酸多型性位點。 Wald檢定的一項已知限制是,它可能因參數化方式不同而產生不同結果,因為此檢定依賴對概似函數的局部二次近似。在小樣本下,通常更偏好概似比檢定,因為它更準確。Wald檢定在樣本數夠大、估計值近似服從常態分配(即滿足漸近條件)且標準誤估計可靠時最為穩健。

Wald檢定範例

來自經濟學、醫學與一般統計的三個真實情境,展示Wald檢定的實際應用。

輸入決策詳細資訊
β̂=2.5, β₀=0, SE=1.1, α=0.05拒絕H₀z = 2.27,W = 5.17,p ≈ 0.023。此估計值距離0超過2個標準誤,因此在α = 0.05時拒絕虛無假設。
β̂=0.08, β₀=0, SE=0.02, α=0.05拒絕H₀教育係數:z = 4.0,p < 0.001。教育年限每增加1年,對薪資的非零影響都高度顯著。
β̂=−0.5, β₀=0, SE=0.2, α=0.01不拒絕H₀在更嚴格的α=0.01下評估藥物療效:z = −2.5,p ≈ 0.012。此效果在α = 0.05時顯著,但在更嚴格的1%門檻下不顯著。

如何使用Wald檢定計算器

  1. 輸入迴歸結果或統計模型中的參數估計β̂。
  2. 輸入假設值β₀——通常在檢驗係數是否不為零時取0。
  3. 輸入估計的標準誤SE,該值會在同一統計輸出中提供。
  4. 設定顯著水準α——常用0.05表示5%的慣例門檻,或0.01表示更嚴格的1%門檻。
  5. 按下「計算」,即可取得Wald統計量、z值、雙尾p值,以及拒絕/不拒絕的決策。

Wald檢定常見問題

Wald檢定衡量什麼?
Wald檢定衡量參數估計與假設值之間相差多遠,並以標準誤單位表示。它檢驗這個距離是否足夠大,從而能在給定顯著水準下得出真實參數不同於假設值的結論。
Wald檢定和t檢定有什麼差別?
在大樣本下,兩者本質上等價——都是以標準誤單位比較估計值與虛無值。主要差別在於,t檢定使用t分配(考慮方差估計的不確定性),而Wald檢定使用常態分配,因此它是漸近檢定,更適合大樣本。
為什麼虛無假設通常是β₀ = 0?
與0比較是在檢驗某個預測變數是否完全沒有影響。在迴歸中,係數為0表示該變數沒有作用。設定β₀ = 0是最常見的用法,但你也可以檢驗任何值——例如確認參數是否等於理論預測值1或−0.5。
不拒絕H₀代表什麼?
不拒絕H₀表示資料不足以證明參數與假設值不同。這不代表H₀為真。這個結果可能表示效應確實為0,也可能只是因為樣本太小或標準誤太大,導致統計力不足。
什麼時候應該改用概似比檢定?
當樣本數較小、參數接近其可允許範圍的邊界,或Wald檢定結果對所選參數化方式非常敏感時,通常更適合使用概似比檢定。對於大樣本且估計值平滑分布的情況,Wald檢定和概似比檢定給出的p值幾乎相同。
應該使用什麼顯著水準?
常用門檻是α = 0.05(5%),表示你接受5%的機率去錯誤拒絕一個真實的虛無假設。對於更嚴格的需求——如醫療器材審核、基因體學或物理學——會使用α = 0.01甚至0.001。探索性研究有時會接受α = 0.10。顯著水準應在看資料之前決定。