殘差計算器 - 線性迴歸殘差
假設檢定與統計推論
這個工具可計算簡單線性迴歸模型的殘差。輸入你的 X 與 Y 資料點,即可找出迴歸直線並分析預測誤差。
殘差計算器 - 線性迴歸殘差
假設檢定與統計推論
關於殘差計算器
殘差是觀測值與統計模型預測值之間的差異。在簡單線性迴歸中,第 i 筆觀測的殘差定義為 e_i = y_i − ŷ_i,其中 y_i 是實際觀測值,而 ŷ_i 是最小平方法迴歸直線 ŷ = b₀ + b₁x 所預測的值。
普通最小平方法(OLS)會找出使殘差平方和最小的迴歸直線(SSE = Σe_i²)。本工具使用標準公式計算斜率(b₁)與截距(b₀):b₁ = Σ(xᵢ − x̄)(yᵢ − ȳ) / Σ(xᵢ − x̄)²,b₀ = ȳ − b₁x̄。
殘差分析是迴歸診斷的基礎步驟。模型配適完成後,應檢視殘差以驗證關鍵假設:線性(殘差對 x 作圖時不應出現系統性圖樣)、同質變異(殘差應大致具有固定變異)、獨立性(殘差不應具有自相關)以及常態性(殘差應近似服從常態分布)。
殘差圖——也就是殘差對預測值或對自變數的散點圖——是主要的診斷工具。若殘差在 0 附近隨機分散且沒有明顯圖樣,代表線性模型是適合的。U 形等系統性圖樣表示非線性,漏斗形表示異質變異,而群聚則可能代表存在具影響力的觀測值或離群值。
決定係數 R² 衡量 y 的變異有多少可由 x 解釋。R² 範圍從 0(模型無法解釋任何變異)到 1(完全配適)。其計算方式為 1 − SSE/SST,其中 SST = Σ(yᵢ − ȳ)²。
這個計算器很適合學習迴歸的學生、進行快速資料品質檢查的分析師,以及在進一步建模前驗證模型配適的研究人員。結果包含完整的迴歸方程式、逐點殘差表、SSE 總和與 R² 值,方便立即解讀。
殘差計算範例
這些範例示範如何根據 X 與 Y 資料對來計算殘差。
| X → Y 資料 | 迴歸直線 | R² |
|---|---|---|
| X: 1,2,3,4,5 / Y: 2,4,5,4,5 | ŷ = 0.6x + 2.2 | R² = 0.60 |
| X: 1,2,3,4 / Y: 2,4,6,8 | ŷ = 2x + 0 | R² = 1.00(完全配適) |
| X: 1,2,3,4,5 / Y: 5,3,4,2,1 | ŷ = -0.9x + 5.7 | R² = 0.81 |
如何使用這個計算器
- 在第一個文字區輸入自變數(X)值,以逗號或空格分隔。
- 在第二個文字區依照與 X 相同的順序輸入對應的觀測(Y)值。
- 按一下「計算」,以最小平方法配適迴歸直線並計算所有殘差。
- 查看殘差表,找出遠離迴歸直線的觀測值。
- 檢視 R²,以評估線性模型與資料的配適程度。
常見問題
殘差很大代表什麼?
殘差很大表示觀測值與迴歸模型預測值相差很遠。較大的殘差可能代表離群值、具影響力的觀測值,或線性模型不是資料的最佳配適。在下結論之前,應先檢查這些點。
為什麼 OLS 迴歸中的殘差總和會是 0?
當 OLS 迴歸包含截距項時,殘差總和一定會剛好等於 0。這是最小平方法估計量的數學性質:迴歸直線必須通過點(x̄,ȳ),因此正負偏差會彼此抵銷。
殘差和誤差有什麼差別?
誤差是觀測值與真實母體迴歸直線之間無法直接觀察的差異。殘差是觀測值與估計迴歸直線之間可觀察的差異。實務上會用殘差來估計與分析誤差。
R² 對殘差有什麼意義?
R²(決定係數)是線性迴歸模型對 Y 總變異的解釋比例。R² 越高,代表模型配適越好,殘差相對於 Y 的總變異也越小。不過,光是高 R² 並不能保證模型假設都成立。
如何偵測殘差中的異質變異?
將殘差對擬合值作圖。如果殘差的散布會隨擬合值系統性增加或減少(呈現漏斗形),就表示存在異質變異。Breusch-Pagan 檢定或 White 檢定等正式統計檢定可進一步加以確認。
這個計算器可以處理多元線性迴歸嗎?
不行,這個計算器只支援一個自變數(X)與一個依變數(Y)的簡單線性迴歸。若要處理有兩個以上預測變數的多元迴歸,請使用 R、Python(statsmodels)、Excel 或 SPSS 等統計軟體。