잔차 계산기 - 선형 회귀 잔차

가설 검정과 통계적 추론

이 도구는 단순 선형 회귀 모델의 잔차를 계산합니다. X와 Y 데이터 포인트를 입력해 회귀선을 구하고 예측 오차를 분석하세요.

잔차 계산기 - 선형 회귀 잔차
가설 검정과 통계적 추론

잔차 계산기 소개

잔차는 관측값과 통계 모델이 예측한 값의 차이입니다. 단순 선형 회귀에서는 i번째 관측의 잔차를 e_i = y_i − ŷ_i로 정의하며, 여기서 y_i는 실제 관측값이고 ŷ_i는 최소제곱 회귀선 ŷ = b₀ + b₁x가 예측한 값입니다. 최소제곱법(OLS)은 잔차 제곱합(SSE = Σe_i²)을 최소화하는 회귀선을 찾습니다. 이 도구는 표준 공식으로 기울기(b₁)와 절편(b₀)을 계산합니다. b₁ = Σ(xᵢ − x̄)(yᵢ − ȳ) / Σ(xᵢ − x̄)², b₀ = ȳ − b₁x̄ 입니다. 잔차 분석은 회귀 진단의 기본 단계입니다. 모델을 적합한 뒤에는 핵심 가정을 확인하기 위해 잔차를 살펴봐야 합니다. 선형성(잔차를 x에 대해 그렸을 때 체계적인 패턴이 없어야 함), 등분산성(잔차의 분산이 대체로 일정해야 함), 독립성(잔차에 자기상관이 없어야 함), 정규성(잔차가 대체로 정규분포를 따라야 함)입니다. 잔차 플롯, 즉 잔차를 예측값 또는 독립 변수에 대해 그린 산점도가 가장 중요한 진단 도구입니다. 잔차가 0 주변에 무작위로 퍼져 있고 패턴이 없다면 선형 모델이 적절하다는 뜻입니다. U자형 같은 체계적 패턴은 비선형성을, 깔때기 모양은 이분산성을, 군집은 영향력 있는 관측치나 이상치를 시사합니다. 결정계수 R²는 y의 분산 중 x가 얼마나 설명하는지를 나타냅니다. R²는 0(아무 분산도 설명하지 못함)부터 1(완벽한 적합)까지입니다. 계산식은 1 − SSE/SST이며, SST = Σ(yᵢ − ȳ)² 입니다. 이 계산기는 회귀를 배우는 학생, 빠른 데이터 품질 검사를 하는 분석가, 더 복잡한 모델링으로 넘어가기 전에 모델 적합도를 검증하려는 연구자에게 적합합니다. 결과에는 전체 회귀 방정식, 각 점의 잔차 표, SSE 총합, R² 값이 포함되어 바로 해석할 수 있습니다.

잔차 계산 예시

다음 예시는 X와 Y 데이터 쌍으로 잔차를 어떻게 계산하는지 보여줍니다.

X → Y 데이터회귀선
X: 1,2,3,4,5 / Y: 2,4,5,4,5ŷ = 0.6x + 2.2R² = 0.60
X: 1,2,3,4 / Y: 2,4,6,8ŷ = 2x + 0R² = 1.00 (완전 적합)
X: 1,2,3,4,5 / Y: 5,3,4,2,1ŷ = -0.9x + 5.7R² = 0.81

사용 방법

  1. 첫 번째 텍스트 영역에 독립 변수(X) 값을 쉼표나 공백으로 구분해 입력하세요.
  2. 두 번째 텍스트 영역에 X와 같은 순서로 대응하는 관측값(Y)을 입력하세요.
  3. ‘계산’을 클릭해 최소제곱 회귀선을 적합하고 모든 잔차를 계산하세요.
  4. 잔차 표를 확인해 회귀선에서 멀리 떨어진 관측치를 찾으세요.
  5. R²를 확인해 선형 모델이 데이터에 얼마나 잘 맞는지 평가하세요.

자주 묻는 질문

잔차가 크다는 것은 무엇을 의미하나요?
잔차가 크다는 것은 관측값이 회귀 모델의 예측값에서 크게 벗어난다는 뜻입니다. 큰 잔차는 이상치, 영향력이 큰 관측치, 또는 선형 모델이 데이터에 최적이 아님을 나타낼 수 있습니다. 결론을 내리기 전에 그런 점들을 확인하세요.
왜 OLS 회귀에서는 잔차의 합이 0인가요?
OLS 회귀에 절편이 포함되면 잔차의 합은 항상 정확히 0이 됩니다. 이는 최소제곱 추정량의 수학적 성질로, 회귀선이 점 (x̄, ȳ)를 지나야 하므로 양의 편차와 음의 편차가 서로 상쇄됩니다.
잔차와 오차의 차이는 무엇인가요?
오차는 관측값과 진짜 모집단 회귀선 사이의, 직접 관찰할 수 없는 차이입니다. 잔차는 관측값과 추정된 회귀선 사이의 관찰 가능한 차이입니다. 실제로는 잔차를 사용해 오차를 추정하고 분석합니다.
R²는 잔차에 대해 무엇을 알려주나요?
R²(결정계수)는 선형 회귀 모델이 Y의 총 분산 중 얼마나 설명하는지를 나타냅니다. R²가 높을수록 모델 적합이 좋고, 잔차는 Y의 전체 변동에 비해 작아집니다. 하지만 R²가 높다고 해서 모델 가정이 모두 충족된다는 뜻은 아닙니다.
잔차에서 이분산성은 어떻게 찾나요?
잔차를 적합값에 대해 그려 보세요. 적합값에 따라 잔차의 퍼짐이 체계적으로 커지거나 작아지면(깔때기 모양) 이분산성이 있습니다. Breusch-Pagan 검정이나 White 검정 같은 공식 검정으로 통계적으로 확인할 수 있습니다.
이 계산기는 다중 선형 회귀도 지원하나요?
아니요. 이 계산기는 독립 변수(X) 하나와 종속 변수(Y) 하나를 사용하는 단순 선형 회귀만 지원합니다. 두 개 이상의 예측 변수가 있는 다중 회귀에는 R, Python(statsmodels), Excel, SPSS 같은 통계 소프트웨어를 사용하세요.