표본비율의 표본분포 계산기
임의의 표본비율에 대한 표본분포의 평균, 표준오차, 정규성 조건, Z점수, 누적확률을 구합니다.
모비율 (p)과 표본 크기 (n)를 입력하세요. 특정 표본비율 (p̂)을 입력하면 해당 Z점수와 누적확률을 계산할 수 있습니다.
표본비율의 표본분포 계산기
임의의 표본비율에 대한 표본분포의 평균, 표준오차, 정규성 조건, Z점수, 누적확률을 구합니다.
표본비율의 표본분포란?
표본비율의 표본분포는, 실제 모비율이 p인 모집단에서 고정된 크기 n의 모든 가능한 무작위 표본을 뽑았을 때 나올 수 있는 표본비율 (p̂)의 범위를 설명하는 이론적 분포입니다. 이는 추론통계의 가장 기본적인 개념 중 하나이며, 설문조사 방법론, 가설 검정, 신뢰구간 구성의 토대가 됩니다.
표본분포의 평균은 모비율 p와 같습니다. 이것이 불편성의 성질입니다. 평균적으로 표본비율은 추정하는 모수와 같다는 뜻입니다. 표본분포의 표준편차는 비율의 표준오차로, σ(p̂) = √[p(1–p)/n]로 계산합니다. 표본 크기 n이 커질수록 표준오차는 작아지며, 더 큰 표본일수록 표본비율이 실제 값 p 주변에 더 촘촘히 모입니다.
중심극한정리에 따르면 np ≥ 10 그리고 n(1–p) ≥ 10 두 조건을 모두 만족하면 표본분포를 대략 정규분포로 볼 수 있습니다. 이 조건은 표본에서 성공과 실패의 수가 충분히 커서 정규근사가 신뢰할 만하다는 것을 보장합니다. 하나라도 만족하지 못하면, 특히 표본이 작거나 비율이 0 또는 1에 매우 가까운 경우에는 이항분포를 사용해야 합니다.
특정한 관측 표본비율 p̂를 입력하면 계산기는 Z점수를 계산합니다. 이는 p̂가 평균에서 표준오차 몇 개만큼 떨어져 있는지를 나타내며, Z = (p̂ – p) / σ(p̂)로 구합니다. 절대값이 큰 Z점수는 주어진 모비율 가정하에서 관측된 표본비율이 우연히 나올 가능성이 낮다는 뜻이며, 이것이 가설 검정의 기반입니다.
누적확률 P(p̂ < x)는 지정한 모집단에서 크기 n의 표본을 무작위로 뽑았을 때 x 이하의 표본비율이 관측될 확률을 뜻합니다. 보완확률 P(p̂ > x)는 x보다 큰 비율이 관측될 확률입니다. 이 두 값을 함께 보면 관측한 표본비율이 이론적 분포에 비해 얼마나 극단적인지 판단할 수 있습니다.
이 개념은 여론조사(후보자의 실제 지지율이 임계값을 넘는지 추정), 품질 관리(배치의 불량률이 허용 기준을 넘는지 판단), 의료 연구(치료 반응 비율이 과거 기준과 다른지 평가) 등에 널리 활용됩니다.
표본분포 예시
세 가지 사례로 평균, 표준오차, 정규성 검정, Z점수 계산을 보여줍니다.
| 매개변수 | 핵심 결과 | 설명 |
|---|---|---|
| p=0.60, n=100, p̂=0.65 | μ=0.60, σ=0.049, Z=1.02, P(<0.65)≈0.846 | 정규성 조건을 만족합니다(np=60, n(1-p)=40). 관측된 65%는 모비율보다 약 1 표준오차 높습니다. |
| p=0.50, n=400, p̂=0.53 | μ=0.50, σ=0.025, Z=1.20, P(<0.53)≈0.885 | 표본이 클수록 정밀도가 높아집니다. 표본 크기가 4배가 되면 표준오차는 절반이 되어, 0.50에서의 차이를 더 쉽게 확인할 수 있습니다. |
| p=0.05, n=50 | μ=0.05, σ=0.031, 정규성 실패 | np=2.5 < 10 이므로 정규성 조건을 만족하지 않습니다. 작은 비율과 작은 표본에서는 정확한 이항분포를 사용하세요. |
표본비율 표본분포 계산기 사용법
- 모비율 (p)을 0과 1 사이의 소수로 입력하세요(끝점 제외). 이는 모집단의 알려졌거나 가정한 실제 비율입니다.
- 표본 크기 (n)를 양의 정수로 입력하세요. 이것이 표준오차를 결정하고 정규성 조건 충족 여부에 영향을 줍니다.
- 필요하면 표본비율 (p̂)을 입력해 Z점수와 누적확률 P(p̂ < x), P(p̂ > x)를 계산하세요.
- 계산을 누르면 평균, 표준오차, 정규성 검정 결과와 (p̂를 입력한 경우) Z점수 및 확률이 표시됩니다.
- 초기화를 누르면 모든 입력이 지워지고 새 계산을 시작할 수 있습니다.
비율 표본분포 FAQ
표본비율의 표준오차는 무엇인가요?
표준오차는 표본분포의 표준편차로, 표본마다 표본비율이 얼마나 달라지는지 측정합니다. 값은 √[p(1–p)/n]입니다. 표준오차가 작을수록 표본비율은 실제 모비율 p 주위에 더 촘촘히 모입니다.
표본분포가 근사적으로 정규가 되는 시점은 언제인가요?
np ≥ 10 그리고 n(1–p) ≥ 10 두 조건을 모두 만족할 때 정규근사가 유효합니다. 어느 하나라도 실패하면 분포가 비대칭이 되고, 정규근사에 기반한 확률 계산은 부정확해집니다. 이 경우에는 정확한 이항분포를 사용하세요.
표본 크기를 늘리면 분포는 어떻게 변하나요?
n이 커지면 표준오차는 1/√n에 비례해 감소하여 표본분포가 좁아집니다. 평균은 표본 크기와 상관없이 p와 같습니다. 분포가 좁아질수록 표본비율이 실제 모비율에 더 가까워질 가능성이 높아져 추정과 추론이 더 정확해집니다.
표본비율의 Z점수가 2라는 뜻은 무엇인가요?
Z점수가 2라는 것은 관측된 표본비율 p̂가 모비율 p보다 2 표준오차 높다는 뜻입니다. 정규근사에서 이렇게 크거나 더 큰 Z점수가 순전히 우연히 나올 확률은 약 2.3%입니다(단측). 이는 가정한 모비율에 대한 강하지만 결정적이지 않은 반증입니다.
이 계산기는 0이나 1에 가까운 비율도 처리할 수 있나요?
계산은 가능하지만, np < 10 또는 n(1–p) < 10이면 정규성 조건 실패로 표시됩니다. p = 0.02 또는 p = 0.98 같은 극단적 비율에서는 표본분포가 비대칭이므로 정확한 확률 계산에는 이항분포를 사용해야 합니다.
비율의 표준편차와 표준오차는 어떻게 다른가요?
이진 변수의 모표준편차는 개별 관측값 내부의 변동성을 나타냅니다: σ = √[p(1–p)]. 표본비율의 표준오차는 반복 표집에서 표본비율들 사이의 변동성을 나타냅니다: σ(p̂) = √[p(1–p)/n]. 표준오차는 1/√n 만큼 더 작으며, 여러 관측값을 평균내는 효과를 반영합니다.