분산 계산기 - 표본 및 모집단 분산

어떤 데이터셋이든 분산, 표준편차, 평균, 중앙값, 최빈값, IQR을 계산 — 표본 또는 모집단 공식을 선택하세요.

쉼표나 공백으로 구분된 숫자를 입력하고 표본 또는 모집단을 선택하면, 완전한 통계 요약을 즉시 확인할 수 있습니다.

분산 계산기 - 표본 및 모집단 분산
어떤 데이터셋이든 분산, 표준편차, 평균, 중앙값, 최빈값, IQR을 계산 — 표본 또는 모집단 공식을 선택하세요.

분산 계산기에 대해

분산은 각 데이터 포인트와 데이터셋 평균의 차이를 제곱한 값들의 평균으로, 분포가 얼마나 퍼져 있는지 정량화합니다. 분산이 0이면 모든 값이 같고, 분산이 크다는 것은 값들이 평균 주변에 넓게 퍼져 있다는 뜻입니다. 분산은 제곱 단위로 표현되므로 그 제곱근인 표준편차가 더 직관적인 경우가 많지만, 분산 자체는 가법성을 가지며 많은 고급 기법의 기반이 되기 때문에 통계 이론에서 매우 중요합니다. 이 분산 계산기는 근본적으로 다른 두 가지 사용 사례를 구분합니다. 모집단 분산(σ²)은 제곱 편차의 합을 n, 즉 값의 총 개수로 나눕니다. 예를 들어 한 반의 모든 학생 키처럼 설명하려는 전체 집단이 데이터일 때 사용합니다. 표본 분산(s²)은 n − 1로 나누며 베셀 보정을 적용해, 표본 평균이 추정치이므로 실제 모집단의 퍼짐을 약간 과소평가하는 점을 보정합니다. 유한한 표본에서는 보정값이 항상 비보정값보다 조금 더 큽니다. 더 큰 집단에서 뽑은 표본이라면 표본 분산이 표준 선택입니다. 분산 외에도 이 계산기는 완전한 기술 통계 요약을 제공합니다. 평균은 산술평균, 즉 합계를 개수로 나눈 값입니다. 중앙값은 데이터를 정렬했을 때 가운데 값이며, 짝수 개라면 가운데 두 값의 평균입니다. 이상치에 강하고, 치우친 분포에서는 평균보다 더 유용할 때가 많습니다. 최빈값은 가장 자주 나타나는 값(또는 값들)이며, 모든 숫자가 한 번씩만 나오면 최빈값 없음으로 설명합니다. 범위는 최댓값과 최솟값의 차이입니다. 사분위 범위(IQR)는 데이터의 가운데 50%가 차지하는 폭으로, 25번째 백분위수부터 75번째 백분위수까지를 말하며, 특히 이상치를 식별하는 데 유용합니다. 분산과 그 관련 지표인 표준편차, IQR, 범위는 데이터 분석 전반에서 쓰입니다. 품질 엔지니어는 분산으로 생산 일관성을 감시하고 사양에서 벗어난 배치를 찾아냅니다. 투자 분석가는 분산을 포트폴리오 변동성의 척도로 사용합니다. 수익률 분산이 높을수록 자산 위험도 높아집니다. 교육자는 시험 점수가 좁게 모여 있는지(낮은 분산, 일관된 이해) 아니면 흩어져 있는지(높은 분산, 이해 수준이 다양함)를 판단하는 데 사용합니다. 역학자는 질병 발생의 지역별 분포를 설명하는 데 모집단 분산을 쓰고, 사회과학자는 인구 집단 간 불평등을 비교하는 데 이를 사용합니다. 이 도구는 정수, 소수, 양수, 음수를 포함한 어떤 숫자 목록이든 처리하며, 모든 통계량을 한 번에 계산합니다. 매우 크거나 매우 작은 숫자는 가독성과 정확도의 균형을 맞추기 위해 유효숫자 최대 6자리까지 표시됩니다.

분산 계산기 예시

서로 다른 데이터 분포에서 분산이 어떻게 달라지는지 보여 주는 세 가지 예시입니다.

데이터셋분산세부 정보
표본: 85, 92, 78, 88, 95, 81, 74s² ≈ 57.24학생 7명의 시험 점수입니다. 평균 ≈ 84.71, s ≈ 7.57. 평균 주위의 퍼짐이 중간 정도입니다.
모집단: 25, 32, 28, 45, 38, 29, 33, 51σ² ≈ 70.36한 부서의 직원 8명 전체 연령입니다. 평균 = 35.125, σ ≈ 8.39. 45와 51의 이상치 때문에 분산이 더 높습니다.
표본: 250.5, 252.1, 249.8, 255.3, 254.7, 251.9, 253.2, 256.0s² ≈ 5.108일간의 주식 종가입니다. 평균 ≈ 252.94, s ≈ 2.26. 분산이 낮아 가격이 매우 좁게 모여 있습니다.

분산 계산기 사용 방법

  1. 데이터 입력란에 숫자를 입력하거나 붙여넣습니다. 쉼표, 공백, 줄바꿈으로 구분할 수 있습니다.
  2. 더 큰 모집단의 일부라면 ‘표본’을, 전체 구성원을 모두 포함하면 ‘모집단’을 선택하세요.
  3. 계산을 클릭하면 분산, 표준편차, 평균, 중앙값, 최빈값, IQR, 범위를 계산합니다.
  4. 분산 행에서 제곱된 퍼짐을, 표준편차 행에서 같은 퍼짐을 원래 단위로 확인하세요.
  5. 초기화를 클릭해 모든 입력을 지우고 새 계산을 시작하거나, 예시를 불러와 완성된 데이터셋을 확인하세요.

분산 계산기 FAQ

분산이란 무엇이며 무엇을 측정하나요?
분산은 숫자 집합이 평균 주변에서 얼마나 퍼져 있는지를 측정합니다. 각 값과 평균의 차이를 제곱한 값들의 평균으로 계산합니다. 분산이 높을수록 산포가 크고, 분산이 0이면 모든 값이 같습니다.
표본 분산과 모집단 분산의 차이는 무엇인가요?
모집단 분산은 n으로 나누며, 데이터가 그룹 전체를 포함할 때 사용합니다. 표본 분산은 n − 1로 나누는 베셀 보정을 사용하며, 더 큰 모집단에서 추출한 일부 데이터에 사용합니다. 이 보정은 실제 모집단의 퍼짐을 과소평가하지 않도록 합니다.
분산과 표준편차는 어떤 관계인가요?
표준편차는 분산의 제곱근입니다. 분산은 제곱 단위(예: 제곱 달러, 제곱 킬로그램)라서 바로 해석하기 어렵습니다. 제곱근을 취하면 원래 단위로 돌아가므로 대부분의 비교에서 표준편차가 더 직관적입니다.
언제 분산을 표준편차 대신 보고해야 하나요?
이론 연구나 ANOVA, 회귀, 포트폴리오 이론처럼 가법성이 중요한 기법에서는 분산이 선호됩니다. 독립변수 합의 분산은 각 분산의 합과 같기 때문입니다. 일반 대상에게 퍼짐을 설명할 때는 데이터와 같은 단위를 쓰는 표준편차가 더 적합합니다.
높거나 낮은 IQR은 무엇을 의미하나요?
IQR은 데이터 중간 50%의 범위입니다. IQR이 작으면 중심값이 촘촘하게 모여 있다는 뜻이고, 크면 더 퍼져 있다는 뜻입니다. 극단적 이상치를 무시하므로 분산과 표준편차보다 더 견고합니다.
분산이 음수가 될 수 있나요?
아니요. 분산은 제곱 항의 합을 양수로 나누는 값이므로 항상 0 이상입니다. 분산이 0이면 데이터셋의 모든 값이 같습니다. 어디선가 음수가 보인다면 계산 오류입니다.