Question 1

분산이란 무엇이며 무엇을 측정하나요?

Accepted Answer

분산은 숫자 집합이 평균 주변에서 얼마나 퍼져 있는지를 측정합니다. 각 값과 평균의 차이를 제곱한 값들의 평균으로 계산합니다. 분산이 높을수록 산포가 크고, 분산이 0이면 모든 값이 같습니다.

Question 2

표본 분산과 모집단 분산의 차이는 무엇인가요?

Accepted Answer

모집단 분산은 n으로 나누며, 데이터가 그룹 전체를 포함할 때 사용합니다. 표본 분산은 n − 1로 나누는 베셀 보정을 사용하며, 더 큰 모집단에서 추출한 일부 데이터에 사용합니다. 이 보정은 실제 모집단의 퍼짐을 과소평가하지 않도록 합니다.

Question 3

분산과 표준편차는 어떤 관계인가요?

Accepted Answer

표준편차는 분산의 제곱근입니다. 분산은 제곱 단위(예: 제곱 달러, 제곱 킬로그램)라서 바로 해석하기 어렵습니다. 제곱근을 취하면 원래 단위로 돌아가므로 대부분의 비교에서 표준편차가 더 직관적입니다.

Question 4

언제 분산을 표준편차 대신 보고해야 하나요?

Accepted Answer

이론 연구나 ANOVA, 회귀, 포트폴리오 이론처럼 가법성이 중요한 기법에서는 분산이 선호됩니다. 독립변수 합의 분산은 각 분산의 합과 같기 때문입니다. 일반 대상에게 퍼짐을 설명할 때는 데이터와 같은 단위를 쓰는 표준편차가 더 적합합니다.

Question 5

높거나 낮은 IQR은 무엇을 의미하나요?

Accepted Answer

IQR은 데이터 중간 50%의 범위입니다. IQR이 작으면 중심값이 촘촘하게 모여 있다는 뜻이고, 크면 더 퍼져 있다는 뜻입니다. 극단적 이상치를 무시하므로 분산과 표준편차보다 더 견고합니다.

Question 6

분산이 음수가 될 수 있나요?

Accepted Answer

아니요. 분산은 제곱 항의 합을 양수로 나누는 값이므로 항상 0 이상입니다. 분산이 0이면 데이터셋의 모든 값이 같습니다. 어디선가 음수가 보인다면 계산 오류입니다.

데이터셋	분산	세부 정보
표본: 85, 92, 78, 88, 95, 81, 74	s² ≈ 57.24	학생 7명의 시험 점수입니다. 평균 ≈ 84.71, s ≈ 7.57. 평균 주위의 퍼짐이 중간 정도입니다.
모집단: 25, 32, 28, 45, 38, 29, 33, 51	σ² ≈ 70.36	한 부서의 직원 8명 전체 연령입니다. 평균 = 35.125, σ ≈ 8.39. 45와 51의 이상치 때문에 분산이 더 높습니다.
표본: 250.5, 252.1, 249.8, 255.3, 254.7, 251.9, 253.2, 256.0	s² ≈ 5.10	8일간의 주식 종가입니다. 평균 ≈ 252.94, s ≈ 2.26. 분산이 낮아 가격이 매우 좁게 모여 있습니다.

분산 계산기 - 표본 및 모집단 분산

분산 계산기에 대해