计算器仍会给出结果，但当 np < 10 或 n(1–p) < 10 时，会提示正态性条件未通过。对于极端比例（例如 p = 0.02 或 p = 0.98），抽样分布会偏斜，应该使用二项分布来进行准确的概率计算。

二元变量的总体标准差衡量的是单个观测值内部的变异性：σ = √[p(1–p)]。比例的标准误差衡量的是重复抽样时样本比例之间的变异性：σ(p̂) = √[p(1–p)/n]。标准误差会因 1/√n 而更小，反映了多次观测的平均效应。

Question 1

样本比例的标准误差是什么？

Accepted Answer

标准误差就是抽样分布的标准差，用来衡量不同样本之间样本比例的波动程度。它等于 √[p(1–p)/n]。标准误差越小，说明样本比例越紧密地围绕真实总体比例 p 分布。

Question 2

抽样分布什么时候近似正态？

Accepted Answer

当 np ≥ 10 且 n(1–p) ≥ 10 时，正态近似是有效的。如果任一条件不满足，分布就会偏斜，基于正态近似的概率计算也会不准确。这时应使用精确的二项分布来给出概率。

Question 3

增加样本量会如何影响分布？

Accepted Answer

增加 n 会使标准误差按 1/√n 的比例下降，从而让抽样分布变窄。无论样本量多大，均值都仍等于 p。更窄的分布意味着样本比例更有可能接近真实总体比例，使估计和推断更精确。

Question 4

样本比例的 Z 分数为 2 代表什么？

Accepted Answer

Z 分数为 2 表示观测到的样本比例 p̂ 比总体比例 p 高出 2 个标准误差。在正态近似下，纯属随机地观察到这么大或更大的 Z 分数的概率约为 2.3%（单尾）。这属于较强但并非决定性的反对证据，针对假设的总体比例。

Question 5

这个计算器能处理接近 0 或 1 的比例吗？

Accepted Answer

计算器仍会给出结果，但当 np < 10 或 n(1–p) < 10 时，会提示正态性条件未通过。对于极端比例（例如 p = 0.02 或 p = 0.98），抽样分布会偏斜，应该使用二项分布来进行准确的概率计算。

Question 6

比例的标准差和标准误差有什么区别？

Accepted Answer

二元变量的总体标准差衡量的是单个观测值内部的变异性：σ = √[p(1–p)]。比例的标准误差衡量的是重复抽样时样本比例之间的变异性：σ(p̂) = √[p(1–p)/n]。标准误差会因 1/√n 而更小，反映了多次观测的平均效应。

参数	关键结果	说明
p=0.60, n=100, p̂=0.65	μ=0.60, σ=0.049, Z=1.02, P(<0.65)≈0.846	满足正态性条件（np=60，n(1-p)=40）。观测到的 65% 比总体比例高约 1 个标准误差。
p=0.50, n=400, p̂=0.53	μ=0.50, σ=0.025, Z=1.20, P(<0.53)≈0.885	更大的样本提高了精度。样本量四倍时，标准误差减半，因此更容易发现相对 0.50 的偏离。
p=0.05, n=50	μ=0.05, σ=0.031, 正态性未通过	np=2.5 < 10，因此正态性条件不成立。对于比例很小且样本很少的情况，应改用精确的二项分布。

样本比例抽样分布计算器

关于样本比例的抽样分布