样本比例抽样分布计算器

为任意样本比例的抽样分布求出均值、标准误差、正态性条件、Z 分数和累积概率。

输入总体比例 (p) 和样本量 (n)。如需计算对应的 Z 分数与累积概率,可选填具体样本比例 (p̂)。

样本比例抽样分布计算器
为任意样本比例的抽样分布求出均值、标准误差、正态性条件、Z 分数和累积概率。

关于样本比例的抽样分布

样本比例的抽样分布是一种理论分布,用来描述:从总体真实比例为 p 的群体中,抽取所有可能的固定大小 n 的随机样本时,样本比例 (p̂) 可能出现的取值范围。它是推论统计中最基础的概念之一,也是问卷调查方法、假设检验和置信区间构建的重要基础。 抽样分布的均值等于总体比例 p。这体现了无偏性:平均来看,样本比例等于它所估计的参数。抽样分布的标准差称为比例的标准误差,计算公式为 σ(p̂) = √[p(1–p)/n]。随着样本量 n 增大,标准误差会减小,这意味着更大的样本会让样本比例更紧密地聚集在真实值 p 附近。 根据中心极限定理,只要满足两个条件,抽样分布就可以近似看作正态分布:np ≥ 10 且 n(1–p) ≥ 10。这两个条件可确保样本中的“成功”和“失败”数量都足够大,从而让正态近似更可靠。当其中一个或两个条件不满足时——通常出现在样本很小或比例接近 0 或 1 的极端情形——应改用二项分布。 当输入一个具体观测到的样本比例 p̂ 时,计算器会计算 Z 分数,用于衡量 p̂ 距离均值有多少个标准误差:Z = (p̂ – p) / σ(p̂)。绝对值较大的 Z 分数说明,在给定总体比例的假设下,观测到的样本比例不太可能只是随机产生的,这也是假设检验的基础。 累积概率 P(p̂ < x) 表示:在总体指定、样本量为 n 的随机样本中,观测到小于或等于 x 的样本比例的概率。互补概率 P(p̂ > x) 则表示观测到大于 x 的比例的概率。结合这两个值,你可以判断自己的观测样本比例相对于理论分布有多极端。 这个概念广泛用于民调(估计候选人的真实支持率是否高于某个阈值)、质量控制(判断某批次缺陷率是否超过可接受标准)以及医学研究(评估患者对治疗的响应比例是否不同于历史基准)。

样本分布示例

三个场景演示均值、标准误差、正态性检验和 Z 分数的计算。

参数关键结果说明
p=0.60, n=100, p̂=0.65μ=0.60, σ=0.049, Z=1.02, P(<0.65)≈0.846满足正态性条件(np=60,n(1-p)=40)。观测到的 65% 比总体比例高约 1 个标准误差。
p=0.50, n=400, p̂=0.53μ=0.50, σ=0.025, Z=1.20, P(<0.53)≈0.885更大的样本提高了精度。样本量四倍时,标准误差减半,因此更容易发现相对 0.50 的偏离。
p=0.05, n=50μ=0.05, σ=0.031, 正态性未通过np=2.5 < 10,因此正态性条件不成立。对于比例很小且样本很少的情况,应改用精确的二项分布。

如何使用样本比例分布计算器

  1. 输入总体比例 (p),格式为 0 到 1 之间的十进制小数(不含端点)。这代表总体中已知或假设的真实比例。
  2. 输入样本量 (n),必须为正整数。它决定标准误差,并影响是否满足正态性条件。
  3. 如有需要,可输入样本比例 (p̂),以计算 Z 分数以及累积概率 P(p̂ < x) 和 P(p̂ > x)。
  4. 点击“计算”即可查看均值、标准误差、正态性检验结果,以及(如已提供 p̂)Z 分数和概率输出。
  5. 点击“重置”可清空所有字段并重新开始计算。

比例抽样分布常见问题

样本比例的标准误差是什么?
标准误差就是抽样分布的标准差,用来衡量不同样本之间样本比例的波动程度。它等于 √[p(1–p)/n]。标准误差越小,说明样本比例越紧密地围绕真实总体比例 p 分布。
抽样分布什么时候近似正态?
当 np ≥ 10 且 n(1–p) ≥ 10 时,正态近似是有效的。如果任一条件不满足,分布就会偏斜,基于正态近似的概率计算也会不准确。这时应使用精确的二项分布来给出概率。
增加样本量会如何影响分布?
增加 n 会使标准误差按 1/√n 的比例下降,从而让抽样分布变窄。无论样本量多大,均值都仍等于 p。更窄的分布意味着样本比例更有可能接近真实总体比例,使估计和推断更精确。
样本比例的 Z 分数为 2 代表什么?
Z 分数为 2 表示观测到的样本比例 p̂ 比总体比例 p 高出 2 个标准误差。在正态近似下,纯属随机地观察到这么大或更大的 Z 分数的概率约为 2.3%(单尾)。这属于较强但并非决定性的反对证据,针对假设的总体比例。
这个计算器能处理接近 0 或 1 的比例吗?
计算器仍会给出结果,但当 np < 10 或 n(1–p) < 10 时,会提示正态性条件未通过。对于极端比例(例如 p = 0.02 或 p = 0.98),抽样分布会偏斜,应该使用二项分布来进行准确的概率计算。
比例的标准差和标准误差有什么区别?
二元变量的总体标准差衡量的是单个观测值内部的变异性:σ = √[p(1–p)]。比例的标准误差衡量的是重复抽样时样本比例之间的变异性:σ(p̂) = √[p(1–p)/n]。标准误差会因 1/√n 而更小,反映了多次观测的平均效应。