样本量计算器 - 科克伦公式

计算可靠调查或研究所需的最小样本量。设置置信水平、误差范围和总体比例,即可立即得到结果。

选择置信水平,输入百分比形式的误差范围,设置预期总体比例(如不确定可使用 0.5),并可选填总体规模以应用有限总体修正。

样本量计算器 - 科克伦公式
计算可靠调查或研究所需的最小样本量。设置置信水平、误差范围和总体比例,即可立即得到结果。

关于样本量计算器

样本量确定是设计任何调查、实验或观察性研究时最重要的步骤之一。选择合适的参与者数量,既能确保结果具有统计意义,也能更高效地使用资源。 本计算器采用科克伦公式,这是在总体较大或未知时估算所需样本量的行业标准方法。公式为:n = Z² × p × (1 – p) / E²,其中 Z 是对应目标置信水平的 Z 分数,p 是估计总体比例,E 是可接受的误差范围(以小数表示)。 置信水平反映了你希望样本结果落在所述误差范围内的把握程度。95% 置信水平是社会科学和市场研究中最常见的选择,对应的 Z 分数为 1.96。这意味着如果你重复调查 100 次,真实总体值大约会有 95 次落在你的误差范围内。 误差范围定义了估计值周围的不确定区间宽度。±5% 的误差范围表示,观测到的比例可能比真实总体比例高或低 5 个百分点。更小的误差范围需要更大的样本量。由于公式中包含 E²,将误差范围减半,所需样本量大约会增加四倍。 总体比例 p 决定了公式中的方差。将 p 设为 0.5 会使 p(1 – p) 达到最大值 0.25,因此得到最保守(也就是最大的)样本量估计。这是在没有先验信息时的标准建议。如果你已有可靠的历史研究结果,也可以用该 p 值来降低所需样本量。 当总体规模 N 相对于所需样本较小时(具体而言,当 n 超过 N 的 5% 时),应应用有限总体修正(FPC):n_adj = n / (1 + (n – 1) / N)。这种调整会降低所需样本量,因为此时被测量的总体占比更大。 在实际操作中,建议为无应答、数据质量问题和脱落率预留缓冲。常见做法是用预期回应率去除目标样本量。例如,如果计算得到 n = 385,但预计回应率只有 70%,则至少应联系 385 / 0.70 ≈ 550 名潜在受访者。

样本量计算示例

三个常见场景,展示置信水平、误差范围和总体规模如何影响所需样本量。

参数样本量说明
95% CL, ±5% MoE, p=0.5, infinite population385经典经验法则样本量。适用于全国民调和总体规模非常大的大规模调查。
95% CL, ±3% MoE, p=0.5, infinite population1,068将误差范围从 5% 收紧到 3%,由于 E² 的关系,所需样本量会增加到原来的两倍以上。
95% CL, ±5% MoE, p=0.5, N=500218有限总体修正将样本量从 385 降至 218,因为样本已经占总体的很大一部分。

如何使用样本量计算器

  1. 从下拉菜单中选择所需的置信水平(80%、85%、90%、95% 或 99%)。对于大多数调查,95% 是标准选择。
  2. 输入误差范围,单位为百分比。输入 5 表示 ±5%。数值越小,精度越高,但所需样本也越大。
  3. 输入预期总体比例,范围为 0 到 1 之间的小数。如果不确定,请使用 0.5,它会给出最大(也最保守)的样本量估计。
  4. 如果你的总体较小且有限,可以选填总体规模。若总体很大或未知,则留空即可。
  5. 点击“计算”查看建议的最小样本量。点击“重置”清除所有字段并重新开始。

样本量计算器常见问题

为什么在不确定时建议使用 0.5 作为比例?
当 p = 0.5 时,表达式 p(1 – p) 达到最大值 0.25。使用 0.5 可以确保在给定置信水平和误差范围下,公式会产生尽可能大的样本量,从而得到保守估计,并保证无论真实比例是多少都足够使用。
95% 置信水平是什么意思?
95% 置信水平表示,如果你多次重复抽样过程,生成的置信区间中有 95% 会包含真实总体参数。它并不意味着真实值有 95% 的概率落在某个特定的计算区间内。
总体规模如何影响所需样本量?
对于大型总体,所需样本量几乎与总体规模无关——对 3 亿人口的国家做 385 人的调查,在统计意义上与对 10 万人口的城市做同样的调查并无差别。只有当所需样本超过总体总量的 5% 时,有限总体修正才会带来有意义的变化。
误差范围与样本量之间是什么关系?
误差范围在科克伦公式中位于分母的 E² 项,因此二者呈反平方关系:将误差范围减半,所需受访者数量大约会增加四倍。这也是为什么要达到非常高的精度(例如 ±1%)在样本量上会非常昂贵。
是否应该为无应答额外增加受访者?
是的。计算出的样本量是所需完成并可用的有效答卷数量。为了考虑无应答,应将该数字除以预期回应率。如果你预计回应率为 60%,而需要 385 份完成问卷,则至少应联系 385 / 0.60 ≈ 642 名潜在受访者。
这个计算器可以用于 A/B 测试吗?
这里实现的科克伦公式主要用于调查研究中的比例估计。对于 A/B 测试,你还需要指定最小可检测效应和统计功效(通常为 80%)。专门的 A/B 测试样本量计算器会使用略有不同的公式,因此更适合该场景。