样本均值抽样分布计算器
使用中心极限定理计算样本均值概率——几秒内得到标准误、z 分数和精确概率。
输入总体均值、标准差和样本量,再选择概率类型并填写样本均值,即可立即得到结果。
样本均值抽样分布计算器
使用中心极限定理计算样本均值概率——几秒内得到标准误、z 分数和精确概率。
计算样本均值小于给定值 x₁ 的概率。
关于样本均值抽样分布计算器
样本均值的抽样分布描述的是:当从同一总体中反复抽取相同样本量的随机样本时,样本均值会如何在不同样本之间波动。它是推断统计中最重要的概念之一,因为几乎所有科学与工业领域中的置信区间、假设检验和质量控制图都建立在这一理论基础之上。
中心极限定理(CLT)让这种分布变得实用。CLT 指出,无论总体分布的形状如何,随着样本量 n 增大,样本均值的抽样分布都会趋近于正态分布。实际上,当样本量达到 30 或更大时,这种近似通常已经非常好。若总体本身就服从正态分布,那么无论样本量多小,这一结论都成立。
均值的标准误(SE)用于衡量抽样分布的离散程度。它等于总体标准差 σ 除以样本量 n 的平方根:SE = σ / √n。样本量越大,SE 越小,这意味着更大的样本能更精确地估计总体均值。这也解释了为什么样本量翻倍会使标准误按 √2 的比例缩小,以及为什么研究者会投入更多数据来减少不确定性。
一旦知道标准误,任何样本均值 x̄ 都可以通过 z = (x̄ − μ) / SE 转换为 z 分数。z 分数表示 x̄ 距离真实总体均值 μ 有多少个标准误。由于抽样分布(近似)服从正态分布,标准正态表——或其数学形式 Φ(z)——就能给出样本均值低于、高于或介于指定值之间的精确概率。
本计算器支持三种概率类型。第一种,P(X̄ < x),给出样本量为 n 的随机样本其均值低于 x 的左尾概率。第二种,P(X̄ > x),给出右尾(上尾)概率。第三种,P(x₁ < X̄ < x₂),给出样本均值介于两个指定值之间的概率,计算方式是两个累积正态概率之差。
它的实际用途遍及各个领域。质量工程师会监控一批零件的平均尺寸是否超出公差;营养师会检查抽样人群的平均热量摄入是否与已知总体均值相符;金融分析师会估计某个季度的平均日收益是否超过阈值;临床研究者会判断样本中的平均降压效果是否反映了真实的人群效应。在这些场景中,这个计算器都能一次计算给出所需概率。
抽样分布示例
以下是真实场景示例,展示如何使用抽样分布计算器。
| 场景 | 概率 | 解释 |
|---|---|---|
| μ=80, σ=10, n=30, P(X̄ < 78) | ≈ 13.6% | 考试成绩:当真实均值为 80 时,30 名学生班级的平均分低于 78 的概率约为 14%。 |
| μ=1000, σ=50, n=40, P(X̄ > 1010) | ≈ 10.3% | 灯泡寿命:40 个灯泡的批次平均寿命超过 1010 小时的概率约为 10%。 |
| μ=3, σ=0.5, n=50, P(2.9 < X̄ < 3.1) | ≈ 84.3% | 咖啡杯量:样本均值落在总体均值上下 0.1 杯以内的概率约为 84%。 |
| μ=0.05, σ=1, n=100, P(X̄ < 0) | ≈ 30.9% | 股票收益:当真实均值为 0.05% 时,100 天平均收益为负的概率约为 31%。 |
如何使用样本均值抽样分布计算器
- 输入总体均值 (μ)——整个总体已知或假定的平均值。
- 输入总体标准差 (σ)——必须为正数。
- 输入样本量 (n)——每个样本中的观测数(整数 ≥ 2)。
- 选择概率类型:P(X̄ < x) 表示左尾,P(X̄ > x) 表示右尾,P(x₁ < X̄ < x₂) 表示区间概率。
- 输入样本均值并点击计算,即可查看标准误、z 分数和精确概率。
抽样分布常见问题
什么是样本均值的抽样分布?
它是指从总体中反复抽取大小为 n 的随机样本时,所有可能样本均值构成的概率分布。中心极限定理保证当 n 足够大时,这个分布近似正态,其均值等于总体均值 μ,标准差等于标准误 SE = σ/√n。
什么是标准误,它和标准差有什么区别?
标准差 (σ) 衡量的是单个数据点围绕总体均值的离散程度。标准误 (SE = σ/√n) 衡量的是样本均值围绕 μ 的离散程度。随着 n 增大,SE 会变小,也就是样本越大,对均值的估计越精确。
什么时候可以使用这个计算器?
只要你知道总体标准差 σ,且样本量 n 足够大到可以应用中心极限定理(通常 n ≥ 30),就可以使用。若总体本身服从正态分布,则任意 n 都适用。若 σ 未知,则应改用 t 分布。
这里的 z 分数是怎么计算的?
z 分数按 z = (x̄ − μ) / SE 计算,其中 x̄ 是你输入的样本均值,μ 是总体均值,SE = σ/√n。它表示目标样本均值距离总体均值有多少个标准误,从而可借助标准正态表把该距离转换为概率。
为什么样本量越大,概率分布越窄?
因为 SE = σ/√n,n 翻倍时 SE 会按 √2 的倍数缩小。更小的 SE 意味着抽样分布更高更窄,样本均值会更紧密地聚集在 μ 附近。因此,极端样本均值出现的概率更低,置信区间也更短,这就是为什么收集更多数据能提高估计精度。
“区间”概率模式计算什么?
区间模式计算 P(x₁ < X̄ < x₂)——随机样本均值严格落在 x₁ 和 x₂ 之间的概率。它的计算方式是 Φ(z₂) − Φ(z₁),其中 z₁ 和 z₂ 分别是 x₁ 与 x₂ 的 z 分数。这个模式适合判断样本均值是否落在总体均值附近的可接受范围内。