標本平均のサンプリング分布計算機
中心極限定理で標本平均の確率を計算 — 標準誤差、zスコア、正確な確率を数秒で求めます。
母平均、標準偏差、標本サイズを入力し、確率の種類を選んで標本平均の値を指定すると、すぐに結果が表示されます。
標本平均のサンプリング分布計算機
中心極限定理で標本平均の確率を計算 — 標準誤差、zスコア、正確な確率を数秒で求めます。
標本平均が与えられた値 x₁ より小さくなる確率を計算します。
標本平均のサンプリング分布計算機について
標本平均のサンプリング分布とは、同じ母集団から同じサイズの標本を何度も無作為抽出したとき、標本平均が各標本ごとにどう変動するかを表すものです。これは推測統計で最も重要な概念のひとつで、信頼区間、仮説検定、品質管理図など、ほぼすべての科学・産業分野の理論的基盤になっています。
この分布を実用的にするのが中心極限定理(CLT)です。CLT は、母集団分布の形に関係なく、標本サイズ n が大きくなるにつれて標本平均のサンプリング分布が正規分布に近づくと述べます。実務上は、標本サイズが 30 以上あれば近似は非常に良好であることが多いです。母集団がもともと正規分布であれば、標本サイズの大小にかかわらずこの結果が成り立ちます。
平均の標準誤差(SE)は、サンプリング分布の広がりを表します。SE は母標準偏差 σ を n の平方根で割ったもので、SE = σ / √n です。標本サイズが大きいほど SE は小さくなり、より大きな標本ほど母平均の推定が正確になることを意味します。標本サイズを 2 倍にすると標準誤差が 1/√2 になる理由や、研究者が不確実性を減らすためにより多くのデータを集める理由はここにあります。
標準誤差がわかれば、任意の標本平均 x̄ は z = (x̄ − μ) / SE によって z スコアへ変換できます。z スコアは、x̄ が真の母平均 μ から標準誤差で何個分離れているかを示します。サンプリング分布が(近似的に)正規分布であるため、標準正規表、またはその数学的表現である Φ(z) を使えば、標本平均が指定値より下か上か、あるいはその間に入る確率を正確に求められます。
この計算機は 3 種類の確率に対応しています。1 つ目の P(X̄ < x) は、サイズ n の無作為標本の平均が x 未満になる左側確率です。2 つ目の P(X̄ > x) は右側(上側)確率です。3 つ目の P(x₁ < X̄ < x₂) は、標本平均が 2 つの指定値の間に入る確率で、2 つの累積正規確率の差として計算されます。
実用例はあらゆる分野にあります。品質技術者は部品ロットの平均寸法が公差外かを監視します。栄養士は抽出した集団の平均カロリー摂取量が既知の平均から妥当かを確認します。金融アナリストは四半期の平均日次リターンが閾値を超える確率を見積もります。臨床研究者は、標本の平均血圧低下が真の集団効果を反映しているかを判断します。どのケースでも、この計算機は 1 回の計算で確率を答えます。
サンプリング分布の例
サンプリング分布計算機の使い方を示す実例です。
| シナリオ | 確率 | 解釈 |
|---|---|---|
| μ=80, σ=10, n=30, P(X̄ < 78) | ≈ 13.6% | 試験の点数:真の平均が 80 のとき、30 人のクラス平均が 78 を下回る確率は約 14% です。 |
| μ=1000, σ=50, n=40, P(X̄ > 1010) | ≈ 10.3% | 電球の寿命:40 個の電球の平均寿命が 1010 時間を超える確率は約 10% です。 |
| μ=3, σ=0.5, n=50, P(2.9 < X̄ < 3.1) | ≈ 84.3% | コーヒーカップ量:標本平均が母平均から 0.1 杯以内に収まる確率は約 84% です。 |
| μ=0.05, σ=1, n=100, P(X̄ < 0) | ≈ 30.9% | 株式リターン:真の平均が 0.05% のとき、100 日平均リターンがマイナスになる確率は約 31% です。 |
サンプリング分布計算機の使い方
- 母平均 (μ) を入力します。母集団全体の既知または想定される平均値です。
- 母標準偏差 (σ) を入力します。正の数である必要があります。
- 標本サイズ (n) を入力します。各標本の観測数で、整数かつ 2 以上である必要があります。
- 確率の種類を選びます。P(X̄ < x) は左側、P(X̄ > x) は右側、P(x₁ < X̄ < x₂) は区間確率です。
- 標本平均の値を入力して計算を押すと、標準誤差、z スコア、正確な確率が表示されます。
サンプリング分布 FAQ
標本平均のサンプリング分布とは何ですか?
母集団からサイズ n の無作為標本を繰り返し抽出したときに得られる、すべての可能な標本平均の確率分布です。中心極限定理により、n が大きい場合はこの分布が近似的に正規分布となり、平均は母平均 μ、標準偏差は標準誤差 SE = σ/√n に等しくなります。
標準誤差とは何ですか? 標準偏差とどう違いますか?
標準偏差 (σ) は、個々のデータが母平均の周りにどれだけ散らばっているかを表します。標準誤差 (SE = σ/√n) は、標本平均が μ の周りにどれだけ散らばるかを表します。n が大きくなるほど SE は小さくなり、平均の推定はより正確になります。
この計算機はいつ使えますか?
母標準偏差 σ がわかっており、標本サイズ n が中心極限定理を適用できるほど十分大きい場合(一般に n ≥ 30)に使えます。母集団が正規分布であれば、任意の n で有効です。σ が不明な場合は、代わりに t 分布を使う必要があります。
ここでの z スコアはどのように計算されますか?
z スコアは z = (x̄ − μ) / SE で計算されます。x̄ は入力した標本平均、μ は母平均、SE = σ/√n です。これは、目標の標本平均が母平均から標準誤差で何個分離れているかを示し、その距離を標準正規表で確率に変換できます。
なぜ標本サイズが大きいほど確率の広がりは小さくなるのですか?
SE = σ/√n なので、n を 2 倍にすると SE は √2 の倍率で小さくなります。SE が小さいほどサンプリング分布は高く細くなり、標本平均は μ の周りにより密集します。その結果、極端な標本平均は起こりにくくなり、信頼区間も短くなります。より多くのデータを集めると推定精度が上がるのはそのためです。
「between」確率モードは何を計算しますか?
between モードは P(x₁ < X̄ < x₂)、つまり無作為標本の平均が x₁ と x₂ の間に厳密に入る確率を計算します。これは Φ(z₂) − Φ(z₁) として求められ、z₁ と z₂ はそれぞれ x₁ と x₂ の z スコアです。標本平均が母平均の周辺の許容範囲に収まるかを確認したいときに便利です。