Yates 连续性校正卡方计算器

计算 2×2 列联表的 Yates 校正卡方统计量。在期望格频数较小时降低第一类错误。

输入 2×2 列联表中的四个格子计数(a、b、c、d),即可计算 Yates 校正后的 χ² 值和 p 值。

Yates 连续性校正卡方计算器
计算 2×2 列联表的 Yates 校正卡方统计量。在期望格频数较小时降低第一类错误。

请输入 2×2 列联表的计数:A 组在行,结果 1/2 在列。

关于 Yates 连续性校正

Yates 连续性校正是在 2×2 列联表中使用卡方(χ²)检验时的一种调整。卡方分布是连续的,而列联表中的观测频数是离散计数。这种差异会使卡方近似高估检验统计量,导致 p 值偏小,并增加第一类错误的风险——尤其是在样本量或期望格频数较小时。 Frank Yates 于 1934 年提出了这一校正。方法很简单:先取观测频数与期望频数之差的绝对值,再减去 0.5,然后平方。校正后的公式为 χ² = Σ (|O − E| − 0.5)² / E,对全部四个格子求和。这个小调整会降低总体卡方值,得到更保守(更大)的 p 值,更好地反映观测结果或更极端结果的真实概率。 当任何期望格频数低于 10,尤其低于 5 时,这种校正尤为重要。在这些情况下,标准卡方检验已知不够可靠,而 Yates 校正有助于补偿。对于较大的样本,如果所有期望频数都超过 10,校正的影响很小,标准卡方检验通常已足够。 使用计算器时,需要把数据整理成 2×2 列联表。两行代表两组(例如治疗组与对照组),两列代表两种可能结果(例如成功与失败)。a 为 A 组且结果 1 的人数,b 为 A 组且结果 2 的人数,c 为 B 组且结果 1 的人数,d 为 B 组且结果 2 的人数。 2×2 表的自由度始终为 1。p 值依据自由度为 1 的卡方分布计算。通常 p 值低于 0.05 会被解释为组别与结果之间存在统计学显著关联的证据。 统计学界对于何时使用 Yates 校正一直存在争论。有些统计学家认为它会过度校正并降低统计功效。许多现代统计学家在期望频数极小的情况下更偏好 Fisher 精确检验,因为它无需依赖卡方近似即可计算精确概率。不过,Yates 校正仍被广泛教授并在许多学科中被接受;当你需要 2×2 表的快速、保守结果时,它是合适的选择。

实用示例

查看不同场景,了解计算器的工作方式。

输入(a, b, c, d)χ² / p 值备注
a=3, b=22, c=11, d=14χ²≈4.86, p≈0.027疫苗试验——结果显著;疫苗可降低感染率。
a=15, b=5, c=8, d=12χ²≈3.68, p≈0.055教学方法——接近临界,在 α=0.05 下不显著。
a=25, b=975, c=15, d=985χ²≈2.07, p≈0.151A/B 广告测试——点击率无显著差异。
a=1, b=49, c=6, d=44χ²≈2.48, p≈0.115罕见副作用研究——由于格子计数较低,这里必须使用 Yates 校正。

如何使用计算器

  1. 将数据整理为 2×2 表:A 组放在第一行,B 组放在第二行,结果 1 放在第一列,结果 2 放在第二列。
  2. 在第一个输入框中输入单元格 a(A 组,结果 1)的计数,第二个输入框中输入 b(A 组,结果 2)的计数。
  3. 在剩余输入框中输入单元格 c(B 组,结果 1)和 d(B 组,结果 2)的计数。所有值都必须是非负整数。
  4. 点击“计算”即可查看 Yates 校正后的 χ² 值、自由度(始终为 1)、p 值以及显著性判断。
  5. 使用示例按钮加载预设数据,验证结果或探索常见用例。

常见问题

什么是 Yates 连续性校正?
Yates 连续性校正是对 2×2 表标准卡方公式的一种调整。它会先从观测频数与期望频数的绝对差中减去 0.5,再进行平方运算。这样做会让检验更保守,在样本量或期望格频数较小时,可降低假阳性(第一类错误)的风险。
什么时候该使用 Yates 校正,而不是标准卡方检验?
当任何期望格频数低于 10 时,应使用 Yates 校正。若所有期望频数都至少为 10,则标准卡方检验就足够了。对于任何期望频数低于 5 的极小样本,建议改用 Fisher 精确检验,因为在这种情况下它更可靠。
a、b、c、d 分别代表什么?
a 是 A 组中出现结果 1 的人数,b 是 A 组中出现结果 2 的人数,c 是 B 组中出现结果 1 的人数,d 是 B 组中出现结果 2 的人数。以疫苗研究为例,A 组可表示接种者,B 组表示未接种者,结果 1 表示感染,结果 2 表示未感染。
为什么 2×2 表的自由度总是 1?
卡方独立性检验的自由度等于(行数 − 1)×(列数 − 1)。对于 2×2 表,就是(2−1)×(2−1)= 1。这意味着一旦知道边际总数和一个单元格的值,其他所有单元格都被完全确定,只剩一个自由参数。
Yates 校正会降低统计功效吗?
会。让检验更保守意味着需要更强的证据才能拒绝原假设。批评者认为 Yates 校正可能过度校正,从而增加第二类错误(漏掉真实效应)的风险。对于期望计数较高的大样本,校正影响可以忽略。许多现代统计学家在小样本 2×2 分析中更偏好 Fisher 精确检验。
我可以把这个计算器用于大于 2×2 的表吗?
不可以。Yates 校正专门用于 2×2 列联表。对于更大的表(例如 3×2 或 3×3),应使用不带连续性校正的标准 Pearson 卡方检验。更大表的公式和自由度都不同。