Wilcoxon符号秩检验计算器 - 配对样本
使用非参数Wilcoxon符号秩检验比较两个相关样本或重复测量。无需假设正态分布,即可得到W统计量、Z分数和p值。
请输入成对的前后测量值,使用英文逗号分隔。两个样本必须包含相同数量的数值。
Wilcoxon符号秩检验计算器 - 配对样本
使用非参数Wilcoxon符号秩检验比较两个相关样本或重复测量。无需假设正态分布,即可得到W统计量、Z分数和p值。
关于Wilcoxon符号秩检验
Wilcoxon符号秩检验是一种非参数统计假设检验,用于比较两个相关样本或同一组的重复测量。它是配对t检验的非参数对应方法,适用于无法证明配对差值服从正态分布的场景。
该检验由Frank Wilcoxon于1945年提出,在临床试验和行为科学中尤为有用,因为同一批受试者通常会在干预前后被测量。检验不直接使用原始数值,而是先对配对观测值的绝对差进行排序,再分别汇总正差与负差对应的秩。
检验步骤如下:对每一对数据计算差值 d = (after − before)。差值为零的配对会被排除。然后将绝对差从小到大排序,若存在并列,则分配平均秩。正差的秩和记为 W⁺,负差的秩和记为 W⁻。检验统计量 W 取 W⁺ 和 W⁻ 中较小者。
对于较大的样本(通常 n ≥ 10),W 的分布可用正态分布近似。Z分数根据原假设下 W 的均值和标准差计算。均值为 n(n+1)/4,标准差为 √[n(n+1)(2n+1)/24],其中 n 为非零差值的个数。
原假设认为配对观测之间的中位差为零——即处理没有影响。备择假设则认为中位差不为零(双尾),或为正/负(一尾)。本计算器返回双尾 p 值,这是最保守的选择。
通常当 p 值低于 0.05 时,可认为两组配对测量存在显著差异。在血压研究中,这可能表示某种药物显著降低了收缩压;在心理学研究中,则可能说明治疗项目显著降低了焦虑评分。
该检验要求观测值必须成对——样本1中的每个观测都必须对应样本2中的特定观测(例如同一受试者的不同时点,或匹配受试者)。各配对之间必须相互独立,且差值应来自对称分布,但不一定是正态分布。
与配对t检验相比,Wilcoxon符号秩检验对离群值和非正态分布更稳健,但在正态性假设成立时功效略低。对于小样本、有序型结果,或数据中存在极端值的情况,它通常是更推荐的选择。
实用示例
通过这些示例,了解计算器如何处理不同的配对数据集。
| 输入 | 输出 | 说明 |
|---|---|---|
| 治疗前:140,135,150,160,130,145,155,138,148,152 — 治疗后:132,130,142,151,125,137,145,130,140,148 | W=0, Z≈−2.80, p≈0.005 | 血压药物——所有差值均为负,显著下降。 |
| 治疗前:8,7,6,9,8,7,8,9 — 治疗后:6,5,5,7,6,6,7,7 | W=0, Z≈−2.52, p≈0.012 | 治疗后的焦虑评分——在α = 0.05水平下显著改善。 |
| 治疗前:75,80,82,79,88,90,76,85,89,92,78,84 — 治疗后:80,85,85,83,90,94,81,88,92,95,81,89 | W=0, Z≈+3.06, p≈0.002 | 学生测试成绩——新教学方法前后提升显著。 |
如何使用计算器
- 在样本1字段中输入治疗前(或基线)测量值,并用逗号分隔。
- 在样本2字段中输入对应的治疗后测量值。两个样本必须具有完全相同的数值数量。
- 点击“计算”即可求出差值、排序,并生成W统计量、Z分数和p值。
- 低于0.05的p值(以红色显示)表示两种条件之间存在统计学显著差异。
- 使用示例按钮可快速载入真实数据集,并用已知结果验证计算器。
常见问题
Wilcoxon符号秩检验与配对t检验有什么区别?
两者都用于比较配对测量,但配对t检验假设差值服从正态分布。Wilcoxon符号秩检验不做此假设,因此更适合小样本、有序数据或存在明显离群值的数据。当正态性成立时,t检验的检验效力略高。
差值为零的配对会怎样处理?
治疗前后数值完全相同(差值 = 0)的配对会从分析中排除。用于计算检验统计量和p值的有效样本量 n 只统计非零差值。这是大多数统计教材推荐的标准做法。
如何处理并列差值?
当多个配对具有相同的绝对差值时,这些值会获得它们本应占据的秩的平均值。例如,三个 |d| = 5 的配对若竞争第4、5、6秩,则每个都取第5秩。这样的中秩修正可保持Z近似的有效性。
为什么这个计算器只提供双尾p值?
双尾检验最保守,也是大多数探索性研究的默认选择。它检验中位差是否在任一方向上等于零。对于有方向性的假设(例如治疗总能改善结果),可以将报告的双尾p值除以2,得到单尾p值。
样本量多大时Z近似才有效?
当 n ≥ 10(移除零差值后)时,W统计量的正态近似通常较可靠。对于更小的样本,应查阅Wilcoxon表中的精确临界值。此计算器使用正态近似,因此在 n < 10 时需谨慎。