Калькулятор хи-квадрат с поправкой Йейтса
Вычисляет хи-квадрат со поправкой Йейтса для таблиц сопряжённости 2×2. Снижает ошибку I рода при малых ожидаемых частотах.
Введите четыре значения ячеек (a, b, c, d) из таблицы сопряжённости 2×2, чтобы вычислить скорректированное по Йейтсу значение χ² и p-значение.
Калькулятор хи-квадрат с поправкой Йейтса
Вычисляет хи-квадрат со поправкой Йейтса для таблиц сопряжённости 2×2. Снижает ошибку I рода при малых ожидаемых частотах.
Введите частоты для таблицы сопряжённости 2×2: группа A в строках, результат 1/2 в столбцах.
О поправке Йейтса на непрерывность
Поправка Йейтса на непрерывность — это корректировка, применяемая к критерию хи-квадрат (χ²) при использовании таблицы сопряжённости 2×2. Распределение хи-квадрат является непрерывным, а наблюдаемые частоты в таблице сопряжённости — это дискретные счёты. Из-за этого приближение хи-квадрат склонно завышать статистику критерия, что приводит к слишком маленьким p-значениям и повышает риск ошибки I рода — особенно при малом объёме выборки или малых ожидаемых частотах.
Фрэнк Йейтс предложил эту поправку в 1934 году. Идея проста: вычесть 0.5 из абсолютной разницы между каждой наблюдаемой и ожидаемой частотой перед возведением в квадрат. Скорректированная формула: χ² = Σ (|O − E| − 0.5)² / E, суммирование идёт по всем четырём ячейкам. Эта небольшая корректировка уменьшает итоговое значение хи-квадрат и даёт более консервативное (большее) p-значение, которое лучше отражает реальную вероятность наблюдаемого или ещё более экстремального результата.
Коррекция особенно важна, когда любая ожидаемая частота меньше 10, а особенно меньше 5. В таких условиях стандартный критерий хи-квадрат считается ненадёжным, и поправка Йейтса помогает компенсировать это. Для больших выборок, где все ожидаемые частоты превышают 10, влияние поправки минимально и стандартного критерия хи-квадрат достаточно.
Чтобы воспользоваться калькулятором, нужно представить данные в виде таблицы сопряжённости 2×2. Две строки соответствуют двум группам (например, лечение и контроль), а два столбца — двум возможным исходам (например, успех и неудача). Ячейка a — это число участников группы A с исходом 1, ячейка b — группа A с исходом 2, ячейка c — группа B с исходом 1, а ячейка d — группа B с исходом 2.
Степени свободы для таблицы 2×2 всегда равны 1. p-значение вычисляется по распределению хи-квадрат с 1 степенью свободы. Значение p ниже 0.05 обычно интерпретируется как свидетельство статистически значимой связи между принадлежностью к группе и исходом.
В статистике продолжаются споры о том, когда следует использовать поправку Йейтса. Некоторые статистики считают, что она чрезмерно корректирует результат и снижает статистическую мощность. Альтернатива, которую многие современные статистики предпочитают для очень малых ожидаемых частот, — точный критерий Фишера, который вычисляет точную вероятность без опоры на приближение хи-квадрат. Тем не менее поправка Йейтса по-прежнему широко преподаётся и принимается во многих дисциплинах; это подходящий выбор, когда нужен быстрый и консервативный результат для таблицы 2×2.
Практические примеры
Изучите разные сценарии, чтобы понять, как работает калькулятор.
| Ввод (a, b, c, d) | χ² / p-значение | Примечание |
|---|---|---|
| a=3, b=22, c=11, d=14 | χ²≈4.86, p≈0.027 | Испытание вакцины — значимо; вакцина снижает уровень заражения. |
| a=15, b=5, c=8, d=12 | χ²≈3.68, p≈0.055 | Метод обучения — погранично, незначимо при α=0.05. |
| a=25, b=975, c=15, d=985 | χ²≈2.07, p≈0.151 | A/B-тест рекламы — значимой разницы в CTR нет. |
| a=1, b=49, c=6, d=44 | χ²≈2.48, p≈0.115 | Исследование редкого побочного эффекта — здесь поправка Йейтса обязательна из-за малых чисел в ячейках. |
Как пользоваться калькулятором
- Расположите данные в таблице 2×2: группа A в первой строке, группа B во второй, результат 1 в первом столбце, результат 2 во втором.
- Введите число для ячейки a (группа A, результат 1) в первое поле, а для ячейки b (группа A, результат 2) — во второе.
- Введите число для ячейки c (группа B, результат 1) и d (группа B, результат 2) в оставшиеся поля. Все значения должны быть неотрицательными целыми числами.
- Нажмите «Вычислить», чтобы увидеть скорректированное по Йейтсу значение χ², степени свободы (всегда 1), p-значение и решение о значимости.
- Используйте кнопки примеров, чтобы загрузить готовые данные и проверить результат или изучить распространённые случаи.
Часто задаваемые вопросы
Что такое поправка Йейтса на непрерывность?
Поправка Йейтса — это корректировка стандартной формулы хи-квадрат для таблиц 2×2. Из абсолютной разницы между наблюдаемыми и ожидаемыми частотами вычитается 0.5 перед возведением в квадрат. Это делает критерий более консервативным и снижает риск ложноположительного результата (ошибки I рода) при малом объёме выборки или малых ожидаемых частотах.
Когда использовать поправку Йейтса вместо стандартного критерия хи-квадрат?
Используйте поправку Йейтса, когда любая ожидаемая частота меньше 10. Стандартный критерий хи-квадрат подходит, если все ожидаемые частоты не меньше 10. Для очень маленьких выборок, где любая ожидаемая частота меньше 5, стоит рассмотреть точный критерий Фишера, поскольку в этом случае он ещё надёжнее.
Что означают ячейки a, b, c и d?
Ячейка a — это число участников группы A с исходом 1. Ячейка b — число участников группы A с исходом 2. Ячейка c — число участников группы B с исходом 1. Ячейка d — число участников группы B с исходом 2. В исследовании вакцины группа A может означать привитых, группа B — непривитых, исход 1 — заражение, а исход 2 — отсутствие заражения.
Почему степень свободы для таблицы 2×2 всегда равна 1?
Степени свободы для критерия хи-квадрат независимости равны (число строк − 1) × (число столбцов − 1). Для таблицы 2×2 это (2−1) × (2−1) = 1. Это означает, что после того как известны маргинальные суммы и значение одной ячейки, все остальные значения полностью определены, и остаётся только один свободный параметр.
Снижает ли поправка Йейтса статистическую мощность?
Да, более консервативный критерий требует более сильных доказательств для отклонения нулевой гипотезы. Критики утверждают, что поправка Йейтса может чрезмерно корректировать результат и повышать риск ошибки II рода (пропустить реальный эффект). При больших выборках с высокими ожидаемыми частотами влияние поправки пренебрежимо мало. Многие современные статистики предпочитают точный критерий Фишера для малых 2×2-анализов.
Можно ли использовать этот калькулятор для таблиц больше 2×2?
Нет. Поправка Йейтса специально предназначена для таблиц сопряжённости 2×2. Для больших таблиц, например 3×2 или 3×3, используйте стандартный критерий хи-квадрат Пирсона без поправки на непрерывность. Формула и степени свободы там другие.