Калькулятор теста Вальда - Статистическая значимость

Проведите тест Вальда, чтобы определить, является ли оценка параметра статистически значимой — введите β̂, β₀, SE и α для мгновенного результата.

Введите оценку параметра, гипотезируемое значение, стандартную ошибку и уровень значимости. Калькулятор возвращает статистику Вальда, z-оценку, p-значение и решение.

Калькулятор теста Вальда - Статистическая значимость
Проведите тест Вальда, чтобы определить, является ли оценка параметра статистически значимой — введите β̂, β₀, SE и α для мгновенного результата.

О калькуляторе теста Вальда

Тест Вальда — это параметрический статистический тест, названный в честь статистика Abraham Wald. Он является одним из трёх классических тестов гипотез в методе максимального правдоподобия наряду с тестом отношения правдоподобий и score-тестом (тестом множителя Лагранжа). Тест Вальда наиболее распространён, потому что для него нужны только сама оценка и её стандартная ошибка — обе величины обычно выдаются статистическим ПО — без необходимости полной функции правдоподобия. Идея теста Вальда проста. Если оценка параметра β̂ находится далеко от гипотезируемого значения β₀ относительно своей точности (измеряемой стандартной ошибкой SE), то нулевая гипотеза H₀: β = β₀ маловероятна. Статистика Вальда равна W = ((β̂ − β₀) / SE)², то есть квадрату z-оценки. При нулевой гипотезе и достаточно большом объёме выборки W имеет распределение хи-квадрат с одной степенью свободы. Эквивалентно, знаковая z-оценка z = (β̂ − β₀) / SE имеет стандартное нормальное распределение, поэтому двустороннее p-значение равно 2 · (1 − Φ(|z|)), где Φ — функция распределения стандартного нормального закона. p-значение отвечает на вопрос: если бы нулевая гипотеза была верна, какова вероятность наблюдать статистику не менее экстремальную, чем полученная? Малое p-значение (обычно ниже уровня значимости α, часто 0,05 или 0,01) даёт основания против H₀. Когда p < α, результат называют статистически значимым, и мы отклоняем нулевую гипотезу. Когда p ≥ α, мы не отклоняем её — у нас недостаточно доказательств, чтобы заключить, что параметр отличается от β₀, хотя это не означает, что H₀ истинна. Тест Вальда повсеместно используется в прикладной статистике. В линейной и логистической регрессии t-статистики, публикуемые для каждого коэффициента, по сути являются z-оценками Вальда, а соответствующие p-значения проверяют, отличается ли коэффициент от нуля. В эконометрике тест Вальда применяют для проверки совместных гипотез о нескольких коэффициентах одновременно (с расширениями линейной алгебры). В анализе выживаемости он проверяет, значимо ли ковариата предсказывает риск. В генетике GWAS используют статистики типа Вальда для проверки миллионов однонуклеотидных полиморфизмов. Известное ограничение теста Вальда состоит в том, что он может давать разные результаты в зависимости от параметризации, поскольку опирается на локальную квадратичную аппроксимацию правдоподобия. Для малых выборок часто предпочтительнее тест отношения правдоподобий, так как он точнее. Тест Вальда наиболее надёжен, когда объём выборки велик, оценка примерно нормально распределена (то есть асимптотические условия выполняются), а стандартная ошибка оценена хорошо.

Примеры теста Вальда

Три реалистичных сценария из экономики, медицины и общей статистики, показывающие тест Вальда в действии.

ВводРешениеПодробности
β̂=2.5, β₀=0, SE=1.1, α=0.05Отклонить H₀z = 2.27, W = 5.17, p ≈ 0.023. Оценка находится более чем в 2 стандартных ошибках от нуля, поэтому при α = 0,05 мы отклоняем нулевую гипотезу.
β̂=0.08, β₀=0, SE=0.02, α=0.05Отклонить H₀Коэффициент образования: z = 4.0, p < 0.001. Дополнительный год обучения даёт высоко значимый ненулевой эффект на заработок.
β̂=−0.5, β₀=0, SE=0.2, α=0.01Не отклонить H₀Эффективность препарата при строгом α=0,01: z = −2.5, p ≈ 0.012. Эффект значим при α = 0,05, но не на более строгом 1% пороге.

Как пользоваться калькулятором теста Вальда

  1. Введите оценку параметра β̂ из результатов регрессии или статистической модели.
  2. Введите гипотезируемое значение β₀ — обычно 0, если проверяется, отличается ли коэффициент от нуля.
  3. Введите стандартную ошибку SE оценки, указанную в том же статистическом выводе.
  4. Задайте уровень значимости α — используйте 0,05 для обычного 5% порога или 0,01 для более строгого 1% порога.
  5. Нажмите «Вычислить», чтобы получить статистику Вальда, z-оценку, двустороннее p-значение и решение отклонить/не отклонить.

FAQ по тесту Вальда

Что измеряет тест Вальда?
Тест Вальда измеряет, насколько далеко оценка параметра находится от гипотезируемого значения, в единицах стандартной ошибки. Он проверяет, достаточно ли велико это расстояние, чтобы при заданном уровне значимости сделать вывод, что истинный параметр отличается от гипотезируемого значения.
В чём разница между тестом Вальда и t-тестом?
В больших выборках они по сути эквивалентны — оба сравнивают оценку с нулевым значением в единицах стандартной ошибки. Главное различие в том, что t-тест использует t-распределение (учитывая неопределённость оценки дисперсии), а тест Вальда — нормальное распределение и поэтому является асимптотическим тестом, лучше подходящим для больших выборок.
Почему нулевая гипотеза обычно β₀ = 0?
Проверка относительно нуля отвечает на вопрос, есть ли у предиктора вообще какой-либо эффект. В регрессии коэффициент, равный нулю, означает, что переменная несущественна. β₀ = 0 — самый распространённый случай, но можно проверять любое значение, например соответствует ли параметр теоретически ожидаемому значению 1 или −0.5.
Что означает не отклонить H₀?
Не отклонить H₀ означает, что данные не дают достаточно доказательств, чтобы заключить, что параметр отличается от гипотезируемого значения. Это не доказывает, что H₀ истинна. Результат может отражать реально нулевой эффект или просто недостаточную статистическую мощность из-за малого объёма выборки или большой стандартной ошибки.
Когда лучше использовать тест отношения правдоподобий?
Тест отношения правдоподобий предпочтителен, когда выборки малы, когда параметр близок к границе допустимого диапазона или когда результаты теста Вальда сильно зависят от выбранной параметризации. При больших выборках и плавно распределённых оценках тест Вальда и тест отношения правдоподобий дают почти одинаковые p-значения.
Какой уровень значимости следует использовать?
Обычный порог — α = 0,05 (5%), что означает готовность принять 5% риск ошибочно отклонить истинную нулевую гипотезу. Для более строгих требований — например, в медтехнике, геномике или физике — используют α = 0,01 или даже 0,001. В исследовании поискового характера иногда допускают α = 0,10. Уровень следует выбирать до просмотра данных.