Калькулятор размера выборки - формула Кокрана

Рассчитайте минимальный размер выборки для надёжного опроса или исследования. Укажите уровень доверия, погрешность и долю населения, чтобы мгновенно получить результат.

Выберите уровень доверия, введите погрешность в процентах, задайте ожидаемую долю населения (используйте 0.5, если она неизвестна) и при необходимости укажите общий размер населения для поправки на конечную совокупность.

Калькулятор размера выборки - формула Кокрана
Рассчитайте минимальный размер выборки для надёжного опроса или исследования. Укажите уровень доверия, погрешность и долю населения, чтобы мгновенно получить результат.

О калькуляторе размера выборки

Определение размера выборки — один из самых важных этапов при проектировании любого опроса, эксперимента или наблюдательного исследования. Правильное число участников обеспечивает статистическую значимость результатов и эффективное использование ресурсов. Этот калькулятор использует формулу Кокрана — общепринятый отраслевой подход для оценки требуемого размера выборки, когда совокупность велика или неизвестна. Формула: n = Z² × p × (1 – p) / E², где Z — Z-оценка, соответствующая желаемому уровню доверия, p — оценённая доля населения, а E — допустимая погрешность, выраженная в виде десятичной дроби. Уровень доверия показывает, насколько вы хотите быть уверены, что результаты выборки попадут в заданную погрешность. Уровень доверия 95% — самый распространённый в социальных науках и маркетинговых исследованиях — соответствует Z-оценке 1.96. Это означает, что если повторить опрос 100 раз, истинное значение совокупности окажется в пределах вашей погрешности примерно в 95 из этих повторений. Погрешность определяет ширину зоны неопределённости вокруг оценки. Погрешность ±5% означает, что наблюдаемая доля может быть на 5 процентных пунктов выше или ниже истинной доли населения. Более узкая погрешность требует большего размера выборки. Поскольку в формуле присутствует E², при уменьшении погрешности вдвое необходимый размер выборки примерно возрастает в четыре раза. Доля p определяет дисперсию в формуле. При p = 0.5 выражение p(1 – p) достигает максимума 0.25, поэтому получается наиболее консервативная (то есть наибольшая) оценка размера выборки. Это стандартная рекомендация, когда исходной информации нет. Если у вас есть надёжная оценка p из предыдущего исследования, можно использовать её и потенциально уменьшить требуемый размер выборки. Когда общий размер совокупности N мал по сравнению с требуемой выборкой (точнее, когда n превышает 5% от N), следует применять поправку на конечную совокупность (FPC): n_adj = n / (1 + (n – 1) / N). Эта корректировка уменьшает требуемый размер выборки, отражая тот факт, что измеряется большая доля совокупности. На практике стоит добавить запас на неответы, проблемы с качеством данных и отказы. Обычно целевой размер выборки делят на ожидаемую долю ответов. Например, если вы рассчитали n = 385, но ожидаете уровень ответов 70%, вам следует связаться как минимум с 385 / 0.70 ≈ 550 потенциальными респондентами.

Примеры расчёта размера выборки

Три типичных сценария показывают, как уровень доверия, погрешность и размер совокупности влияют на требуемую выборку.

ПараметрыРазмер выборкиПримечания
95% CL, ±5% MoE, p=0.5, infinite population385Классический ориентир размера выборки. Используется для общенациональных опросов и крупных исследований при очень большой совокупности.
95% CL, ±3% MoE, p=0.5, infinite population1,068Сужение погрешности с 5% до 3% более чем удваивает требуемый размер выборки из-за зависимости от E².
95% CL, ±5% MoE, p=0.5, N=500218Поправка на конечную совокупность уменьшает выборку с 385 до 218, поскольку выборка составляет большую долю всей совокупности.

Как пользоваться калькулятором размера выборки

  1. Выберите нужный уровень доверия в выпадающем списке (80%, 85%, 90%, 95% или 99%). Для большинства опросов стандартом является 95%.
  2. Введите погрешность в процентах. Значение 5 означает ±5%. Меньшие значения дают более высокую точность, но требуют большего размера выборки.
  3. Введите ожидаемую долю населения в виде десятичной дроби от 0 до 1. Если не уверены, используйте 0.5 — это даст наибольшую и наиболее консервативную оценку размера выборки.
  4. При необходимости укажите общий размер населения, если ваша совокупность мала и конечна. Если совокупность большая или неизвестна, оставьте поле пустым.
  5. Нажмите «Рассчитать», чтобы увидеть рекомендуемый минимальный размер выборки. Нажмите «Сбросить», чтобы очистить все поля и начать заново.

Часто задаваемые вопросы о калькуляторе размера выборки

Почему при неопределённости рекомендуется 0.5?
Выражение p(1 – p) достигает максимума 0.25 при p = 0.5. Использование 0.5 гарантирует, что формула даст максимально возможный размер выборки при заданных уровне доверия и погрешности, обеспечивая консервативную оценку, достаточную независимо от истинной доли.
Что означает уровень доверия 95%?
Уровень доверия 95% означает, что если многократно повторять процедуру выборки, 95% полученных доверительных интервалов будут содержать истинный параметр совокупности. Это не означает, что существует 95% вероятность того, что истинное значение находится в конкретном рассчитанном интервале.
Как размер совокупности влияет на требуемую выборку?
Для больших совокупностей требуемый размер выборки практически не зависит от размера населения — опрос 385 человек статистически столь же значим для страны с населением 300 миллионов, как и для города с 100 000 жителей. Поправка на конечную совокупность имеет значение только тогда, когда требуемая выборка превышает 5% от всей совокупности.
Какова связь между погрешностью и размером выборки?
Погрешность входит в формулу Кокрана как E² в знаменателе, поэтому связь обратно-квадратичная: при уменьшении погрешности вдвое требуется примерно в четыре раза больше респондентов. Поэтому добиться очень высокой точности (например, ±1%) чрезвычайно дорого с точки зрения размера выборки.
Нужно ли добавлять респондентов на случай неответов?
Да. Рассчитанный размер выборки — это количество завершённых и пригодных ответов. Чтобы учесть неответы, разделите это число на ожидаемую долю ответов. Если вы ожидаете уровень ответов 60% и вам нужны 385 завершённых анкет, следует связаться как минимум с 385 / 0.60 ≈ 642 потенциальными респондентами.
Можно ли использовать этот калькулятор для A/B-тестов?
Формула Кокрана, реализованная здесь, предназначена для оценки долей в опросных исследованиях. Для A/B-тестов также нужно задать минимально обнаруживаемый эффект и статистическую мощность (обычно 80%). Специальные калькуляторы размера выборки для A/B-тестов используют немного другие формулы и лучше подходят для этого случая.