Калькулятор частоты аллелей - инструмент Харди-Вайнберга
Рассчитывайте частоты аллелей, частоты генотипов и равновесие Харди-Вайнберга для любой популяции по числу генотипов или прямому вводу аллелей.
Введите числа генотипов (AA, Aa, aa) или прямые числа аллелей, чтобы вычислить p, q, ожидаемые частоты генотипов и критерий хи-квадрат для HWE.
Калькулятор частоты аллелей - инструмент Харди-Вайнберга
Рассчитывайте частоты аллелей, частоты генотипов и равновесие Харди-Вайнберга для любой популяции по числу генотипов или прямому вводу аллелей.
О калькуляторе частоты аллелей
Калькулятор частоты аллелей — это инструмент популяционной генетики, который вычисляет основные величины, используемые для описания генетической изменчивости внутри популяции: частоту каждого аллеля, частоту каждого генотипа и то, находится ли популяция в равновесии Харди-Вайнберга (HWE). Эти расчеты необходимы в курсах генетики и эволюционной биологии, клинической генетике, биологии сохранения и любых исследованиях, связанных с ДНК-данными на уровне популяций.
Частота аллеля — самая простая и важная сводная статистика в популяционной генетике. Для системы с двумя аллелями — доминантным аллелем A и рецессивным аллелем a — частоты аллелей обозначают p (частота A) и q (частота a), при этом должно выполняться p + q = 1. При расчете по числам генотипов p = (2 × AA + Aa) / (2 × N), где N — общее число диплоидных особей. Знаменатель 2N — это общее число аллелей в популяции, поскольку каждая диплоидная особь несет две копии. При прямом подсчете аллелей p = A / (A + a), а q = a / (A + a).
Частоты генотипов показывают, какая доля популяции несет каждый из трех классов диплоидных генотипов: AA (доминантная гомозигота), Aa (гетерозигота) и aa (рецессивная гомозигота). Наблюдаемые частоты генотипов — это просто соответствующие числа, деленные на N. Ожидаемые частоты генотипов при равновесии Харди-Вайнберга равны соответственно p², 2pq и q², как предсказывает принцип Харди-Вайнберга.
Принцип Харди-Вайнберга утверждает, что в большой случайно скрещивающейся популяции без мутаций, миграции, естественного отбора и генетического дрейфа частоты аллелей и генотипов остаются постоянными из поколения в поколение. Ожидаемые числа генотипов при HWE составляют p² × N для AA, 2pq × N для Aa и q² × N для aa. Если наблюдаемые числа генотипов существенно отличаются от этих ожиданий, популяцию считают находящейся вне HWE; это может указывать на инбридинг, стратификацию популяции, естественный отбор, действующий на данный локус, или ошибку генотипирования в лабораторных данных.
Критерий хи-квадрат дает формальную статистическую основу для решения, превышают ли отклонения от HWE то, что можно ожидать случайно. Статистика критерия — это сумма (наблюдаемое − ожидаемое)² / ожидаемое по трем классам генотипов. При одной степени свободы (2 аллеля, 3 генотипа, 1 ограничение) критическое значение при p = 0.05 равно 3.841. Значение хи-квадрат ниже 3.841 согласуется с HWE; значение выше указывает на статистически значимое отклонение.
Практические применения очень разнообразны. В клинической генетике проверка SNP на HWE является стандартным этапом контроля качества: систематическое отклонение от HWE в данных генотипирования контрольной группы указывает на пакетные эффекты или ошибки генотипирования. В биологии сохранения отклонение от HWE в малых или фрагментированных популяциях может свидетельствовать об инбредной депрессии или генетических бутылочных горлышках. В судебной генетике предположения HWE лежат в основе правила произведения, используемого для расчета вероятности случайного совпадения ДНК-профиля. Понимание p и q для аллелей, связанных с заболеваниями, также позволяет эпидемиологам оценивать частоты носителей с помощью формулы 2pq.
Примеры частоты аллелей
Реальные популяционные сценарии с числами генотипов, частотами аллелей и ожиданиями Харди-Вайнберга.
| Популяция | p / q | Оценка HWE |
|---|---|---|
| 50 AA, 30 Aa, 20 aa (N=100) | p = 0.6500, q = 0.3500 | Ожидается: AA 42.25, Aa 45.50, aa 12.25. Хи-квадрат ≈ 7.14 — отклоняется от HWE. |
| 10 AA, 80 Aa, 10 aa (N=100) | p = 0.5000, q = 0.5000 | Преобладают гетерозиготы. Ожидается: AA 25, Aa 50, aa 25. Хи-квадрат ≈ 36 — сильное отклонение от HWE (избыток гетерозигот). |
| 120 аллелей A, 80 аллелей a | p = 0.6000, q = 0.4000 | Режим прямого ввода аллелей. N оценивается как 100. Ожидается: AA 36, Aa 48, aa 16. |
| 3 AA, 2 Aa, 5 aa (N=10) | p = 0.4000, q = 0.6000 | Малая популяция. Ожидается: AA 1.6, Aa 4.8, aa 3.6. Малые размеры выборки делают тест HWE ненадежным. |
Как пользоваться калькулятором частоты аллелей
- Выберите метод ввода: «Числа генотипов», если у вас есть числа AA, Aa и aa, или «Числа аллелей», если у вас есть прямые числа каждого аллеля.
- Для чисел генотипов: введите количество доминантных гомозигот (AA), гетерозигот (Aa) и рецессивных гомозигот (aa).
- Для чисел аллелей: введите количество аллелей A и аллелей a. При желании введите общее число особей, чтобы получить масштабированные ожидаемые числа HWE.
- Нажмите «Рассчитать». Инструмент покажет p и q, общее N, ожидаемые числа генотипов при HWE и (для ввода генотипов) критерий хи-квадрат для отклонения от HWE.
- Нажмите «Сбросить», чтобы очистить все поля и начать новый расчет.
FAQ по калькулятору частоты аллелей
Что означают p и q в генетике?
В системе с двумя аллелями p — это частота доминантного аллеля (A), а q — частота рецессивного аллеля (a). Их сумма всегда равна 1 (p + q = 1), потому что каждый аллель в локусе должен быть либо A, либо a. Частоты аллелей варьируют от 0 (аллель отсутствует) до 1 (аллель закреплен в популяции).
Что такое равновесие Харди-Вайнберга?
Равновесие Харди-Вайнберга (HWE) описывает теоретическое состояние популяции, при котором частоты аллелей и генотипов остаются постоянными между поколениями. Для этого нужны пять условий: большая численность популяции, случайное скрещивание, отсутствие мутаций, отсутствие миграции и отсутствие естественного отбора. При HWE ожидаемые частоты генотипов равны p² (AA), 2pq (Aa) и q² (aa).
Почему моя популяция может отклоняться от HWE?
Распространенные причины отклонения от HWE включают инбридинг (снижает гетерозиготность), стратификацию популяции (смешение генетически различающихся субпопуляций), сильный естественный отбор на данном локусе, недавнюю миграцию или ошибки генотипирования в лабораторных данных. Избыток гомозиготности указывает на инбридинг; избыток гетерозиготности может указывать на стратификацию популяции или преимущество гетерозигот.
Как интерпретировать критерий хи-квадрат для HWE?
Статистика хи-квадрат измеряет разницу между наблюдаемыми и ожидаемыми числами генотипов. При 1 степени свободы значение ниже 3.841 не является статистически значимым на уровне 5% (согласуется с HWE). Значение выше 3.841 указывает на значимое отклонение от HWE. Обратите внимание, что при очень малых размерах выборки (N < 20) приближение хи-квадрат ненадежно, и предпочтителен точный тест.
Можно ли использовать этот калькулятор для X-сцепленных локусов?
Стандартные формулы Харди-Вайнберга, приведенные здесь, применимы к аутосомным локусам. Для X-сцепленных локусов мужчины гемизиготны (несут только один аллель), поэтому частота рецессивного фенотипа у мужчин равна q, а не q². Требуется отдельный анализ HWE для X-сцепленных локусов, хотя расчет частоты аллелей (p и q) по числам женских генотипов использует ту же формулу.
Какова типичная частота аллеля для распространенного варианта заболевания?
Распространенные SNP, связанные с заболеваниями и выявленные в полногеномных ассоциативных исследованиях (GWAS), часто имеют частоты минорного аллеля (MAF) от 0.05 до 0.50. Редкие варианты менделевских заболеваний могут иметь частоты значительно ниже 0.01 (1%). Частота носителей рецессивного заболевания равна 2pq, поэтому для рецессивного аллеля с q = 0.01 частота носителей составляет примерно 2 × 0.99 × 0.01 ≈ 2%.