Calculadora de frecuencia alélica - Hardy-Weinberg

Calcula frecuencias alélicas, frecuencias genotípicas y el equilibrio de Hardy-Weinberg de cualquier población a partir de conteos de genotipos o entradas directas de alelos.

Introduce conteos de genotipos (AA, Aa, aa) o conteos directos de alelos para calcular p, q, frecuencias genotípicas esperadas y una prueba chi-cuadrado de HWE.

Calculadora de frecuencia alélica - Hardy-Weinberg
Calcula frecuencias alélicas, frecuencias genotípicas y el equilibrio de Hardy-Weinberg de cualquier población a partir de conteos de genotipos o entradas directas de alelos.

Acerca de la calculadora de frecuencia alélica

La calculadora de frecuencia alélica es una herramienta de genética de poblaciones que calcula las magnitudes fundamentales usadas para caracterizar la variación genética dentro de una población: la frecuencia de cada alelo, la frecuencia de cada genotipo y si la población está en equilibrio de Hardy-Weinberg (HWE). Estos cálculos son esenciales en cursos de genética y biología evolutiva, genética clínica, biología de la conservación y cualquier investigación con datos de ADN a nivel poblacional. La frecuencia alélica es el estadístico resumido más simple e importante en genética de poblaciones. Para un sistema de dos alelos —el alelo dominante A y el alelo recesivo a— las frecuencias alélicas se denotan p (frecuencia de A) y q (frecuencia de a), con el requisito de que p + q = 1. Al trabajar desde conteos de genotipos, p = (2 × AA + Aa) / (2 × N), donde N es el número total de individuos diploides. El denominador 2N es el número total de alelos en la población porque cada individuo diploide porta dos copias. A partir de conteos directos de alelos, p = A / (A + a) y q = a / (A + a). Las frecuencias genotípicas describen qué fracción de la población porta cada una de las tres clases de genotipos diploides: AA (homocigoto dominante), Aa (heterocigoto) y aa (homocigoto recesivo). Las frecuencias genotípicas observadas son simplemente los conteos divididos por N. Las frecuencias genotípicas esperadas bajo el equilibrio de Hardy-Weinberg son p², 2pq y q², respectivamente, predichas por el principio de Hardy-Weinberg. El principio de Hardy-Weinberg establece que, en una población grande con apareamiento aleatorio y sin mutación, migración, selección natural ni deriva genética, las frecuencias alélicas y genotípicas permanecerán constantes de generación en generación. Los conteos genotípicos esperados bajo HWE son p² × N para AA, 2pq × N para Aa y q² × N para aa. Cuando los conteos genotípicos observados difieren significativamente de estas expectativas, se dice que la población está fuera de HWE, lo que puede indicar endogamia, estratificación poblacional, selección natural actuando sobre el locus o un error de genotipado en datos de laboratorio. La prueba chi-cuadrado proporciona un marco estadístico formal para decidir si las desviaciones respecto de HWE son mayores de lo esperado por azar. El estadístico de prueba es la suma de (observado − esperado)² / esperado en las tres clases genotípicas. Con un grado de libertad (2 alelos, 3 genotipos, 1 restricción), el valor crítico para p = 0.05 es 3.841. Un valor chi-cuadrado por debajo de 3.841 es compatible con HWE; un valor superior indica una desviación estadísticamente significativa. Las aplicaciones prácticas son muy variadas. En genética clínica, comprobar si un SNP está en HWE es un paso estándar de control de calidad: una desviación sistemática de HWE en datos de genotipado de controles señala efectos de lote o errores de genotipado. En biología de la conservación, la desviación de HWE en poblaciones pequeñas o fragmentadas puede indicar depresión endogámica o cuellos de botella genéticos. En genética forense, los supuestos de HWE sustentan la regla del producto usada para calcular la probabilidad de coincidencia aleatoria de un perfil de ADN. Comprender p y q para alelos asociados a enfermedades también permite a los epidemiólogos estimar frecuencias de portadores usando la fórmula 2pq.

Ejemplos de frecuencia alélica

Escenarios poblacionales reales que muestran conteos de genotipos, frecuencias alélicas y expectativas de Hardy-Weinberg.

Poblaciónp / qEvaluación de HWE
50 AA, 30 Aa, 20 aa (N=100)p = 0.6500, q = 0.3500Esperado: AA 42.25, Aa 45.50, aa 12.25. Chi-cuadrado ≈ 7.14 — se desvía de HWE.
10 AA, 80 Aa, 10 aa (N=100)p = 0.5000, q = 0.5000Predominan los heterocigotos. Esperado: AA 25, Aa 50, aa 25. Chi-cuadrado ≈ 36 — claramente fuera de HWE (exceso de heterocigotos).
120 alelos A, 80 alelos ap = 0.6000, q = 0.4000Modo de entrada directa de alelos. N estimado como 100. Esperado: AA 36, Aa 48, aa 16.
3 AA, 2 Aa, 5 aa (N=10)p = 0.4000, q = 0.6000Población pequeña. Esperado: AA 1.6, Aa 4.8, aa 3.6. Los tamaños de muestra pequeños hacen que la prueba de HWE sea poco fiable.

Cómo usar la calculadora de frecuencia alélica

  1. Elige el método de entrada: 'Conteos de genotipos' si tienes conteos de AA, Aa y aa, o 'Conteos de alelos' si tienes conteos directos de cada alelo.
  2. Para conteos de genotipos: introduce el número de individuos homocigotos dominantes (AA), heterocigotos (Aa) y homocigotos recesivos (aa).
  3. Para conteos de alelos: introduce el número de alelos A y alelos a. Opcionalmente, introduce el número total de individuos para obtener conteos esperados de HWE escalados.
  4. Haz clic en Calcular. La herramienta muestra p y q, N total, conteos genotípicos esperados bajo HWE y (para entrada por genotipo) una prueba chi-cuadrado de desviación de HWE.
  5. Haz clic en Restablecer para borrar todos los campos e iniciar un nuevo cálculo.

Preguntas frecuentes sobre la calculadora de frecuencia alélica

¿Qué representan p y q en genética?
En un sistema de dos alelos, p es la frecuencia del alelo dominante (A) y q es la frecuencia del alelo recesivo (a). Siempre suman 1 (p + q = 1) porque cada alelo en el locus debe ser A o a. Las frecuencias alélicas van de 0 (alelo ausente) a 1 (alelo fijado en la población).
¿Qué es el equilibrio de Hardy-Weinberg?
El equilibrio de Hardy-Weinberg (HWE) describe el estado teórico de una población en el que las frecuencias alélicas y genotípicas permanecen constantes entre generaciones. Requiere cinco condiciones: tamaño poblacional grande, apareamiento aleatorio, ausencia de mutación, ausencia de migración y ausencia de selección natural. Bajo HWE, las frecuencias genotípicas esperadas son p² (AA), 2pq (Aa) y q² (aa).
¿Por qué podría mi población desviarse de HWE?
Las causas comunes de desviación de HWE incluyen endogamia (reduce la heterocigosidad), estratificación poblacional (mezcla de subpoblaciones genéticamente distintas), selección natural fuerte sobre el locus, migración reciente o errores de genotipado en datos de laboratorio. El exceso de homocigosidad sugiere endogamia; el exceso de heterocigosidad puede indicar estratificación poblacional o ventaja del heterocigoto.
¿Cómo se interpreta la prueba chi-cuadrado para HWE?
El estadístico chi-cuadrado mide la diferencia entre los conteos genotípicos observados y esperados. Con 1 grado de libertad, un valor por debajo de 3.841 no es estadísticamente significativo al nivel del 5% (compatible con HWE). Un valor por encima de 3.841 indica una desviación significativa de HWE. Ten en cuenta que con tamaños de muestra muy pequeños (N < 20), la aproximación chi-cuadrado no es fiable y se prefiere una prueba exacta.
¿Puedo usar esta calculadora para loci ligados al X?
Las fórmulas estándar de Hardy-Weinberg mostradas aquí se aplican a loci autosómicos. Para loci ligados al X, los varones son hemicigotos (portan un solo alelo), por lo que la frecuencia del fenotipo recesivo en varones equivale a q en lugar de q². Se necesita un análisis HWE ligado al X por separado, aunque el cálculo de frecuencia alélica (p y q) a partir de conteos de genotipos femeninos usa la misma fórmula.
¿Cuál es una frecuencia alélica típica para una variante común de enfermedad?
Los SNP comunes asociados a enfermedades identificados en estudios de asociación de genoma completo (GWAS) suelen tener frecuencias del alelo menor (MAF) entre 0.05 y 0.50. Las variantes raras de enfermedades mendelianas pueden tener frecuencias muy por debajo de 0.01 (1%). La frecuencia de portadores de una enfermedad recesiva equivale a 2pq, por lo que para un alelo recesivo con q = 0.01, la frecuencia de portadores es aproximadamente 2 × 0.99 × 0.01 ≈ 2%.