대립유전자 빈도 계산기 - 하디-바인베르크
유전자형 계수 또는 직접 대립유전자 입력으로 모든 집단의 대립유전자 빈도, 유전자형 빈도, 하디-바인베르크 평형을 계산합니다.
유전자형 수(AA, Aa, aa) 또는 직접 대립유전자 수를 입력해 p, q, 기대 유전자형 빈도와 HWE 카이제곱 검정을 계산하세요.
대립유전자 빈도 계산기 - 하디-바인베르크
유전자형 계수 또는 직접 대립유전자 입력으로 모든 집단의 대립유전자 빈도, 유전자형 빈도, 하디-바인베르크 평형을 계산합니다.
대립유전자 빈도 계산기 소개
대립유전자 빈도 계산기는 집단 내 유전적 변이를 설명하는 기본 지표, 즉 각 대립유전자의 빈도, 각 유전자형의 빈도, 그리고 집단이 하디-바인베르크 평형(HWE)에 있는지를 계산하는 집단유전학 도구입니다. 이러한 계산은 유전학 및 진화생물학 수업, 임상유전학, 보전생물학, 집단 수준 DNA 데이터를 다루는 모든 연구에 필수적입니다.
대립유전자 빈도는 집단유전학에서 가장 단순하면서도 가장 중요한 요약 통계량입니다. 우성 대립유전자 A와 열성 대립유전자 a로 이루어진 두 대립유전자 체계에서 대립유전자 빈도는 p(A의 빈도)와 q(a의 빈도)로 표시되며, p + q = 1이어야 합니다. 유전자형 계수에서 계산할 때 p = (2 × AA + Aa) / (2 × N)이고, N은 이배체 개체의 총수입니다. 각 이배체 개체는 두 개의 사본을 가지므로 분모 2N은 집단의 총 대립유전자 수입니다. 직접 대립유전자 계수에서는 p = A / (A + a), q = a / (A + a)입니다.
유전자형 빈도는 집단 중 세 가지 이배체 유전자형 계급인 AA(우성 동형접합), Aa(이형접합), aa(열성 동형접합)를 가진 비율을 설명합니다. 관측 유전자형 빈도는 단순히 각 수를 N으로 나눈 값입니다. 하디-바인베르크 평형하의 기대 유전자형 빈도는 하디-바인베르크 원리에 따라 각각 p², 2pq, q²로 예측됩니다.
하디-바인베르크 원리는 크고 무작위로 교배하는 집단에서 돌연변이, 이주, 자연선택, 유전적 부동이 없으면 대립유전자 및 유전자형 빈도가 세대가 지나도 일정하게 유지된다고 말합니다. HWE 하의 기대 유전자형 수는 AA의 경우 p² × N, Aa의 경우 2pq × N, aa의 경우 q² × N입니다. 관측 유전자형 수가 이러한 기대값과 유의하게 다르면 해당 집단은 HWE에서 벗어난 것으로 보며, 이는 근친교배, 집단 층화, 해당 좌위에 작용하는 자연선택 또는 실험실 데이터의 유전자형 분석 오류를 시사할 수 있습니다.
카이제곱 검정은 HWE로부터의 편차가 우연히 기대되는 범위보다 큰지 판단하기 위한 공식적인 통계 틀을 제공합니다. 검정 통계량은 세 유전자형 계급에 대해 (관측값 − 기대값)² / 기대값을 합산한 값입니다. 자유도 1(2개의 대립유전자, 3개의 유전자형, 1개의 제약)에서 p = 0.05의 임계값은 3.841입니다. 카이제곱 값이 3.841보다 낮으면 HWE와 일치하며, 더 높으면 통계적으로 유의한 이탈을 의미합니다.
실무 적용 범위는 매우 넓습니다. 임상유전학에서는 SNP가 HWE를 따르는지 검사하는 것이 표준 품질관리 단계입니다. 대조군 유전자형 데이터에서 체계적인 HWE 이탈은 배치 효과나 유전자형 분석 오류를 알리는 신호입니다. 보전생물학에서는 작거나 단편화된 집단의 HWE 이탈이 근교약세나 유전적 병목을 나타낼 수 있습니다. 법유전학에서는 DNA 프로필의 무작위 일치 확률을 계산하는 곱셈 법칙의 기초에 HWE 가정이 놓여 있습니다. 질병 관련 대립유전자의 p와 q를 이해하면 역학자들이 2pq 공식을 사용해 보인자 빈도를 추정할 수도 있습니다.
대립유전자 빈도 예시
유전자형 계수, 대립유전자 빈도, 하디-바인베르크 기대값을 보여주는 실제 집단 시나리오입니다.
| 집단 | p / q | HWE 평가 |
|---|---|---|
| 50 AA, 30 Aa, 20 aa (N=100) | p = 0.6500, q = 0.3500 | 기대값: AA 42.25, Aa 45.50, aa 12.25. 카이제곱 ≈ 7.14 — HWE에서 벗어남. |
| 10 AA, 80 Aa, 10 aa (N=100) | p = 0.5000, q = 0.5000 | 대부분 이형접합체입니다. 기대값: AA 25, Aa 50, aa 25. 카이제곱 ≈ 36 — HWE에서 강하게 벗어남(이형접합체 과잉). |
| A 대립유전자 120개, a 대립유전자 80개 | p = 0.6000, q = 0.4000 | 직접 대립유전자 입력 모드. N은 100으로 추정됩니다. 기대값: AA 36, Aa 48, aa 16. |
| 3 AA, 2 Aa, 5 aa (N=10) | p = 0.4000, q = 0.6000 | 작은 집단입니다. 기대값: AA 1.6, Aa 4.8, aa 3.6. 표본 크기가 작으면 HWE 검정은 신뢰하기 어렵습니다. |
대립유전자 빈도 계산기 사용 방법
- 입력 방법을 선택하세요. AA, Aa, aa 수가 있으면 '유전자형 계수'를, 각 대립유전자의 직접 수가 있으면 '대립유전자 계수'를 선택합니다.
- 유전자형 계수의 경우 우성 동형접합(AA), 이형접합(Aa), 열성 동형접합(aa) 개체 수를 입력합니다.
- 대립유전자 계수의 경우 A 대립유전자와 a 대립유전자 수를 입력합니다. 스케일된 HWE 기대 수를 얻으려면 전체 개체 수도 선택적으로 입력하세요.
- 계산을 클릭하세요. 도구는 p와 q, 총 N, HWE 하의 기대 유전자형 수, 그리고 (유전자형 입력의 경우) HWE 이탈에 대한 카이제곱 검정을 표시합니다.
- 초기화를 클릭하면 모든 필드를 지우고 새 계산을 시작할 수 있습니다.
대립유전자 빈도 계산기 FAQ
유전학에서 p와 q는 무엇을 의미하나요?
두 대립유전자 체계에서 p는 우성 대립유전자(A)의 빈도이고 q는 열성 대립유전자(a)의 빈도입니다. 해당 좌위의 모든 대립유전자는 A 또는 a여야 하므로 둘의 합은 항상 1(p + q = 1)입니다. 대립유전자 빈도는 0(대립유전자 없음)에서 1(집단에 고정됨)까지입니다.
하디-바인베르크 평형이란 무엇인가요?
하디-바인베르크 평형(HWE)은 집단의 대립유전자 및 유전자형 빈도가 세대에 걸쳐 일정하게 유지되는 이론적 상태를 말합니다. 이를 위해서는 큰 집단 크기, 무작위 교배, 돌연변이 없음, 이주 없음, 자연선택 없음이라는 다섯 조건이 필요합니다. HWE 하에서 기대 유전자형 빈도는 p²(AA), 2pq(Aa), q²(aa)입니다.
왜 내 집단이 HWE에서 벗어날 수 있나요?
HWE 이탈의 흔한 원인으로는 근친교배(이형접합도 감소), 집단 층화(유전적으로 다른 하위집단의 혼합), 해당 좌위에 대한 강한 자연선택, 최근 이주, 또는 실험실 데이터의 유전자형 분석 오류가 있습니다. 동형접합체 과잉은 근친교배를 시사하고, 이형접합체 과잉은 집단 층화 또는 이형접합체 우위를 나타낼 수 있습니다.
HWE 카이제곱 검정은 어떻게 해석하나요?
카이제곱 통계량은 관측 유전자형 수와 기대 유전자형 수의 차이를 측정합니다. 자유도 1에서 3.841 미만의 값은 5% 수준에서 통계적으로 유의하지 않으며(HWE와 일치), 3.841을 초과하면 HWE에서 유의하게 벗어난 것입니다. 표본 크기가 매우 작을 때(N < 20)는 카이제곱 근사가 신뢰하기 어렵고 정확 검정이 더 적합합니다.
이 계산기를 X-연관 좌위에 사용할 수 있나요?
여기에 제시된 표준 하디-바인베르크 공식은 상염색체 좌위에 적용됩니다. X-연관 좌위에서는 남성이 반접합(대립유전자 하나만 보유)이므로 남성의 열성 표현형 빈도는 q²가 아니라 q와 같습니다. 별도의 X-연관 HWE 분석이 필요하지만, 여성 유전자형 계수에서 대립유전자 빈도(p와 q)를 계산할 때는 같은 공식을 사용합니다.
흔한 질병 변이의 일반적인 대립유전자 빈도는 얼마인가요?
전장유전체 연관분석(GWAS)에서 확인된 흔한 질병 관련 SNP는 흔히 0.05에서 0.50 사이의 소수 대립유전자 빈도(MAF)를 가집니다. 드문 멘델성 질병 변이는 빈도가 0.01(1%)보다 훨씬 낮을 수 있습니다. 열성 질병의 보인자 빈도는 2pq이므로, 열성 대립유전자 q = 0.01이면 보인자 빈도는 약 2 × 0.99 × 0.01 ≈ 2%입니다.