하플로타이프

Haplotype
DNA 분자 1은 단일 염기쌍 위치(C/A 다형성)에서 DNA 분자 2와 다르다.

하플로타입(하플로이드 유전자형)은 한 [1][2]부모로부터 함께 유전되는 유기체의 대립 유전자 그룹입니다.

많은 유기체들은 두 부모로부터 물려받은 유전 물질을 가지고 있다.보통 이 유기체들은 그들의 DNA를 두 쌍의 비슷한 염색체 세트로 배열한다.그 자손은 부모로부터 각 쌍에 하나의 염색체를 물려받는다.염색체 한 쌍은 이배체라고 불리며 각 쌍의 절반만 있는 한 쌍은 반배체라고 불린다.반수체 유전자형은 염색체 쌍이 아닌 단수 염색체를 고려하는 유전자형이다.그것은 부모 중 한 명으로부터 나온 모든 염색체일 수도 있고 염색체의 작은 부분일 수도 있다. 예를 들어, 염기쌍 9000개의 염기서열일 수도 있다.

그러나 이 용어에는 다른 용도가 있다.첫째, 그것은 함께 유전될 가능성이 높은 염색체 상의 긴밀하게 연결된 유전자의 군집 내 특정 대립 유전자(즉, 특정 DNA 배열)의 집합을 의미하는데 사용된다. 즉, 그것들은 여러 세대의 [3][4]생식의 하강에서 살아남는 배열로 보존될 가능성이 높다.두 번째 용도는 항상 함께 발생하는 경향이 있는(즉 통계적으로 연관된) 연결된 단일핵산다형(SNP) 대립 유전자 세트를 의미한다.이러한 통계적 연관성과 특정 하플로타입 시퀀스의 몇 가지 대립 유전자를 식별하면 염색체 근처에 있는 다른 모든 다형성 부위를 쉽게 식별할 수 있을 것으로 생각된다.이러한 정보는 일반적인 질병의 유전학을 조사하는데 매우 중요합니다. 사실 국제 햅맵 [5][6]프로젝트에 의해 인간에게서 조사되었습니다.세 번째로, 많은 인간 유전자 검사 회사들은 세 번째 방법으로 이 용어를 사용한다: 주어진 유전자 세그먼트 내의 특정 돌연변이들의 개별적인 집합을 가리킨다; (짧은 연속 반복 돌연변이 참조).

'하플로그룹'이라는 용어는 특정 인간 하플로타입의 집합이 속한 분지군을 나타내는 SNP/UEP(Unique-Event Polymorphism) 돌연변이를 말한다. (여기서 분지군은 공통 조상을 공유하는 하플로타입 세트를 가리킨다.)[7]하플로그룹단핵 다형 [8][9]돌연변이와 공통 조상을 공유하는 유사한 하플로타입의 그룹이다.미토콘드리아 DNA는 수천 년 [8]전으로 거슬러 올라갈 수 있는 모계 혈통을 이어받는다.

하플로타입 해상도

유기체의 유전자형은 그것의 하플로형을 독특하게 정의하지 않을 수 있다.예를 들어, 같은 염색체 위에 있는 이배체 유기체와 두 개의 이중알레르기 위치(SNP 등)를 생각해 보자.첫 번째 궤적에 대립 유전자 A 또는 T가 있고 두 번째 궤적에 G 또는 C가 있다고 가정합니다.따라서 두 위치 모두 각각 (AA, AT, TT) (GG, GC, CC)의 세 가지 유전자형을 가질 수 있다.특정 개인에 대해 이 두 위치(아래의 Punnett 정사각형에 표시)에는 9개의 가능한 구성(하플로타입)이 있습니다.한쪽 또는 양쪽의 위치에서 동형 접합된 개인의 경우, 하플로타입은 명확합니다. 즉, 하플로타입 T1T2와 하플로타입 T2T1의 차이는 없습니다. 여기서 T1과 T2는 동일한 궤적을 나타내기 위해 라벨이 표시되지만, 어느 쪽의 순서로 T1과 T2의 결과를 고려할지는 중요하지 않습니다.양쪽 위치에서 헤테로 접합된 개인의 경우, 배우자 단계모호합니다. 이 경우, TA 대 AT와 같이 어떤 하플로타입이 있는지 알 수 없습니다.

AA AT TT
GG AG AG AG TG TG TG
GC AG AC AG TC
또는
AC TG
TG TC
참조 AC AC AC TC TC TC

위상 모호성을 해결하는 유일한 분명한 방법은 시퀀싱입니다.그러나 개인 표본을 사용하여 위상이 애매한 경우 특정 하플로타입의 확률을 추정할 수 있습니다.

다수의 개인의 유전자형이 주어졌을 때, 하플로타입은 하플로타입 분해능 또는 하플로타입 페이싱 기법에 의해 추론될 수 있다.이 방법들은 특정 하플로타입이 특정 게놈 영역에서 공통적이라는 관찰을 적용함으로써 작용한다.따라서, 가능한 일련의 하플로타입 분해능이 주어졌을 때, 이러한 방법들은 전체적으로 덜 다른 하플로타입들을 사용하는 방법을 선택한다.이러한 방법의 세부 사항은 다양하다. 일부는 조합적 접근법(: 인색)에 기초하는 반면, 다른 일부는 하디-바인버그 원리, 결합 이론 모델 또는 완벽한 계통 발생과 같은 다른 모델과 가정에 기초하는 우도 함수를 사용한다.그런 다음 이러한 모델의 매개변수는 기대 최대화 알고리즘(EM), 마르코프 연쇄 몬테 카를로(MCMC) 또는 숨겨진 마르코프 모델(HMM)과 같은 알고리즘을 사용하여 추정된다.

미세유체전체게놈하플로타이핑은 각 대립 유전자에 대한 하플로타입의 직접 분해에 이은 중상세포에서 개별 염색체를 물리적으로 분리하는 기술이다.

계보 DNA 검사 결과 Y-DNA 하플로타입

다른 염색체들과 달리, Y 염색체는 일반적으로 쌍으로 나오지 않는다.XYY 증후군을 가진 사람을 제외하고 모든 인간 남성은 그 염색체의 복사본을 하나만 가지고 있다.즉, 어떤 복사가 유전되는지 우연한 변이가 없으며, (대부분의 염색체) 재조합에 의한 복사가 서로 섞이지 않는다는 것을 의미한다. 따라서 상염색체 하플로타입과는 달리, 세대간 Y염색체 하플로타입의 무작위화는 사실상 없다.인간 남성은 아버지와 같은 Y염색체를 많이 공유해야 하며, 몇 가지 돌연변이를 주거나 받아야 한다. 따라서 Y염색체는 남성 혈통을 구별하는 데 도움이 될 수 있는 작지만 축적된 돌연변이와 함께 아버지로부터 아들에게 대체로 온전하게 전달되는 경향이 있다.특히 돌연변이를 제외하고 Y-DNA 계보 DNA 검사의 번호결과는 일치해야 한다.

UEP 결과(SNP 결과)

SNP 등의 Unique-Event Polymorphism(UEPS)은 하플로그룹을 나타냅니다.STR은 단수형을 나타냅니다.Y 염색체 DNA 테스트에서 완전한 Y-DNA 하플로타입으로 구성된 결과는 두 부분으로 나눌 수 있다. 즉, UEP의 결과와 대부분의 UEP가 단일핵산 다형성이기 때문에 SNP 결과라고도 느슨하게 불린다. 그리고 마이크로 위성 단발 탠덤 반복 시퀀스(Y-STR)의 결과이다.

UEP 결과는 모든 인류 역사에서 단 한 번만 발생했다고 가정할 수 있는 사건의 상속을 나타낸다.이것들은 전 인류의 가계도에서 개인의 Y-DNA 하플로그룹을 식별하는 데 사용될 수 있다.다른 Y-DNA 하플로그룹은 종종 특정 지리적 지역과 뚜렷하게 연관된 유전자 집단을 식별한다; 다른 지역에 위치한 보다 최근의 집단에서의 그들의 출현은 현재 개인의 직접적인 부계 조상의 수만 년 전 이동을 나타낸다.

Y-STR 하플로타입

유전자 결과에는 테스트된 Y-STR 마커의 결과 세트인 Y-STR 하플로타입도 포함됩니다.

UEP와 달리 Y-STR은 돌연변이가 훨씬 쉬워 최근의 계보를 구별하는 데 사용할 수 있습니다.그러나 이것은 또한 유전적인 사건의 후손들의 인구가 모두 같은 결과를 공유하기 보다는, Y-STR 하플로타입이 분산되어 비슷한 결과를 가진 클러스터를 형성했을 가능성이 높다는 것을 의미한다.일반적으로 이 클러스터는 가장 가능성이 높은 중심, 모달 하플로타입(원래 창립 사건의 하플로타입과 유사할 가능성이 있음) 및 하플로타입 다양성(확대 정도)을 가지고 있습니다.과거에 결정적인 사건이 더 많이 발생할수록, 그리고 후속 인구 증가가 더 일찍 일어날수록, 특정한 수의 후손들에게 하플로타입의 다양성은 더 커질 것이다.그러나 특정 후손의 수가 하플로타입 다양성이 작다면 이는 공통 조상이 더 최근에 발생했거나 개체 수가 최근에 증가했음을 나타낼 수 있습니다.

유의해야 할 점은 UEP와 달리 유사한 Y-STR 하플로타입의 두 개인이 반드시 유사한 조상을 공유하지는 않을 수 있다는 점이다.Y-STR 이벤트는 고유하지 않습니다.대신, 다른 사건 및 다른 이력으로부터 상속된 Y-STR 하플로타입 결과의 클러스터는 중복되는 경향이 있습니다.

대부분의 경우, 하플로그룹이 사건을 정의한 지 오래되었기 때문에, 일반적으로 그 사건의 후손과 관련된 Y-STR 하플로타입 결과의 클러스터는 상당히 넓어졌습니다.이러한 결과는 다른 하플로그룹과 연관된 Y-STR 하플로타입의 (비슷하게 넓은) 클러스터와 유의하게 겹치는 경향이 있다.이것은 연구자들이 Y-STR 하플로타입이 어떤 Y-DNA 하플로그룹을 가리킬지 절대적으로 정확하게 예측하는 것을 불가능하게 만든다.UEP가 테스트되지 않은 경우, Y-STR은 하플로그룹 조상에 대한 확률을 예측하는 데만 사용될 수 있지만 확실성은 사용할 수 없다.

비슷한 시나리오가 공유 성이 공유된 유전적 조상을 나타내는지 여부를 평가하려고 할 때 존재한다.유사한 Y-STR 하플로타입의 클러스터는 식별 가능한 모달 하플로타입과 함께 공통의 조상을 나타낼 수 있지만, 그 클러스터가 역사적으로 독립적으로 같은 이름을 채택한 다른 개인으로부터 우연히 일어났을 수 있는 것과 충분히 구별되는 경우에만 해당된다.예를 들어, 많은 이름들은 공통 직업에서 따왔거나 특정 부지의 거주와 관련이 있었다.유전자 계보를 확립하기 위해서는 보다 광범위한 하플로타입이 필요하다.상업적인 DNA 검사 회사들은 이제 그들의 유전자 조상의 정의를 개선하기 위해 고객들에게 더 많은 수의 마커 세트를 테스트하는 것을 제공하고 있다.테스트된 마커 세트의 수는 초기 12개에서 최근 111개로 증가했습니다.

데이터베이스에서 데이터를 추출한 다른 성 사이의 그럴듯한 연관성을 확립하는 것은 훨씬 더 어렵다.연구자는 그러한 이유로 의도적으로 모집단에서 선택된 가장 가까운 모집단이 우연히 일치할 가능성이 낮다는 것을 입증해야 한다.이것은 무작위로 선택된 모집단의 구성원이 우연히 그렇게 근접한 일치를 보일 가능성이 없다는 것을 입증하는 것 이상이다.이 때문에, 이러한 시나리오에서와 같이 다른 성과의 관련성을 확립하는 것은, 검토 대상자의 인구 규모를 대폭 제한하는 특별한 정보가 있는 경우를 제외하고 불가능할 가능성이 높다.

다양성

하플로타입 다양성은 특정 집단에서 특정 하플로타입의 고유성에 대한 척도이다.하플로타입 다양성(H)은 다음과 [10]같이 계산된다.

서 x i})는 샘플 내 각 하플로타입의 (상대적인) 하플로타입 이고N(\ N 샘플 크기입니다.각 샘플에 대해 하플로타입의 다양성이 주어집니다.

「 」를 참조해 주세요.

소프트웨어

  • FAMHAP[11] - FAMHAP은 단일 마커 분석용 소프트웨어이며, 특히 밀접하게 연결된 마커에서 단계화되지 않은 유전자형 데이터를 공동 분석합니다(하플로타입 분석).
  • Fugue - 전자파 기반 하플로타입 추정 및 관련성 테스트(비관련 및 핵가족).
  • HPlus[12] — 기대 최대화 알고리즘과 프로그레시브 결찰로 알려진 베이지안 방법을 통합한 수정된 방법을 사용하여 관련 연구에서 하플로타입의 치환 및 테스트를 위한 소프트웨어 패키지.
  • 하플로 블록 파인더 - 하플로타입 블록 구조를 분석하기 위한 소프트웨어 패키지입니다.
  • 하플로스크라이브[13] - 희귀 변종을 포함한 핵가족의 모든 유전자형 위치에 기초한 전체 염색체 하플로타입 재구성.
  • 하플로뷰[14] - 연계 불균형, 하플로타입 추정 및 하플로타입 태그 부착(홈페이지) 시각화
  • HelixTree — Happlype 분석 소프트웨어 - Hatplotype Trend Regression(HTR), Happlotype Association 테스트 및 기대 최대화(EM) 알고리즘과 복합 Happlotype Method(CHM)를 모두 사용한 Happlotype 빈도 추정.
  • PHASE : 모집단 데이터에서 하플로타입 재구성 및 재조합률 추정을 위한 소프트웨어입니다.
  • SHAPEIT[15] - SHAPEIT2는 염색체 전체에 걸쳐 큰 코호트의 SNP 유전자형을 하플로타입으로 추정하기 위한 프로그램입니다.
  • SNPHAP - 단계화되지 않은 유전자형에서 하플로타입 주파수를 추정하기 위한 전자파 기반 소프트웨어.
  • WHAP[16] - 하플로타입 기반의 연관성 분석.

레퍼런스

  1. ^ C. 베리 콕스, 피터 D.무어, 리처드 레이들Wiley-Blackwell, 2016년 ISBN978-1-118-96858-1p106.생물 지리학: 생태학적, 진화적 접근법
  2. ^ 편집위원회, V&S 퍼블리셔스, 2012, ISBN 9381588643 p137.간결한 과학 사전
  3. ^ BiologyPages/H/Haplotypees.html Kimball의 Biology Pages (Creative Commons Attribution 3.0)
  4. ^ "haplotype / haplotypes Learn Science at Scitable". www.nature.com.
  5. ^ The International HapMap Consortium (2003). "The International HapMap Project" (PDF). Nature. 426 (6968): 789–796. Bibcode:2003Natur.426..789G. doi:10.1038/nature02168. hdl:2027.42/62838. PMID 14685227. S2CID 4387110.
  6. ^ The International HapMap Consortium (2005). "A haplotype map of the human genome". Nature. 437 (7063): 1299–1320. Bibcode:2005Natur.437.1299T. doi:10.1038/nature04226. PMC 1880871. PMID 16255080.
  7. ^ "Facts & Genes. Volume 7, Issue 3". Archived from the original on May 9, 2008.
  8. ^ a b Arora, Devender; Singh, Ajeet; Sharma, Vikrant; Bhaduria, Harvendra Singh; Patel, Ram Bahadur (2015). "Hgs Db: Haplogroups Database to understand migration and molecular risk assessment". Bioinformation. 11 (6): 272–5. doi:10.6026/97320630011272. PMC 4512000. PMID 26229286.
  9. ^ 국제유전자계보학회 2015 유전학 용어집
  10. ^ 네이 마사토시, 다지마 후미오, 제한핵산가수분해효소에 의해 검출되는 DNA 다형성", 유전학 97:145(1981)
  11. ^ Becker T.; Knapp M. (2004). "Maximum-likelihood estimation of haplotype frequencies in nuclear families". Genetic Epidemiology. 27 (1): 21–32. doi:10.1002/gepi.10323. PMID 15185400. S2CID 42602447.
  12. ^ Li S.S.; Khalid N.; Carlson C.; Zhao L.P. (2003). "Estimating haplotype frequencies and standard errors for multiple single nucleotide polymorphisms". Biostatistics. 4 (4): 513–522. doi:10.1093/biostatistics/4.4.513. PMID 14557108.
  13. ^ Roach J.C.; Glusman G.; Hubley R.; Montsaroff S.Z.; Holloway A.K.; Mauldin D.E.; Srivastava D.; Garg V.; Pollard K.S.; Galas D.J.; Hood L.; Smit A.F.A. (2011). "Chromosomal Haplotypes by Genetic Phasing of Human Families". American Journal of Human Genetics. 89 (3): 382–397. doi:10.1016/j.ajhg.2011.07.023. PMC 3169815. PMID 21855840.
  14. ^ Barrett J.C.; Fry B.; Maller J.; Daly M.J. (2005). "Haploview: analysis and visualization of LD and haplotype maps". Bioinformatics. 21 (2): 263–265. doi:10.1093/bioinformatics/bth457. PMID 15297300.
  15. ^ Delaneau O, Zagury JF, Marchini J (2013). "Improved whole chromosome phasing for disease and population genetic studies". Nature Methods. 10 (1): 5–6. doi:10.1038/nmeth.2307. PMID 23269371. S2CID 205421216.
  16. ^ Purcell S.; Daly M. J.; Sham P. C. (2007). "WHAP: haplotype-based association analysis". Bioinformatics. 23 (2): 255–256. doi:10.1093/bioinformatics/btl580. PMID 17118959.

외부 링크