고정지수

Fixation index

고정지수(FST)는 유전자 구조에 의한 모집단 분화의 척도이다.단핵다형증(SNP) 또는 마이크로위성 등 유전자 다형성 데이터에서 자주 추정됩니다.라이트의 F 통계특별한 사례로 개발된 이 통계는 집단 유전학에서 가장 일반적으로 사용되는 통계 중 하나이다.

정의.

주어진 궤적에서 F에 대해ST 가장 일반적으로 사용되는 두 가지 정의는 1) 모집단 간 대립 유전자 빈도의 분산과 2) 혈통에 의한 동일성의 확률에 기초한다.

{ \ { } 、 the 2( \ \ _ { S ^{ 、 T 2 ( \ \ _ { Te 총 모집단에서 대립 유전체 상태의 분산ST, F는 다음과 같이 정의된다.

라이트의 정의는 F가 인구구조에 의해 설명될 수 있는 유전적 분산의 양을 측정하는ST 것을 보여준다.이것은 또한 총 다양성의 분율로 생각할 수 있는데, 여기서 다양성은 무작위로 선택된 두 개의 대립 유전자가 다를 확률에 의해 측정된다. 즉, ( ) \ 2 p (1 - p)。 i\ i} 대립 유전자의 빈도가모집단은 })이고, i i 모집단의 상대 크기는 입니다.

또,[2]

서 f 0 두 개인이 동일한 하위집단에 속한다는 점에서 두 개인의 혈통에 의한 신원확률이고 ¯({ 전체 모집단에서 두 개인이 혈통에 의해 동일할 확률입니다.이 정의를 사용하면 F는ST 총 모집단과 비교하여 동일한 하위 모집단의 두 개인이 얼마나 가까운지를 측정하는 것으로 해석될 수 있다.돌연변이율이 작을 경우, 이 해석은 하강에 의한 동일성 확률을 결합 시간에 연결함으로써 보다 명확하게 할 수 있다.T와0 T는 각각 동일한 하위 모집단과 총 모집단의 개체들이 합체하는 데 걸리는 평균 시간을 나타낸다.그리고나서,

이 공식은 유전자 데이터로부터 결합까지의 예상 시간을 쉽게 추정할 수 있다는 장점이 있으며, 이는 F에ST 대한 다양한 추정기 개발로 이어졌다.

견적

실제로는 정의에 사용되는 수량을 쉽게 측정할 수 없습니다.그 결과, 다양한 추정치가 제안되었다.DNA 배열 데이터에 적용할 수 있는 특히 간단한 추정치는 다음과 같습니다.[3]

서 "\ _ "\ _ 사이Within은 서로 다른 서브그룹 \text{Between 또는 한 서브그룹(「Between _에서 샘플링된 두 개인 간의 평균 차이 수.[ } } 。모집단 내 평균 쌍별 차이는 쌍별 차이의 합을 쌍 수로 나눈 값으로 계산할 수 있습니다.그러나 표본 크기가 작거나 모집단 간에 차이가 있는 경우에는 이 추정치가 치우칩니다.따라서 실제로는 F를 계산하는ST 데 보다 정교한 방법이 사용됩니다.가장 널리 사용되는 두 가지 절차는 Wear & Cockerham(1984)[4]의 추정기 또는 분자 분산 분석을 수행하는 것입니다.구현 목록은 이 문서의 끝에 있습니다.

해석

모집단 내 및 모집단 간의 유전자 변동 비교는 응용 집단 유전학에서 자주 사용된다.값의 범위는 0 ~1 입니다.값이 0이면 완전한 범혼합이 됩니다.즉, 두 집단이 자유롭게 교배하고 있는 것입니다.값이 1이면 모든 유전적 변이가 모집단 구조에 의해 설명되고 두 모집단이 유전적 다양성을 공유하지 않는다는 것을 의미한다.

Wright의 유한 섬 모델과 같은 이상적인 모델의 경우 F를 사용하여ST 마이그레이션 속도를 추정할 수 있습니다.이 모델에서 이행률은

여기서 m은 세대당 ,μ {\ [5]세대당 변환환율입니다.

분석된 데이터가 다형성이 높은 경우 F의 해석이ST 어려울 수 있습니다.이 경우, 혈통에 의한 동일성의 확률은 매우 낮고ST F는 임의로 낮은 상한을 가질 수 있으며, 이는 데이터의 잘못된 해석을 초래할 수 있다.또한 엄밀히 말하면ST F는 삼각 부등식을 만족시키지 못하기 때문에 수학적인 의미에서 거리가 아니다.

분명히 동일한 종에 속하는 식물군의 경우, 15% 이상의 F 값은ST "대" 또는 "중요" 분화로 간주되며, 5% 미만의 값은 "소" 또는 "중요" [6]분화로 간주된다.아종 간 또는 밀접하게 연관된 종 사이의 포유류 개체군 은 일반적으로 5%에서 20% 사이이다.유라시아와 북미 회색늑대 개체군의 F는 9.9%, 붉은늑대회색늑대 개체군의 F는 17%에서 18%로 보고되었다ST.최근 혼혈이 심한 늑대 유사종인 동부늑대는 유라시아산(7.6%)과 북미산 회색늑대(5.7%)에 비해 F가ST 10% 미만이고 붉은늑대(8.5%)와 함께라면 코요테(4.5%)[7]와 짝짓기 할 때 F가 더 낮다.

인간의ST F

FST 값은 모집단의 선택에 따라 크게 달라집니다.덴마크인 대 네덜란드인 또는 포르투갈인스페인인과 같이 밀접하게 연관된 민족 집단은 1% 미만의 가치를 보여주며 판믹시아와 구별할 수 없다.유럽 내에서 가장 다른 인종 집단은 7%의 값을 가지고 있는 것으로 밝혀졌다(랩스 대 랩스).사르디니아인).

고도로 분산된 균질 그룹을 비교할 경우 더 큰 값을 찾을 수 있다. 발견된 가장 높은 값은 Mbuti[8]Papuans 사이의 46%에 가까웠다.

고전적 마커에 기초한 상염색체 유전자 거리

인간 유전자의 역사와 지리(1994년)에서 카발리 스보레, 메노지, 광장은 대륙 내 및 대륙 간 인구 사이의 유전적 거리에 대한 가장 상세하고 포괄적인 추정치를 제공한다.초기 데이터베이스는 다양한 위치의 6,633개 샘플에 해당하는 76,676개의 유전자 빈도(120개의 혈액 다형 사용)를 포함합니다.이러한 표본을 도태하고 풀링함으로써 분석을 491개 모집단으로 제한한다.그들은 유럽의 대이동이 [9]시작된 15세기 말에 현재의 위치에 있었던 원주민들에 초점을 맞추고 있다.세계 수준에서 유전적 차이를 연구할 때, 그 수를 42개의 대표 집단으로 줄여 높은 수준의 유전적 유사성을 특징으로 하는 하위 집단을 집계한다.이 42개 모집단의 경우, Cavalli-Sorga와 공동 저자는 120개의 대립 유전자로부터 계산된 양쪽 거리를 보고한다.이 42개의 세계 인구 집단 중에서, 관찰된 가장 큰 유전적 거리는 음부티 피그미족과 파푸아 뉴기니족 사이의 거리이며, 여기서 Fst 거리는 0.4573이고, 가장 작은 유전적 거리(0.0021)는 덴마크인과 영국인 사이의 거리이다.26개 유럽 인구에 대해 더 세분화된 데이터를 고려할 때, 가장 작은 유전적 거리(0.0009)는 네덜란드인과 덴마크인 사이이고, 가장 큰(0.0667)는 랍스와 사르디니아인 사이이다.선택된 42개 모집단의 861쌍 중 평균 유전적 거리는 0.1338인 [page needed]것으로 밝혀졌다.0.1338의 유전적 거리는 세계 인구에 대해 같은 조상을 가진 혈연관계가 무작위로 짝짓기 인구에서 이복 형제 간의 혈연관계와 동등하다는 것을 의미한다.이것은 또한 만약 주어진 조상 인구에서 온 인간이 혼혈인 반자매를 가지고 있다면, 그 인간은 유전적으로 혼혈인 반자매보다 조상 인구와 관련이 없는 개인에 더 가깝다는 것을 암시한다.[10]

SNP에 기초한 상염색체 유전자 거리

햅맵 프로젝트 데이터를 기반으로 한 2012년 연구 유럽인들의 3대"대륙"인구(노던 대학의 유타 주민과 서유럽 조상에서 CEPH 컬렉션에서, 이탈리아 투스카니에서)사이에 에프에스티로 추정하고 동 아시아인(베이징, 중국어 대도시 덴버와 요구에서 한족 조합입니다.ne일본 도쿄 출신) 및 사하라 이남 아프리카인(케냐 웹예의 Luhya, 케냐의 Kinyawa의 Maasai, 나이지리아 이바단의 Yoruba를 합친 것).대륙 인구 간에는 12%에 가까운 값을, 대륙 인구 [11]내에서는 1% 미만인 범믹시아에 가까운 값을 보고했다.

SNP에[12] 기초한 대륙간 상염색체 유전자 거리
유럽(CEU) 사하라 사막 이남 아프리카(요루바) 동아시아(일본어)
사하라 사막 이남 아프리카(요루바) 0.153
동아시아(일본어) 0.111 0.190
동아시아(중국어) 0.110 0.192 0.007
SNP에[12][13] 기초한 유럽/중해 내 상염색체 유전자 거리
이탈리아인 팔레스타인인 스웨덴어 스페인어 독일인들. 러시아인 프랑스어 그리스인
팔레스타인인 0.0064
스웨덴어 0.0064-0.0090 0.0191
0.0130-0.0230 0.0050-0.0110
스페인어 0.0010-0.0050 0.0101 0.0040-0055 0.0110-0.0170
독일인들. 0.0029-0.0080 0.0136 0.0007-0.0010 0.0060-0.0130 0.0015-0.0030
러시아인 0.0088-0.0120 0.0202 0.0030-0.0036 0.0060-0.0120 0.0070-0.0079 0.0030-0.0037
프랑스어 0.0030-0.0050 0.0020 0.0080-0.0150 0.0010 0.0010 0.0050
그리스인 0.0000 0.0057 0.0084 0.0035 0.0039 0.0108

F 계산을ST 위한 프로그램

F 계산을ST 위한 모듈

레퍼런스

  1. ^ Holsinger, Kent E.; Bruce S. Weir (2009). "Genetics in geographically structured populations: defining, estimating and interpreting FST". Nat Rev Genet. 10 (9): 639–650. doi:10.1038/nrg2611. ISSN 1471-0056. PMC 4687486. PMID 19687804.
  2. ^ Richard Durrett (12 August 2008). Probability Models for DNA Sequence Evolution. Springer. ISBN 978-0-387-78168-6. Retrieved 25 October 2012.
  3. ^ Hudson, RR.; Slatkin, M.; Maddison, WP. (Oct 1992). "Estimation of Levels of Gene Flow from DNA Sequence Data". Genetics. 132 (2): 583–9. doi:10.1093/genetics/132.2.583. PMC 1205159. PMID 1427045.
  4. ^ Weir, B. S.; Cockerham, C. Clark (1984). "Estimating F-Statistics for the Analysis of Population Structure". Evolution. 38 (6): 1358–1370. doi:10.2307/2408641. ISSN 0014-3820. JSTOR 2408641. PMID 28563791.
  5. ^ Peter Beerli, 지리적으로 구조화된 모집단의 이주율과 인구 크기 추정(1998), 분자 생태학의 진보(ed.G. Carvalho).나토 과학 시리즈 A: 생명과학, IOS 프레스, 암스테르담, 39-53.
  6. ^ Frankham, R., Ballou, J.D., Briscoe, D.A., 2002.보존 유전학 입문캠브리지 대학 출판부, 캠브리지Hartl DL, Clark AG(1997) 집단 유전학의 원리, 제3편.시나우어 어소시에이츠 주식회사, 선덜랜드, 매사추세츠
  7. ^ B. M. von Holdt et al., "전체 유전자 배열 분석 결과 북미 늑대의 두 고유종이 코요테와 회색 늑대가 혼재한 것으로 나타났다.", 2016년 7월 27일, 과학 진보: Vol.2, No.7, e1501714, doi:10.126/sci.15014.
  8. ^ Cavalli-Svari-Svari 등(1994년), V 뒤에 인용.긴즈버그, S. 웨버, The Palgrave Handbook of Economics and Language, 스프링어(2016), 페이지 182.
  9. ^ Cavali-Svari-Svari 외, 1994, 페이지 24
  10. ^ Harpending, Henry (2002). "Kinship and Population Subdivision". Population and Environment. 24 (2): 141–147. doi:10.1023/A:1020815420693. S2CID 15208802.
  11. ^ Elhaik, Eran (2012). "Empirical Distributions of FST from Large-Scale Human Polymorphism Data". PLOS ONE. 7 (11): e49837. Bibcode:2012PLoSO...749837E. doi:10.1371/journal.pone.0049837. PMC 3504095. PMID 23185452.
  12. ^ a b Nelis, Mari; et al. (2009-05-08). Fleischer, Robert C. (ed.). "Genetic Structure of Europeans: A View from the North–East". PLOS ONE. 4 (5): e5472. Bibcode:2009PLoSO...4.5472N. doi:10.1371/journal.pone.0005472. PMC 2675054. PMID 19424496. 참조
  13. ^ Tian, Chao; et al. (November 2009). "European Population Genetic Substructure: Further Definition of Ancestry Informative Markers for Distinguishing among Diverse European Ethnic Groups". Molecular Medicine. 15 (11–12): 371–383. doi:10.2119/molmed.2009.00094. ISSN 1076-1551. PMC 2730349. PMID 19707526. 참조
  14. ^ Crawford, Nicholas G. (2010). "smogd: software for the measurement of genetic diversity". Molecular Ecology Resources. 10 (3): 556–557. doi:10.1111/j.1755-0998.2009.02801.x. PMID 21565057. S2CID 205970662.
  15. ^ Kitada S, Kitakado T, Kishino H (2007). "Empirical Bayes inference of pairwise F(ST) and its distribution in the genome". Genetics. 177 (2): 861–73. doi:10.1534/genetics.107.077263. PMC 2034649. PMID 17660541.

추가 정보

  • 인구의 진화와 유전학 제2권: 유전자 주파수 이론, 페이지 294-295, S. 라이트, 시카고 대학 출판부, 1969년
  • 인간 게놈의 하플로타입 지도, The International HapMap Consortium, Nature 2005

「 」를 참조해 주세요.

외부 링크