연결불균형

Linkage disequilibrium

집단 유전학에서, 결합 불균형(LD)은 주어진 모집단의 다른 위치에 있는 대립 유전자의 비랜덤 연관성이다.서로 다른 대립 유전자의 결합 빈도가 독립적이고 [1]무작위로 연관되었을 때 예상되는 것보다 높거나 낮을 때 Loci는 연결불평형 상태에 있다고 한다.

연계불균형은 선택, 유전자 재조합 속도, 돌연변이율, 유전자 표류, 짝짓기 시스템, 개체 구조, 유전자 연계를 포함한 많은 요인에 의해 영향을 받는다.그 결과, 게놈의 연결불균형의 패턴은 그것을 구조화하고 있는 모집단의 유전적 과정의 강력한 신호이다.

그 이름에도 불구하고, 연결불평형은 유전자적 연관 없이 다른 위치에 있는 대립 유전자 사이에 존재할 수 있으며 대립 유전자 빈도가 평형 상태에 있는지 여부에 관계없이 존재할 수 있다(시간에 [1]따라 변화하지 않는다.또한 결합불평형은 때때로 배우자상불평형이라고 [2]불리기도 하지만, 이 개념은 무성생물에도 적용되므로 배우자의 존재에 의존하지 않는다.

형식적 정의

성 생식 집단에서 형성되는 배우자 중 대립 유전자 A가 style 로 발생한다고 가정합니다. 하나의 장소(예: { style 해당 궤적에서 A를 가진 배우자의 비율)이며, 다른 궤적에서는 에서 B가 발생한다. 마찬가지로 B})로 한다.AB AB가 같은 배우자 내에서 함께 발생하는 빈도(, p A 입니다. AB 하플로타입의 빈도입니다.

대립 유전자 A와 B 사이의 연관성은 하나의 발생이 다른 하나의 발생에 영향을 미치지 않는 경우 완전히 무작위적인 것으로 간주할 수 있다. 이 경우 AB가 함께 발생할 확률은 B {\에 의해 주어진다. 확률입니다. A B (표시 는 항상 두 대립 유전자 사이에 연관성 불균형이 있다고 한다.(는) .{ style 어떤 이유에서든.

A와 B 사이의 연결불평형 은 연결불평형 B(\에 의해 정량화될 수 있으며, 이 계수는 다음과 같이 정의된다.

\ p_ 0보다 큽니다.링크의 불균형은 A (\ 0합니다. (\}= p A A AB})가 있습니다. 대립 유전자 A, B는 결합 평형 상태라고 한다.의 첨자 "는 연결불균형이 대립 유전자의 쌍 {A, B}의 특성이지 각각의 자리의 특성은 아님을 강조한다.동일한 두 위치에 있는 다른 대립 유전자 쌍은 서로 다른 연결 불균형 계수를 가질 수 있다.

두 개의 바이알렐 궤적에서 a와 b가 다른 대립 유전자인 경우, 제약이 너무 강해서 D의 값 하나만 이 대립 유전자들 사이의 모든 연결 불균형 관계를 나타내기에 충분하다. 경우 B - - a B = D ab { } = - _ { Ab } = - D { } = _ {} 。그들의 관계는 다음과 같이 특징지을 수 있다.[3]

이 경우 D 부호는 임의로 선택됩니다.D의 크기는 연결불균형의 [4]정도를 나타내기 때문에 D의 크기는 D의 부호보다 더 중요하다.그러나 양의 D 값은 배우자의 빈도가 예상보다 높다는 것을 의미하며 음의 값은 이들 두 대립 유전자의 조합 빈도가 예상보다 낮다는 것을 의미합니다.

무성 집단에서의 연계 불균형은 모집단 대립 유전자의 빈도에서 유사한 방법으로 정의될 수 있다.또한 3개 이상의 대립 유전자 간의 결합불균형을 정의할 수도 있지만 [1]이들 고차적 연관성은 실제로는 일반적으로 사용되지 않는다.

D에서 도출된 조치

D(\ D 가능한 값의 범위가 참조하는 대립 유전자의 빈도에 따라 달라지기 때문에 연결불평형계수의 측정이 항상 편리한 것은 아닙니다.이것은 다른 대립 유전자 쌍들 사이의 연결 불균형 수준을 비교하는 것을 어렵게 만든다.

Lewontin[5] 다음과 같이 관측된 하플로타입 빈도와 예상 하플로타입 빈도의 이론적인 최대 차이로 나누어 D를 정규화할 것을 제안했다.

어디에

D { D}의 대안은 위치 쌍 상관계수이며, 보통 r 2 })로 표현된다.

연계 불균형 측정치의 범위에 대한 한계

r2(\2(\ D 범위에 제한이 있으며 모든 loci 쌍에 대해 0 ~1의 모든 값을 넘지 않습니다.r2{\displaystyle r^{2}}의 최대치가 대립 유전자 주파수에 두 장소 비교되는 것에서는 불과 0하나는 장소에서 대립 유전자 주파수가 같은지에 이르기까지 다양하게 의존하고 있는 PA=PB{\displaystyle P_{A}=P_{B}}이 D>0{\displaystyle D>0}을 때, 그 대립 유전자 frequencie.shav 관계 - B { _ { A } = 1 - _ { } ( < 0 \ D< [7] ) 。, D { D'는 항상 최대값 1을 취할 수 있지만, 두 loci의 최소값은 r {r}과 동일합니다.[8]

예:2로시 및 2알레

각각 두 개의 대립 유전자가 있는 두 개의 위치 A와 B에 대한 단수형을 고려하십시오. 즉, 두 개의 위치, 두 개의 대립 유전자가 있는 모델입니다.다음 표에 각 조합의 주파수를 정의합니다.

하플로타이프 빈도수.

이것들은 상대 주파수입니다.위의 주파수를 사용하여 각 대립 유전자의 주파수를 결정할 수 있습니다.

알레레 빈도수.

두 개의 궤적과 대립 유전자가 서로 독립적이라면 A_})을 표시 표시 표현할 수 있다.위의 표에 를 나타냅니다.따라서 주파수는 (입니다.기본 통계 정보 1({}=

예상으로부터 하플로타입의 관측 빈도의 편차는 연결 불균형이라고[10] 불리는 양이며[9], 일반적으로 대문자 D로 표시됩니다.

다음 표는 하플로타입 빈도와 대립 유전자 빈도와 D 사이의 관계를 보여줍니다.

재조합의 역할

무작위 짝짓기, Mendelian 분리, 무작위 염색체 분류염색체 교차(, 자연 선택, 근친 교배 및 유전적 표류가 없는 경우) 이외의 진화력이 없는 경우, 연결 불균형 D(\ D는 ma에 따라 시간 축을 따라 0으로 수렴한다.두 위치 사이의 재결합 c c c.

위의 - 1 {\ D11}-1}을 사용하면 다음과 같이 0으로의 수렴을 나타낼 수 있습니다.다음 세대에서는 의 주파수인 µ({.

이는 자손의 하플로타입 중 일부1- 재결합하지 않아 부모에게서 무작위로 하플로타입이 복제되었기 때문이다.그 중 x 디스플레이 x 11 A1 A_입니다. c c 이 두 개의 위치를 재결합했습니다.부모가 무작위로 짝짓기를 한 경우 위치 복사본이 대립 을 가질 확률은 A_ 위치B의 복사본이 대립 B 스타일 B_1})을가질 확률은 B)입니다. 그리고 이 복사본들이 처음에 이배체 유전자형을 형성한 두 개의 다른 생식체에 있기 때문에, 이것들은 확률을 증가시킬 수 있는 독립적인 사건들이다.

이 공식은 다음과 같이 고쳐 쓸 수 있습니다.

하도록

n(\ n - generation의D(\ D 으로 지정됩니다.이렇게 해서

{\ n\infty이면 (- ) 0 { {\displaystyle }\ 0이므로 Dn {\n}이) 0으로 수렴됩니다.

어느 시점에 연계불평형이 관찰되면 재조합에 의해 미래에 사라질 것이다.단, 두 위치 사이의 거리가 작을수록 D D 속도는 0으로 작아집니다.

예:인간 백혈구항원(HLA) 대립 유전자

HLA는 인간의 MHC로도 알려진 세포 표면 항원의 그룹을 구성합니다.HLA 유전자는 염색체의 특정 영역의 인접 위치에 위치하고 있으며 서로 또는 다른 유전자와 함께 인식증을 보이는 것으로 추정되기 때문에 상당수의 대립 유전자가 결합불평형 상태에 있다.

이러한 연관성 불균형의 예는 Vogel과 Motulsky(1997)[12]에 의해 언급된 관련되지[11] 않은 덴마크에서 HLA-A1과 B8 대립 유전자 사이의 것이다.

표 1.
항원j
항원 i
개인수

HLA는 공수성이며 HLA 발현은 조사에서 궤적으로만 시험되므로 LD 측정치는 이와 같은 우측 2×[12][13][14][15]2 표에서 추정한다.

i i의 발현displaystyle i:

j(\ j의 발현 {\ 빈도:

'+/-', '+/+', '-/+' 을 가진 사람은 모두 i i에 양성 반응을 보인다.

그리고.

항원 i에서 '-' 대립 유전자를 x, 항원 j에서 y로 나타내면 xy의 관측 빈도는 다음과 같다.

그리고 하플로타입 xy의 추정 빈도는

LD 측정치 j\ \ _ { 다음과 같이 표현됩니다.

표준 S \ SEs는다음과 같이 구합니다.

그러면 만약에

절대값이 2를 초과하면 j \ \ _ { 크기가 통계적으로 유의하게 커집니다.표 1의 데이터의 경우 20.9이므로 모집단에서 A1과 B8 사이의 통계적으로 유의한 LD의 존재가 인정된다.

표 2
HLA-A 대립 유전자 i HLA-B 대립 유전자 j
A1 B8 0.065 16.0
A3 B7 0.039 10.3
A2 Bw40 0.013 4.4
A2 Bw15 0.01 3.4
A1 Bw17 0.014 5.4
A2 B18 0.006 2.2
A2 Bw35 −0.009 −2.3
A29 B12 0.013 6.0
A10 Bw16 0.013 5.9

표 2는 범유럽인 [15]사이에서 유의한 LD가 관찰된 HLA-A와 B 대립 유전자의 조합을 보여준다.

Vogel과 Motulsky([12]1997)는 HLA-A와 B의 위치 사이의 연관성 불균형이 사라지는 데 얼마나 걸릴 것이라고 주장했다.HLA-A와 B의 위치 간 재조합은 진도 0.008 정도로 간주되었다.우리는 아래의 Vogel과 Motulsky와 비슷하게 논쟁할 것이다.미탈[15] 목록에서 범유럽에서 LD 측정치가 0.003으로 관찰된 경우, 대부분 유의하지 않다.0 \ _ 재조합 효과 하에서 0.07에서 0.003으로 감소했다면 \ _ _으로 감소했을 경우δ 400한 세대가 25년이 걸렸다고 가정하면, 이것은 10,000년을 의미합니다.인간의 역사에서 시간은 다소 짧은 것 같다.따라서 관찰된 HLA-A와 B 위치 사이의 연계 불균형은 일종의 상호작용적 [12]선택을 나타낼 수 있다.

HLA 궤적과 질병 감수성의 추정 주요 유전자 사이의 연계 불균형의 존재는 다음 현상 중 하나에 해당한다.

  • 특정 HLA 대립 유전자를 가진 사람이 특정 질병에 걸릴 위험성은 [16]1보다 크다.
  • 환자의 HLA 항원 빈도는 건강한 집단보다 높다.이 값은 0을 초과하기 값으로[17] 평가됩니다.
표 3
강직성 척추염
환자 건전한 제어
HLA 대립 유전자
  • 2×2 환자의 연관표와 HLA 대립 유전자에 대한 건강한 대조군은 한계 빈도에서 추론된 평형 상태에서 유의한 편차를 보인다.

(1) 상대 리스크

질환에 대한 HLA 대립 유전자의 상대적 위험은 해당 대립 유전자와 질환의 2×2 연관표에서 승산비로 근사한다.표 3은 네덜란드 인구 [18]중 강직성 척추염과 HLA-B27의 연관성을 보여준다.이 대립 유전자의 상대적 x(\ x 다음과 같습니다.

Woolf의 방법은[19] 통계적으로 유의성이 있는지 확인하기 위해 적용된다.허락하다

그리고.

그리고나서

{ df=1의 카이-제곱 분포를 따릅니다. 표 3의 데이터에서는 유의한 연관성이 0.1% 수준에서 존재합니다.Haldane의 수정은[20] a d({ a 가 0인 경우에 적용됩니다. 서 x x/1/ 다음과 같이 대체됩니다.

그리고.

각각 다음과 같다.

표 4
질병 HLA 대립 유전자 상대위험(%) FAD(%) FAP(%)
강직성 척추염 B27 90 90 8 0.89
반응성 관절염 B27 40 70 8 0.67
염증성 장질환의 척추염 B27 10 50 8 0.46
류마티스 관절염 DR4 6 70 30 0.57
전신성 홍반성 낭창 DR3 3 45 20 0.31
다발성 경화증 DR2 4 60 20 0.5
제1형 당뇨병 DR4 6 75 30 0.64

표 4에는 HLA 대립 유전자와 질병 간의 연관성의 몇 가지 예가 [16]제시되어 있다.

(1a) 대조군에 대한 환자의 대립 유전자 빈도 초과

HLA 대립 유전자와 질병 사이의 높은 상대적 위험이 관찰되더라도,[17] 상대적 위험의 크기만 연관성의 강도를 결정할 수 없을 것이다. \displaystyle } 과 같습니다.

FADP(Displaystyle FAP [17]환자와 건강한 인구의 HLA 대립 유전자 빈도입니다.표 4에는 인용문에 컬럼이 추가되었습니다.소아당뇨병 1)은 상대위험도가 높은 2가지 질환을 하고도 다른 질병 중에서도 DR4와 연관성이 강하다

(2) HLA 대립유전자 및 질환의 2×2 연관표에서 한계빈도의 기대치와의 불일치

는 § 2(\^{ 테스트 계산으로 확인할 수 있습니다.

서 d df 한계 총계가 15( N, 30({ N 30보다 큰 등 샘플 크기가 작은 데이터의 경우 Yates의 보정을 연속성 또는 Fisher의 정확한 테스트에 [21]활용해야 합니다.

자원.

Devlin & Risch에[22] 의해 LD의 다양한 측정값 비교가 제공되고 있습니다.

International HapMap Project는 온라인에서 인간 인구의 LD 연구를 가능하게 한다.Ensembl 프로젝트는 HapMap 데이터를 dbSNP의 다른 유전 정보와 통합합니다.

분석 소프트웨어

  • PLINK – LD를 계산할 수 있는 전체 게놈 연관 분석 도구 세트
  • LDHat
  • 하플로뷰
  • LdCompare[23]: LD 계산을 위한 오픈소스 소프트웨어.
  • SNP Variation Suite – 인터랙티브 LD 플롯이 있는 상용 소프트웨어.
  • GOLD – 링크 불균형 그래프 개요
  • TASSEL – 연계 불균형, 특성 연관성 및 진화 패턴을 평가하는 소프트웨어
  • rAggr1000 Genetomes Project HapMap 유전자형 데이터베이스를 사용하여 조회된 마커 세트와 연계된 불균형 상태에 있는 프록시 마커(SNP 및 인델)를 찾습니다.
  • SNeP – PLINK 형식의 대규모 유전자형 데이터셋에 대해 LD 및 Ne를 빠르게 계산합니다.
  • LDlink – 모집단 서브그룹 내 연계불균형을 쉽고 효율적으로 탐색하기 위한 웹 기반 애플리케이션 스위트.모든 모집단 유전자형 데이터는 1000 Genetomes Project의 3단계에서 생성되며 변형 RS 번호는 dbSNP 빌드 151에 기반하여 색인화된다.
  • Bcftools – VCF 및 BCF를 바리안트 호출 및 조작하기 위한 유틸리티.

시뮬레이션 소프트웨어

  • Happloid - 집단 유전자 시뮬레이션(GPL)용 C 라이브러리

「 」를 참조해 주세요.

레퍼런스

  1. ^ a b c Slatkin, Montgomery (June 2008). "Linkage disequilibrium — understanding the evolutionary past and mapping the medical future". Nature Reviews Genetics. 9 (6): 477–485. doi:10.1038/nrg2361. PMC 5124487. PMID 18427557.
  2. ^ Falconer, DS; Mackay, TFC (1996). Introduction to Quantitative Genetics (4th ed.). Harlow, Essex, UK: Addison Wesley Longman. ISBN 978-0-582-24302-6.
  3. ^ Slatkin, Montgomery (June 2008). "Linkage disequilibrium — understanding the evolutionary past and mapping the medical future". Nature Reviews Genetics. 9 (6): 477–485. doi:10.1038/nrg2361. ISSN 1471-0056. PMC 5124487. PMID 18427557.
  4. ^ Calabrese, Barbara (2019-01-01), Ranganathan, Shoba; Gribskov, Michael; Nakai, Kenta; Schönbach, Christian (eds.), "Linkage Disequilibrium", Encyclopedia of Bioinformatics and Computational Biology, Oxford: Academic Press, pp. 763–765, doi:10.1016/b978-0-12-809633-8.20234-3, ISBN 978-0-12-811432-2, retrieved 2020-10-21
  5. ^ Lewontin, R. C. (1964). "The interaction of selection and linkage. I. General considerations; heterotic models". Genetics. 49 (1): 49–67. PMC 1210557. PMID 17248194.
  6. ^ Hill, W.G. & Robertson, A. (1968). "Linkage disequilibrium in finite populations". Theoretical and Applied Genetics. 38 (6): 226–231. PMID 24442307.{{cite journal}}: CS1 maint: 여러 이름: 작성자 목록(링크)
  7. ^ VanLiere, J.M. & Rosenberg, N.A. (2008). "Mathematical properties of the measure of linkage disequilibrium". Theoretical Population Biology. 74 (1): 130–137. PMC 2580747. PMID 18572214.{{cite journal}}: CS1 maint: 여러 이름: 작성자 목록(링크)
  8. ^ Smith, R.D. (2020). "The nonlinear structure of linkage disequilibrium". Theoretical Population Biology. 134: 160–170. PMID 32222435.
  9. ^ Robbins, R.B. (1 July 1918). "Some applications of mathematics to breeding problems III". Genetics. 3 (4): 375–389. PMC 1200443. PMID 17245911.
  10. ^ R.C. Lewontin & K. Kojima (1960). "The evolutionary dynamics of complex polymorphisms". Evolution. 14 (4): 458–472. doi:10.2307/2405995. ISSN 0014-3820. JSTOR 2405995.
  11. ^ a b Svejgaard A, Hauge M, Jersild C, Plaz P, Ryder LP, Staub Nielsen L, Thomsen M(1979).HLA 시스템: 제2판 입문 조사바젤, 런던, 치체스터: 카거, Wiley, ISBN 3805530498(pbk).
  12. ^ a b c d Vogel F, Motulsky AG(1997).인간유전학: 문제와 접근법, 제3판.베를린; 런던: 스프링거, ISBN 3-540-60290-9.
  13. ^ 미탈 KK, 하세가와 T, 팅에이, 미키 MR, 테라사키 PI(1973년)."아이너스, 일본인, 백인 사이의 HL-A 체계 유전적 변이" In Dausset J, Colombani J, eds.조직적합성 테스트, 1972년, 187-195페이지, 코펜하겐:Munksgaard, ISBN 87-16-01101-5.
  14. ^ Yasuda, N; Tsuji, K (June 1975). "A counting method of maximum likelihood for estimating haplotype frequency in the HL-A system". Jinrui Idengaku Zasshi. 20 (1): 1–15. PMID 1237691.
  15. ^ a b c d Mittal, KK (1976). "The HLA polymorphism and susceptibility to disease". Vox Sang. 31?-73 (3): 161–73. doi:10.1111/j.1423-0410.1976.tb02206.x. PMID 969389.
  16. ^ a b c Gregersen PK(2009)."류머티즘 질환의 유전학", InFirestein GS, Budd RC, Harris ED Jr, McInnes IB, Ruddy S, Sergent JS, ed. (2009).켈리의 류마티스학 교과서, 필라델피아, 305-321페이지: 손더스/엘세비어, ISBN 978-1-4160-3285-4.
  17. ^ a b c Bengtsson, BO; Thomson, G (November 1981). "Measuring the strength of associations between HLA antigens and diseases". Tissue Antigens. 18 (5): 356–63. doi:10.1111/j.1399-0039.1981.tb01404.x. PMID 7344182.
  18. ^ a b Nijenhuis, LE (September 1977). "Genetic considerations on association between HLA and disease". Hum. Genet. 38 (2): 175–82. doi:10.1007/bf00527400. PMID 908564.
  19. ^ Woolf, B (June 1955). "On estimating the relation between blood group and disease". Ann. Hum. Genet. 19 (4): 251–3. doi:10.1111/j.1469-1809.1955.tb01348.x. PMID 14388528.
  20. ^ Haldane, JB (May 1956). "The estimation and significance of the logarithm of a ratio of frequencies". Ann. Hum. Genet. 20 (4): 309–11. doi:10.1111/j.1469-1809.1955.tb01285.x. PMID 13314400.
  21. ^ 소칼 RR, 롤프 FJ(1981년).생체 측정: 생물학 연구에 있어서의 통계의 원칙과 실천.옥스퍼드: W.H. 프리먼, ISBN 0-7167-1254-7.
  22. ^ Devlin B.; Risch N. (1995). "A Comparison of Linkage Disequilibrium Measures for Fine-Scale Mapping" (PDF). Genomics. 29 (2): 311–322. CiteSeerX 10.1.1.319.9349. doi:10.1006/geno.1995.9003. PMID 8666377.
  23. ^ Hao K.; Di X.; Cawley S. (2007). "LdCompare: rapid computation of single – and multiple-marker r2 and genetic coverage". Bioinformatics. 23 (2): 252–254. doi:10.1093/bioinformatics/btl574. PMID 17148510.

추가 정보

  • Hedrick, Philip W. (2005). Genetics of Populations (3rd ed.). Sudbury, Boston, Toronto, London, Singapore: Jones and Bartlett Publishers. ISBN 978-0-7637-4772-5.
  • 서지학: 연계불균형분석: 연계불균형에 관한 1,000개 이상의 논문 목록 1918년 이후 출판되었습니다.