분자유전학
Molecular phylogenetics분자 계통유전학(/mɛljkjəlrr fafaloloddɛnɛɛnɛtksks, mɒ-, moʊ-/)[1][2]은 주로 DNA 서열에서 유전적, 유전적 분자 차이를 분석하여 유기체의 진화 관계에 대한 정보를 얻는 계통이다.이러한 분석을 통해 종간의 다양성이 달성된 과정을 파악할 수 있다.분자 계통생성 분석의 결과는 계통생성 나무로 표현된다.분자 계통학은 분자 계통학의 한 측면으로, 분류학 및 생물 지리학에서 분자 데이터를 사용하는 것을 포함하는 더 넓은 용어다.[3][4][5]
분자 계통유전학과 분자 진화는 상관관계가 있다.분자 진화는 생명의 나무(진화)의 여러 가지 가지 가지에 걸쳐 분자 수준(유전, 단백질 등)에서 선택적 변화(진화)의 과정이다.분자 계통유전학은 분자 진화로 인해 발생하는 진화적 관계를 추론하고 계통유전 나무를 만드는 결과를 낳는다.[6]
역사
분자 계통학을 위한 이론적 프레임워크는 1960년대에 에밀 주커칸들, 이매뉴얼 마골리아시, 리누스 폴링, 그리고 월터 M의 작품에서 세워졌다. 피치.[7] 분자 계통학의 응용은 찰스 G. 시블리(새) 허버트 C에 의해 개척되었다. 데사우어(herpetology), 모리스 굿맨(primates)이 뒤를 이었고, 앨런 C가 그 뒤를 이었다. 윌슨, 로버트 K. 셀랜더, 그리고 존 C. 아비즈(여러 그룹을 연구한 사람)단백질 전기영양증에 대한 작업은 1956년경에 시작되었다.비록 결과가 양적인 것은 아니었고 처음에는 형태학적 분류에 대해 개선되지 않았지만, 그들은 예를 들어 새의 분류에 대한 오랜 개념은 상당한 수정이 필요하다는 감질나는 힌트를 제공했다.1974-1986년에 DNA-DNA 교배는 유전적 차이를 측정하는 데 사용되는 지배적인 기술이었다.[8]
이론적 배경
분자 계통학에 대한 초기 시도는 화학약사학이라고도 불리며 크로마토그래피와 같은 기법을 사용하여 분리되고 특징지어지는 단백질, 효소, 탄수화물, 기타 분자를 사용하였다.이것들은 다른 기법을 사용하여 추출한 DNA 또는 RNA 부분들 중 하나에서 뉴클레오티드나 염기서열의 정확한 순서를 생성하는 DNA 염기서열로 최근 대체되었다.일반적으로 진화의 작용은 궁극적으로 유전적 순서에 반영되기 때문에 이것들은 진화 연구에 우월한 것으로 간주된다.현재, 유기체의 전체 DNA를 염기서열화하는 것은 여전히 길고 비용이 많이 드는 과정이다.그러나 특정 염색체의 정의된 영역의 순서를 결정하는 것은 상당히 실현 가능하다.일반적인 분자 체계 분석에는 약 1000개의 염기쌍의 염기서열이 필요하다.그러한 시퀀스 내의 어떤 위치에서든 주어진 위치에서 발견되는 베이스는 유기체마다 다를 수 있다.주어진 유기체에서 발견되는 특정한 순서를 happlotype이라고 한다.원칙적으로 1000개의 염기쌍을 가진 4개의 염기형이 있기 때문에 4개의1000 뚜렷한 하플라타입이 있을 수 있다.그러나 특정 종 내의 유기체나 관련 종의 집단에 있는 유기체의 경우, 단지 소수의 부위만이 전혀 변동을 보이는 것이 경험적으로 발견되었고, 발견되는 변종의 대부분은 상관관계가 있기 때문에 발견되는 뚜렷한 하모형의 수는 상대적으로 적다.[9]
분자 체계적 분석에서, happlotype은 유전 물질의 정의된 영역에 대해 결정된다; 대상 종이나 다른 세원의 상당한 표본이 사용된다; 그러나, 많은 현재 연구는 단일 개인을 기반으로 한다.밀접하게 연관되어 있지만 서로 다른 세자의 개체 수도 결정된다.마지막으로, 확실히 다른 세원의 소수 개인에서 나온 happlotype이 결정된다. 이들을 아웃그룹이라고 한다.그런 다음 happlotype에 대한 기본 시퀀스를 비교한다.가장 간단한 경우, 두 개의 happlotype의 차이를 그들이 서로 다른 기초를 가진 위치의 수를 세어 평가한다: 이것을 대체물의 수라고 한다(예를 들어, happlotype 사이의 다른 종류의 차이도 발생할 수 있다, 예를 들어, happlotype의 한 부분에 핵산 부분을 삽입하는 것 등이 있다 i.n 다른 것유기체들 간의 차이는 대체물의 수를 분석된 염기쌍의 수로 나누어서 보통 백분율 차이로서 다시 표현된다: 희망은 이 조치가 염기서열화된 DNA 부분의 위치와 길이에 독립적일 것이라는 것이다.
오래되고 대체된 접근법은 DNA-DNA 교배에 의해 개인의 유전자형 간 분열을 결정하는 것이었다.유전자 염기서열화보다는 잡종화를 사용했다는 장점은 DNA의 특정 부분이 아닌 전체 유전자형에 기초한다는 점이었다.현대 시퀀스 비교 기법은 복수의 시퀀스를 사용함으로써 이러한 반대를 극복한다.
모든 표본 쌍 간의 분산이 결정되면, 결과적인 삼각 행렬의 차이점은 어떤 형태의 통계적 클러스터 분석으로 제출되고, 그 결과 덴드로그램은 표본 군집이 집단의 분류에 대한 현재 아이디어에서 기대되는 방식으로 이루어지는지 확인하기 위해 조사된다.그들 중 어떤 그룹보다 서로 더 유사한 모든 하플라타입 집단은 다른 하플라데를 구성한다고 말할 수 있으며, 오른쪽의 그림이 보여주는 것처럼 시각적으로 표현될 수 있다.부트스트래핑과 잭나이프팅과 같은 통계적 기법은 진화 나무 내의 happlotype 위치에 대한 신뢰성 추정치를 제공하는 데 도움이 된다.
기법 및 응용 프로그램
모든 생물체는 디옥시리보핵산(DNA), 리보핵산(RNA), 단백질을 포함한다.일반적으로 밀접하게 연관된 유기체는 이러한 물질의 분자 구조에서 높은 수준의 유사성을 가지고 있는 반면, 먼 관계가 있는 유기체의 분자는 종종 다른 형태의 유사성을 보인다.미토콘드리아 DNA와 같이 보존된 염기서열은 시간이 지남에 따라 돌연변이가 축적될 것으로 예상되며, 일정한 돌연변이를 가정하면, 데이트 분자시계를 제공하게 된다.분자 계통생성은 그러한 데이터를 이용하여 다양한 유기체의 가능한 진화를 보여주는 "관계 나무"를 구축한다.1977년 생어 염기서열 분석의 발명으로, 이러한 분자 구조를 분리하고 식별할 수 있게 되었다.[10][11]고투과 시퀀싱은 또한 유기체의 성적 증명서를 얻기 위해 사용될 수 있으며, 성적 증명 데이터를 사용한 혈전 관계의 추론을 허용한다.
가장 일반적인 접근방식은 유사성을 식별하기 위해 시퀀스 정렬 기법을 사용하여 유전자에 대한 동음이의 시퀀스를 비교하는 것이다.분자 계통의 또 다른 적용은 DNA 바코딩에 있는데, 여기서 개별 유기체의 종에서는 미토콘드리아 DNA의 작은 부분이나 엽록체 DNA를 사용하여 식별된다.이것을 가능하게 하는 기술의 또 다른 적용은, 아이의 친자부를 결정하기 위해 유전자 검사를 점점 더 많이 사용하는 것뿐만 아니라, 유전자 지문 채취라고 알려진 증거에 초점을 맞춘 범죄 과학 수사학의 새로운 지부의 출현과 같은, 인간 유전학의 매우 한정된 분야에서 볼 수 있다.
분자 계통학적 분석
분자 계통생리학적 분석을 수행하는 데 사용할 수 있는 몇 가지 방법이 있다.자연 프로토콜에서는 DNA/아미노산 연속 시퀀스 어셈블리, 다중 시퀀스 정렬, 모델 테스트(최상의 대체 모델 테스트), 최대우도 및 베이지안 추론을 사용한 골생재 재구성을 포함한 한 가지 방법을 사용할 수 있다.[12]
또 다른 분자 계통학적 분석 기법은 Pevsner에 의해 설명되었으며 따라야 할 문장에 요약되어야 한다(Pvsner, 2015).계통생리학적 분석은 일반적으로 5가지 주요 단계로 구성된다.첫 번째 단계는 시퀀스 획득으로 구성된다.다음 단계는 계통생성 트리를 구성하는 기본 바탕이 되는 다중 시퀀스 정렬을 수행하는 것으로 구성된다.3단계는 DNA와 아미노산 대체의 다른 모델을 포함한다.여러 가지 대체 모델이 존재한다.몇 가지 예로는 해밍 거리, 주크스와 칸토어의 1-모수 모델, 키무라 2-모수 모델(DNA 진화 모델 참조) 등이 있다.네 번째 단계는 거리 기반과 문자 기반 방법 등 다양한 나무 건축 방법으로 구성된다.정규화된 해밍 거리와 주크스캔터 보정 공식은 각각 산란 정도와 핵산염이 다른 것으로 변화할 확률을 제공한다.일반적인 나무 쌓기 방법으로는 거리 기반 방법인 산술 평균(UPGMA)과 인접 결합을 이용한 비가중 쌍체 그룹 방법, 문자 기반 방법인 최대 파모니(Maximum parsimony), 문자 기반/모델 기반 방법인 최대우도 추정 및 베이시안 추론이 있다.UPGMA는 간단한 방법이지만, 인접 접근법에 비해 정확도가 떨어진다.마지막으로, 마지막 단계는 나무를 평가하는 것이다.정확성에 대한 이러한 평가는 일관성, 효율성 및 강건성으로 구성된다.[13]
MEG(분자 진화유전분석)는 사용자 친화적이고 다운로드와 사용이 자유로운 분석 소프트웨어다.이 소프트웨어는 거리 기반과 문자 기반 트리 방법론을 모두 분석할 수 있다.또한 메가에는 경험적 접근법 및 부트스트래핑과 같이 한 사람이 활용할 수 있는 몇 가지 옵션이 포함되어 있다.부트스트래핑은 계통생성 트리에서 위상의 강건성을 측정하는 데 일반적으로 사용되는 접근법으로, 여러 번의 반복실험 후 각 클래드가 지지되는 비율을 보여준다.일반적으로 70%를 초과하는 값은 유의적인 것으로 간주된다.오른쪽에 표시된 흐름도는 지금까지 설명한 펩너의 분자 계통 분석 기법의 5단계 순서를 시각적으로 보여준다.[13]
제한 사항
분자 계통학은 본질적으로 피복재론적 접근법이다. 분자는 분류를 반드시 계통생성 하강에 대응해야 하며, 모든 유효한 세자는 단극성이어야 한다고 가정한다.이는 계통생성 트리의 일부를 이등분하고 다시 연결하는 것을 수반하는 최적 트리를 결정할 때 제한된다.
최근 유기체들 사이에 광범위한 수평 유전자가 전이된 것이 발견되면서 분자 계통학에 상당한 복잡성을 야기하고 있으며, 이는 동일한 유기체 내의 서로 다른 유전자가 서로 다른 유전자를 가질 수 있음을 보여준다.
게다가, 분자 계통은 그것들을 만드는 데 들어가는 가정과 모델에 민감하다.우선 순서가 일치해야 한다. 그런 다음 장기 지점 유치, 포화, 택슨 샘플링 문제와 같은 문제를 해결해야 한다.이는 동일한 데이터 집합에 서로 다른 모델을 적용함으로써 현저하게 다른 결과를 얻을 수 있다는 것을 의미한다.[14][15]
더욱이 앞에서 언급한 바와 같이 UPGMA는 트리가 항상 뿌리를 내리고 있는 단순한 접근법이다.알고리즘은 트리의 시퀀스에 대해 일정한 분자 시계를 가정한다.이는 균등하지 않은 대체율이 존재할 경우 그 결과가 잘못된 트리가 될 수 있다는 한계와 관련이 있다.[13]
참고 항목
참고 및 참조
- ^ Jones, Daniel (2003) [1917], Peter Roach; James Hartmann; Jane Setter (eds.), English Pronouncing Dictionary, Cambridge: Cambridge University Press, ISBN 3-12-539683-2
- ^ "Phylogenetic". Merriam-Webster Dictionary.
- ^ 2004년 J. 펠센슈타인유전자를 유추하고 있어시나워 어소시에이츠 주식회사.ISBN 0-87893-177-5.
- ^ 솔티스, P.S., 솔티스, D.E., 도일, J.J. (1992) 식물의 분자 계통학.채프먼 & 홀, 뉴욕.ISBN 0-41202-231-1.
- ^ 솔티스, P.S., 솔티스, D.E., 도일, J.J.(1998) 식물의 분자 체계학 II: DNA 염기서열 분석.런던 도드레흐트 주 보스턴 클루워 학술 출판사ISBN 0-41211-131-4.
- ^ 힐리스, D. M. & 모리츠, C. 1996.분자 계통학.2부.시나워 어소시에이츠 주식회사.ISBN 0-87893-282-8
- ^ Suárez-Díaz, Edna & Anaya-Muñoz, Victor H. (2008). "History, objectivity, and the construction of molecular phylogenies". Stud. Hist. Phil. Biol. & Biomed. Sci. 39 (4): 451–468. doi:10.1016/j.shpsc.2008.09.002. PMID 19026976.
- ^ Ahlquist, Jon E. (1999). "Charles G. Sibley: A commentary on 30 years of collaboration". The Auk. 116 (3): 856–860. doi:10.2307/4089352. JSTOR 4089352.
- ^ Page, Roderic D. M.; Holmes, Edward C. (1998). Molecular evolution : a phylogenetic approach. Oxford: Blackwell Science. ISBN 9780865428898. OCLC 47011609.
- ^ Sanger F, Coulson AR (May 1975). "A rapid method for determining sequences in DNA by primed synthesis with DNA polymerase". J. Mol. Biol. 94 (3): 441–8. doi:10.1016/0022-2836(75)90213-2. PMID 1100841.
- ^ Sanger F, Nicklen S, Coulson AR (December 1977). "DNA sequencing with chain-terminating inhibitors". Proc. Natl. Acad. Sci. U.S.A. 74 (12): 5463–7. Bibcode:1977PNAS...74.5463S. doi:10.1073/pnas.74.12.5463. PMC 431765. PMID 271968.
- ^ Bast, F. (2013). "Sequence Similarity Search, Multiple Sequence Alignment, Model Selection, Distance Matrix and Phylogeny Reconstruction". Protoc. Exch. doi:10.1038/protex.2013.065.
- ^ a b c Pevsner, J. (2015). "Chapter 7: Molecular Phylogeny and Evolution". Bioinformatics and Functional Genomics (3rd ed.). Wiley-Blackwell. pp. 245–295. ISBN 978-1-118-58178-0.
- ^ Cabra-García, Jimmy; Hormiga, Gustavo (2020). "Exploring the impact of morphology, multiple sequence alignment and choice of optimality criteria in phylogenetic inference: A case study with the Neotropical orb-weaving spider genus Wagneriana (Araneae: Araneidae)". Zoological Journal of the Linnean Society. 188 (4): 976–1151. doi:10.1093/zoolinnean/zlz088.
- ^ Philippe, H.; Brinkmann, H.; Lavrov, D. V.; Littlewood, D. T. J.; Manuel, M.; Wörheide, G.; Baurain, D. (2011). Penny, David (ed.). "Resolving Difficult Phylogenetic Questions: Why More Sequences Are Not Enough". PLOS Biology. 9 (3): e1000602. doi:10.1371/journal.pbio.1000602. PMC 3057953. PMID 21423652.
추가 읽기
- San Mauro, D.; Agorreta, A. (2010). "Molecular systematics: a synthesis of the common methods and the state of knowledge". Cellular & Molecular Biology Letters. 15 (2): 311–341. doi:10.2478/s11658-010-0010-8. PMC 6275913. PMID 20213503.
외부 링크
- NCBI – 계통학 및 분자 계통학 계통학
- 메가 소프트웨어
- DNA 분류법의 약속 (Mark L. Blaxter)
- 브리태니커 백과사전(Britannica)의 분자 계통유전학.