클래도그램
클래도그램(그리스산 클래도 "지점" 및 그램마 "문자"에서)은 유기체 간의 관계를 나타내기 위해 클래도 통계학에서 사용되는 도표다. 그러나 클래도그램은 조상들이 후손들과 어떻게 연관되어 있는지 보여주지도 않고, 얼마나 변화했는지를 보여주지도 않기 때문에 진화 트리가 아니며, 따라서 서로 다른 많은 진화 트리는 동일한 클래도그램과 일치할 수 있다.[1][2][3][4][5] 클래도그램은 마지막 공통 조상을 가진 유기체 그룹인 클래드로 끝나는 다른 방향으로 갈라지는 선을 사용한다. 클래도그램의 모양은 여러 가지가 있지만 모두 다른 선에서 분기되는 선을 가지고 있다. 그 선들은 그들이 분기하는 곳까지 거슬러 올라갈 수 있다. 이러한 분기점은 가상의 조상(실제 실체가 아님)을 나타내며, 위 터미널 세금 사이에 공유된 특성을 나타내기 위해 유추할 수 있다.[4][6] 그러면 이 가상의 조상은 조상들에 대한 다양한 특징, 적응, 그리고 다른 진화적 서술의 진화의 질서에 대한 단서를 제공할 수 있을 것이다. 전통적으로 그러한 클래도그램은 주로 형태학적 문자에 기초하여 생성되었지만, DNA와 RNA 염기서열 데이터 및 컴퓨터용 페이롤유전학은 현재 자체 또는 형태학과 결합하여 클래도그램 생성에 매우 일반적으로 사용되고 있다.
클래도그램 생성
분자 대 형태론적 데이터
클래도그램을 만드는 데 사용되는 특성은 형태학(시냅스 두개골, 온혈, 노토코드, 단세포 등) 또는 분자(DNA, RNA 또는 기타 유전 정보)로 대략 분류할 수 있다.[7] DNA 염기서열의 등장 이전에 피복재 분석은 주로 형태학적 데이터를 사용했다. 행동 데이터(동물에 대한)도 사용할 수 있다.[8]
DNA 염기서열이 저렴하고 쉬워짐에 따라 분자계통학은 계통학적 가설들을 추론하는 점점 더 대중적인 방법이 되었다.[9] 인조 기준을 사용하는 것은 분자 데이터로부터 인조체를 추론하는 몇 가지 방법 중 하나일 뿐이다. 시퀀스 진화의 명시적 모델을 포함하는 최대우도 같은 접근법은 시퀀스 데이터를 평가하기 위한 비헨식 방법이다. 유전체를 재구성하는 또 다른 강력한 방법은 유전체 역트랜스포존 표지를 사용하는 것인데, 이것은 시퀀스 데이터를 괴롭히는 역전의 문제에 덜 취약하다고 생각된다. 그들은 또한 게놈에 대한 그들의 통합이 완전히 무작위라고 한때 생각되었기 때문에 일반적으로 동종류의 발생률이 낮은 것으로 가정된다; 그러나 이것은 적어도 때때로 그렇지 않은 것처럼 보인다.

플레시오모르피스와 시냅오피시스
연구자들은 어떤 문자 상태가 "동시적"(플레시오모르피)이며 어떤 문자 상태가 파생(시냅토피리스)인지를 결정해야 하는데, 이는 시냅토픽 문자 상태만이 그룹화의 증거를 제공하기 때문이다.[10] 이 결정은 보통 하나 이상의 아웃그룹에 대한 문자 상태와 비교하여 이루어진다. 아웃그룹과 일부 그룹 멤버들 사이에 공유된 상태는 형태변환형이다; 그룹 내 하위집단에만 존재하는 상태는 시냅동형이다. 단일 단자(자동형)에 고유한 문자 상태는 그룹화의 증거를 제공하지 않는다는 점에 유의하십시오. 아웃그룹의 선택은 클래드리스틱 분석에서 중요한 단계로, 아웃그룹마다 위상이 심오하게 다른 트리를 만들 수 있기 때문이다.
호모플라시스
동음이의어는 공통 조상이 아닌 어떤 원인으로 인해 둘 이상의 세자가 공유하는 문자 상태를 말한다.[11] 동음이의 두 가지 주요 유형은 융합(최소한 두 개의 구별되는 선에서 "동일한" 문자의 진화)과 역전(조상적 인격 상태로의 회귀)이다. 북극 포유류의 서로 다른 선에 있는 흰 털과 같이 명백히 동종 플라스틱인 문자는 인간관계에 대한 우리의 이해에 아무런 기여도 하지 않기 때문에 계통생성 분석에서 문자로 포함시켜서는 안 된다. 단, 동종성은 문자 자체의 검사(예: DNA 서열에서와 같이)에서 뚜렷하지 않은 경우가 많으며, 그 다음 가장 박음질성 클래도그램에서 불규칙성(불가습성 분포)에 의해 검출된다. 동종 플라스틱인 문자는 여전히 계통생성 신호를 포함할 수 있다는 점에 유의하십시오.[12]
융합적 진화에 의한 동종류의 대표적인 예는 "날개의 존재"라는 등장인물이 될 것이다. 비록 새, 박쥐, 곤충의 날개는 같은 기능을 하지만, 각각의 날개는 해부학에서 볼 수 있듯이 독립적으로 진화했다. 만약 새, 박쥐, 날개 달린 곤충이 "날개의 존재"라는 캐릭터에 대해 점수가 매겨진다면, 동종이 데이터 집합에 도입될 것이고, 이것은 잠재적으로 분석을 혼란에 빠뜨릴 수 있으며, 아마도 관계에 대한 잘못된 가설을 야기할 수 있다. 물론 애초에 동음이의 분포를 알아볼 수 있는 유일한 이유는 그 동음이의 분포를 드러내는 관계의 패턴을 암시하는 다른 문자가 있기 때문이다.
Cladogram이 아닌 것
이 섹션은 검증을 위해 추가 인용구가 필요하다. (2021년 1월) (이 과 시기 |
클래도그램은 시너포모피만을 기초로 taxa를 그룹화하는 분석의 도표적 결과물이다. 데이터를 다소 다르게 취급하는 다른 계통생성 알고리즘도 많이 있으며, 그 결과 클라도그램처럼 보이지만 클라도그램이 아닌 계통생성 나무가 된다. 예를 들어 UPGMA 및 인접 결합과 같은 페네틱 알고리즘은 전체적인 유사성에 따라 그룹화하고, 그룹화의 증거로 시냅포모형과 심볼포모형을 모두 취급한다. 마찬가지로 결과 도표는 cladogram이 아닌 페노그램이다. 마찬가지로 모델 기반 방법의 결과(최대우도 또는 베이지안 접근법)도이다.분지 순서와 "분지 길이"는 그룹화에 대한 증거로서 시너포모르피와 자동포모르피스를 모두 계산한다. 이러한 분석의 결과 다이어그램도 클래도그램이 아니다.[13]
클래도그램 선택
"최상의" 클래도그램을 식별할 수 있는 몇 가지 알고리즘이 있다.[14] 대부분의 알고리즘은 후보 클래도그램이 데이터와 얼마나 일치하는지 측정하기 위해 메트릭을 사용한다. 대부분의 클래도그램 알고리즘은 최적화와 최소화의 수학적 기법을 사용한다.
일반적으로 클라도그램 생성 알고리즘은 데이터 세트가 보통일 때(예를 들어 몇 종과 두어 가지 특성) 수동으로 수행할 수 있지만 컴퓨터 프로그램으로 구현해야 한다.
어떤 알고리즘은 특성 데이터가 분자(DNA, RNA)일 때만 유용하고, 다른 알고리즘은 특성 데이터가 형태학적일 때만 유용하다. 특성 데이터가 분자 및 형태학 데이터를 모두 포함할 경우 다른 알고리즘을 사용할 수 있다.
클래도그램 또는 다른 유형의 계통생성 트리에 대한 알고리즘에는 최소 제곱, 인접 결합, 편협성, 최대우도 및 베이지안 추론이 포함된다.
생물학자들은 때때로 특정한 종류의 클래도그램 생성 알고리즘에 대해 파시모니라는 용어를 사용하며, 때로는 모든 계통생성 알고리즘에 대한 포괄적 용어로 사용한다.[15]
최적화 작업(건물 클래도그램 등)을 수행하는 알고리즘은 입력 데이터(종목 리스트 및 그 특성)가 제시되는 순서에 민감할 수 있다. 데이터를 다양한 순서로 입력하면 동일한 알고리즘이 서로 다른 "최상의" 클래도그램을 생성하게 될 수 있다. 이런 상황에서는 사용자가 데이터를 다양한 순서로 입력하고 결과를 비교해야 한다.
각 알고리즘은 "최고"에 대한 고유한 정의를 가질 수 있기 때문에 단일 데이터 집합에 서로 다른 알고리즘을 사용하면 때때로 다른 "최상의" 클래도그램을 산출할 수 있다.
가능한 클래도그램의 천문학적인 수 때문에 알고리즘은 솔루션이 전체 최고의 솔루션이라고 보장할 수 없다. 프로그램이 원하는 전역 최소값이 아닌 국소 최소값으로 안착될 경우 최적이 아닌 클래도그램이 선택된다.[16] 이 문제를 해결하기 위해 많은 클래도그램 알고리즘은 선택된 클래도그램이 최적일 가능성을 높이기 위해 시뮬레이션된 어닐링 접근방식을 사용한다.[17]
기저 위치는 뿌리가 있는 계통형 트리나 클래도그램의 베이스(또는 뿌리)의 방향이다. 기저 쇄골은 (주어진 분류학 등급[a] 중)이 더 큰 쇄골 내에서 분기되는 가장 초기 쇄골이다.
통계
부조화 길이 차이 검정(또는 파티션 균질성 검정)
부조화 길이 차이 시험(ILD)은 서로 다른 데이터 집합(예: 형태학 및 분자학, 플라스티드 및 핵 유전자)의 조합이 긴 나무에 어떻게 기여하는지를 측정한 것이다. 먼저 각 파티션의 총 트리 길이를 계산하고 합계를 계산하여 측정한다. 그런 다음 복제품은 원래 칸막이로 구성된 임의로 조립된 칸막이를 만들어 만든다. 길이가 합하다. 99개의 반복실험이 더 긴 조합 트리 길이를 갖는 경우 100번의 반복실험에 대해 0.01의 p 값을 구한다.
동종류 측정
일부 측정은 트리를 기준으로 데이터 집합의 동종분포체 양을 측정하려고 시도하지만, 이 측정치가 정량화를[19] 목표로 하는 속성이 반드시 명확하지는 않다.[18]
일관성 지수
일관성 지수(CI)는 데이터 집합에 대한 트리의 일관성을 측정하는데, 이는 트리가 암시하는 동종류의 최소 양을 측정한 것이다.[20] 데이터 집합의 최소 변경 수를 세고 이를 클래도그램에 필요한 실제 변경 수로 나누어 계산한다.[20] c로i 표시된 개별 문자 i에 대해서도 일관성 지수를 계산할 수 있다.
동음이의 양을 반영하는 것 외에도, 미터법은 데이터 집합의 세자의 수,[21] 데이터 집합의 문자 수,[22] 각 문자가 계통생성 정보를 전달하는 정도,[23] 첨가 문자가 코딩되는 방식도 반영하여 목적에 적합하지 않다.[24]
c는i 균일한 상태 분포의 이진 문자로 1에서 1/[n.taxa/2] 사이의 범위를 차지한다. c의 최소값은 상태가 균등하게 확산되지 않을 때 더 크다.[23][18] In general, for a binary or non-binary character with , ci occupies a range from 1 to .[23]
보존지수
보존 지수(RRI)는 "특정 애플리케이션에 대한"[25] CI의 개선으로 제안되었다. 이 측정 지표는 또한 동종류의 양을 측정하기 위한 것이기도 하지만, 또한 나무를 얼마나 잘 설명하는지도 측정한다. 이 값은 (트리의 최대 변경 수 - 트리의 변경 수 - 트리의 변경 수 - 데이터 집합의 최소 변경 수)를 사용하여 계산한다.
재조정 일관성 지수(RC)는 CI에 RI를 곱하여 얻는다. 실제로 이는 최소 이론적으로 달성 가능한 값이 0으로 재조정되고 최대값은 1로 유지되도록 CI 범위를 확장한다.[18][25] 동종 지수(HI)는 단순히 1 - CI이다.
동모포체 초과비
이것은 이론적으로 존재할 수 있는 동종류의 최대 양에 비례하여 나무에서 관찰되는 동종류의 양을 측정한다 – 1 - (관측 동종류 초과) / (최대 동종류 초과)[22] 값이 1이면 동종양이 없음을 나타내며, 0은 완전 랜덤 데이터 집합에 있을 수 있는 만큼의 동종양을 나타내며, 음의 값은 더 많은 동종양(그리고 조작된 예에서만 발생하는 경향이 있음)[22]을 나타낸다. HER은 현재 이용 가능한 동종류의 가장 좋은 척도로 제시된다.[18][26]
참고 항목
참조
- ^ Mayr, Ernst (2009). "Cladistic analysis or cladistic classification?". Journal of Zoological Systematics and Evolutionary Research. 12: 94–128. doi:10.1111/j.1439-0469.1974.tb00160.x.
- ^ Foote, Mike (Spring 1996). "On the Probability of Ancestors in the Fossil Record". Paleobiology. 22 (2): 141–51. doi:10.1017/S0094837300016146. JSTOR 2401114.
- ^ Dayrat, Benoît (Summer 2005). "Ancestor-Descendant Relationships and the Reconstruction of the Tree of Life". Paleobiology. 31 (3): 347–53. doi:10.1666/0094-8373(2005)031[0347:aratro]2.0.co;2. JSTOR 4096939.
- ^ Jump up to: a b Posada, David; Crandall, Keith A. (2001). "Intraspecific gene genealogies: Trees grafting into networks". Trends in Ecology & Evolution. 16: 37–45. doi:10.1016/S0169-5347(00)02026-7.
- ^ Podani, János (2013). "Tree thinking, time and topology: Comments on the interpretation of tree diagrams in evolutionary/phylogenetic systematics" (PDF). Cladistics. 29 (3): 315–327. doi:10.1111/j.1096-0031.2012.00423.x.
- ^ Schuh, Randall T. (2000). Biological Systematics: Principles and Applications. ISBN 978-0-8014-3675-8.[페이지 필요]
- ^ DeSalle, Rob (2002). Techniques in Molecular Systematics and Evolution. Birkhauser. ISBN 978-3-7643-6257-7.[페이지 필요]
- ^ Wenzel, John W. (1992). "Behavioral homology and phylogeny". Annu. Rev. Ecol. Syst. 23: 361–381. doi:10.1146/annurev.es.23.110192.002045.
- ^ Hillis, David (1996). Molecular Systematics. Sinaur. ISBN 978-0-87893-282-5.[페이지 필요]
- ^ Hennig, Willi (1966). Phylogenetic Systematics. University of Illinois Press.
- ^ West-Eberhard, Mary Jane (2003). Developmental Plasticity and Evolution. Oxford Univ. Press. pp. 353–376. ISBN 978-0-19-512235-0.
- ^ Kalersjo, Mari; Albert, Victor A.; Farris, James S. (1999). "Homoplasy Increases Phylogenetic Structure". Cladistics. 15: 91–93. doi:10.1111/j.1096-0031.1999.tb00400.x.
- ^ Brower, Andrew V.Z. (2016). "What is a cladogram and what is not?". Cladistics. 32 (5): 573–576. doi:10.1111/cla.12144.
- ^ Kitching, Ian (1998). Cladistics: The Theory and Practice of Parsimony Analysis. Oxford University Press. ISBN 978-0-19-850138-1.[페이지 필요]
- ^ Stewart, Caro-Beth (1993). "The powers and pitfalls of parsimony". Nature. 361 (6413): 603–7. Bibcode:1993Natur.361..603S. doi:10.1038/361603a0. PMID 8437621.
- ^ Foley, Peter (1993). Cladistics: A Practical Course in Systematics. Oxford Univ. Press. p. 66. ISBN 978-0-19-857766-9.
- ^ Nixon, Kevin C. (1999). "The Parsimony Ratchet, a New Method for Rapid Parsimony Analysis". Cladistics. 15 (4): 407–414. doi:10.1111/j.1096-0031.1999.tb00277.x.
- ^ Jump up to: a b c d 에서 검토된.
- ^ Chang, Joseph T.; Kim, Junhyong (1996). "The Measurement of Homoplasy: A Stochastic View". Homoplasy. pp. 189–203. doi:10.1016/b978-012618030-5/50009-5. ISBN 9780126180305.
- ^ Jump up to: a b Kluge, A. G.; Farris, J. S. (1969). "Quantitative Phyletics and the Evolution of Anurans". Systematic Zoology. 18 (1): 1–32. doi:10.2307/2412407. JSTOR 2412407.
- ^ Archie, J. W.; Felsenstein, J. (1993). "The Number of Evolutionary Steps on Random and Minimum Length Trees for Random Evolutionary Data". Theoretical Population Biology. 43: 52–79. doi:10.1006/tpbi.1993.1003.
- ^ Jump up to: a b c Archie, J. W. (1989). "HOMOPLASY EXCESS RATIOS : NEW INDICES FOR MEASURING LEVELS OF HOMOPLASY IN PHYLOGENETIC SYSTEMATICS AND A CRITIQUE OF THE CONSISTENCY INDEX". Systematic Zoology. 38 (3): 253–269. doi:10.2307/2992286. JSTOR 2992286.
- ^ Jump up to: a b c Hoyal Cuthill, Jennifer F.; Braddy, Simon J.; Donoghue, Philip C. J. (2010). "A formula for maximum possible steps in multistate characters: Isolating matrix parameter effects on measures of evolutionary convergence". Cladistics. 26: 98–102. doi:10.1111/j.1096-0031.2009.00270.x.
- ^ Sanderson, M. J.; Donoghue, M. J. (1989). "Patterns of variations in levels of homoplasy". Evolution. 43 (8): 1781–1795. doi:10.2307/2409392. JSTOR 2409392.
- ^ Jump up to: a b Farris, J. S. (1989). "The retention index and the rescaled consistency index". Cladistics. 5 (4): 417–419. doi:10.1111/j.1096-0031.1989.tb00573.x.
- ^ Hoyal Cuthill, Jennifer (2015). "The size of the character state space affects the occurrence and detection of homoplasy: Modelling the probability of incompatibility for unordered phylogenetic characters". Journal of Theoretical Biology. 366: 24–32. doi:10.1016/j.jtbi.2014.10.033. PMID 25451518.
외부 링크
위키미디어 커먼스의 Cladogram 관련 매체