계통발생학에서의 베이지안 추론

Bayesian inference in phylogeny
계통발생학에서의 베이지안 추론
분류진화생물학
하위 분류분자 계통학
최적의 검색 조건베이지안 추론

계통 발생의 베이지안 추론은 이전 및 데이터 우도의 정보를 결합하여 소위 나무 사후 확률을 생성한다. 이것은 데이터, 이전 및 가능성 모델이 주어진 트리가 정확할 확률이다.베이지안 추론은 세 개의 독립적인 그룹에 의해 1990년대에 분자 계통학으로 도입되었다.버클리에서는 [1][2]브루스 라날라와 지엥 양, [3]매디슨에서는 밥 마우, [4]아이오와 대학에서는 슈잉 리가 박사과정 학생이었다.[5]접근법은 2001년 MrBayes 소프트웨어 출시 이후 매우 인기를 끌었으며, 현재는 분자 계통학에서 가장 인기 있는 방법 중 하나이다.

계통발생학적 배경과 기초에 대한 베이지안 추론

베이즈 정리
MCMC 방법 단계를 나타내는 은유

베이지안 추론은 토마스 베이즈 목사가 베이즈의 정리에 기초하여 개발한 확률론적 방법을 말한다.1763년에 사후에 출판된 그것은 역확률의 첫 번째 표현이자 베이지안 추론의 기초였다.독립적으로, 피에르-시몽 라플라스는 베이즈의 정리를 1774년에 [6]발전시켰다.

베이지안 추론 또는 역확률법은 RA 피셔가 현재 고전/자주파/피셔 추론으로 알려진 것을 개발하기 전인 1900년대 초반까지 통계적 사고의 표준 접근법이었다.마르코프 연쇄 몬테 카를로(MCMC) 알고리즘이 베이지안 계산을 혁신한 1990년대까지 계산상의 어려움과 철학적 반대가 베이지안 접근법의 광범위한 채택을 막았다.

계통학적 재구성에 대한 베이지안 접근방식은 나무 P(A)의 이전 확률과 나무 P(A B)[7]에 사후 확률 분포를 생성하기 위한 데이터(B)의 가능성을 결합한다.트리의 사후 확률은 이전, 데이터 및 우도 모형의 정확성을 고려할 때 트리가 정확할 확률입니다.

MCMC 방법은 세 단계로 설명될 수 있다. 먼저 확률적 메커니즘을 사용하여 마르코프 연쇄에 대한 새로운 상태를 제안한다.둘째, 이 새로운 상태가 정확할 확률이 계산됩니다.세 번째로, 새로운 랜덤 변수(0,1)가 제안된다.이 새로운 값이 허용 확률보다 작을 경우 새로운 상태가 받아들여지고 체인 상태가 갱신됩니다.이 프로세스는 수천 또는 수백만 번 실행됩니다.사슬의 과정 동안 나무 한 그루가 방문하는 횟수는 그 사후 확률의 근사치이다.MCMC 방법에 사용되는 가장 일반적인 알고리즘으로는 Metropolis-Hastings 알고리즘, Metropolis-Coupling MCMC(MC) 및 LOCAL 알고리즘 Larget과 Simon이 있습니다.

Metropolis-Hastings 알고리즘

가장 일반적으로 사용되는 MCMC 방식 중 하나는 Metropolis-Hastings [8]알고리즘입니다.Metropolis 알고리즘은 [9]원래 Metropolis 알고리즘의 수정 버전입니다.복잡하고 다차원적인 분포 확률에서 무작위로 표본을 추출하는 데 널리 사용되는 방법입니다.Metropolis 알고리즘은 다음 [10]단계로 설명합니다.

  1. 초기 트리 T를i 랜덤으로 선택한다.
  2. 수목 집합에서 이웃나무 T를j 선택한다.
  3. T와i T의 확률j(또는 확률 밀도 함수)의 비율 R은 다음과 같이 계산된다. R = f(Tj)/f(Ti)
  4. R이 1이면 T가j 현재 트리로 받아들여집니다.
  5. R < 1, T가j 확률 R의 전류 트리로 받아들여지고 그렇지 않으면i T가 유지됩니다.
  6. 이 시점에서 이 프로세스는 스텝2 N부터 반복됩니다.

알고리즘은 평형 분포에 도달할 때까지 계속 실행됩니다.또한 우리가 오래된 트리i 상태 T에 있을 때 새로운j 트리 T를 제안할 확률은 우리가j T에 있을 때 T를i 제안할 확률과 동일하다고 가정한다.그렇지 않은 경우 헤이스팅스 보정이 적용됩니다.Metropolis-Hastings 알고리즘의 목적은 마르코프 프로세스가 정상 분포에 도달할 때까지 결정된 분포로 상태 모음을 생성하는 것이다.알고리즘에는 다음 2개의 컴포넌트가 있습니다.

  1. 전이 확률 함수i,j q를 사용하여 한 상태에서 다른 상태(i → j)로의 잠재적 전이
  2. 확률i,j α의 상태 j에 대한 사슬의 움직임과 확률i,j 1 [2]– α의 i에 머무른다.

메트로폴리스 결합 MCMC

Metropolis-Coupled MCMC 알고리즘(MC))은 목표 분포가 낮은 계곡으로 분리된 여러 국소 피크를 트리 공간에 존재하는 것으로 알려진 경우 피크를 가로질러 이동하는 마르코프 체인의 실질적인 문제를 해결하기 위해 제안되었다.이는 최대 근량(MP), 최대우도(ML) 및 최소진화(ME) 기준에 따른 휴리스틱 트리 검색의 경우이며, MCMC를 사용한 확률 트리 검색에서도 동일하게 예상할 수 있다.이 문제로 인해 검체가 후방 밀도에 정확하게 근접하지 못할 수 있습니다.(MC))는 후방 밀도에 여러 국소 피크가 존재하는 경우 마르코프 체인의 혼합을 개선합니다.여러 개의 체인을 병렬로 실행합니다. 각 체인은 n회 반복 동안 서로 다른 고정 분포 j( . j ,2, , 2, m\}. 서 첫 번째 체인은 \ \ {1입니다. _ ,3, { j, 3 이 혼합을 개선하도록 선택되었습니다.예를 들어 다음과 같이 폼의 증분 가열 방식을 선택할 수 있습니다.

따라서 첫 번째 체인은 정확한 목표 밀도의 콜드 체인이고, 2, ,…, 2, 가열 체인입니다.밀도(.){ (. ) 1 1 1 T> \ 증가하면 금속을 가열하는 것과 마찬가지로 분포가 평탄해지는 것에 주의해 주십시오.이러한 분포에서는 원래 분포보다 피크 간(밸리로 구분됨)을 더 쉽게 이동할 수 있습니다.각 반복 후, 무작위로 선택된 두 개의 체인 간의 상태 교환은 메트로폴리스 유형 단계를 통해 제안된다.j ,2 , { { j , 2 , \ )의 현재 상태를 j(\ i 상태 간 스왑은 다음과 같이 허용됩니다.

실행이 끝나면 콜드 체인의 출력만 사용되며 핫 체인의 출력은 폐기됩니다.경험적으로 핫 체인은 국소 피크를 비교적 쉽게 방문할 수 있으며, 체인 간의 상태를 바꾸면 콜드 체인이 때때로 계곡을 점프하여 혼합이 개선됩니다., i (() / ( ){ _ _}가 불안정한 경우 제안된 스왑은 거의 받아들여지지 않습니다.이것이 증분적으로만 다른 여러 체인을 사용하는 이유입니다.

알고리즘의 명백한 단점은 체인이 실행되며 추론에 사용되는 체인은 뿐이라는 것입니다 이유로 M C 3(\ 으로 각 체인이 반복당 동일한 양의 연산을 요구하므로 병렬 머신에서의 구현에 이상적입니다.

LARget과 Simon의 LOCAL 알고리즘

LOCAL 알고리즘은[13] 이전 방법보다 계산상의 이점을 제공하며, 베이지안 접근법이 더 큰 나무에서 계산적으로 실용적인 불확실성을 평가할 수 있음을 보여준다.LOCAL 알고리즘은 Mau, Newton 및 Larget(1999)[14]에 제시된 GLOBAL 알고리즘의 개량판으로, 모든 분기 길이가 모든 사이클에서 변경됩니다.LOCAL 알고리즘은 트리의 내부 분기를 랜덤으로 선택하여 트리를 수정합니다.이 분기의 끝에 있는 노드는 각각 다른2개의 분기에 접속되어 있습니다.각 쌍 중 하나가 랜덤으로 선택됩니다.이 세 개의 선택된 가장자리를 왼쪽에서 오른쪽으로 빨랫줄처럼 늘어뜨리고 방향(왼쪽/오른쪽)도 무작위로 선택된다고 상상해 보십시오.선택된 첫 번째 가지의 두 끝에는 옷조각처럼 줄에 매달린 서브 트리가 있습니다.알고리즘은 빨랫줄을 늘리거나 줄이는 것과 마찬가지로 선택한 세 가지 분기에 공통 랜덤 양을 곱하는 방식으로 진행됩니다.마지막으로 2개의 매달린 서브트리 중 왼쪽 끝부분을 분리하여 랜덤으로 균일하게 선택된 위치에서 빨랫줄에 재설치한다.이것은 후보 트리입니다.

먼저 A AB(\ B 구분하는 (\8의 내부 브랜치를 선택합니다.또, 양쪽에서 displaystyle 브런치를 선택해, 이러한 브런치의 방향을 설정했다고 합니다. 1+ 8 + ({ m)로 합니다.}, 빨랫줄의 현재 길이입니다.새로운 길이를 m U 1 - .5 =m \ exp ( \ m^ { \ star } ) = m \ exp ( \ ( { 1 -. 5 )\ 합니다.서 U1 { U _ { \ 0 . 1 \ 0 . 0 . 0 . . . 0 . 0 . 0 . 0 . 0 . 0 . 0 . 0 . 0 . 0 . 0 . 0 . 0 . 0 . 0 . 0 . 0 .

수렴 평가

JC 아래 2개의 분류 트리의 분기 t 추정하려면 {{개의 사이트가 변동하지 {displaystyle n_{2}}개의 사이트가 변동하는 )를 ratedisplay {\의 지수 사전 분포로 가정합니다. 밀도는 ) t입니다. p e t 가능한 사이트 패턴의 확률은 다음과 같습니다.

미변동 사이트의 경우

따라서 정규화되지 않은 후방 분포는 다음과 같습니다.

또는, 혹은,

현재 값을 중심으로 한 에서 무작위로 새 값을 선택하여 분기 길이를 업데이트합니다.

U {\ {\ w{\w 사이에서균일하게 분포됩니다.합격 확률은 다음과 같습니다.

예: n } 2 }= w .1{ w 에 대한 결과를 비교합니다 5\ 길이 2000 업데이트합니다.

최대 절약 및 최대 가능성

호랑이 계통발생적 관계, 부트스트랩 값은 나뭇가지에 표시되어 있습니다.
긴 가지 끌어당김의 예.브런치(A&C)가 길수록 관계가 깊어집니다.

계통수 재구축에는 장점과 단점이 있는 많은 접근법이 있으며, "최적의 방법은 무엇인가?"에 대한 직접적인 답은 없다.최대 절약성(MP)과 최대우도(ML)는 계통 발생의 추정에 널리 사용되는 전통적인 방법이며, 베이지안 방법처럼 두 방법 모두 문자 정보를 직접 사용한다.

Maximum Parsimony는 특정 분류군의 이산 문자 매트릭스를 기반으로 하나 이상의 최적 트리를 복구하며 진화적 변화의 모델을 필요로 하지 않습니다.MP는 주어진 데이터 세트에 대해 가장 간단한 설명을 제공하며, 시퀀스 전체에 걸쳐 가능한 한 적은 변화를 포함하는 계통 발생 트리를 재구성합니다.트리 브런치의 지원은 부트스트랩 퍼센티지로 표시됩니다.MP는 널리 사용되고 있는 것과 같은 이유로, 그 단순성 또한 비판을 받아 왔고 ML과 베이지안 방식으로 배경에 밀려났다.MP에는 몇 가지 문제와 제한이 있습니다.으로서 Felsenstein(1978년)에서 보여지듯이, 하원 의원 통계적으로 점점 더 많은 데이터(예를 들어 서열 길이)의 축적이다 결과 잘못된 나무에 대고 기다란 나뭇가지 매력, 긴 가지들을 taxa( 수많은 형질 상태 변화)더 밀접하게 rel 나타나는 경향이 있는 계통 발생적 현상으로 이어진다는 사실을 융합할 수 있음을 의미하 inconsistent,[15] 수 있다.먹었다.실제보다 계통발생에 더 많은 영향을 끼친다.형태학적 데이터의 경우, 최근의 시뮬레이션 연구는 베이지안 [16]접근법을 사용하여 만들어진 나무보다 편차가 덜 정확할 수 있다는 것을 시사한다. 이는 [18]논란의 여지가 있지만, 잠재적으로 과잉 [17]정밀도 때문이다.새로운 시뮬레이션 방법을 사용한 연구는 추론 방법 간의 차이가 [19]사용된 최적화보다는 사용된 검색 전략과 합의 방법에서 비롯된다는 것을 보여주었다.

최대 절약과 마찬가지로 최대우도 대체 트리를 평가합니다.그러나 진화 모델을 기반으로 주어진 데이터를 설명하는 각 나무의 확률을 고려한다.이 경우 데이터를 설명할 확률이 가장 높은 트리가 다른 [20]트리보다 선택됩니다.즉, 다양한 나무가 관측된 데이터를 예측하는 방법을 비교합니다.뉴클레오티드 치환의 확률과 치환율이 고려되기 때문에 ML 분석에서 진화 모델의 도입은 MP보다 유리하며, 분류군의 계통학적 관계를 보다 현실적인 방식으로 설명한다.이 방법의 중요한 고려사항은 분기의 길이입니다.단기보다 긴 분기에 따라 변경이 발생할 가능성이 높기 때문에 절약은 이를 무시합니다.이 접근방식은 긴 가지 매력을 없애고 MP에 비해 ML의 일관성이 뛰어난 것을 설명할 수 있습니다.많은 사람들이 이론적인 관점에서 계통 발생을 추론하는 최선의 접근방식으로 간주하고 있지만 ML은 계산 집약적이며 너무 많은 나무가 있기 때문에 모든 나무를 탐색하는 것은 거의 불가능합니다.베이지안 추론은 또한 진화 모델을 통합하며, MP와 ML에 비해 주요 장점은 기존 방법보다 계산적으로 더 효율적이며, 불확실성의 원천을 수량화하고 해결하며, 복잡한 진화 모델을 통합할 수 있다는 것이다.

함정과 논란

  • 부트스트랩 값과 사후 확률.근소함 또는 최대 가능성 아래에서 계산된 부트스트랩 지지 값은 베이지안 [21][22][23][24][25]추론에 의해 얻어진 사후 확률보다 낮은 경향이 있는 것으로 관찰되었다.이것은 다음과 같은 많은 질문으로 이어집니다: 사후 확률이 [26]결과에 대한 과신하는 것으로 이어집니까?부트스트랩 값이 사후 확률보다 더 강력합니까?
  • 사전 확률 사용에 대한 논란.베이지안 분석에 대한 사전 확률을 사용하는 것은 분석 중인 데이터 이외의 소스로부터 정보를 통합하는 방법을 제공하기 때문에 많은 사람들에 의해 장점으로 여겨져 왔다.그러나 그러한 외부 정보가 부족하면 통계적 분포를 사용하여 완전한 무지를 나타낼 수 없더라도 선행 정보를 사용할 수 밖에 없다.또한 사전이 자의적이고 주관적일 때 베이지안 사후 확률이 주관적인 의견을 반영할 수 있다는 점도 우려된다.
  • 모델 선택계통 발생의 베이지안 분석 결과는 선택된 진화 모델과 직접 관련이 있으므로 관찰된 데이터에 맞는 모델을 선택하는 것이 중요하다. 그렇지 않으면 계통 발생의 추론이 잘못될 것이다.많은 과학자들은 모델이 알려지지 않았거나 틀렸을 때 베이지안 추론의 해석에 대해 의문을 제기해 왔다.예를 들어, 지나치게 단순화된 모형은 더 높은 사후 [21][27]확률을 제공할 수 있습니다.

MrBayes 소프트웨어

MrBayes는 계통 발생의 베이지안 추론을 수행하는 자유 소프트웨어 도구입니다.그것은 원래 존 P에 의해 쓰여졌다.2001년 [28]휴엘센벡과 프레데릭 론퀴스트.베이지안 방법이 인기를 끌면서 MrBayes는 많은 분자 계통학자들이 선택한 소프트웨어 중 하나가 되었습니다.Macintosh, Windows 및 UNIX 운영 체제용으로 제공되며 명령줄 인터페이스가 있습니다.이 프로그램은 표준 MCMC 알고리즘과 Metropolis 커플링 MCMC 변형을 사용합니다.Bayes 씨는 배열된 배열 매트릭스(DNA 또는 아미노산)를 표준 NEXUS [29]형식으로 읽습니다.

MrBayes는 나무의 후방 확률을 추정하기 [9]위해 MCMC를 사용한다.사용자는 대체 모델의 전제 조건, 우선 순위 및 MC' 분석의 상세 내용을 변경할 수 있습니다.또한 사용자는 분류와 문자를 제거하고 분석에 추가할 수 있습니다.이 프로그램은 가장 표준적인 DNA 치환 모델인 JC69라고도 불리는 4x4를 사용합니다. 이것은 뉴클레오티드에 걸친 변화가 [30]동일한 확률로 일어난다고 가정합니다.또한 아미노산 치환의 20x20 모델과 DNA 치환의 코돈 모델을 구현합니다.그것은 뉴클레오티드 [31]부위에 걸쳐 동등한 치환율의 가정을 완화하기 위한 다른 방법을 제공한다.MrBayes는 또한 계통수 및 모델 파라미터에 대한 불확실성을 수용하는 조상 상태를 추론할 수 있다.

MrBayes[32] 3은 원래의 MrBayes를 완전히 재구성하고 재구성한 버전입니다.주요 신규성은 데이터 세트의 이질성을 수용하는 소프트웨어의 능력이었다.이 새로운 프레임워크는 사용자가 다른 유형의 데이터(예: 단백질, 뉴클레오티드 및 형태학)를 다룰 때 모델을 혼합하고 베이지안 MCMC 분석의 효율성을 활용할 수 있도록 한다.기본적으로는 Metropolis-Coupling MCMC를 사용합니다.

MrBayes 3.2는 2012년에 출시되었습니다[33].새로운 버전에서는 여러 분석을 동시에 실행할 수 있습니다.또한 우도 계산을 고속화하고 이러한 계산을 GPU(그래픽 처리 유닛)에 위임할 수 있습니다.버전 3.2는 FigTree 및 기타 트리 뷰어와 호환되는 광범위한 출력 옵션을 제공합니다.

계통학 소프트웨어 목록

이 표에는 베이지안 프레임워크에서 계통 발생을 추론하는 데 사용되는 가장 일반적인 계통 발생 소프트웨어가 포함되어 있습니다.그들 중 일부는 배타적으로 베이지안 방식을 사용하지 않는다.

이름. 묘사 방법 작가. 웹사이트 링크
베이즈 씨 계통학적 추론 광범위한 계통발생학적 및 진화적 모델에 걸친 베이지안 추론 및 모델 선택을 위한 프로그램. Zangh, Huelsenbeck, Der Mark, Ronquist & Teslenko https://nbisweden.github.io/MrBayes/
비스트 베이지안 진화 분석 샘플링 트리 베이지안 추론, 완화 분자 시계, 인구 통계학적 역사 A. J. 드러몬드, A. 램보 & M. 수차드 https://disc.disc.disc
비스트 2 베이지안 진화 분석을 위한 소프트웨어 플랫폼 베이지안 추론, 패키지, 다중 모델 R Bouckaert, J Heled, Dühnert, T Vaughan, CH Wu, D Xie, MA Suchard, A Rambaut, AJ Drummond.[35] http://www.beast2.org
PhyloBayes / PhyloBayes MPI 계통학적 재구성을 위한 베이지안 몬테카를로 마르코프 체인(MCMC) 샘플러. 뉴클레오티드 또는 아미노산 성질의 부위 간 변동을 모델링하기 위한 비모수적 방법. N. 라티로드, N. 로드리게, D.스텁스, J. 리치 http://www.atgc-montpellier.fr/phylobayes/
발리피 정렬과 계통 발생의 동시 베이지안 추론 베이지안 추론, 정렬 및 트리 검색 수차드 MA, 레델링스 BD[37] http://www.bali-phy.org
버키 유전자 나무의 베이지안 일치 루트가 없는 사분위의 수정된 탐욕 컨센서스를 사용한 베이지안 일치 C. Ané, B. Larget, D.A. Baum, S.D. Smith, A. Rockas 및 B.라겟, S.K. 코타, C.N. 듀이, C.아네 http://www.stat.wisc.edu/ ~ ane / // /
배트윙 내부 노드 생성을 수반하는 트리의 베이지안 해석 베이지안 추론, 인구통계학적 역사, 인구분할 I. J. 윌슨, D.Weale, D.제모 http://www.maths.abdn.ac.uk/ijw[영구 데드링크]
베이즈균류 마르코프 연쇄 몬테카를로 방법을 이용한 나무의 베이지안 추론 베이지안 추론, 다중 모형, 혼합물 모형(자동 분할) M. Pagel, A.미드[40] http://www.evolution.rdg.ac.uk/BayesPhy.html Wayback Machine에서 2020-02-19 아카이브 완료
Armadillo 워크플로우 플랫폼 계통발생 및 일반 생물정보 분석 전용 워크플로우 플랫폼 MrBayes의 GUI 래퍼 로드, M. 르클레르크, A.BOC, A.B. Diallo, V.마카렌코프[41] https://github.com/armadilloUQAM/armadillo2/
Genious(MrBayes 플러그인) Genious는 게놈과 프로테옴 연구 도구를 제공합니다. MrBayes의 GUI 래퍼 A. J. 드러몬드, M.수차드, 브이르포르 등 http://www.geneious.com
토팔리 계통학적 추론 MrBayes의 GUI 래퍼 I. Milne, D.린드너 [42] http://www.topali.org

적용들

베이지안 추론은 분자 계통학자에 의해 광범위한 응용 분야에서 광범위하게 사용되어 왔다.그 중 몇 가지는 다음과 같습니다.

BEAST를 이용한 분자 클럭 분석으로 얻은 크로노그램.각 노드의 원형 차트는 베이지안 이항 MCMC 분석(Basian Binary MCMC Analysis, Basesian Binary MCM)에서 추론된 가능한 조상 분포를 나타냅니다.
  • 계통 [43][44]발생의 추론.
  • 계통 [45]발생의 불확실성에 대한 추론 및 평가.
  • 조상의 성격 상태 [46][47]진화에 대한 추론.
  • 조상들의 [48]지역에 대한 추론.
  • 분자 연대 분석.[49][50]
  • 종의 다양화와 멸종[51] 모델 역학
  • 병원균 [52]분산의 패턴을 명확히 한다.

레퍼런스

  1. ^ Rannala, Bruce; Yang, Ziheng (September 1996). "Probability distribution of molecular evolutionary trees: A new method of phylogenetic inference". Journal of Molecular Evolution. 43 (3): 304–311. Bibcode:1996JMolE..43..304R. doi:10.1007/BF02338839. PMID 8703097. S2CID 8269826.
  2. ^ a b Yang, Z.; Rannala, B. (1 July 1997). "Bayesian phylogenetic inference using DNA sequences: a Markov Chain Monte Carlo Method". Molecular Biology and Evolution. 14 (7): 717–724. doi:10.1093/oxfordjournals.molbev.a025811. PMID 9214744.
  3. ^ Mau, Bob; Newton, Michael A.; Larget, Bret (March 1999). "Bayesian Phylogenetic Inference via Markov Chain Monte Carlo Methods". Biometrics. 55 (1): 1–12. doi:10.1111/j.0006-341x.1999.00001.x. JSTOR 2533889. PMID 11318142.
  4. ^ Li, Shuying; Pearl, Dennis K.; Doss, Hani (June 2000). "Phylogenetic Tree Construction Using Markov Chain Monte Carlo". Journal of the American Statistical Association. 95 (450): 493–508. doi:10.1080/01621459.2000.10474227. JSTOR 2669394. S2CID 122459537.
  5. ^ Huelsenbeck, J. P.; Ronquist, F. (1 August 2001). "MRBAYES: Bayesian inference of phylogenetic trees". Bioinformatics. 17 (8): 754–755. doi:10.1093/bioinformatics/17.8.754. PMID 11524383.
  6. ^ Laplace P (1774). "Memoire sur la Probabilite des Causes par les Evenements". L'Académie Royale des Sciences. 6: 621–656. NAID 10010866843. 영어 번역자
  7. ^ Nascimento, Fabrícia F.; Reis, Mario dos; Yang, Ziheng (October 2017). "A biologist's guide to Bayesian phylogenetic analysis". Nature Ecology & Evolution. 1 (10): 1446–1454. doi:10.1038/s41559-017-0280-x. PMC 5624502. PMID 28983516.
  8. ^ Hastings WK (April 1970). "Monte Carlo sampling methods using Markov chains and their applications". Biometrika. 57 (1): 97–109. Bibcode:1970Bimka..57...97H. doi:10.1093/biomet/57.1.97.
  9. ^ a b Metropolis N, Rosenbluth AW, Rosenbluth MN, Teller AH, Teller E (June 1953). "Equation of state calculations by fast computing machines". The Journal of Chemical Physics. 21 (6): 1087–92. Bibcode:1953JChPh..21.1087M. doi:10.1063/1.1699114. OSTI 4390578.
  10. ^ Felsenstein J (2004). Inferring phylogenies. Sunderland, Massachusetts: Sinauer Associates.
  11. ^ Yang Z (2014). Molecular Evolution: A Statistical Approach. Oxford, England: Oxford University Press.
  12. ^ Geyer CJ (1991). "Markov chain Monte Carlo maximum likelihood.". In Keramidas EM, Kaufman SM (eds.). Computing Science and Statistics: Proceedings of the 23rd Symposium on the Interface. Fairfax Station: Interface Foundation. pp. 156–163. OCLC 26603816.
  13. ^ Larget B, Simon DL (June 1999). "Markov chain Monte Carlo algorithms for the Bayesian analysis of phylogenetic trees". Molecular Biology and Evolution. 16 (6): 750–9. doi:10.1093/oxfordjournals.molbev.a026160.
  14. ^ Mau B, Newton MA, Larget B (March 1999). "Bayesian phylogenetic inference via Markov chain Monte Carlo methods". Biometrics. 55 (1): 1–12. doi:10.1111/j.0006-341x.1999.00001.x. PMID 11318142.
  15. ^ Felsenstein J (December 1978). "Cases in which parsimony or compatibility methods will be positively misleading". Systematic Zoology. 27 (4): 401–10. doi:10.1093/sysbio/27.4.401.
  16. ^ Castorani MC, Reed DC, Raimondi PT, Alberto F, Bell TW, Cavanaugh KC, et al. (January 2017). "Fluctuations in population fecundity drive variation in demographic connectivity and metapopulation dynamics". Proceedings. Biological Sciences. 284 (1847): 20162086. doi:10.1098/rspb.2016.2086. PMC 5310032. PMID 28123088.
  17. ^ O'Reilly JE, Puttick MN, Parry L, Tanner AR, Tarver JE, Fleming J, Pisani D, Donoghue PC (April 2016). "Bayesian methods outperform parsimony but at the expense of precision in the estimation of phylogeny from discrete morphological data". Biology Letters. 12 (4): 20160081. doi:10.1098/rsbl.2016.0081. PMC 4881353. PMID 27095266.
  18. ^ Goloboff PA, Torres A, Arias JS (2018). "Weighted parsimony outperforms other methods of phylogenetic inference under models appropriate for morphology". Cladistics. 34 (4): 407–437. doi:10.1111/cla.12205. ISSN 0748-3007.
  19. ^ Keating JN, Sansom RS, Sutton MD, Knight CG, Garwood RJ (February 2020). "Morphological phylogenetics evaluated using novel evolutionary simulations". Systematic Biology. 69 (5): 897–912. doi:10.1093/sysbio/syaa012. PMC 7440746. PMID 32073641.
  20. ^ Swofford DL, Olsen GJ, Waddell PJ, Hillis DM (1996). "Phylogenetic inference". In Hillis DM, Moritz C, Mable BK (eds.). Molecular Systematics, 2nd edition. Sunderland, MA: Sinauer. pp. 407–514. ISBN 9780878932825.
  21. ^ a b Suzuki Y, Glazko GV, Nei M (December 2002). "Overcredibility of molecular phylogenies obtained by Bayesian phylogenetics". Proceedings of the National Academy of Sciences of the United States of America. 99 (25): 16138–43. Bibcode:2002PNAS...9916138S. doi:10.1073/pnas.212646199. PMC 138578. PMID 12451182.
  22. ^ Alfaro ME, Zoller S, Lutzoni F (February 2003). "Bayes or bootstrap? A simulation study comparing the performance of Bayesian Markov chain Monte Carlo sampling and bootstrapping in assessing phylogenetic confidence". Molecular Biology and Evolution. 20 (2): 255–66. doi:10.1093/molbev/msg028. PMID 12598693.
  23. ^ Douady CJ, Delsuc F, Boucher Y, Doolittle WF, Douzery EJ (February 2003). "Comparison of Bayesian and maximum likelihood bootstrap measures of phylogenetic reliability". Molecular Biology and Evolution. 20 (2): 248–54. doi:10.1093/molbev/msg042. PMID 12598692.
  24. ^ García-Sandoval R (January 2014). "Why some clades have low bootstrap frequencies and high Bayesian posterior probabilities". Israel Journal of Ecology & Evolution. 60 (1): 41–4. doi:10.1080/15659801.2014.937900.
  25. ^ Yang, Z. (18 April 2007). "Fair-Balance Paradox, Star-tree Paradox, and Bayesian Phylogenetics". Molecular Biology and Evolution. 24 (8): 1639–1655. doi:10.1093/molbev/msm081. PMID 17488737.
  26. ^ Yang, Ziheng; Zhu, Tianqi (20 February 2018). "Bayesian selection of misspecified models is overconfident and may cause spurious posterior probabilities for phylogenetic trees". Proceedings of the National Academy of Sciences. 115 (8): 1854–1859. doi:10.1073/pnas.1712673115. PMC 5828583. PMID 29432193.
  27. ^ Erixon P, Svennblad B, Britton T, Oxelman B (October 2003). "Reliability of Bayesian posterior probabilities and bootstrap frequencies in phylogenetics". Systematic Biology. 52 (5): 665–73. doi:10.1080/10635150390235485. PMID 14530133.
  28. ^ Huelsenbeck JP, Ronquist F (August 2001). "MRBAYES: Bayesian inference of phylogenetic trees". Bioinformatics. Oxford, England. 17 (8): 754–5. doi:10.1093/bioinformatics/17.8.754. PMID 11524383.
  29. ^ Maddison DR, Swofford DL, Maddison WP (December 1997). "NEXUS: an extensible file format for systematic information". Systematic Biology. 46 (4): 590–621. doi:10.1093/sysbio/46.4.590. PMID 11975335.
  30. ^ Jukes TH, Cantor CR (1969). Evolution of Protein Molecules. New York: Academic Press. pp. 21–132.
  31. ^ Yang Z (November 1993). "Maximum-likelihood estimation of phylogeny from DNA sequences when substitution rates differ over sites". Molecular Biology and Evolution. 10 (6): 1396–401. doi:10.1093/oxfordjournals.molbev.a040082. PMID 8277861.
  32. ^ Ronquist F, Huelsenbeck JP (August 2003). "MrBayes 3: Bayesian phylogenetic inference under mixed models". Bioinformatics. Oxford, England. 19 (12): 1572–4. doi:10.1093/bioinformatics/btg180. PMID 12912839.
  33. ^ Ronquist F, Teslenko M, van der Mark P, Ayres DL, Darling A, Höhna S, Larget B, Liu L, Suchard MA, Huelsenbeck JP (May 2012). "MrBayes 3.2: efficient Bayesian phylogenetic inference and model choice across a large model space". Systematic Biology. 61 (3): 539–42. doi:10.1093/sysbio/sys029. PMC 3329765. PMID 22357727.
  34. ^ Drummond AJ, Suchard MA, Xie D, Rambaut A (August 2012). "Bayesian phylogenetics with BEAUti and the BEAST 1.7". Molecular Biology and Evolution. 29 (8): 1969–73. doi:10.1093/molbev/mss075. PMC 3408070. PMID 22367748.
  35. ^ Bouckaert R, Heled J, Kühnert D, Vaughan T, Wu CH, Xie D, Suchard MA, Rambaut A, Drummond AJ (April 2014). "BEAST 2: a software platform for Bayesian evolutionary analysis". PLOS Computational Biology. 10 (4): e1003537. Bibcode:2014PLSCB..10E3537B. doi:10.1371/journal.pcbi.1003537. PMC 3985171. PMID 24722319.
  36. ^ Lartillot N, Philippe H (June 2004). "A Bayesian mixture model for across-site heterogeneities in the amino-acid replacement process". Molecular Biology and Evolution. 21 (6): 1095–109. doi:10.1093/molbev/msh112. PMID 15014145.
  37. ^ Suchard MA, Redelings BD (August 2006). "BAli-Phy: simultaneous Bayesian inference of alignment and phylogeny". Bioinformatics. 22 (16): 2047–8. doi:10.1093/bioinformatics/btl175. PMID 16679334.
  38. ^ Ané C, Larget B, Baum DA, Smith SD, Rokas A (February 2007). "Bayesian estimation of concordance among gene trees". Molecular Biology and Evolution. 24 (2): 412–26. doi:10.1093/molbev/msl170. PMID 17095535.
  39. ^ Wilson IJ, Weale ME, Balding DJ (June 2003). "Inferences from DNA data: population histories, evolutionary processes and forensic match probabilities". Journal of the Royal Statistical Society, Series A (Statistics in Society). 166 (2): 155–88. doi:10.1111/1467-985X.00264.
  40. ^ Pagel M, Meade A (June 2006). "Bayesian analysis of correlated evolution of discrete characters by reversible-jump Markov chain Monte Carlo". The American Naturalist. 167 (6): 808–25. doi:10.1086/503444. PMID 16685633. S2CID 205984494.
  41. ^ Lord E, Leclercq M, Boc A, Diallo AB, Makarenkov V (2012). "Armadillo 1.1: an original workflow platform for designing and conducting phylogenetic analysis and simulations". PLOS ONE. 7 (1): e29903. Bibcode:2012PLoSO...729903L. doi:10.1371/journal.pone.0029903. PMC 3256230. PMID 22253821.
  42. ^ Milne I, Lindner D, Bayer M, Husmeier D, McGuire G, Marshall DF, Wright F (January 2009). "TOPALi v2: a rich graphical interface for evolutionary analyses of multiple alignments on HPC clusters and multi-core desktops". Bioinformatics. 25 (1): 126–7. doi:10.1093/bioinformatics/btn575. PMC 2638937. PMID 18984599.
  43. ^ Alonso R, Crawford AJ, Bermingham E (March 2012). "Molecular phylogeny of an endemic radiation of Cuban toads (Bufonidae: Peltophryne) based on mitochondrial and nuclear genes". Journal of Biogeography. 39 (3): 434–51. doi:10.1111/j.1365-2699.2011.02594.x.
  44. ^ Antonelli A, Sanmartín I (October 2011). "Mass extinction, gradual cooling, or rapid radiation? Reconstructing the spatiotemporal evolution of the ancient angiosperm genus Hedyosmum (Chloranthaceae) using empirical and simulated approaches". Systematic Biology. 60 (5): 596–615. doi:10.1093/sysbio/syr062. PMID 21856636.
  45. ^ de Villemereuil P, Wells JA, Edwards RD, Blomberg SP (June 2012). "Bayesian models for comparative analysis integrating phylogenetic uncertainty". BMC Evolutionary Biology. 12: 102. doi:10.1186/1471-2148-12-102. PMC 3582467. PMID 22741602.
  46. ^ Ronquist F (September 2004). "Bayesian inference of character evolution". Trends in Ecology & Evolution. 19 (9): 475–81. doi:10.1016/j.tree.2004.07.002. PMID 16701310.
  47. ^ Schäffer S, Koblmüller S, Pfingstl T, Sturmbauer C, Krisper G (August 2010). "Ancestral state reconstruction reveals multiple independent evolution of diagnostic morphological characters in the "Higher Oribatida" (Acari), conflicting with current classification schemes". BMC Evolutionary Biology. 10: 246. doi:10.1186/1471-2148-10-246. PMC 2930640. PMID 20701742.
  48. ^ Filipowicz N, Renner SS (July 2012). "Brunfelsia (Solanaceae): a genus evenly divided between South America and radiations on Cuba and other Antillean islands". Molecular Phylogenetics and Evolution. 64 (1): 1–11. doi:10.1016/j.ympev.2012.02.026. PMID 22425729.
  49. ^ Bacon CD, Baker WJ, Simmons MP (May 2012). "Miocene dispersal drives island radiations in the palm tribe Trachycarpeae (Arecaceae)". Systematic Biology. 61 (3): 426–42. doi:10.1093/sysbio/syr123. PMID 22223444.
  50. ^ Särkinen T, Bohs L, Olmstead RG, Knapp S (September 2013). "A phylogenetic framework for evolutionary study of the nightshades (Solanaceae): a dated 1000-tip tree". BMC Evolutionary Biology. 13: 214. doi:10.1186/1471-2148-13-214. PMC 3850475. PMID 24283922.
  51. ^ Silvestro D, Schnitzler J, Liow LH, Antonelli A, Salamin N (May 2014). "Bayesian estimation of speciation and extinction from incomplete fossil occurrence data". Systematic Biology. 63 (3): 349–67. doi:10.1093/sysbio/syu006. PMC 4361715. PMID 24510972.
  52. ^ Lemey P, Rambaut A, Drummond AJ, Suchard MA (September 2009). "Bayesian phylogeography finds its roots". PLOS Computational Biology. 5 (9): e1000520. Bibcode:2009PLSCB...5E0520L. doi:10.1371/journal.pcbi.1000520. PMC 2740835. PMID 19779555.

외부 링크