T-REX(웹 서버)
T-REX (web server)이 기사는 대부분의 독자들이 이해하기에는 너무 전문적일 수 있다.세부사항을 할 수 해 . (2012년 10월 ( 템플릿메시지의에 대해 합니다) |
T-REX(Tree and Reticulogram Reconstruction)[1][2]는 퀘벡 대학 컴퓨터과학과에서 개발된 무료로 이용 가능한 웹 서버로, 계통수 및 계통발생 네트워크의 추론, 검증 및 시각화에 전념하고 있습니다.T-REX 웹 서버를[1][2] 통해 사용자는 몇 가지 인기 있는 계통발생학적 분석 방법뿐만 아니라 계통발생학적 나무와 네트워크를 추론, 그리기 및 검증하기 위한 몇 가지 새로운 계통발생학적 응용 프로그램을 수행할 수 있습니다.
계통학적 추론
거리를 사용하여 계통수를 추론하고 검증하는 방법은 다음과 같습니다.NJ(Neighbor Joining), NINJ 대규모 Neighbor Joining, BioNJ, UNJ, ADDTREE, MW, FITCH 및 순환 주문 재구축.DNAPARS, PROTPARS, PARS 및 DOLOP의 최대 절약성의 경우, PHYLIP 패키지의 모든 것 및 최대 가능성의 경우:PhyML,[3] RAxML,[4] DNAML, DNAMLK, DNAMLK, PROML 및 PROMLK의 4가지 방법은 PHYLIP 패키지에서 사용할 수 있습니다.
트리 그리기
계층적 수직, 수평, 반지름 및 축 유형의 트리 도면을 사용할 수 있습니다.
입력 데이터는 다음 3가지 형식입니다.Newick 형식, PHYLIP 및 FASTA 형식.T-REX 서버가 제공하는 모든 그래픽 결과를 SVG(Scalable Vector Graphics) 형식으로 저장한 후 사용자가 선호하는 그래픽 편집기에서 열고 수정할 수 있습니다(예: 출판 또는 프레젠테이션 준비).
트리 빌딩
계통수를 그리기 위한 개발된 어플리케이션으로 Newick 형식으로 저장할 수 있습니다.
불완전한 행렬에서 트리 추론
결측값을 포함하는 거리 매트릭스(즉, 불완전한 매트릭스)에서 계통수를 재구성하는 다음과 같은 방법을 사용할 수 있다.게노슈와 르클레르(2001년), 랜드리, 라포인트, 키르슈(1996년), 랜드리, 라포인트, 키르슈(1996년)에 이은 결측치 추정을 위한 울트라메트릭 절차, 랜드리, 라포인트, 키르슈에 이은 결측치 추정을 위한 가산 절차, NJ에 이은 수정 가중치 최소 제곱법.(2004년)MW* 메서드는 엔트리의 견적이 불가능할 경우 기존 엔트리에 가중치 1을 할당하고 추정 엔트리에 가중치 0.5를 할당하며 가중치 0을 할당합니다.(Makarenkov 및 Lapointe 2004)에 설명된 시뮬레이션에서는 MW* 방법이 삼각형, 울트라메트릭 및 가법 절차보다 확실히 우수한 것으로 나타났습니다.
수평 유전자 전달 검출
T-REX 서버에는 완전하고 부분적인 수평 유전자 전달 검출 및 검증 방법이 포함되어 있습니다.HGT-Detection 프로그램은[5] 주어진 종과 유전자 나무의 점진적인 조화를 진행하면서 수평 유전자 이동의 최적, 즉 최소 비용 시나리오를 결정하는 것을 목표로 한다.
망상추론
망막도 즉 망막 네트워크 재구성 프로그램은 먼저 기존의 트리 추론 방법 중 하나를 사용하여 지원 계통수를 구축한다.그 [6]후 알고리즘의 각 단계에서 최소 제곱 또는 가중 최소 제곱 목적 함수를 최소화하는 망막 분기가 트리(또는 스텝2부터 시작하는 네트워크)에 추가됩니다.두 가지 통계 기준 Q1과 Q2는 각 망막 부문이 제공하는 적합성의 이득을 측정하기 위해 제안되었다.
또한 T-REX의 웹 서버 버전에서는 하나의 거리 매트릭스에서 지지 트리를 추론한 후 다른 거리 매트릭스를 사용하여 망막 분기를 추가할 수 있습니다.그러한 알고리즘은 주어진 종들 사이의 형태학적 또는 유전적 유사성을 묘사하는데 또는 종들의 나무를 추론하기 위한 첫 번째 거리 매트릭스와 추정적인 수평 유전자 [7]이동을 나타내는 망막 가지를 추론하기 위한 두 번째 매트릭스를 사용함으로써 HGT 사건을 식별하는데 유용할 수 있습니다.
시퀀스 얼라인먼트
가장 널리 사용되는 다중 시퀀스 정렬 도구 중 하나인 MAFFT, MUSCLE(얼라인먼트 소프트웨어) 및 ClusteralW는 느리고 빠른 쌍별 정렬 옵션과 함께 사용할 수 있습니다.
대체 모델(시퀀스-거리 변환)
T-REX에는 다음과 같은 DNA 및 아미노산 진화의 인기 대체 모델이 포함되어 있으며, 배열 데이터로부터의 진화 거리를 추정할 수 있다. 즉, 보정되지 않은 거리, Jukes-Cantor 1969, K80 – 2 매개변수(Kimura 1980), Tamura 1992, Tajima-Neti(1984).Kimura 단백질(Kimura 1983), LogDet(Lockhart 등 1994), F84(Felsain 1981), WAG(Wheelan 및 Goldman 2001), JTT(Jones 등 1992), LG(Le 및 Gascuel 2008).
로빈슨과 폴드의 위상 거리
이 프로그램은 사용자가 지정한 첫 번째 나무와 다음 모든 나무 사이의 나무 유사성에 대한 일반적인 측정값인 로빈슨-폴즈(RF) 토폴로지 거리(Robinson and Foulds 1981)를 계산한다.트리는 newick 또는 distance matrix 형식으로 제공될 수 있습니다.RF 메트릭을 계산하기 위해 (Makarenkov 및 Lecler 2000)에 기재된 최적 알고리즘을 실행한다.
Newick에서 매트릭스로 변환
Newick-to-Distance 매트릭스 및 Distance 매트릭스-Newick 형식 변환.사내 어플리케이션에서는 Newick 형식에서 Distance 매트릭스 형식으로 계통 트리를 변환할 수 있습니다.
랜덤 트리 생성기
이 애플리케이션은 사용자가 변수 k, n 및 l을 정의하는 쿠너와 펠센슈타인(1994)[8]에 의해 기술된 무작위 나무 생성 절차를 사용하여 n개의 잎, 즉 종 또는 분류군과 평균 가지 길이 l을 가진 k개의 무작위 계통 발생 나무를 생성한다.나무의 가지 길이는 지수 분포를 따릅니다.분기 길이에 1+ax를 곱하면 변수 x는 지수 분포(P(x>k) = expµk)에서 구하고 상수 a는 편차 강도를 설명하는 튜닝 계수이다(Guindon 및 Gascuel(2002)[9]에서 설명한 바와 같이 a 값은 0.8로 설정됨).이 절차에 의해 생성되는 랜덤트리의 깊이는 O(log(n)입니다.
레퍼런스
- ^ a b Boc A, Diallo Alpha B, Makarenkov V (June 2012). "T-REX: a web server for inferring, validating and visualizing phylogenetic trees and networks". Nucleic Acids Res. 40 (Web Server issue): W573–W579. doi:10.1093/nar/gks485. PMC 3394261. PMID 22675075.
- ^ a b Makarenkov V (July 2001). "T-REX: Reconstructing and visualizing phylogenetic trees and reticulation networks". Bioinformatics. 17 (7): 664–668. doi:10.1093/bioinformatics/17.7.664. PMID 11448889.
- ^ Guindon S, Delsuc F, Dufayard JF, Gascuel O (2009). Estimating maximum likelihood phylogenies with PhyML. Methods in Molecular Biology. Vol. 537. Humana Press. pp. 113–137. CiteSeerX 10.1.1.464.7907. doi:10.1007/978-1-59745-251-9_6. ISBN 978-1-58829-910-9. PMID 19378142.
- ^ Stamatakis A. (August 2006). "RAxML-VI-HPC: maximum likelihood-based phylogenetic analyses with thousands of taxa and mixed models". Bioinformatics. 22 (21): 2688–2690. doi:10.1093/bioinformatics/btl446. PMID 16928733.
- ^ Boc A, Philippe H, Makarenkov V (January 2010). "Inferring and validating horizontal gene transfer events using bipartition dissimilarity". Syst. Biol. 59 (2): 195–211. doi:10.1093/sysbio/syp103. PMID 20525630.
- ^ a b Legendre P, Makarenkov V (April 2002). "Reconstruction of biogeographic and evolutionary networks using reticulograms". Syst. Biol. 51 (2): 199–216. doi:10.1080/10635150252899725. PMID 12028728.
- ^ Makarenkov V, Legendre P (2004). "From a phylogenetic tree to a reticulated network". J. Comput. Biol. 11 (1): 195–212. doi:10.1089/106652704773416966. PMID 15072696.
- ^ Kuhner MK, Felsenstein J (May 1994). "A simulation comparison of phylogeny algorithms under equal and unequal evolutionary rates". Mol Biol Evol. 11 (3): 459–468. doi:10.1093/oxfordjournals.molbev.a040126. PMID 8015439.
- ^ Guindon S, Gascuel O (April 2002). "Efficient biased estimation of evolutionary distances when substitution rates vary across sites". Mol Biol Evol. 19 (4): 534–43. doi:10.1093/oxfordjournals.molbev.a004109. PMID 11919295.
죽어버려