유니프랙
UniFrac| 통계 |
|---|
UniFrac은 생물학적 공동체를 비교하는 데 사용되는 거리 측정 기준이다.관찰된 유기체 간의 계통생성 거리를 계산에 통합해 공동체 구성원의 상대적 연관성에 대한 정보를 통합한다는 점에서 브레이-커티스 등 상이한 측정치와 차이가 있다.
가중(양적) 변종과 가중(양적) 변종인 유니프락은[1] 모두 전자가 관찰된 유기체의 풍부함을 설명하는 미생물 생태계에 널리 쓰이고 후자는 존재 여부만을 고려한다.이 방법은 캐서린 로주폰이 고안한 것으로 2005년 볼더에서 콜로라도 대학의 롭 나이트와[2] 함께 일하고 있었다.[3][4]
연구방법
거리는 표본 쌍들 사이에서 계산된다(각 표본은 유기체 집단을 나타낸다).한 가지 또는 두 가지 표본에서 발견된 모든 세자는 계통생성 나무에 놓인다.두 표본에서 taxa로 이어지는 분기는 "공유"로 표시되며, 하나의 표본에만 나타나는 taxa로 이어지는 분기는 "공유되지 않음"으로 표시된다.그런 다음 두 표본 사이의 거리를 다음과 같이 계산한다.
이 정의는 거리 메트릭의 요구사항을 만족하며, 비 음수이며, 실체가 동일하고, 전이적이며, 삼각형 불평등을 준수하는 경우에만 0이다.
여러 개의 다른 표본이 있는 경우, 각 표본 쌍에 대해 트리를 만들고 UniFrac 측정값을 계산하여 거리 행렬을 만들 수 있다.이후 데이터 군집화 및 주요 좌표 분석과 같은 표준 다변량 통계 방법을 사용할 수 있다.
몬테카를로 시뮬레이션을 통해 두 표본 사이의 유니프락 거리의 통계적 유의성을 결정할 수 있다.트리에 있는 각 택슨의 표본 분류를 랜덤화하고(가지 구조를 변경하지 않은 상태로 유지) UniFrac 거리 값의 분포를 생성하면 UniFrac 값의 분포를 얻을 수 있다.이로부터, p-값은 표본들 사이의 실제 거리에 주어질 수 있다.
또한, 지역사회에서 각 세자의 상대적 풍부함을 설명하는 가중치 있는 버전의 유니프락 메트릭이 있다.이것은 일반적으로 메타게놈학 연구에 사용되는데, 메타게놈학 읽기의 수는 수만 개일 수 있으며, 이러한 읽기를 운영 분류학 단위, 즉 OTU로 'bin'하는 것이 적절하며, 이는 UniFrac 프레임워크 내에서 taxa로 취급할 수 있다.
2012년에는 가중치와 미가중 UniFrac 거리를 단일 프레임워크로 통합하는 일반화된 UniFrac 버전이 제안되었다.[5]가중되고 가중되지 않은 UniFrac 거리는 풍부한 선이나 희귀 선에 너무 많은 무게를 둔다.환경적 영향을 탐지하는 그들의 힘은 적당히 풍부한 라인업들이 대부분 영향을 받는 일부 환경에서는 제한된다.일반화된 UniFrac 거리는 가중/가중된 UniFrac 거리의 한계를 풍부하거나 희귀한 선에 중점을 둔 하한 가중/가중된 UniFrac 거리의 한계를 수정한다.
참조
- ^ Lozupone, C. A.; Hamady, M; Kelley, S. T.; Knight, R. (2007). "Quantitative and qualitative beta diversity measures lead to different insights into factors that structure microbial communities". Applied and Environmental Microbiology. 73 (5): 1576–85. doi:10.1128/AEM.01996-06. PMC 1828774. PMID 17220268.
- ^ Knight, Rob (2015). Follow Your Gut: The Enormous Impact of Tiny Microbes. Simon & Schuster/TED. p. 89. ISBN 978-1-4767-8475-5.
- ^ Lozupone, C.; Knight, R. (2005). "UniFrac: A New Phylogenetic Method for Comparing Microbial Communities". Applied and Environmental Microbiology. 71 (12): 8228–8235. doi:10.1128/AEM.71.12.8228-8235.2005. PMC 1317376. PMID 16332807.
- ^ Hamady, M; Lozupone, C; Knight, R (2010). "Fast Uni Frac: Facilitating high-throughput phylogenetic analyses of microbial communities including analysis of pyrosequencing and Phylo Chip data". The ISME Journal. 4 (1): 17–27. doi:10.1038/ismej.2009.97. PMC 2797552. PMID 19710709.
- ^ Chen, J.; Bittinger, K.; Charlson, E. S.; Hoffmann, C.; Lewis, J.; Wu, G. D.; Collman, R. G.; Bushman, F. D.; Li, H. (2012). "Associating microbiome composition with environmental covariates using generalized UniFrac distances". Bioinformatics. 28 (16): 2106–2113. doi:10.1093/bioinformatics/bts342. PMC 3413390. PMID 22711789.
