Top Hat (생물정보학)
TopHat (bioinformatics)TopHat은 Transcriptomics 기술(예: RNA-Seq)에 의해 생성된 샷건 cDNA 시퀀싱 판독의 처리량 정렬을 위해 먼저 Bowtie를 사용한 후 참조 게놈에 매핑하여 RNA 스플라이스 사이트 de novo를 [1]발견하기 위한 오픈 소스 바이오 인포매틱스 도구이다.TopHat은 RNA-Seq 판독치를 포유동물 크기의 [2]게놈에 맞춥니다.
역사
TopHat은 2009년 Cole Trapnell, Lior Pachter 및 Steven Salzberg에 의해 메릴랜드 대학, 칼리지 파크 및 UC [1]버클리 수학부에서 최초로 개발되었습니다.TopHat2는 처음에는 메릴랜드 대학, College Park에서, 나중에는 존스 홉킨스 대학 컴퓨터 생물학 센터에서 Daehwan Kim과 Steven Salzberg의 공동 연구였습니다.Kim은 Cole Trapnell 및 다른 회사와의 협력을 통해 Trapnell의 원래 TopHat 코드 중 일부를 C++로 재작성하고 정확성을 높이기 위해 많은 휴리스틱스를 추가했다.Kim과 Salzberg는 또한 TopHat-Fusion을 개발했는데, TopHat-Fusion은 암 [3]조직의 유전자 융합을 발견하기 위해 트랜스크립텀 데이터를 사용했다.
사용하다
TopHat은 RNA-Seq 실험의 판독치를 정렬하는 데 사용됩니다.이것은 읽기 매핑 알고리즘이며 읽기를 참조 게놈에 맞춥니다.알려진 스플라이스 [1]사이트에 의존할 필요가 없기 때문에 유용합니다.TopHat은 Tuxedo 파이프라인에서 사용할 수 있으며 Bowtie에서 자주 사용됩니다.
장점/단점
이점
Top Hat이 처음 나왔을 때 이전 시스템보다 더 빨랐습니다.CPU 시간당 220만 개 이상의 읽기를 매핑했습니다.이 속도로 사용자는 표준 데스크톱 [1]컴퓨터에서도 하루도 채 안 되는 시간에 전체 RNA-Seq 실험을 처리할 수 있었습니다.Tophat은 처음에 Bowtie를 사용하여 판독치를 분석하지만, 이후 Exon-Exon 접합부에 걸친 판독치를 분석합니다.RNA-Seq 데이터에 TopHat을 사용하는 경우 참조 [4]게놈에 대해 더 많은 판독치를 얻을 수 있습니다.
TopHat의 또 다른 장점은 읽기를 참조 [1]게놈에 맞출 때 알려진 스플라이스 사이트에 의존할 필요가 없다는 것입니다.
단점들
Top Hat은 유지보수 및 지원 부족 단계에 있으며 수정해야 [5]할 서드파티 후처리 소프트웨어를 생성한 소프트웨어 버그가 포함되어 있습니다.보다 효율적이고 정확하며 동일한 핵심 기능(RNA-Seq [2]판독치의 분할 정렬)을 제공하는 HISAT2로 대체되었습니다.
「 」를 참조해 주세요.
레퍼런스
- ^ a b c d e Trapnell C, Pachter L, Salzberg SL (May 2009). "TopHat: discovering splice junctions with RNA-Seq". Bioinformatics. 25 (9): 1105–11. doi:10.1093/bioinformatics/btp120. PMC 2672628. PMID 19289445.
- ^ a b "TopHat". ccb.jhu.edu. Retrieved 2018-04-17.
- ^ Kim D, Pertea G, Trapnell C, Pimentel H, Kelley R, Salzberg SL (April 2013). "TopHat2: accurate alignment of transcriptomes in the presence of insertions, deletions and gene fusions". Genome Biology. 14 (4): R36. doi:10.1186/gb-2013-14-4-r36. PMC 4053844. PMID 23618408.
- ^ "Bowtie & Tophat". www.biostars.org. Retrieved 2018-04-24.
- ^ Brueffer C, Saal LH (May 2016). "TopHat-Recondition: a post-processor for TopHat unmapped reads". BMC Bioinformatics. 17 (1): 199. doi:10.1186/s12859-016-1058-x. PMC 4855331. PMID 27142976.