시퀀스 정렬 소프트웨어 목록

List of sequence alignment software

시퀀스 정렬 소프트웨어 목록은 쌍으로 배열된 시퀀스 정렬과 다중 시퀀스 정렬에 사용되는 소프트웨어 도구와 웹 포털의 모음입니다.단백질의 구조 정렬구조 정렬 소프트웨어를 참조하십시오.

데이터베이스 검색만

이름 설명 시퀀스 유형* 작가들 연도
블라스트 빠른 k-tuple 휴리스틱을 사용한 로컬 검색(Basic Local Alignment Search Tool) 둘 다 알츠철 SF, 기쉬 W, 밀러 W, 마이어스 EW, 립만 DJ[1] 1990
HPC-BLAST NCBI 호환 다중 노드 및 멀티코어 블라스트 래퍼.최신 버전의 블라스트와 함께 배포된 이 래퍼는 노드 수가 많고 각 노드 내에 코어가 많은 현대 하이브리드 아키텍처에서 알고리즘의 병렬화를 용이하게 한다.[2] 단백질 Burdyshaw CE, Sawyer S, Horton MD, Brook RG, Rekapalli B 2017
CS-BLAST VLAST, FASTA 및 SSEART보다 민감한 시퀀스 컨텍스트별 블라스트. PSI-BLAST보다 민감한 위치별 반복 버전 CSI-BLAST 단백질 앵그리뮬러 C, 비거트 A, 소시드[3] J 2013
CUDASW++ 다중 공유 호스트 GPU에 대한 GPU 가속 Smith Waterman 알고리즘 단백질 류이, 마스텔 DL, 슈미트 B 2009/2010
다이아몬드 이중 인덱싱 기반 블라스트X 및 블라스트P 얼라이너 단백질 Buchfink B, Xie C, Husson DH, Reuter K, Drost HG 2015/2021
파스타 빠른 k-tuple 휴리스틱으로 로컬 검색, 블라스트보다 느리지만 민감함 둘 다
GGSearch, GLSearch 글로벌:글로벌(GGG), 글로벌:통계로 로컬(GL) 정렬 단백질
게놈 마술사 초고속 로컬 DNA 시퀀스 모티브 검색 및 NGS 데이터 쌍 정렬(FASTA, FASTQ)용 소프트웨어. DNA 헤펠 D(www.sequentix.de) 2020
지노글 지노글은 DNA와 단백질 서열을 검색하기 위해 인덱싱과 병렬 처리 기술을 사용한다.자바와 오픈 소스로 개발되었다. 둘 다 알브레히트 F 2015
흐머 프로파일 Hidden Markov 모델을 사용한 로컬 및 글로벌 검색(PSI-BLAST보다 민감함) 둘 다 더빈 R, 에디 SR, 크로그 A, 미치슨[6] G 1998
HH-suite 프로파일 Hidden Markov 모델의 쌍 비교, 매우 민감 단백질 소딩J[7][8] 2005/2012
IDF 역 문서 주파수 둘 다
지옥 프로필 SCFG 검색 RNA 에디 S
KLAST 고성능 범용 시퀀스 유사성 검색 도구 둘 다 2009/2014
람다 고성능 로컬 얼라이너로 블라스트와 호환 가능하지만 훨씬 빠름, SAM/BAM 지원 단백질 한네스 하우스웨델, 조센 싱어, 크누트 라이너트[9] 2014
MMseqs2 대규모 시퀀스 세트를 검색하고 클러스터링하는 소프트웨어 제품군.블라스트 및 PSI-BLAST에 대한 감도는 비슷하지만, 더 빠른 크기 주문 단백질 스티네거 M, 미르디타 M, 갈리에즈 C, 소딩[10] J 2017
USEARCH 초고속 시퀀스 분석 툴 둘 다 Edgar, R. C. (2010). "Search and clustering orders of magnitude faster than BLAST". Bioinformatics. 26 (19): 2460–2461. doi:10.1093/bioinformatics/btq461. PMID 20709691. 출판하다 2010
오스왈드 Altera의 대단백질 데이터베이스용 FPGA의 OpenCL Smith-Water 단백질 루치 E, 가르시아 C, 보텔라 G, 드 기우스티 A, 나이우프 M, 프리에토 마티아스[11] M 2016
파라세일 SIMD 병렬화를 사용한 Fast Smith-Waterman 검색 둘 다 데일리J 2015
PSI-BLAST 위치별 반복적 블라스트, 위치별 점수 매트릭스를 사용한 로컬 검색, 블라스트보다 훨씬 민감함 단백질 알츠철 SF, 매든 TL, 셰퍼 AA, 장제, 장제, 밀러 W, 립맨 DJ[12] 1997
PSI-검색 Smith-Waterman 검색 알고리즘과 PSI-BLAST 프로파일 구축 전략을 결합하여 원거리 관련 단백질 시퀀스를 찾고 동질성 과확장 오류를 방지한다. 단백질 Li W, McWilliam H, Goujon M, Cowley A, Lopez R, Pearson WR[13] 2012
R&R R&R(Retrieve and Consist)은 고성능이지만 민감한 멀티 데이터베이스 검색 엔진으로 DNA, RNA, 단백질 시퀀스를 통해 병렬로 검색할 수 있다. 둘 다 2019
스칼라BLAST 고도로 병렬 확장 가능한 블라스트 둘 다 외멘 [14] 2011
세실랍 NCBI-BLAST 결과의 시퀀스 정렬 데이터를 주요 시퀀스 분석 서버/서비스와 연결 및 프로파일링 뉴클레오티드, 펩타이드 2010
샘. 프로파일 Hidden Markov 모델을 사용한 로컬 및 글로벌 검색(PSI-BLAST보다 민감함) 둘 다 Karplus K, Krogh A[15] 1999
SSEARK FASTA보다 느리지만 민감한 Smith-Waterman 검색 둘 다
스와피 Smith-Waterman 단백질 데이터베이스 검색을 가속화하는 새로운 Intel Xeon Phis를 사용하는 최초의 병렬 알고리즘 단백질 류와 슈미트 B 2014
스와피-LS Intel Xeon Phi 클러스터를 활용하여 긴 DNA 시퀀스의 정렬을 가속화하는 첫 번째 병렬 Smith-Waterman 알고리즘 DNA 류이, 트란 TT, 로엔로스 F, 슈미트 B 2014
SUMM Intel Multicore 및 Multicore 아키텍처를 위한 Smith-Waterman 구현 단백질 루치 E, 가르시아 C, 보텔라 G, 드 기우스티 A, 나이우프 M, 프리에토 마티아스[16] M 2015
SUMM2.0 AVX-512 벡터 확장을 기반으로 한 Intel의 멀티코어 및 Multicore 아키텍처에서 향상된 Smith-Waterman 단백질 루치 E, 가르시아 C, 보텔라 G, 드 기우스티 A, 나이우프 M, 프리에토 마티아스[17] M 2018
스와이프 SIMD 병렬화를 사용한 Fast Smith-Waterman 검색 둘 다 로그네스 T 2011

*시퀀스 유형: 단백질 또는 뉴클레오티드

쌍방향 정렬

이름 설명 시퀀스 유형* 정렬 유형*** 작가 연도
아카나 빠른 휴리스틱 앵커 기반 페어웨이즈 정렬 둘 다 둘 다 황, 움바흐, 리 2005
얼라이너미 막 단백질 시퀀스 정렬 단백질 둘 다 M. 스탬, K. 카피조프, R. 스타리츠비클러, L.R. 포레스트 2013
앨릴린 최대 32MB까지 DNA, RNA 및 단백질 분자의 경우 K 크기 이상의 모든 시퀀스를 정렬한다.유사한 선형이 분석을 위해 함께 그룹화된다.자동 반복 시퀀스 필터. 둘 다 국부적 E. 와치텔 2017
바이오컨덕터 바이오스트링::pairwiseAlignment 동적 프로그래밍 둘 다 두 가지 + 끝 모두 없음 P. 아보윤 2008
바이오펄 디팔린 동적 프로그래밍 둘 다 두 가지 + 끝 모두 없음 Y. M. 찬 2003
블라스트즈, 라스트즈 시드 패턴 매칭 뉴클레오티드 국부적 슈워츠 외 [18][19]연구진 2004,2009
CUDAlign 단일 또는 다중 GPU에서 제한되지 않은 크기의 DNA 시퀀스 정렬 뉴클레오티드 로컬, 세미글로벌, 글로벌 E. 샌더스[20][21][22] 2011-2015
디나도트 웹 기반 점도표 도구 뉴클레오티드 글로벌 R. 보웬 1998
도틀렛 Java 기반 점도표 도구 둘 다 글로벌 M. Pagni와 T.주니에 1998
잔치 설명적 진화 모델을 사용한 후향 기반 국소 확장 뉴클레오티드 국부적 A. K. Hudek과 D. G. Brown 2010
게놈 컴파일러 게놈 컴파일러 크로마토그램 파일(.ab1, .scf)을 템플릿 시퀀스에 맞춰 정렬하고 오류를 찾아 즉시 수정하십시오. 뉴클레오티드 국부적 게놈 컴파일러 주식회사 2014
G-PAS 역추적을 포함한 GPU 기반 동적 프로그래밍 둘 다 로컬, 세미글로벌, 글로벌 W. Frohmberg, M. Kierzynka 등. 2011
갑미스 쌍방향 시퀀스 정렬을 하나의 갭으로 수행하는지 여부 둘 다 세미글로벌 K. Frousios, T.플루리, C. S. 일리오풀로스, K. 파크, S. P. 피시스, G.티슐러 2012
게놈 마술사 초고속 로컬 DNA 시퀀스 모티브 검색 및 NGS 데이터 쌍 정렬(FASTA, FASTQ)용 소프트웨어. DNA 로컬, 세미글로벌, 글로벌 헤펠 D(www.sequentix.de) 2020
GGSearch, GLSearch 글로벌:글로벌(GGG), 글로벌:통계로 로컬(GL) 정렬 단백질 글로벌 쿼리 W. 피어슨 2007
JALIGNER Java 오픈소스 스미스-워터맨 구현 둘 다 국부적 A. 무스타파 2005
K*동기화 이차 구조, 구조 보존, 구조 파생 시퀀스 프로파일 및 일치 정렬 점수를 포함하는 구조 정렬에 대한 단백질 시퀀스 단백질 둘 다 D. 치비안 & D.베이커[23] 2003
랄린 겹치지 않는 다중 로컬 유사성(SIM과 동일한 알고리즘) 둘 다 로컬 비 겹침 W. 피어슨 1991년 (1998년)
NW-align 표준 Needleman-Wunsch 동적 프로그래밍 알고리즘 단백질 글로벌 Y장 2012
맬린 모델링 정렬, 시퀀스의 정보 내용 모델링 뉴클레오티드 둘 다 D. 파월, L. 앨리슨, T.아이 딕스 2004
매처녀 Waterman-Eggert 로컬 정렬(LALIGN 기반) 둘 다 국부적 I. 롱든(W. Pearson에서 수정) 1999
맥컬린2 노골적인 진화의 모델들 DNA 글로벌 J. 왕 외 2006
메갈린 프로(Lasergene Molecular Biology) MUSIC, Maube, MAFFT, Clustal Omega, Jotun Hain, Wilbur-Lipman, Martinez Needleman-Wunsch, Lipman-Pearson 및 점도표 분석을 포함한 쌍과 다중 시퀀스 정렬 알고리즘을 통해 DNA, RNA, 단백질 또는 DNA + 단백질 시퀀스를 정렬하는 소프트웨어. 둘 다 둘 다 데스타 1993-2016
MUMUMMER 접미사 트리 기반 뉴클레오티드 글로벌 S. 커츠 외 2004
바늘을 꿰다 Needleman-Wunsch 동적 프로그래밍 둘 다 세미글로벌 A. 블라스비 1999
은길라 로그 및 애프터눈 갭 비용 및 지워지지 않는 진화의 명시적 모델 둘 다 글로벌 R. 카트라이트 2007
NW Needleman-Wunsch 동적 프로그래밍 둘 다 글로벌 틀:축구단 마틴 1990-2015
파라세일 SSE, AVX2용 C/C++/Python/Java SIMD 동적 프로그래밍 라이브러리 둘 다 글로벌, 엔드포인트 없음, 로컬 제이 데일리 2015
경로 Smith-Waterman on 단백질 역번역 그래프(단백질 수준에서 프레임 변형 검출) 단백질 국부적 M.[24] 게르데아 외 2009
패턴헌터 시드 패턴 매칭 뉴클레오티드 국부적 B.[25][26] 마 외 2002–2004
프로바(프로파) 동적 프로그래밍을 통한 확률 파티션 함수 샘플링 둘 다 글로벌 U.S. 뮌헨 2002
파이몰 "직렬" 명령은 시퀀스를 정렬하고 구조에 적용 단백질 전역(선택별) W. L. 데라노 2007
리퓨터 접미사 트리 기반 뉴클레오티드 국부적 S. 커츠 외 2001
사베르토프 예측 연결 프로필을 사용한 정렬 단백질 글로벌 F. Teichert, J. Minning, U. Bastolla, M.포르투 2009
사쓰마 병렬 전체 유전체 동기화 선형 DNA 국부적 M.G. 그래버 외 2010
SEQALN 다양한 동적 프로그래밍 둘 다 로컬 또는 글로벌 틀:축구단 워터맨과 P하디 1996
SIM, GAP, NAP, LAP 다양한 갭 처리와 국소 유사성 둘 다 로컬 또는 글로벌 X. 황과 W. 밀러 1990-6
SIM 국소 유사성 둘 다 국부적 X. 황과 W. 밀러 1991
SPA: 슈퍼 페어웨이즈 정렬 빠른 페어 와이즈 글로벌 정렬 뉴클레오티드 글로벌 심, 양, 야오, 황 2002
SSEARK 통계로 로컬(Smith-Waterman) 정렬 단백질 국부적 W. 피어슨 1981(알고리즘)
시퀀스 스튜디오 다양한[27] 알고리즘을 시연하는 Java 애플릿 제네릭 시퀀스 로컬 및 글로벌 A.메스카우스카스 1997(참고서)
스위폴드 긴 DNA 시퀀스에 대한 OpenCL을 사용한 Intel FPGA의 Smith-Waterman 가속 뉴클레오티드 국부적 E. 루치[28][29] 2017-2018
스위프트 슈트 빠른 로컬 정렬 검색 DNA 국부적 K. 라스무센,[30] W. 게라크 2005,2008
들것에 실리다 메모리에 최적화된 Needleman-Wunsch 동적 프로그래밍 둘 다 글로벌 I. 롱든(G에서 수정됨)마이어스와 W. 밀러) 1999
트라밸런싱하다 단백질 정렬이 주어진 핵산 염기서열 정렬 뉴클레오티드 NA G. 윌리엄스(B에서 수정됨)Pearson) 2002
우게네 SSE/CUDA용 오픈소스 Smith-Waterman, 접미사 배열 기반 반복 검출기 & 점도표 둘 다 둘 다 유니프로 2010
물을 주다 스미스-워터맨 동적 프로그래밍 둘 다 국부적 A. 블라스비 1999
워드매치 k-tuple 쌍방향 일치 둘 다 NA I. 롱든 1998
야스 시드 패턴 매칭 뉴클레오티드 국부적 L. Noe와 G. Kucherov[31] 2004

*시퀀스 유형: 단백질 또는 뉴클레오티드 **정렬 유형: 로컬 또는 글로벌

다중 시퀀스 정렬

이름 설명 시퀀스 유형* 정렬 유형*** 작가 연도 면허증
ABA A-브루이진 선형 단백질 글로벌 B.Raphael 등 2004 교육, 연구, 비영리 시설을 위한 전용 프리웨어
ALE 수동 정렬; 일부 소프트웨어 지원 뉴클레오티드 국부적 J. Blandy와 K.포겔 1994년 (1994년 버전 2007) 무료, GPL2
앨릴린 최대 32MB까지 DNA, RNA 및 단백질 분자의 경우, K 이상 크기, MSA 또는 단일 분자 내에 있는 모든 시퀀스를 정렬한다.유사한 선형이 분석을 위해 함께 그룹화된다.자동 반복 시퀀스 필터. 둘 다 국부적 E. 와치텔 2017 무료
AMAP 시퀀스 어닐링 둘 다 글로벌 A. 슈워츠와 L. 파히터 2006
아논 선형 갭 비용을 사용하여 세 개의 시퀀스를 빠르고 최적으로 정렬 뉴클레오티드 글로벌 D. 파월, L. 앨리슨, T.아이 딕스 2000
배리피 트리+멀티 얼라인먼트, 확률론-베이시안, 공동 추정 둘 다 + 코돈 글로벌 BD 레들링스와 MA 수카드 2005년 (2018년 버전) 무료, GPL
베이스 바이 베이스 Java 기반 다중 시퀀스 정렬 편집기(통합 분석 도구 포함) 둘 다 로컬 또는 글로벌 R. 브로디 외 2004 전용, 프리웨어, 등록해야 함
카오스, 다이얼린 반복 정렬 둘 다 로컬(선호) M. 브루드노와 B.모겐스턴 2003
ClustalW 프로그레시브 정렬 둘 다 로컬 또는 글로벌 톰슨 1994 무료, LGPL
코돈코드 얼라이너 다중 정렬, ClustalW & Phrap 지원 뉴클레오티드 로컬 또는 글로벌 P. 리히테리히 외 2003년(하드웨어 버전 2009)
나침반 다단백질 시퀀스의 COmparison 통계적 유의성 평가에 따른 선형 단백질 글로벌 R.I. Sadreyev 등. 2009
해독하다 진행-반복 정렬 둘 다 글로벌 에릭 S. 2014 무료, GPL
DIALING-TX 및 DIALING-T 세그먼트 기반 방법 둘 다 로컬(선호됨) 또는 전역 A.R. 수브라마니안 2005년 (2008년 버전)
DNA 정렬 영역 내 맞춤에 대한 세그먼트 기반 방법 둘 다 로컬(선호됨) 또는 전역 A.롤 2005년 (2008년 버전)
DNA 베이저 시퀀스 조립기 다중 정렬, 전체 자동 시퀀스 정렬, 자동 모호성 수정, 내부 기본 호출자, 명령줄 Seq 정렬 뉴클레오티드 로컬 또는 글로벌 헤라클 바이오소프트 SRL 2006년 (2018년 버전) 상용(일부 모듈은 프리웨어)
디나디나모 DNA와 MUSIC, Clustal 및 Smith-Waterman과의 단백질 다중 정렬 연결 둘 다 로컬 또는 글로벌 디나디나모 2004년 (2017년 버전)
EDNA DNA 결합부위를 위한 에너지 기반 다중 시퀀스 정렬 뉴클레오티드 로컬 또는 글로벌 살라마, RA 등 2013
FAMSA 극도로 큰 단백질 계열을 위한 점진적인 정렬(수십만 명의 구성원) 단백질 글로벌 드로위츠 외 2016
FSA 시퀀스 어닐링 둘 다 글로벌 R. K. 브래들리 외 2008
지니어스 진행-반복 정렬, ClustalW 플러그인 둘 다 로컬 또는 글로벌 A.J. 드럼몬드 2005년 (2017년 버전)
칼린 프로그레시브 정렬 둘 다 글로벌 T. 라스만 2005
MAFFT 진행-반복 정렬 둘 다 로컬 또는 글로벌 K. 카토 외 2005 무료, BSD
마나 RNA의 다중 정렬 RNA 국부적 S. Siebert 등. 2005
MAVID 프로그레시브 정렬 둘 다 글로벌 N. Bray와 L. Pachter 2004
메갈린 프로(Lasergene Molecular Biology) MUSIC, Maube, MAFFT, Clustal Omega, Jotun Hain, Wilbur-Lipman, Martinez Needleman-Wunsch, Lipman-Pearson 및 점도표 분석을 포함한 쌍과 다중 시퀀스 정렬 알고리즘을 통해 DNA, RNA, 단백질 또는 DNA + 단백질 시퀀스를 정렬하는 소프트웨어. 둘 다 로컬 또는 글로벌 데스타 1993-2016
MSA 동적 프로그래밍 둘 다 로컬 또는 글로벌 D.J. 립먼 외 1989년 (1995년)
MSAProbs 동적 프로그래밍 단백질 글로벌 Y. 류, B.슈미트, D마스텔 2010
멀티레인 동적 프로그래밍-클러스터링 둘 다 로컬 또는 글로벌 F. 코펫 1988
멀티라간 프로그레시브 다이내믹 프로그래밍 정렬 둘 다 글로벌 M. 브루드노 외 2003
근육 진행-반복 정렬 둘 다 로컬 또는 글로벌 에드가 R. 2004
오팔 진행-반복 정렬 둘 다 로컬 또는 글로벌 T. 휠러와 J. 케세시오글루 2007년 (2013년 안정적, 최신 베타 2016)
페칸 확률-일관성 DNA 글로벌 B. 패튼 외 2008
필로 다중 정렬을 해결하기 위한 비교 유전체학을 위한 휴먼 컴퓨팅 프레임워크 뉴클레오티드 로컬 또는 글로벌 맥길 생물정보학 2010
PMFASTR 점진적 구조 인식 정렬 RNA 글로벌 D. 드블라시오, J 브라운드, S 장 2009
프랄린 프리프로필링 및 이차 구조 예측을 통한 점진적 반복-정합성-호몰로지 확장 정렬 단백질 글로벌 J. 헤링가 1999 (1999년 버전 2009)
PicXAA 비진행적, 최대 예상 정확도 정렬 둘 다 글로벌 S.M.E.사래이안과 B.J.윤 2010
POA 부분 순서/숨김 마코프 모델 단백질 로컬 또는 글로벌 C. 리 2002
프로발라인 확률론적/파티션 함수 확률과의 일관성 단백질 글로벌 로샨과 리바이 2006 자유, 공용 도메인
프로브컨스 확률적/일관성 단백질 로컬 또는 글로벌 C. 도 외 2005 자유, 공용 도메인
프롬 3D 점진적 정렬/숨김 마코프 모델/보조 구조/3D 구조 단백질 글로벌 J. Pei 외 2008
PRRN/PRP 반복 정렬(특히 정교함) 단백질 로컬 또는 글로벌 Y. 토토키(O자 기준)고토) 1991년 이후
PSAlign 비 휴리스틱을 보존하는 선형 둘 다 로컬 또는 글로벌 S.H. Sze, Y. Lu, Q. Yang. 2006
RevTrans 단백질 정렬을 DNA로 역번역하여 DNA와 단백질 정렬을 결합한다. DNA/단백질(특수) 로컬 또는 글로벌 베르너스슨과 페더슨 2003(하드웨어 버전 2005)
사가 유전자 알고리즘에 의한 시퀀스 정렬 단백질 로컬 또는 글로벌 C. Notredame 등 1996년 (새 버전 1998년)
샘. 히든 마르코프 모델 단백질 로컬 또는 글로벌 A. 크로흐 1994년(최신 2002년 버전)
세알 수동 정렬 둘 다 국부적 A. 람보 2002
StatAlign 선형 및 골생성의 베이시안 공동 추정(MMC) 둘 다 글로벌 A. 노박 외 2008
스템록 다중 정렬 및 이차 구조 예측 RNA 로컬 또는 글로벌 I. 홈즈 2005 무료, GPL 3(Parte de DART)
티커피 보다 민감한 진행형 정렬 둘 다 로컬 또는 글로벌 C. Notredame 등 2000년(하드웨어 버전 2008) 무료, GPL 2
우게네 MUSIC, KALign, ClustalMAFFT 플러그인으로 다중 정렬 지원 둘 다 로컬 또는 글로벌 UGENE 팀 2010년(기본 버전 2020) 무료, GPL 2
벡터 프렌즈 Vector Friends Aligner, MUSIC 플러그인 및 ClustalW 플러그인 둘 다 로컬 또는 글로벌 바이오프렌즈팀 2013 학업을 위한 전용 프리웨어
GLProbs 적응형 쌍 숨김 마코프 모델 기반 접근 방식 단백질 글로벌 Y. Y. Y. 2013

*시퀀스 타입: 단백질 또는 뉴클레오티드.**정렬 유형: 로컬 또는 글로벌

유전체 분석

이름 설명 시퀀스 유형*
이글 게놈 데이터에서 상대적인 부재 단어를 찾을 수 있는 초고속 도구 뉴클레오티드
ACT(Artemis Comparis Tool) 싱테니와 비교유전체학 뉴클레오티드
AVID 전체 게놈과 쌍으로 글로벌 정렬 뉴클레오티드
블라 cDNA 시퀀스를 게놈에 정렬. 뉴클레오티드
해독하다 6프레임 변환을 이용한 재배열 게놈의 정렬 뉴클레오티드
플라크 퍼지 전체 게놈 정렬 및 분석 뉴클레오티드
GMAP cDNA 시퀀스를 게놈에 정렬.높은 정확도로 스플라이스 사이트 접합부를 식별한다. 뉴클레오티드
스플라인 cDNA 시퀀스를 게놈에 정렬.높은 정확도로 스플라이스 사이트 접합부를 식별한다.유전자 중복을 인식하고 분리할 수 있다. 뉴클레오티드
마우브 재배열된 게놈의 다중 정렬 뉴클레오티드
MGA 다중 게놈 얼라이너 뉴클레오티드
뮬란 게놈 길이 시퀀스의 로컬 다중 맞춤 뉴클레오티드
멀티즈 게놈의 다중 정렬 뉴클레오티드
플라스티-ncRNA 파티션 함수 로컬 정렬을 통해 게놈에서 ncRNA 검색 뉴클레오티드
세케로메 주요 서버/서비스에 대한 프로파일링 시퀀스 정렬 데이터 뉴클레오티드, 펩타이드
세실랍 NCBI-BLAST 결과에서 주요 서버-서비스로 시퀀스 정렬 데이터 프로파일링 뉴클레오티드, 펩타이드
셔플-라간 완료된 게놈 영역의 쌍방향 글로컬 정렬 뉴클레오티드
SIBsim4, Sim4 표현된 DNA 염기서열을 유전체 염기서열에 맞추어 인트론이 가능하도록 설계된 프로그램 뉴클레오티드
슬램 유전자 소견, 정렬, 주석(인간-마우스 호몰로지 식별) 뉴클레오티드
SRPRISM 스플라이스 없이 읽기를 정렬하여 명시적 보증을 가진 어셈블리를 위한 효율적인 얼라이너 뉴클레오티드

*시퀀스 유형: 단백질 또는 뉴클레오티드


모티브 찾기

이름 설명 시퀀스 유형*
PMS 모티브 검색 및 검색 둘 다
FMM 모티브 검색 및 검색(농축 모티브 검색을 위한 입력으로 긍정 및 부정 시퀀스도 얻을 수 있음) 뉴클레오티드
블록 BlOCKS 데이터베이스에서 삭제되지 않은 모티브 식별 둘 다
eMOTIF 짧은 모티브의 추출 및 식별 둘 다
깁스 모티브 샘플러 통계적 우도에 의한 확률적 모티브 추출 둘 다
흠탑 투과성 나선 및 단백질 위상 예측 단백질
아이사이트 로컬 구조 모티브 라이브러리 단백질
JCoils 코일 코일루신 지퍼 예측 단백질
MEME/MAST 모티브 검색 및 검색 둘 다
쿠다메메 GPU 클러스터에 대한 GPU 가속 MEME(v4.4.0) 알고리즘 둘 다
Merci. 차별적 모티브 검색 및 검색 둘 다
PHI-블라스트 모티브 검색 및 정렬 도구 둘 다
필로스칸 모티브 검색 도구 뉴클레오티드
프랫 ScanProsite와 함께 사용할 패턴 생성 단백질
스캔프로사이트 모티브 데이터베이스 검색 도구 단백질
티레시아스 모티브 추출 및 데이터베이스 검색 둘 다
현무암 다중 모티브 및 정규 표현식 검색 둘 다

*시퀀스 유형: 단백질 또는 뉴클레오티드


벤치마킹

이름 작가들
PFAM 30.0(2016년)
SMART(2015년) 레투닉, 코플리, 슈미트, 치카렐리, 독크스, 슐츠, 폰팅, 보크
BALIBASE 3(2015년) 톰슨, 플뢰니악, 포치
옥스벤치(2011년) 라그하바, 서글, 오들리, 바버, 바톤
벤치마크 수집(2009) 에드가
홈스트라드(2005) 미즈구치
PREFAB 4.0(2005) 에드가
SABmark(2004) 밴 월, 라스, 윈스

정렬 뷰어, 편집기

정렬 시각화 소프트웨어 목록을 참조하십시오.

짧은 판독 시퀀스 정렬

이름 설명 페어 엔드 옵션 FASTQ 품질 사용 가프드 멀티스레드 면허증 참조 연도
아리오크 Smith-Waterman 계산 하나 이상의 GPU에서 선형 및 매핑 품질.BS-seq 맞춤 지원초당 10만~50만 읽기 처리(데이터, 하드웨어 및 구성된 민감도가 있는 보기) 아니요. 무료, BSD [33] 2015
바라쿠다 BWA를 기반으로 한 GPGPU 가속 버로우스-휠러 변환(FM-index) 단축 읽기 정렬 프로그램은 갭 개구부 및 확장이 있는 인델의 정렬을 지원한다. 아니요. 예, POSIX 스레드CUDA 무료, GPL
BBMap 게놈을 신속하게 지수화하기 위해 짧은 kmer를 사용한다. 크기나 비계 수 제한은 없다.버로우스-휠러 얼라이너보다 감도와 특수성이 뛰어나며, 속도는 비슷하거나 더 빠르다.Smith-Waterman보다 느리지만 정확도가 높은 암호 변환 최적화 글로벌 정렬 수행Illumina, 454, PacBio, Sanger 및 Ion Torrent 데이터 처리.스플라이스 인식, 긴 인델과 RNA-seq 처리 가능.순수 Java, 모든 플랫폼에서 실행.공동 게놈 연구소에서 사용한다. 무료, BSD 2010
BFAST 기준 시퀀스를 인덱싱하여 지원하는 사전 정확도 추정을 통한 명시적 시간 및 정확도 트레이드오프.인덱스를 최적으로 압축하십시오.수십억 개의 짧은 읽기를 처리할 수 있다.삽입, 삭제, SNP 및 색상 오류(ABI SOLiD 색상 공간 읽기를 매핑할 수 있음)를 처리할 수 있다.Smith Waterman 전체 정렬 수행 예, POSIX 스레드 무료, GPL [34] 2009
BigBWA Hadoop 클러스터에서 Borrows-Wheeler Aligner-BWA 실행페어링된 단일 읽기 및 페어링된 읽기로 동작하는 BWA-MEM, BWA-ALN, BWA-SW 알고리즘을 지원한다.이는 Hadoop 클러스터에서 실행할 때 계산 시간이 크게 단축됨을 의미하며 확장성과 오류 허용성을 추가한다. 저품질 베이스 트리밍 무료, GPL 3 [35] 2015
블라스트N 블라스트의 뉴클레오티드 정렬 프로그램은 짧은 판독에 대해 느리고 정확하지 않으며, 참조 게놈보다는 시퀀스 데이터베이스(EST, Sanger sequence)를 사용한다.
블라 짐 켄트가 만들었다.초기 정렬 단계에서 한 가지 불일치를 처리할 수 있다. 예, 클라이언트-서버 학구적 및 비상업적 사용을 위한 독점적 [36] 2002
보타이 버로우스-휠러 변환을 사용하여 게놈의 영구적인 재사용 가능 지수; 인간 게놈을 위한 1.3GB 메모리 설치 공간.CPU 시간 1시간에 2500만 개 이상의 Illumina 읽기 정렬Maq 유사 및 SOAP 유사 정렬 정책 지원 아니요. 예, POSIX 스레드 자유, 예술 [37] 2009
BWA 버로우스-휠러 변환을 사용하여 게놈의 인덱스를 만든다.보위티보다 조금 느리지만 인들 정렬이 가능하다. 저품질 베이스 트리밍 무료, GPL [38] 2009
BWA-PSSM 포지션별 점수 매트릭스(PSSM) 사용을 기반으로 하는 확률론적 짧은 읽기 얼라이너.얼라이너는 고대 DNA, PAR-CLIP 데이터 또는 편향된 뉴클레오티드 구성의 게놈에서 관찰된 것과 같은 데이터 특정 편향의 읽기 및 모델의 품질 점수를 고려할 수 있다는 점에서 적응이 가능하다.[39] 무료, GPL [39] 2014
캐쉬엑스 대량의 짧은 읽기 시퀀스 데이터를 정량화하고 관리하십시오.CASCEX 파이프라인에는 함께 또는 모듈로서 별도로 사용할 수 있는 툴 세트가 포함되어 있다.이 알고리즘은 참조 게놈에 대한 완벽한 적중 시 매우 정확하다. 아니요. 학구적 및 비상업적 사용을 위한 독점적
구름버스트 Hadoop MapReduce를 사용한 짧은 읽기 매핑 예, Hadoop MapReduce 자유, 예술
쿠다-EC GPU를 사용한 짧은 읽기 정렬 오류 수정. 예, GPU 사용
쿠쇼 버로우스-휠러 변환 기반의 대형 게놈에 대한 CUDA 호환 짧은 읽기 얼라이너 아니요. 예(GPU 사용) 무료, GPL [40] 2012
쿠시와2 정확한 최대 일치 시드를 기반으로 한 가핑된 짧은 읽기와 긴 읽기의 정렬.이 얼라이너는 베이스 공간(예: Illumina, 454, Ion Torrent 및 PacBio 시퀀서)과 ABI SOLiD 색상 공간 읽기 정렬을 모두 지원한다. 아니요. 무료, GPL 2014
쿠시와2-GPU GPU 가속 CUSHAW2 단축 읽기 얼라이너. 아니요. 무료, GPL
쿠시와3길 민감하고 정확한 베이스 스페이스 및 컬러 스페이스 짧은 읽기 정렬(하이브리드 시딩 포함) 아니요. 무료, GPL [41] 2012
drFAST SOLiD 시퀀싱 플랫폼(색상 공간 읽기)을 위해 설계되었지만, Mr FAST 및 Mrs FAST와 같은 주/캐시 메모리 전송을 최소화하기 위해 캐시를 망각하는 기능을 구현하는 읽기 매핑 정렬 소프트웨어.또한 개선된 구조적 변화 발견을 위해 가능한 모든 지도 위치를 반환한다. 예, 구조 변동의 경우 아니요. 무료, BSD
이랜드 Illumina에 의해 구현됨.유한한 읽기 길이로 절단되지 않은 정렬 포함.
에른 NGS 읽기의 정확한 정렬을 위한 확장 랜덤화 수치 얼라이너.그것은 비황산염 처리된 읽기의 지도를 그릴 수 있다. 저품질 베이스 트리밍 멀티스레딩 및 MPI 사용 무료, GPL 3
가스스트 대형 DNA 뱅크에 대한 짧은 DNA 시퀀스의 글로벌 정렬 찾기 멀티스레딩 CeCIL 버전 2 라이센스. [42] 2011
GEM 고품질 정렬 엔진(대체 및 인델이 포함된 소모성 매핑).BWA 또는 Bowtie 1/2보다 정확하고 몇 배 더 빠르다.많은 독립형 생물학적 응용 프로그램(매퍼, 분할 매퍼, 표시 가능성 및 기타)이 제공되었다. 무료, GPL3 [43] 2012
제날리스 MAP 매우 빠르고 포괄적인 NGS 읽기 얼라이너, 높은 정밀도와 작은 스토리지 설치 공간. 저품질 베이스 트리밍 독점적, 상업적
지니어스 조립러 참조 게놈을 포함하거나 포함하지 않고 페어링을 위한 스페이서 크기와 함께 시퀀싱 기술, 읽기 길이, 페어링 방향의 모든 조합을 처리할 수 있는 기능을 갖춘 빠르고 정확한 오버랩 어셈블리. 독점적, 상업적
젠서치NGS 사용자 친화적인 GUI로 프레임워크를 완성하여 NGS 데이터를 분석하십시오.그것은 독점적인 고품질 정렬 알고리즘과 플러그인 기능을 통합하여 다양한 공공 얼라이너를 프레임워크에 통합하여 짧은 읽기를 가져오기, 정렬, 변형 탐지 및 보고서 생성을 가능하게 한다.그것은 재시퀀싱 프로젝트, 즉 진단 환경에서 만들어진다. 아니요. 독점적, 상업적
GMAP 및 GS냅 견고하고 빠른 단축 읽기 정렬.GMAP: 긴 읽기, 여러 개의 인델과 스플라이스(Genomics 분석에서 위의 항목 참조), GSNAP: 짧은 읽기, 지워지지 않는 하나 또는 읽기당 최대 두 개의 스플라이스.디지털 유전자 발현, SNP 및 지워지지 않는 유전자형에 유용하다.Genentech의 Thomas Wu에 의해 개발되었다.알페우스의 국립 게놈 자원 센터(NCGR)에서 사용한다. 학구적 및 비상업적 사용을 위한 독점적
GNUMAP 차세대 시퀀싱 머신(특히 Solexa-Illumina)에서 얻은 시퀀스 데이터를 모든 크기의 게놈으로 정확하게 정렬한다.어댑터 트리밍, SNP 호출 및 Bisulfite 시퀀스 분석 포함. 예, Illumina *_int도 지원한다.txt 및 *_prb.txt 파일(각 기준의 품질 점수 4개 모두 포함) 멀티스레딩 및 MPI 사용 [44] 2009
HIVE-헥사곤 해시 테이블과 블룸 매트릭스를 사용하여 게놈의 잠재적 위치를 만들고 필터링한다.높은 효율성을 위해 짧은 읽기 간의 교차 유사성을 사용하고 고유하지 않은 중복 시퀀스를 재조정하지 않는다.Bowtie와 BWA보다 빠르고 바이러스, 박테리아, 그리고 보다 보수적인 진핵 정렬에 인델과 다른 민감한 정렬을 허용한다. HIV 구축 인스턴스에 등록되어 있는 교육 기관 및 비상업적 사용자를 위한 전용 프리웨어 [45] 2014
아이모스 개선된 메타 얼라이너 및 Minimap2 On Spark.단일 노드 실행을 통해 선형 확장성을 제공하는 Apache Spark 플랫폼의 긴 읽기 분산 얼라이너. 무료
아이작 하나의 서버 노드에서 사용할 수 있는 모든 컴퓨팅 성능을 완벽하게 사용하므로 광범위한 하드웨어 아키텍처에 걸쳐 확장되며 하드웨어 기능에 따라 조정 성능이 향상됨 무료, GPL
지난 반복적으로 풍부한 염기서열(예: 게놈)으로 적응성 씨앗과 복사물을 보다 효율적으로 사용한다.예를 들어, 반복적인 히트곡에 압도되지 않고 반복적인 마스킹 없이 게놈에 읽기를 정렬할 수 있다. 무료, GPL [46] 2011
MAQ 각 베이스의 품질 점수를 고려한 미가공 정렬. 무료, GPL
Mr FAST, MrsFA세인트 메인/캐시 메모리 전송을 최소화하기 위해 캐시를 인식하지 않고 구현하는 가핑(mrFAST) 및 언가핑(mrsfast) 정렬 소프트웨어.이들은 Illumina 시퀀싱 플랫폼용으로 설계되었으며 개선된 구조적 변화 발견을 위해 가능한 모든 지도 위치를 반환할 수 있다. 예, 구조 변동의 경우 아니요. 무료, BSD
엄마 MOM 또는 최대 올리고뉴클레오티드 매핑은 짧은 판독치 내에서 최대 길이 일치를 캡처하는 쿼리 일치 툴이다.
모사이크 빠르게 도킹된 얼라이너 및 참조 가이드 어셈블리.k-mer 해싱 스키마의 결과에 의해 시드된 밴딩된 Smith-Waterman 알고리즘을 사용하여 읽기를 정렬한다.매우 짧은 읽기부터 매우 긴 읽기 지원.
엠스캔 여과 전략을 기반으로 한 빠른 얼라이너(색인화 없음, q-그램 사용 및 후진 비계측 DOG 일치) [47] 2009
노보알린 & 노보알린CS 싱글 엔드 및 페어링 엔드 Illumina GA I&I, ABI Color Space & ION Torrent 판독값의 게프 정렬.정렬의 모든 단계에서 기본 특성을 사용하는 고감도 및 특수성.어댑터 트리밍, 기본 품질 보정, Bi-Seq 정렬 및 읽기당 다중 정렬 보고 옵션 포함.일반 SNP에 대해 모호한 IUPAC 코드를 사용하면 SNP 리콜을 개선하고 알레르기의 편향을 제거할 수 있다. 유료 라이선스와 함께 사용할 수 있는 멀티스레딩 및 MPI 버전 학구적 및 비상업적 사용을 위한 독점적인 무료 소프트웨어 단일 스레드 버전
넥스트GENe Roche Genome Sequencer FLX, Illumina GA/HiSeq, Life Technologies Applied BioSystems의 SOLiD System, PacBio 및 Ion Torrent 플랫폼의 차세대 시퀀싱 데이터 분석을 수행하는 생물학자들이 사용하기 위해 개발되었다. 독점적, 상업적
NextGenMap 유연하고 빠른 읽기 매핑 프로그램(BWA보다 두 배 빠름)은 스탬피에 버금가는 매핑 감도를 달성한다.내부적으로 메모리 효율 지수 구조(해시 테이블)를 사용하여 참조 게놈에 존재하는 모든 13개 매체의 위치를 저장한다.쌍방향 선형이 필요한 매핑 영역은 각 읽기마다 동적으로 결정된다.CPU에 대한 정렬 계산을 가속화하기 위해 빠른 SIMD 지침(SSE)을 사용한다. 가능한 경우, 정렬은 GPU로 계산된다(OpenCL/CUDA 사용). 런타임을 20-50% 더 줄인다. 아니요. 예, POSIX 스레드, OpenCL/CUDA, SSE 무료 [48] 2013
오믹슨 변종 툴킷 SNP 및 인델 탐지를 위한 매우 민감하고 정확한 도구 포함.참조 게놈과의 중간 거리(최대 30% 시퀀스 발산)로 NGS 단편 판독치를 매핑하는 솔루션을 제공한다.레퍼런스 크기에는 제한이 없으며, 높은 민감도와 결합되어 변형 툴킷이 타겟 시퀀싱 프로젝트 및 진단에 적합하도록 한다. 독점적, 상업적
팔마퍼 분할된 선형과 비정형 맞춤을 높은 정확도로 효율적으로 계산한다.밴드형 Smith-Waterman 유사 알고리즘을 기반으로 한 빠른 매핑과 결합된 머신러닝 전략에 의존해 CPU 1개에서 시간당 약 700만 번의 읽기를 정렬한다.그것은 원래 제안된 QPALMA 접근방식을 다시 정의한다. 무료, GPL
파르텍 플로우 생물학자들과 생물정보학자들이 사용하기 위해서입니다.Illumina, Life Technologies Solid TM, Roche 454 및 Ion Torrent 원시 데이터(품질 정보 유무 또는 유무)의 단일 및 페어엔드 읽기로부터 미가핑, 도핑 및 스플라이스 접합 정렬을 지원한다.FASTQ/Qual 레벨 및 정렬된 데이터에 대한 강력한 품질 관리를 통합한다.추가 기능으로는 원시 판독의 트리밍 및 필터링, SNP 및 InDel 검출, mRNA 및 microRNA 정량화, 퓨전 유전자 검출 등이 있다. 멀티프로세서 코어 클라이언트-서버 설치 가능 독점적, 상업적, 무료 평가판 버전
통과하다 게놈을 색인화한 다음 사전 계산된 단어 정렬을 사용하여 씨앗을 확장한다.기본 공간, 색상 공간(SOLID)과 함께 작동하며 게놈 및 스플라이스 RNA-seq 읽기를 정렬할 수 있다. 학구적 및 비상업적 사용을 위한 독점적
PerM 주기적인 씨앗으로 게놈을 인덱싱하여 최대 4개의 불일치까지 완전 민감도로 정렬을 신속하게 찾으십시오.Illumina와 SOLiD 읽기를 매핑할 수 있다.대부분의 매핑 프로그램과 달리 읽기 길이가 길수록 속도가 빨라진다. 무료, GPL [49]
프라멕스 k-mer 조회 테이블로 게놈을 조절 가능한 수의 불일치까지 완전 민감도로 색인화한다.15-60bp 시퀀스를 게놈에 매핑하는 데 가장 좋다. 아니요. 아니요. 아니요, 검색당 여러 프로세스 [1] 2003
큐팔마 품질 점수, 내부 길이 및 계산 스플라이스 부지 예측을 사용하여 치우치지 않은 선형을 수행하고 수행할 수 있다.RNA-seq 실험과 게놈의 구체적 내용에 따라 훈련할 수 있다.스플라이스 사이트/인트론 발견 및 유전자 모델 구축에 유용하다(더 빠른 버전은 PALMapper 참조). 예, 클라이언트-서버 무료, GPL 2
라제르스 읽기 길이 제한 없음.구성 가능한 오류율로 거리 매핑을 설정하거나 편집하십시오.구성 가능하고 예측 가능한 민감도(runtime/sensitivity tradeoff).페어드 엔드 읽기 매핑 지원 무료, LGPL
REAL, cREAL REAL은 차세대 시퀀싱에서 얻은 짧은 읽기를 정렬하기 위한 효율적이고 정확하며 민감한 도구다.이 프로그램은 차세대 Illumina/Solexa Genome Analyzer에 의해 생성되는 방대한 양의 단일 엔드 읽기 작업을 처리할 수 있다. cREAL은 차세대 염기서열에서 얻은 짧은 읽기를 원형 구조로 게놈에 맞추어 조정하기 위한 REAL의 단순한 확장이다. 무료, GPL
R맵 오류 확률 정보(품질 점수)를 포함하거나 포함하지 않고 읽기를 매핑할 수 있으며, 페어링 엔드 읽기 또는 비황산 처리된 읽기 매핑을 지원한다.읽기 길이나 불일치 수에는 제한이 없다. 무료, GPL 3
RNA NGS 읽기의 정확한 정렬을 위한 무작위화된 수치 얼라이너 저품질 베이스 트리밍 멀티스레딩 및 MPI 사용 무료, GPL 3
RTG 조사자 매우 빠르고, 높은 지워지지 않는 수치 및 대체 수치에 내성적임.전체 읽기 정렬 포함.제품에는 Illumina, Complete Genomics 및 Roche 454 데이터의 조합으로 변형 검출 및 메타게놈 분석을 위한 종합 파이프라인이 포함된다. 예, 변종 통화의 경우 조사자 개개인을 위한 전용 프리웨어
세겔 삽입, 삭제, 불일치 처리 가능, 향상된 접미사 배열 사용 아니요. 비상업적 사용을 위한 독점적, 프리웨어 [50] 2009
SeqMap 최대 5가지 혼합 대체 및 삽입, 다양한 튜닝 옵션 및 입력 출력 형식 학구적 및 비상업적 사용을 위한 독점적
슈렉 접미사 트리 데이터 구조를 사용한 짧은 읽기 오류 수정 예, 자바
새우 버전 2의 참조 게놈을 색인화한다.가능한 키를 생성하기 위해 마스크를 사용한다.ABI SOLiD 색상 공간 읽기를 매핑할 수 있다. 예, OpenMP 무료, [BSD 라이센스 스타일="백그라운드: #DFF; 수직 정렬: 중간; 텍스트 정렬: 가운데; "class="자유 테이블" Free, BSD] 파생 모델

[51] [52]

2009-2011
슬라이더 슬라이더는 Illumina Sequence Analyzer 출력을 위한 애플리케이션으로, 기준 시퀀스 또는 기준 시퀀스 집합에 정렬하기 위한 입력으로 시퀀스 파일 대신 "확률성" 파일을 사용한다. 아니요. 아니요. [53][54] 2009-2010
SOAP, SOAP2, SOAP3, SOAP3-dp SOAP: 적은 수의 차이와 불일치로 견고함.BLAR에 대한 속도 향상, 12글자 해시 테이블을 사용한다.SOAP2: 양방향 BWT를 사용하여 참조지수를 구축하며, 첫 번째 버전보다 훨씬 빠르다.SOAP3: 100만 읽기당 수십 초 만에 모든 4-mismatch 정렬을 찾을 수 있는 GPU 가속 버전.SOAP3-dp, 또한 GPU 가속화는 임의의 수의 불일치 및 격차 발생을 해당 간격 벌점수에 따라 지원한다. 아니요. 예, SOAP3-dp 예, POSIX 스레드; SOAP3, SOAP3-dp는 CUDA가 지원되는 GPU 필요 무료, GPL [55][56]
SOCS ABI SOLiD 기술용.일치하지 않는 판독치(또는 색상 오류)를 매핑하는 데 걸리는 시간이 크게 증가함Rabin-Karp 문자열 검색 알고리즘의 반복 버전을 사용한다. 무료, GPL
스파크BWA Borrows-Wheeler Aligner—B 통합Hadoop에서 실행되는 Apache Spark 프레임워크의 WA.2016년 10월 버전 0.2는 BWA-MEM, BWA-Backtrack, BWA-ALN 알고리즘을 지원한다.이 모든 것들은 단판 읽기와 쌍판 읽기로 작동한다. 저품질 베이스 트리밍 무료, GPL 3 [57] 2016
사하, 사하2 소수의 변형 모델에 빠른 속도 학구적 및 비상업적 사용을 위한 독점적
스탬피 Illumina는 읽는다.인디델, 구조 변형 또는 많은 SNP가 포함된 읽기에는 민감하고 높은 특수성.느리지만 첫 번째 얼라인먼트 패스에 BWA를 사용함으로써 속도가 크게 향상되었다. 아니요. 학구적 및 비상업적 사용을 위한 독점적 [58] 2010
스토름 Illumina 또는 ABI SOLiD 읽기의 경우, SAM 기본 출력 포함.많은 오류가 있는 읽기, 인델(0부터 15까지 꽉 찬 상태, 그렇지 않은 경우 지원 확장)에 매우 민감함.스페이스 시드(단일 히트)와 매우 빠른 SSE-SSE2-AVX2-AVX-512 밴드 정렬 필터를 사용한다.고정 길이 읽기 전용의 경우 저자는 그렇지 않은 경우 SRIMP2를 권장한다. 아니요. 예, OpenMP 무료 [59] 2010
Subread, Subjunc 매우 빠르고 정확한 읽기 얼라이너.서브프레드는 gDNA-seq와 RNA-seq 읽기를 모두 매핑하는 데 사용될 수 있다.Subjunc는 Exon-exon 접합부를 감지하고 RNA-seq 읽기를 매핑한다.그들은 씨앗과 투표라는 새로운 지도화 패러다임을 채택하고 있다. 무료, GPL 3
타이판 Illumina용 디노보 조립기 읽기 학구적 및 비상업적 사용을 위한 독점적
우게네 Bowtie 및 BWA용 시각적 인터페이스와 내장된 얼라이너 무료, GPL
벨로시 매퍼 TimeLogic에서 FPGA 가속 기준 시퀀스 정렬 매핑 도구.BWA 및 Bowtie와 같은 Browers-Wheeler 변환 기반 알고리즘보다 빠름.성능 저하 없이 최대 7개의 불일치 및/또는 인델을 지원한다.민감한 Smith-Waterman 가핑 정렬 생성 독점적, 상업적
XpressAlign FPGA 기반 슬라이딩 윈도우 단축 읽기 얼라이너로, 짧은 읽기 얼라이너라는 당혹스러울 정도로 평행한 특성을 활용한다.성능은 칩 상의 트랜지스터 수에 따라 선형적으로 확장된다(즉 알고리즘을 수정하지 않고 무어의 법칙을 반복할 때마다 성능이 두 배로 보장됨).낮은 전력 소비량은 데이터 센터 장비에 유용하다.예측 가능한 런타임.현재 하드웨어의 소프트웨어 슬라이딩 윈도우 얼라이너보다 가격 대비 성능이 우수하지만, 현재 소프트웨어 BWT 기반 얼라이너보다 나은 것은 아니다.대량의 불일치(>2)를 관리할 수 있다.모든 씨앗에 맞는 모든 위치를 찾을 수 있을 것이다.단일-FPGA 실험 버전, 다중-FPGA 생산 버전으로 개발하기 위한 작업이 필요하다. 학구적 및 비상업적 사용을 위한 독점적
실제 일치하지 않는 15-240bp 사이의 판독치에 대한 100% 민감도.아주 빠르다.삽입 및 삭제 지원.454개가 아니라 Illumina & SOLiD 기기로 작동한다. 예(GUI), 아니오(CLI) 독점적, 상업적 [60]

참고 항목

참조

  1. ^ Altschul SF, Gish W, Miller W, Myers EW, Lipman DJ; Gish; Miller; Myers; Lipman (October 1990). "Basic local alignment search tool". Journal of Molecular Biology. 215 (3): 403–10. doi:10.1016/S0022-2836(05)80360-2. PMID 2231712.{{cite journal}}: CS1 maint : 복수이름 : 작성자 목록(링크)
  2. ^ HPC-BLAST 코드 저장소 https://github.com/UTennessee-JICS/HPC-BLAST
  3. ^ Angermüller, C.; Biegert, A.; Söding, J. (Dec 2012). "Discriminative modelling of context-specific amino acid substitution probabilities". Bioinformatics. 28 (24): 3240–7. doi:10.1093/bioinformatics/bts622. PMID 23080114.
  4. ^ Buchfink, Xie and Huson (2015). "Fast and sensitive protein alignment using DIAMOND". Nature Methods. 12 (1): 59–60. doi:10.1038/nmeth.3176. PMID 25402007. S2CID 5346781.
  5. ^ B Buchfink, K Reuter and HG Drost (2021). "Sensitive protein alignments at tree-of-life scale using DIAMOND". Nature Methods. 18 (4): 366–368. doi:10.1038/s41592-021-01101-x. PMC 8026399. PMID 33828273.
  6. ^ Durbin, Richard; Eddy, Sean R.; Krogh, Anders; Mitchison, Graeme, eds. (1998). Biological sequence analysis: probabilistic models of proteins and nucleic acids. Cambridge, UK: Cambridge University Press. ISBN 978-0-521-62971-3.[페이지 필요]
  7. ^ Söding J (April 2005). "Protein homology detection by HMM-HMM comparison". Bioinformatics. 21 (7): 951–60. doi:10.1093/bioinformatics/bti125. PMID 15531603.
  8. ^ Remmert, Michael; Biegert, Andreas; Hauser, Andreas; Söding, Johannes (2011-12-25). "HHblits: lightning-fast iterative protein sequence searching by HMM-HMM alignment". Nature Methods. 9 (2): 173–175. doi:10.1038/nmeth.1818. hdl:11858/00-001M-0000-0015-8D56-A. ISSN 1548-7105. PMID 22198341. S2CID 205420247.
  9. ^ Hauswedell H, Singer J, Reinert K (2014-09-01). "Lambda: the local aligner for massive biological data". Bioinformatics. 30 (17): 349–355. doi:10.1093/bioinformatics/btu439. PMC 4147892. PMID 25161219.
  10. ^ Steinegger, Martin; Soeding, Johannes (2017-10-16). "MMseqs2 enables sensitive protein sequence searching for the analysis of massive data sets". Nature Biotechnology. 35 (11): 1026–1028. doi:10.1038/nbt.3988. hdl:11858/00-001M-0000-002E-1967-3. PMID 29035372. S2CID 402352.
  11. ^ Rucci, Enzo; Garcia, Carlos; Botella, Guillermo; Giusti, Armando E. De; Naiouf, Marcelo; Prieto-Matias, Manuel (2016-06-30). "OSWALD: OpenCL Smith–Waterman on Altera's FPGA for Large Protein Databases". International Journal of High Performance Computing Applications. 32 (3): 337–350. doi:10.1177/1094342016654215. ISSN 1094-3420. S2CID 212680914.
  12. ^ Altschul SF, Madden TL, Schäffer AA, et al. (September 1997). "Gapped BLAST and PSI-BLAST: a new generation of protein database search programs". Nucleic Acids Research. 25 (17): 3389–402. doi:10.1093/nar/25.17.3389. PMC 146917. PMID 9254694.
  13. ^ Li W, McWilliam H, Goujon M, et al. (June 2012). "PSI-Search: iterative HOE-reduced profile SSEARCH searching". Bioinformatics. 28 (12): 1650–1651. doi:10.1093/bioinformatics/bts240. PMC 3371869. PMID 22539666.
  14. ^ Oehmen, C.; Nieplocha, J. (August 2006). "ScalaBLAST: A scalable implementation of BLAST for high-performance data-intensive bioinformatics analysis". IEEE Transactions on Parallel & Distributed Systems. 17 (8): 740–749. doi:10.1109/TPDS.2006.112. S2CID 11122366.
  15. ^ Hughey, R.; Karplus, K.; Krogh, A. (2003). SAM: sequence alignment and modeling software system. Technical report UCSC-CRL-99-11 (Report). University of California, Santa Cruz, CA.
  16. ^ Rucci, Enzo; García, Carlos; Botella, Guillermo; De Giusti, Armando; Naiouf, Marcelo; Prieto-Matías, Manuel (2015-12-25). "An energy-aware performance analysis of SWIMM: Smith–Waterman implementation on Intel's Multicore and Manycore architectures". Concurrency and Computation: Practice and Experience. 27 (18): 5517–5537. doi:10.1002/cpe.3598. ISSN 1532-0634. S2CID 42945406.
  17. ^ Rucci, Enzo; García, Carlos; Botella, Guillermo; De Giusti, Armando; Naiouf, Marcelo; Prieto-Matías, Manuel (2015-12-25). "SWIMM 2.0: enhanced Smith-Waterman on Intel's Multicore and Manycore architectures based on AVX-512 vector extensions". International Journal of Parallel Programming. 47 (2): 296–317. doi:10.1007/s10766-018-0585-7. ISSN 1573-7640. S2CID 49670113.
  18. ^ Schwartz S, Kent WJ, Smit A, Zhang Z, Baertsch R, Hardison RC, Haussler D, Miller W; Kent; Smit; Zhang; Baertsch; Hardison; Haussler; Miller (2003). "Human-mouse alignments with BLASTZ". Genome Research. 13 (1): 103–107. doi:10.1101/gr.809403. PMC 430961. PMID 12529312.{{cite journal}}: CS1 maint : 복수이름 : 작성자 목록(링크)
  19. ^ Harris R S (2007). Improved pairwise alignment of genomic DNA (Thesis).
  20. ^ Sandes, Edans F. de O.; de Melo, Alba Cristina M.A. (May 2013). "Retrieving Smith-Waterman Alignments with Optimizations for Megabase Biological Sequences Using GPU". IEEE Transactions on Parallel and Distributed Systems. 24 (5): 1009–1021. doi:10.1109/TPDS.2012.194.
  21. ^ Sandes, Edans F. de O.; Miranda, G.; De Melo, A.C.M.A.; Martorell, X.; Ayguade, E. (May 2014). CUDAlign 3.0: Parallel Biological Sequence Comparison in Large GPU Clusters. Cluster, Cloud and Grid Computing (CCGrid), 2014 14th IEEE/ACM International Symposium on. p. 160. doi:10.1109/CCGrid.2014.18.
  22. ^ Sandes, Edans F. de O.; Miranda, G.; De Melo, A.C.M.A.; Martorell, X.; Ayguade, E. (August 2014). Fine-grain Parallel Megabase Sequence Comparison with Multiple Heterogeneous GPUs. Proceedings of the 19th ACM SIGPLAN Symposium on Principles and Practice of Parallel Programming. pp. 383–384. doi:10.1145/2555243.2555280.
  23. ^ Chivian, D; Baker, D (2006). "Homology modeling using parametric alignment ensemble generation with consensus and energy-based model selection". Nucleic Acids Research. 34 (17): e112. doi:10.1093/nar/gkl480. PMC 1635247. PMID 16971460.
  24. ^ Girdea, M; Noe, L; Kucherov, G (January 2010). "Back-translation for discovering distant protein homologies in the presence of frameshift mutations". Algorithms for Molecular Biology. 5 (6): 6. doi:10.1186/1748-7188-5-6. PMC 2821327. PMID 20047662.
  25. ^ Ma, B.; Tromp, J.; Li, M. (2002). "PatternHunter: faster and more sensitive homology search". Bioinformatics. 18 (3): 440–445. doi:10.1093/bioinformatics/18.3.440. PMID 11934743.
  26. ^ Li, M.; Ma, B.; Kisman, D.; Tromp, J. (2004). "Patternhunter II: highly sensitive and fast homology search". Journal of Bioinformatics and Computational Biology. 2 (3): 417–439. CiteSeerX 10.1.1.1.2393. doi:10.1142/S0219720004000661. PMID 15359419.
  27. ^ Gusfield, Dan (1997). Algorithms on strings, trees and sequences. Cambridge university press. ISBN 978-0-521-58519-4.
  28. ^ Rucci, Enzo; Garcia, Carlos; Botella, Guillermo; Naiouf, Marcelo; De Giusti,Armando; Prieto-Matias, Manuel (2018). "SWIFOLD: Smith-Waterman implementation on FPGA with OpenCL for long DNA sequences". BMC Systems Biology. 12 (Suppl 5): 96. doi:10.1186/s12918-018-0614-6. PMC 6245597. PMID 30458766.
  29. ^ Rucci, Enzo; Garcia, Carlos; Botella, Guillermo; Naiouf, Marcelo; De Giusti,Armando; Prieto-Matias, Manuel. Accelerating Smith-Waterman Alignment of Long DNA Sequences with OpenCL on FPGA. 5th International Work-Conference on Bioinformatics and Biomedical Engineering. pp. 500–511. doi:10.1007/978-3-319-56154-7_45.
  30. ^ Rasmussen K, Stoye J, Myers EW; Stoye; Myers (2006). "Efficient q-Gram Filters for Finding All epsilon-Matches over a Given Length". Journal of Computational Biology. 13 (2): 296–308. CiteSeerX 10.1.1.465.2084. doi:10.1089/cmb.2006.13.296. PMID 16597241.{{cite journal}}: CS1 maint : 복수이름 : 작성자 목록(링크)
  31. ^ Noe L, Kucherov G; Kucherov (2005). "YASS: enhancing the sensitivity of DNA similarity search". Nucleic Acids Research. 33 (suppl_2): W540–W543. doi:10.1093/nar/gki478. PMC 1160238. PMID 15980530.
  32. ^ Pratas, Diogo; Silva, Jorge (2020). "Persistent minimal sequences of SARS-CoV-2". Bioinformatics. 36 (21): 5129–5132. doi:10.1093/bioinformatics/btaa686. PMC 7559010. PMID 32730589.
  33. ^ Wilton, Richard; Budavari, Tamas; Langmead, Ben; Wheelan, Sarah J.; Salzberg, Steven L.; Szalay, Alexander S. (2015). "Arioc: high-throughput read alignment with GPU-accelerated exploration of the seed-and-extend search space". PeerJ. 3: e808. doi:10.7717/peerj.808. PMC 4358639. PMID 25780763.
  34. ^ Homer, Nils; Merriman, Barry; Nelson, Stanley F. (2009). "BFAST: An Alignment Tool for Large Scale Genome Resequencing". PLOS ONE. 4 (11): e7767. Bibcode:2009PLoSO...4.7767H. doi:10.1371/journal.pone.0007767. PMC 2770639. PMID 19907642.
  35. ^ Abuín, J.M.; Pichel, J.C.; Pena, T.F.; Amigo, J. (2015). "BigBWA: approaching the Burrows–Wheeler aligner to Big Data technologies". Bioinformatics. 31 (24): 4003–5. doi:10.1093/bioinformatics/btv506. PMID 26323715.
  36. ^ Kent, W. J. (2002). "BLAT---The BLAST-Like Alignment Tool". Genome Research. 12 (4): 656–664. doi:10.1101/gr.229202. ISSN 1088-9051. PMC 187518. PMID 11932250.
  37. ^ Langmead, Ben; Trapnell, Cole; Pop, Mihai; Salzberg, Steven L (2009). "Ultrafast and memory-efficient alignment of short DNA sequences to the human genome". Genome Biology. 10 (3): R25. doi:10.1186/gb-2009-10-3-r25. ISSN 1465-6906. PMC 2690996. PMID 19261174.
  38. ^ Li, H.; Durbin, R. (2009). "Fast and accurate short read alignment with Burrows-Wheeler transform". Bioinformatics. 25 (14): 1754–1760. doi:10.1093/bioinformatics/btp324. ISSN 1367-4803. PMC 2705234. PMID 19451168.
  39. ^ a b Kerpedjiev, Peter; Frellsen, Jes; Lindgreen, Stinus; Krogh, Anders (2014). "Adaptable probabilistic mapping of short reads using position specific scoring matrices". BMC Bioinformatics. 15 (1): 100. doi:10.1186/1471-2105-15-100. ISSN 1471-2105. PMC 4021105. PMID 24717095.
  40. ^ Liu, Y.; Schmidt, B.; Maskell, D. L. (2012). "CUSHAW: a CUDA compatible short read aligner to large genomes based on the Burrows-Wheeler transform". Bioinformatics. 28 (14): 1830–1837. doi:10.1093/bioinformatics/bts276. ISSN 1367-4803. PMID 22576173.
  41. ^ Liu, Y.; Schmidt, B. (2012). "Long read alignment based on maximal exact match seeds". Bioinformatics. 28 (18): i318–i324. doi:10.1093/bioinformatics/bts414. ISSN 1367-4803. PMC 3436841. PMID 22962447.
  42. ^ Rizk, Guillaume; Lavenier, Dominique (2010). "GASSST: global alignment short sequence search tool". Bioinformatics. 26 (20): 2534–2540. doi:10.1093/bioinformatics/btq485. PMC 2951093. PMID 20739310.
  43. ^ Marco-Sola, Santiago; Sammeth, Michael; Guigó, Roderic; Ribeca, Paolo (2012). "The GEM mapper: fast, accurate and versatile alignment by filtration". Nature Methods. 9 (12): 1185–1188. doi:10.1038/nmeth.2221. ISSN 1548-7091. PMID 23103880. S2CID 2004416.
  44. ^ Clement, N. L.; Snell, Q.; Clement, M. J.; Hollenhorst, P. C.; Purwar, J.; Graves, B. J.; Cairns, B. R.; Johnson, W. E. (2009). "The GNUMAP algorithm: unbiased probabilistic mapping of oligonucleotides from next-generation sequencing". Bioinformatics. 26 (1): 38–45. doi:10.1093/bioinformatics/btp614. ISSN 1367-4803. PMC 6276904. PMID 19861355.
  45. ^ Santana-Quintero, Luis; Dingerdissen, Hayley; Thierry-Mieg, Jean; Mazumder, Raja; Simonyan, Vahan (2014). "HIVE-Hexagon: High-Performance, Parallelized Sequence Alignment for Next-Generation Sequencing Data Analysis". PLOS ONE. 9 (6): 1754–1760. Bibcode:2014PLoSO...999033S. doi:10.1371/journal.pone.0099033. PMC 4053384. PMID 24918764.
  46. ^ Kielbasa, S.M.; Wan, R.; Sato, K.; Horton, P.; Frith, M.C. (2011). "Adaptive seeds tame genomic sequence comparison". Genome Research. 21 (3): 487–493. doi:10.1101/gr.113985.110. PMC 3044862. PMID 21209072.
  47. ^ Rivals, Eric; Salmela, Leena; Kiiskinen, Petteri; Kalsi, Petri; Tarhio, Jorma (2009). mpscan: Fast Localisation of Multiple Reads in Genomes. Algorithms in Bioinformatics. Lecture Notes in Computer Science. Vol. 5724. pp. 246–260. Bibcode:2009LNCS.5724..246R. CiteSeerX 10.1.1.156.928. doi:10.1007/978-3-642-04241-6_21. ISBN 978-3-642-04240-9.
  48. ^ Sedlazeck, Fritz J.; Rescheneder, Philipp; von Haeseler, Arndt (2013). "NextGenMap: fast and accurate read mapping in highly polymorphic genomes". Bioinformatics. 29 (21): 2790–2791. doi:10.1093/bioinformatics/btt468. PMID 23975764.
  49. ^ Chen, Yangho; Souaiaia, Tade; Chen, Ting (2009). "PerM: efficient mapping of short sequencing reads with periodic full sensitive spaced seeds". Bioinformatics. 25 (19): 2514–2521. doi:10.1093/bioinformatics/btp486. PMC 2752623. PMID 19675096.
  50. ^ Searls, David B.; Hoffmann, Steve; Otto, Christian; Kurtz, Stefan; Sharma, Cynthia M.; Khaitovich, Philipp; Vogel, Jörg; Stadler, Peter F.; Hackermüller, Jörg (2009). "Fast Mapping of Short Sequences with Mismatches, Insertions and Deletions Using Index Structures". PLOS Computational Biology. 5 (9): e1000502. Bibcode:2009PLSCB...5E0502H. doi:10.1371/journal.pcbi.1000502. ISSN 1553-7358. PMC 2730575. PMID 19750212.
  51. ^ Rumble, Stephen M.; Lacroute, Phil; Dalca, Adrian V.; Fiume, Marc; Sidow, Arend; Brudno, Michael (2009). "SHRiMP: Accurate Mapping of Short Color-space Reads". PLOS Computational Biology. 5 (5): e1000386. Bibcode:2009PLSCB...5E0386R. doi:10.1371/journal.pcbi.1000386. PMC 2678294. PMID 19461883.
  52. ^ David, Matei; Dzamba, Misko; Lister, Dan; Ilie, Lucian; Brudno, Michael (2011). "SHRiMP2: Sensitive yet Practical Short Read Mapping". Bioinformatics. 27 (7): 1011–1012. doi:10.1093/bioinformatics/btr046. PMID 21278192.
  53. ^ Malhis, Nawar; Butterfield, Yaron S. N.; Ester, Martin; Jones, Steven J. M. (2009). "Slider – Maximum use of probability information for alignment of short sequence reads and SNP detection". Bioinformatics. 25 (1): 6–13. doi:10.1093/bioinformatics/btn565. PMC 2638935. PMID 18974170.
  54. ^ Malhis, Nawar; Jones, Steven J. M. (2010). "High Quality SNP Calling Using Illumina Data at Shallow Coverage". Bioinformatics. 26 (8): 1029–1035. doi:10.1093/bioinformatics/btq092. PMID 20190250.
  55. ^ Li, R.; Li, Y.; Kristiansen, K.; Wang, J. (2008). "SOAP: short oligonucleotide alignment program". Bioinformatics. 24 (5): 713–714. doi:10.1093/bioinformatics/btn025. ISSN 1367-4803. PMID 18227114.
  56. ^ Li, R.; Yu, C.; Li, Y.; Lam, T.-W.; Yiu, S.-M.; Kristiansen, K.; Wang, J. (2009). "SOAP2: an improved ultrafast tool for short read alignment". Bioinformatics. 25 (15): 1966–1967. doi:10.1093/bioinformatics/btp336. ISSN 1367-4803. PMID 19497933.
  57. ^ Abuín, José M.; Pichel, Juan C.; Pena, Tomás F.; Amigo, Jorge (2016-05-16). "SparkBWA: Speeding Up the Alignment of High-Throughput DNA Sequencing Data". PLOS ONE. 11 (5): e0155461. Bibcode:2016PLoSO..1155461A. doi:10.1371/journal.pone.0155461. ISSN 1932-6203. PMC 4868289. PMID 27182962.
  58. ^ Lunter, G.; Goodson, M. (2010). "Stampy: A statistical algorithm for sensitive and fast mapping of Illumina sequence reads". Genome Research. 21 (6): 936–939. doi:10.1101/gr.111120.110. ISSN 1088-9051. PMC 3106326. PMID 20980556.
  59. ^ Noe, L.; Girdea, M.; Kucherov, G. (2010). "Designing efficient spaced seeds for SOLiD read mapping". Advances in Bioinformatics. 2010: 708501. doi:10.1155/2010/708501. PMC 2945724. PMID 20936175.
  60. ^ Lin, H.; Zhang, Z.; Zhang, M.Q.; Ma, B.; Li, M. (2008). "ZOOM! Zillions of oligos mapped". Bioinformatics. 24 (21): 2431–2437. doi:10.1093/bioinformatics/btn416. PMC 2732274. PMID 18684737.