우게네
UGENE![]() UGENE 로고 | |
![]() | |
원본 작성자 | 푸르소프 M. |
---|---|
개발자 | 유니프로 |
초기 릴리즈 | 2008; | 전
안정적 해제 | 41 / 2021년 12월 3일; 전 |
기록 위치 | C++, Qt |
운영 체제 | Windows, MacOS, Linux |
다음에서 사용 가능 | 영어, 러시아어 |
유형 | 생물정보학 툴킷 |
면허증 | GPLv2 |
웹사이트 | ugene |
UGENE는 생물정보학을 위한 컴퓨터 소프트웨어다.[1][2]윈도, 맥OS, 리눅스 같은 개인용 컴퓨터 운영 체제에서 작동한다.GNU GPL(General Public License) 버전 2에 따라 무료 오픈소스 소프트웨어로 출시된다.null
UGENE는 생물학자들이 시퀀스, 주석, 다중 선형, 계통생성 나무, NGS 어셈블리 등 다양한 생물학적 유전학 데이터를 분석할 수 있도록 돕는다.데이터는 로컬(개인용 컴퓨터)과 공유 저장소(예: 실험실 데이터베이스)에 모두 저장할 수 있다.null
UGENE는 유전체학, 진화 생물학, 바이러스학 및 기타 생명과학 분야의 맥락에서 잘 알려진 생물학적 도구, 알고리즘 및 독창적인 도구 수십 가지를 통합한다.UGENE는 컴퓨터 프로그래밍 기술이 없는 생물학자들이 그러한 도구에 더 쉽게 접근할 수 있도록 사전 제작된 도구에 그래픽 사용자 인터페이스(GUI)를 제공한다.null
UGENE Workflow Designer를 사용하면 다단계 분석을 간소화할 수 있다.워크플로는 데이터 리더, 임베디드 툴 및 알고리즘을 실행하는 블록, 데이터 작성기 등의 블록으로 구성된다.블록은 명령줄 도구 또는 스크립트를 사용하여 생성할 수 있다.일련의 샘플 워크플로우를 워크플로 디자이너에서 사용할 수 있으며, 시퀀스 주석 달기, 데이터 형식 변환, NGS 데이터 분석 등을 할 수 있다.null
그래픽 인터페이스 옆에 UGENE도 명령줄 인터페이스가 있다.워크플로우도 이에 따라 실행될 수 있다.null
UGENE는 성능 향상을 위해 멀티 코어 프로세서(CPU)와 그래픽 처리 장치(GPU)를 사용하여 몇 가지 알고리즘을 최적화한다.[3][4]null
주요 기능
이 소프트웨어는 다음과 같은 기능을 지원한다.
- 핵산 및 단백질 시퀀스 작성, 편집 및 주석 달기
- 시퀀스 내 빠른 검색
- 다중 시퀀스 정렬: Clustal W 및 O, MUSIC, Kalign, MAFFT, T-Coffee
- 공유 스토리지 생성 및 사용(예: 랩 데이터베이스)
- 온라인 데이터베이스를 통한 검색:NCBI(National Center for Biology Information), PDB(Proton Data Bank), UniProtKB/Swiss-Prot, UniProtKB/TEMBL, DAS 서버
- 로컬 및 NCBI Genbank VOLAS 검색
- 읽기 프레임 검색기 열기
- REBASE[5] 제한 효소 목록이 통합된 제한 효소 검출기
- PCR 프라이머 설계를 위한 통합 프라이머3 패키지[6]
- 플라스미드 구조 및 주석
- 클로닝 벡터 설계를 통한 실리코에서의 클로닝
- Bowtie, BWA [7]및 UGENE 게놈 얼라이너를 사용한 짧은 판독치의 게놈 매핑
- UGENE Assembly Browser를 사용하여 차세대 시퀀싱 데이터(BAM 파일) 시각화
- SAMtools를[8] 사용한 변종 호출
- 턱시도 파이프라인을 사용한 RNA-Seq 데이터 분석(TopHat,[9] Capslinks [10]등)
- Cistrome 파이프라인을 사용한 Chip-seq 데이터 분석(MACS,[11] CEAS [12]등)
- 원시 NGS 데이터 처리
- HMER 2 및 3 패키지 통합
- 크로마토그램 뷰어
- 중량 매트릭스 및 SITECON 알고리즘을 사용한 TFBS(전사 인자 바인딩 사이트) 검색
- DNA 시퀀스에서 직접, 반전 및 탠덤 반복측정 검색
- 최적화된 Smith-Waterman 알고리즘으로 로컬 시퀀스 정렬
- 통합 PHYLIP 인접 결합, MrBayes [13]또는 PhyML[14] 최대 가능성 사용 및 계통발생 트리 편집
- UGENE Workflow Designer를 사용하여 다양한 알고리즘을 사용자 정의 워크플로로 결합
- CAP3를[15] 사용한 콘티그 조립체
- PDB(Protental Data Bank) 및 MMDB(Molecular Modeling Database)[16] 형식의 파일에 대한 3D Structure Viewer, anaglyph 뷰어 지원
- GOR IV 및 PSIPRED 알고리즘으로 단백질 2차 구조 예측
- 핵산 시퀀스에 대한 점 그림 생성
- 스피디와의[17] mRNA 정렬
- ExpertDiscovery를[18] 사용하여 복잡한 신호 검색
- UGENE Query Designer를 사용하여 핵산 시퀀스로 다양한 알고리즘 결과 패턴 검색
- 프라이머 설계 및 매핑을 위한 실리코 PCR
- 스파이드 드 노보 조립기
시퀀스 뷰
시퀀스 뷰는 핵산 또는 단백질 시퀀스를 시각화, 분석 및 수정하는 데 사용된다.시퀀스 유형 및 선택한 옵션에 따라 시퀀스 보기 창에 다음과 같은 보기가 표시될 수 있다.
선형 편집기
정렬 편집기는 여러 핵산 또는 단백질 시퀀스(정렬, 정렬 편집, 분석, 컨센서스 시퀀스 저장, 계통 생성 트리 만들기 등)로 작업할 수 있다.null
계통형 트리 뷰어
계통생성 트리 뷰어는 계통생성 트리를 시각화하고 편집하는 데 도움을 준다.트리를 만들 때 사용한 해당 다중 정렬과 트리를 동기화할 수 있다.null
어셈블리 브라우저
어셈블리 브라우저 프로젝트는 Illumina iDEA Challenge 2011의 항목으로 2010년에 시작되었다.[19]브라우저는 사용자가 대규모의 차세대 시퀀스 어셈블리(최대 수억 개의 짧은 읽기)를 시각화하고 탐색할 수 있도록 한다.SAM,[20] BAM(SAM의 바이너리 버전), ACE 포맷을 지원한다.UGENE에서 어셈블리 데이터를 검색하기 전에 입력 파일이 자동으로 UGENE 데이터베이스 파일로 변환된다.이 접근법은 장단점이 있다.이로 인해 전체 어셈블리를 보고, 그 안에서 항해하고, 잘 덮인 지역으로 빠르게 이동할 수 있다는 것이 장점이다.단점은 변환은 대용량 파일에 시간이 걸릴 수 있으며, 데이터베이스를 저장하기에 충분한 디스크 공간이 필요하다는 것이다.null
워크플로 디자이너
UGENE Workflow Designer는 복잡한 계산 워크플로우 스키마를 만들고 실행할 수 있다.[21]null
다른 생물정보학 워크플로우 관리 시스템과 비교하여 워크플로 디자이너의 구별되는 특징은 워크플로우가 로컬 시스템에서 실행된다는 것이다.원격 파일 스토리지 및 인터넷 연결에 대한 다른 툴의 의존도는 그렇지 않지만, 데이터 전송 문제를 방지하는 데 도움이 된다.null
워크플로우가 구성되는 요소는 UGENE에 통합된 알고리즘의 대부분에 해당하며, 워크플로 디자이너를 사용하면 사용자 정의 워크플로 요소를 생성할 수도 있다.이 요소들은 명령줄 도구나 스크립트를 기반으로 할 수 있다.null
워크플로우는 특수 텍스트 형식으로 저장된다.이것은 그들의 재사용과 사용자들 간의 전송을 허용한다.null
워크플로우는 그래픽 인터페이스를 사용하여 실행하거나 명령줄에서 실행할 수 있다.또한 그래픽 인터페이스는 워크플로우 실행 제어, 파라미터 저장 등을 가능하게 한다.null
데이터를 변환, 필터링 및 주석 달기 위한 워크플로 샘플 라이브러리가 내장되어 있으며, NIH NIAID와 협력하여 개발된 NGS 데이터를 분석하기 위한 파이프라인이 여러 개 있다.[22]각 워크플로 샘플에 대해 마법사를 사용할 수 있다.null
지원되는 생물학적 데이터 형식
- 시퀀스 및 주석: FASTA(.fa), GenBank(.gb), EMBL(.emb), GFF(.gff)
- 다중 시퀀스 선형:clustal(.aln), MSF(.msf), 스톡홀름(.sto), Nexus(.nex)
- 3D 구조: PDB(.pdb), MMDB(.prt)[16]
- 크로마토그램: ABIF(.abi), SCF(.scf)
- 짧은 읽기:시퀀스 정렬/지도(.SAM)(.SAM), 이진 버전의 SAM(.bam), ACE(.ace), FASTQ(.fastq)
- 계통생성 트리:뉴닉(.nwk), PHYLIP(.phy)
- 기타 형식: Bairoch(엔자임 정보), HMM(HMER 프로필), PWM 및 PFM(위치 매트릭스), SNP 및 VCF4(유전자 변형)
해제 사이클
UGENE는 주로 러시아 노보시비르스크의 아카뎀고로드크에 본사를 둔 유니프로 LLC가[23] 개발한다.각각의 반복은 약 1~2개월 동안 지속되며, 그 후 새로운 출시로 이어진다.개발 스냅샷도 다운로드 받을 수 있다.null
각 릴리스에 포함할 기능은 대부분 사용자에 의해 개시된다.null
참고 항목
참조
- ^ Okonechnikov K, Golosova O, Fursov M, the UGENE team (2012). "Unipro UGENE: a unified bioinformatics toolkit". Bioinformatics. 28 (8): 1166–7. doi:10.1093/bioinformatics/bts091. PMID 22368248.
- ^ Fursov, M.; Novikova, O. (2008). "Multitasking software system for DNA analysis" (PDF). Proceedings of the Sixth International Conference on Bioinformatics of Genome Regulation and Structure. 1: 78. ISBN 978-5-91291-005-0.
- ^ Fursov, M. Y.; Oshchepkov, D. Y; Novikova, O. S. (2009). "UGENE: interactive computational schemes for genome analysis" (PDF). Proceedings of the Fifth Moscow International Congress on Biotechnology. 3: 14–15. ISBN 978-5-7237-0372-8.
- ^ Efremov, I. E.; Fursov, M. Y; Danilova, Yu. E. (2009). "UGENE: high performance genome analysis suite". Proceedings of the Fifth Moscow International Congress on Biotechnology. 2: 405–406. ISBN 978-5-7237-0372-8.
- ^ "NEW REBASE HOME". rebase.neb.com. Retrieved 18 October 2019.
- ^ "Primer3 Input (version 0.4.0)". bioinfo.ut.ee. Retrieved 18 October 2019.
- ^ "Burrows-Wheeler Aligner". bio-bwa.sourceforge.net. Retrieved 18 October 2019.
- ^ "SAMtools". samtools.sourceforge.net. Retrieved 18 October 2019.
- ^ "TopHat". ccb.jhu.edu. Retrieved 18 October 2019.
- ^ "IU Webmaster redirect". cufflinks.cbcb.umd.edu. Retrieved 18 October 2019.
- ^ "MACS - Model-based Analysis for ChIP-Seq". liulab.dfci.harvard.edu. Retrieved 18 October 2019.
- ^ "CEAS - Cis-regulatory Element Annotation System". liulab.dfci.harvard.edu. Retrieved 18 October 2019.
- ^ "MrBayes index". nbisweden.github.io. Retrieved 18 October 2019.
- ^ "ATGC: PhyML". atgc.lirmm.fr. Retrieved 18 October 2019.
- ^ CAP3
- ^ a b "Macromolecular Structures Resource Group". www.ncbi.nlm.nih.gov. Retrieved 18 October 2019.
- ^ "Spidey is superceded [sic] by Splign". www.ncbi.nlm.nih.gov. Retrieved 18 October 2019.
- ^ Vaskin, Y.; Khomicheva, I.; Ignatieva, E.; Vityaev, E. (2012). "ExpertDiscovery and UGENE integrated system for intelligent analysis of regulatory regions of genes". In Silico Biology. 11 (3–4): 97–108. doi:10.3233/ISB-2012-0448. PMID 22935964.
- ^ "Illumina - iDEA Challenge". Archived from the original on 2013-01-26. Retrieved 18 October 2019.
- ^ "SAM" (PDF). Retrieved 18 October 2019.
- ^ Fursov, M. Y.; Varlamov, A. (2009). "UGENE - A practical approach for complex computational analysis in molecular biology" (PDF). Proceedings of the 10th Annual Bioinformatics Open Source Conference: 7.
- ^ "NIH: National Institute of Allergy and Infectious Diseases Leading research to understand, treat, and prevent infectious, immunologic, and allergic diseases". www.niaid.nih.gov. Retrieved 18 October 2019.
- ^ "УНИПРО, Новосибирский центр информационных технологий. СОФТ. Разработка, тестирование, реинжиниринг, поддержка ПО" ["UNIPRO, Novosibirsk center of information technologies. SOFT. Development, testing, reengineering, software support"]. Retrieved 18 October 2019.