우게네

UGENE
우게네
A dark blue, nearly square rectangle, within which is a light grey, sans-serif, capital letter U.
UGENE 로고
UGENE 1 4 1 screenshot.png
원본 작성자푸르소프 M.
개발자유니프로
초기 릴리즈2008; 14년(2008)
안정적 해제
41 / 2021년 12월 3일; 2개월(2021-12-03)
기록 위치C++, Qt
운영 체제Windows, MacOS, Linux
다음에서 사용 가능영어, 러시아어
유형생물정보학 툴킷
면허증GPLv2
웹사이트ugene.net

UGENE생물정보학을 위한 컴퓨터 소프트웨어다.[1][2]윈도, 맥OS, 리눅스 같은 개인용 컴퓨터 운영 체제에서 작동한다.GNU GPL(General Public License) 버전 2에 따라 무료 오픈소스 소프트웨어로 출시된다.null

UGENE는 생물학자들이 시퀀스, 주석, 다중 선형, 계통생성 나무, NGS 어셈블리 등 다양한 생물학적 유전학 데이터를 분석할 수 있도록 돕는다.데이터는 로컬(개인용 컴퓨터)과 공유 저장소(예: 실험실 데이터베이스)에 모두 저장할 수 있다.null

UGENE는 유전체학, 진화 생물학, 바이러스학 및 기타 생명과학 분야의 맥락에서 잘 알려진 생물학적 도구, 알고리즘 및 독창적인 도구 수십 가지를 통합한다.UGENE는 컴퓨터 프로그래밍 기술이 없는 생물학자들이 그러한 도구에 더 쉽게 접근할 수 있도록 사전 제작된 도구에 그래픽 사용자 인터페이스(GUI)를 제공한다.null

UGENE Workflow Designer를 사용하면 다단계 분석을 간소화할 수 있다.워크플로는 데이터 리더, 임베디드 툴 및 알고리즘을 실행하는 블록, 데이터 작성기 등의 블록으로 구성된다.블록은 명령줄 도구 또는 스크립트를 사용하여 생성할 수 있다.일련의 샘플 워크플로우를 워크플로 디자이너에서 사용할 수 있으며, 시퀀스 주석 달기, 데이터 형식 변환, NGS 데이터 분석 등을 할 수 있다.null

그래픽 인터페이스 옆에 UGENE도 명령줄 인터페이스가 있다.워크플로우도 이에 따라 실행될 수 있다.null

UGENE는 성능 향상을 위해 멀티 코어 프로세서(CPU)와 그래픽 처리 장치(GPU)를 사용하여 몇 가지 알고리즘을 최적화한다.[3][4]null

주요 기능

이 소프트웨어는 다음과 같은 기능을 지원한다.

시퀀스 뷰

시퀀스 뷰는 핵산 또는 단백질 시퀀스를 시각화, 분석 및 수정하는 데 사용된다.시퀀스 유형 및 선택한 옵션에 따라 시퀀스 보기 창에 다음과 같은 보기가 표시될 수 있다.

선형 편집기

정렬 편집기는 여러 핵산 또는 단백질 시퀀스(정렬, 정렬 편집, 분석, 컨센서스 시퀀스 저장, 계통 생성 트리 만들기 등)로 작업할 수 있다.null

계통형 트리 뷰어

계통생성 트리 뷰어는 계통생성 트리를 시각화하고 편집하는 데 도움을 준다.트리를 만들 때 사용한 해당 다중 정렬과 트리를 동기화할 수 있다.null

어셈블리 브라우저

어셈블리 브라우저

어셈블리 브라우저 프로젝트는 Illumina iDEA Challenge 2011의 항목으로 2010년에 시작되었다.[19]브라우저는 사용자가 대규모의 차세대 시퀀스 어셈블리(최대 수억 개의 짧은 읽기)를 시각화하고 탐색할 수 있도록 한다.SAM,[20] BAM(SAM의 바이너리 버전), ACE 포맷을 지원한다.UGENE에서 어셈블리 데이터를 검색하기 전에 입력 파일이 자동으로 UGENE 데이터베이스 파일로 변환된다.이 접근법은 장단점이 있다.이로 인해 전체 어셈블리를 보고, 그 안에서 항해하고, 잘 덮인 지역으로 빠르게 이동할 수 있다는 것이 장점이다.단점은 변환은 대용량 파일에 시간이 걸릴 수 있으며, 데이터베이스를 저장하기에 충분한 디스크 공간이 필요하다는 것이다.null

워크플로 디자이너

UGENE Workflow Designer는 복잡한 계산 워크플로우 스키마를 만들고 실행할 수 있다.[21]null

다른 생물정보학 워크플로우 관리 시스템과 비교하여 워크플로 디자이너의 구별되는 특징은 워크플로우가 로컬 시스템에서 실행된다는 것이다.원격 파일 스토리지 및 인터넷 연결에 대한 다른 툴의 의존도는 그렇지 않지만, 데이터 전송 문제를 방지하는 데 도움이 된다.null

워크플로우가 구성되는 요소는 UGENE에 통합된 알고리즘의 대부분에 해당하며, 워크플로 디자이너를 사용하면 사용자 정의 워크플로 요소를 생성할 수도 있다.이 요소들은 명령줄 도구나 스크립트를 기반으로 할 수 있다.null

워크플로우는 특수 텍스트 형식으로 저장된다.이것은 그들의 재사용과 사용자들 간의 전송을 허용한다.null

워크플로우는 그래픽 인터페이스를 사용하여 실행하거나 명령줄에서 실행할 수 있다.또한 그래픽 인터페이스는 워크플로우 실행 제어, 파라미터 저장 등을 가능하게 한다.null

데이터를 변환, 필터링 및 주석 달기 위한 워크플로 샘플 라이브러리가 내장되어 있으며, NIH NIAID와 협력하여 개발된 NGS 데이터를 분석하기 위한 파이프라인이 여러 개 있다.[22]각 워크플로 샘플에 대해 마법사를 사용할 수 있다.null

지원되는 생물학적 데이터 형식

해제 사이클

UGENE는 주로 러시아 노보시비르스크의 아카뎀고로드크에 본사를 둔 유니프로 LLC가[23] 개발한다.각각의 반복은 약 1~2개월 동안 지속되며, 그 후 새로운 출시로 이어진다.개발 스냅샷도 다운로드 받을 수 있다.null

각 릴리스에 포함할 기능은 대부분 사용자에 의해 개시된다.null

참고 항목

참조

  1. ^ Okonechnikov K, Golosova O, Fursov M, the UGENE team (2012). "Unipro UGENE: a unified bioinformatics toolkit". Bioinformatics. 28 (8): 1166–7. doi:10.1093/bioinformatics/bts091. PMID 22368248.
  2. ^ Fursov, M.; Novikova, O. (2008). "Multitasking software system for DNA analysis" (PDF). Proceedings of the Sixth International Conference on Bioinformatics of Genome Regulation and Structure. 1: 78. ISBN 978-5-91291-005-0.
  3. ^ Fursov, M. Y.; Oshchepkov, D. Y; Novikova, O. S. (2009). "UGENE: interactive computational schemes for genome analysis" (PDF). Proceedings of the Fifth Moscow International Congress on Biotechnology. 3: 14–15. ISBN 978-5-7237-0372-8.
  4. ^ Efremov, I. E.; Fursov, M. Y; Danilova, Yu. E. (2009). "UGENE: high performance genome analysis suite". Proceedings of the Fifth Moscow International Congress on Biotechnology. 2: 405–406. ISBN 978-5-7237-0372-8.
  5. ^ "NEW REBASE HOME". rebase.neb.com. Retrieved 18 October 2019.
  6. ^ "Primer3 Input (version 0.4.0)". bioinfo.ut.ee. Retrieved 18 October 2019.
  7. ^ "Burrows-Wheeler Aligner". bio-bwa.sourceforge.net. Retrieved 18 October 2019.
  8. ^ "SAMtools". samtools.sourceforge.net. Retrieved 18 October 2019.
  9. ^ "TopHat". ccb.jhu.edu. Retrieved 18 October 2019.
  10. ^ "IU Webmaster redirect". cufflinks.cbcb.umd.edu. Retrieved 18 October 2019.
  11. ^ "MACS - Model-based Analysis for ChIP-Seq". liulab.dfci.harvard.edu. Retrieved 18 October 2019.
  12. ^ "CEAS - Cis-regulatory Element Annotation System". liulab.dfci.harvard.edu. Retrieved 18 October 2019.
  13. ^ "MrBayes index". nbisweden.github.io. Retrieved 18 October 2019.
  14. ^ "ATGC: PhyML". atgc.lirmm.fr. Retrieved 18 October 2019.
  15. ^ CAP3
  16. ^ a b "Macromolecular Structures Resource Group". www.ncbi.nlm.nih.gov. Retrieved 18 October 2019.
  17. ^ "Spidey is superceded [sic] by Splign". www.ncbi.nlm.nih.gov. Retrieved 18 October 2019.
  18. ^ Vaskin, Y.; Khomicheva, I.; Ignatieva, E.; Vityaev, E. (2012). "ExpertDiscovery and UGENE integrated system for intelligent analysis of regulatory regions of genes". In Silico Biology. 11 (3–4): 97–108. doi:10.3233/ISB-2012-0448. PMID 22935964.
  19. ^ "Illumina - iDEA Challenge". Archived from the original on 2013-01-26. Retrieved 18 October 2019.
  20. ^ "SAM" (PDF). Retrieved 18 October 2019.
  21. ^ Fursov, M. Y.; Varlamov, A. (2009). "UGENE - A practical approach for complex computational analysis in molecular biology" (PDF). Proceedings of the 10th Annual Bioinformatics Open Source Conference: 7.
  22. ^ "NIH: National Institute of Allergy and Infectious Diseases Leading research to understand, treat, and prevent infectious, immunologic, and allergic diseases". www.niaid.nih.gov. Retrieved 18 October 2019.
  23. ^ "УНИПРО, Новосибирский центр информационных технологий. СОФТ. Разработка, тестирование, реинжиниринг, поддержка ПО" ["UNIPRO, Novosibirsk center of information technologies. SOFT. Development, testing, reengineering, software support"]. Retrieved 18 October 2019.

외부 링크