유럽생물정보학연구소
European Bioinformatics Institute![]() | |
줄임말 | EMBL-EBI |
---|---|
형성 | 1992년[1] |
위치 | |
좌표 | 52.079889, 0.186356 |
감독. | 이완 버니 |
감독. | 롤프 압바일러 |
모조직 | 유럽 분자 생물학 연구소 |
직원 | 570[2] |
웹 사이트 | www |
유럽생물정보학연구소(EMBL-EBI)는 유럽분자생물학연구소(EMBL) 계열의 일부로서 생물정보학 연구와 서비스에 초점을 맞춘 정부간기구(IGO)이다.캠브리지 인근 힌스턴의 웰컴 게놈 캠퍼스에 위치하고 있으며 600명 이상의 정규 직원([3]FTE)을 고용하고 있습니다.Rolf Apweiler, Alex Bateman, Ewan Birney, Guy [4]Cochrane 등의 연구소 리더는 Genomics 베이징 연구소 BIG 데이터 센터의 국제 연구 네트워크의 일부입니다.
또한, EMBL-EBI는 과학자들에게 생물학적 데이터로 연구의 기초를 가르치고 EMBL-EBI 및 비EMBL-EBI 기반 연구에 사용할 수 있는 수많은 생물 정보 도구를 홍보하는 훈련 프로그램을 주최한다.
바이오 정보 서비스
EMBL-EBI의 역할 중 하나는 Ensembl(전체 게놈 배열 데이터 저장), UniProt(단백질 배열 및 주석 데이터베이스) 및 단백질 데이터 뱅크(단백질 및 핵산 3차 구조 데이터베이스)를 포함한 일련의 데이터베이스에서 생물학적 데이터를 색인화하고 유지하는 것입니다.Basic Local Alignment Search Tool(BLAST) 또는 Clusteral Omega Sequence Alignment Tool 등 다양한 온라인 서비스와 도구가 제공되어 추가 데이터 분석이 가능합니다.
폭발.
BLAST는[5] 생체고분자 1차 구조, 가장 자주 DNA/RNA의 뉴클레오티드 배열 및 단백질의 아미노산 배열의 비교를 위한 알고리즘으로, 생체정보 데이터베이스에 저장되어 있다.알고리즘은 BLOSUM 62 등의 스코어링 매트릭스에 의한 쿼리에 대한 이용 가능한 시퀀스의 스코어링을 이용한다.가장 높은 점수 시퀀스는 기능적 및 진화적 [6]유사성 측면에서 쿼리의 가장 가까운 친척을 나타낸다.
BLAST에 의한 데이터베이스 검색에서는 입력 데이터가 올바른 형식(예: FASTA, GenBank, PIR 또는 EMBL 형식)이어야 합니다.또한 사용자는 검색할 특정 데이터베이스를 지정하고 사용할 스코어링 매트릭스 및 도구를 실행하기 전에 기타 파라미터를 선택할 수 있습니다.BLAST 결과의 최고 적중률은 계산된 E 값(우연히 데이터베이스에 [7]유사하거나 높은 점수 적중률이 존재할 확률)에 따라 정렬된다.
클러스터 오메가
클러스터 오메가(Clusteral[8] Omega)는 최소 3개에서 최대 4000개의 입력 DNA 및 단백질 [9]배열의 최적 정렬을 찾을 수 있는 다중 배열 정렬(MSA) 도구입니다.클러스터링 오메가 알고리즘은 시퀀스의 최종 정렬을 도출하기 위해 두 개의 프로파일 숨겨진 마르코프 모델(HM)을 사용합니다.클러스터 오메가의 출력은 가이드 트리(최적의 쌍으로 이루어진 배열의 계통학적 관계)에서 시각화되거나 [10]쿼리 간의 상호 배열 유사성에 의해 정렬될 수 있다.다른 MSA 툴(Muscle, ProbCons)에 비해 Clusteral Omega의 주요 장점은 결과의 상당한 정확성을 유지하면서 효율성을 유지하는 것입니다.
앙상블
EMBL-EBI를 기반으로 하는 Ensembl은[11] 게놈 데이터를 중심으로 구성된 데이터베이스로 Ensembl 프로젝트에 의해 유지관리됩니다.모델 유기체의 게놈에 대한 지속적인 주석을 부여받은 Ensembl은 연구자들에게 각각의 특정 게놈에 대한 관련 생물학적 정보의 포괄적인 자원을 제공한다.저장된 참조 게놈의 주석은 자동으로 배열 기반입니다.Ensubbl은 웹 브라우저를 통해 액세스할 수 있는 공개 게놈 데이터베이스를 포함합니다.저장된 데이터는 핵형에서 개별 유전자를 통해 뉴클레오티드 [12]배열에 이르기까지 다중 분해능 수준의 데이터 표시를 지원하는 그래픽 UI를 사용하여 상호 작용할 수 있습니다.
원래는 척추동물을 주요 관심 분야로 삼았던 앙상블은 2009년부터 자매 프로젝트 앙상블 게놈에서 식물, 곰팡이, 무척추동물, 박테리아 및 기타 종의 게놈에 대한 주석 데이터를 제공하고 있다.2020년 현재 다양한 Ensembl 프로젝트 데이터베이스에는 50,000개가 넘는 참조 [13]게놈이 저장되어 있습니다.
PDB
PDB는[14] 단백질과 핵산과 같은 생물학적 고분자의 3차원 구조의 데이터베이스이다.데이터는 일반적으로 X선 결정학 또는 NMR 분광학을 통해 입수되며 PDBe, RCSB, PDBj 및 BMRB와 같은 PDB 회원 조직을 통해 전 세계 구조 생물학자들이 수동으로 제출한다.데이터베이스는 PDBe(EMBL-EBI에 저장)를 포함한 구성원의 웹 페이지를 통해 액세스할 수 있습니다.wwPDB 컨소시엄의 멤버로서 PDBe는 고분자 구조 [15]데이터의 아카이브와 유지보수의 공동 임무를 지원합니다.
유니프로트
UniProt는 UniProt KnowledgeBase(UniProt KB), UniProt Reference Clusters(UniRef) 및 UniProt Archive(UniParc) 데이터베이스에 배포되는 단백질 시퀀스 및 주석 데이터의 온라인 저장소입니다.원래 EMBL-EBI의 개별 벤처로 생각되었던 스위스 생물정보학 연구소(SIB)와 단백질 정보 자원(PIR)(단백질 배열 데이터베이스 수용)의 글로벌 데이터 생성 증가는 2002년 [16]Creation의 공동 작업으로 이어졌다.
UniProt에 저장된 단백질 항목은 고유한 UniProt 식별자에 의해 카탈로그화됩니다.각 항목에 대해 수집된 주석 데이터는 논리적 섹션(예: 단백질 기능, 구조, 발현, 배열 또는 관련 출판물)으로 구성되어 관심 단백질에 대한 조정된 개요를 가능하게 한다.외부 데이터베이스 및 원본 데이터 소스에 대한 링크도 제공됩니다.단백질 이름/식별자에 의한 표준 검색 외에도 UniProt 웹 페이지에는 BLAST 검색, 배열 정렬 또는 특정 [17]펩타이드를 포함하는 단백질 검색을 위한 도구가 포함되어 있습니다.
기타 생물정보학 조직
- 미국 국립생물공학정보센터(NCBI), 미국 국립의학도서관
- 국립유전학연구소(DNA 데이터뱅크)
- 스위스 생물정보학연구소(SIB: Expasy)
- 오스트레일리아 생물정보학 자원
- BIG 데이터센터(국립게노믹스 데이터센터), 베이징게노믹스연구소, 중국과학원
「 」를 참조해 주세요.
레퍼런스
- ^ "Background European Bioinformatics Institute". Ebi.ac.uk. 16 May 2018. Retrieved 29 October 2019.
- ^ "Jobs at EMBL-EBI". Retrieved 20 June 2016.
- ^ "Scientific report" (PDF). www.embl.de. 2017. Retrieved 29 October 2019.
- ^ BIG 데이터 센터, 베이징 유전체학 연구소, 중국 과학 아카데미.(2018).연차보고서, 페이지 6. 2020년 3월 26일 취득.
- ^ "NCBI BLAST at EMBL-EBI". www.ebi.ac.uk. Retrieved 3 November 2021.
{{cite web}}
: CS1 maint :url-status (링크) - ^ Altschul SF, Gish W, Miller W, Myers EW, Lipman DJ (October 1990). "Basic local alignment search tool". Journal of Molecular Biology. 215 (3): 403–410. doi:10.1016/S0022-2836(05)80360-2. PMID 2231712.
- ^ Wheeler D, Bhagwat M (2007). BLAST QuickStart. Humana Press. PMID 17993672.
- ^ "Clustal Omega at EMBL-EBI". www.ebi.ac.uk. Retrieved 3 November 2021.
{{cite web}}
: CS1 maint :url-status (링크) - ^ "Clustal Omega Documentation at EMBL-EBI". www.ebi.ac.uk. Retrieved 3 November 2021.
{{cite web}}
: CS1 maint :url-status (링크) - ^ Sievers F, Higgins DG (January 2018). "Clustal Omega for making accurate alignments of many protein sequences". Protein Science. 27 (1): 135–145. doi:10.1002/pro.3290. PMC 5734385. PMID 28884485.
- ^ "Ensembl homepage". www.ensembl.org. Retrieved 3 November 2021.
{{cite web}}
: CS1 maint :url-status (링크) - ^ Howe KL, Achuthan P, Allen J, Allen J, Alvarez-Jarreta J, Amode MR, et al. (January 2021). "Ensembl 2021". Nucleic Acids Research. 49 (D1): D884–D891. doi:10.1093/nar/gkaa942. PMC 7778975. PMID 33137190.
- ^ "About the Ensembl Project". www.ensembl.org. Retrieved 3 November 2021.
- ^ "Protein Data Bank: the single global archive for 3D macromolecular structure data". Nucleic Acids Research. 47 (D1): D520–D528. January 2019. doi:10.1093/nar/gky949. PMC 6324056. PMID 30357364.
- ^ "About PDBe". www.ebi.ac.uk. Retrieved 3 November 2021.
{{cite web}}
: CS1 maint :url-status (링크) - ^ "About UniProt". www.uniprot.org. Retrieved 3 November 2021.
- ^ "UniProt: the universal protein knowledgebase in 2021". Nucleic Acids Research. 49 (D1): D480–D489. January 2021. doi:10.1093/nar/gkaa1100. PMC 7778908. PMID 33237286.