생물학적 데이터베이스 목록

List of biological databases

생물학적 데이터베이스는 생물학적 [1]정보의 저장고이다.Nuclear Acids Research 저널은 정기적으로 생물학적 데이터베이스에 대한 특별 호를 발행하고 그러한 데이터베이스의 목록을 가지고 있습니다.2018년호에는 이러한 데이터베이스와 [2]앞서 설명한 데이터베이스에 대한 업데이트 약 180개의 목록이 수록되어 있습니다.Omics 검색 색인을 사용하여 여러 생물학적 데이터베이스를 검색하고 검색할 수 있습니다.

메타 데이터베이스

메타 데이터베이스는 새 데이터를 생성하기 위해 데이터에 대한 데이터를 수집하는 데이터베이스입니다.이들은 서로 다른 소스의 정보를 병합하여 새롭고 편리한 형태로 이용할 수 있도록 하거나 특정 질병이나 유기체에 중점을 둘 수 있습니다.[메타베이스는 메타데이터 관리, 독립 데이터베이스의 글로벌 쿼리 및 분산 데이터 처리를 위한 데이터베이스 모델입니다.메타다베이스라는 단어는 사전의 추가어이다.원래, 태그, 태그, 마크업 헤더와 같은 데이터에 대한 데이터만을 가리키는 일반적인 용어였습니다.

유기체 데이터베이스 모델

모델 유기체 데이터베이스는 집중적으로 연구된 유기체에 대한 상세한 생물학적 데이터를 제공한다.

핵산 데이터베이스

DNA 데이터베이스

1차 데이터베이스는 국제 뉴클레오티드 배열 데이터베이스(INSD)를 구성합니다.에는 다음이 포함됩니다.

DDBJ(일본), GenBank(미국), European Nucleotide Archive(유럽)는 모든 유기체의 뉴클레오티드 배열 데이터의 저장소이다.세 가지 모두 뉴클레오티드 배열 제출을 받아들인 후 매일 새로운 데이터와 업데이트된 데이터를 교환하여 최적의 동기화를 달성한다.이들 3개의 데이터베이스는 원본 시퀀스 데이터를 저장하기 때문에 기본 데이터베이스입니다.이들은 SRA(Sequence Read Archive)와 협업하며, SRA는 높은 처리량 시퀀싱 기기에서 원시 읽기를 아카이브합니다.

세컨더리 데이터베이스는 다음과 같습니다.[clarification needed]

  • 23andMe 데이터베이스
  • 햅맵
  • OMIM(온라인 멘델리안 인유전) : 유전병
  • 참조
  • 1000개의 게놈 프로젝트: 2008년 1월에 개시.여러 민족 집단에서 온 천 명 이상의 익명의 참가자들의 게놈을 분석하여 공개적으로 이용할 수 있게 되었다.
  • EggNOG 데이터베이스: 5090개의 생물과 2502개의 바이러스를 기반으로 한 계층적, 기능적, 계통적으로 주석이 달린 정형외과 리소스.다중 시퀀스 정렬 및 최대우도 트리와 광범위한 [5][6]기능 주석을 제공합니다.

기타 데이터베이스

유전자 발현 데이터베이스(대부분 마이크로 어레이 데이터)

게놈 데이터베이스

이 데이터베이스는 게놈 염기서열을 수집하고 주석을 달아 분석하며 일반인에게 접근을 제공합니다.일부는 계산된 주석을 개선하기 위해 실험 문헌의 큐레이션을 추가한다.이러한 데이터베이스는 많은 종의 게놈 또는 단일 모델 유기체의 게놈을 보유할 수 있다.

표현형 데이터베이스

  • PHI 기반: 병원체-호스트 상호 작용 데이터베이스.그것은 유전자 정보를 그들의 숙주에 있는 미생물 병원균의 표현형 정보와 연결시킨다.정보는 동료 검토 문헌에서 수동으로 큐레이션된다.
  • RGD Rat 게놈 데이터베이스: Rattus norvegicus의 게놈 및 표현형 데이터
  • PomBase 데이터베이스: 효모 Shychoscaromyces pombe에 대한 수동 큐레이션된 표현형 데이터

RNA 데이터베이스

  • miRBase: microRNA 데이터베이스
  • PolymiRTS: 추정 마이크로RNA 표적 부위의 DNA 변이 데이터베이스
  • PolyQ: 질병 비질환 관련 단백질에서 폴리글루타민 반복 데이터베이스
  • Rfam: RNA 패밀리 데이터베이스

아미노산/단백질 데이터베이스

단백질 관련 정보, 생물학적 지식 발견 및 데이터 중심 가설 [13]생성을 지원하고 관리하기 위해 공개적으로 이용 가능한 여러 데이터 저장소 및 리소스가 개발되었습니다.아래 표의 데이터베이스는 핵산 연구(NAR) 데이터베이스 문제 및 데이터베이스 수집에 나열된 데이터베이스와 UniProtKB에서 상호 참조된 데이터베이스에서 선택합니다.대부분의 데이터베이스는 식별자를 [13]서로 매핑할 수 있도록 UniProt / UniProtKB상호 참조됩니다.

시퀀스 데이터베이스
데이터베이스 단축 이름 데이터베이스명
CCDS Consensus CDS 단백질 세트 데이터베이스
DDBJ 일본 DNA 데이터 은행
에나 유럽 뉴클레오티드 아카이브
GenBank GenBank 뉴클레오티드 배열 데이터베이스
참조 NCBI 참조 시퀀스 데이터베이스
유니진 의 데이터베이스는 동일한 궤적의 기록을 계산적으로 식별한다.
UniProtKB 범용 단백질 자원(UniProt)
3D 구조 단백질 데이터베이스
데이터베이스 단축 이름 데이터베이스명
디프로토 단백질 장애 데이터베이스
모바일 데이터베이스 본질적으로 무질서하고 이동성 단백질 데이터베이스
ModBase 단백질 구조 비교 모델 데이터베이스
PDBum 단백질 데이터 뱅크의 3D 구조 그림 데이터베이스
단백질 모델 포트 PSI-Nature 구조생물학 지식기반 단백질 모델 포털
SMR 주석이 달린 3D 단백질 구조 모델의 데이터베이스


단백질 배열 데이터베이스

단백질 구조 데이터베이스

단백질 구조 데이터베이스에 대한 자세한 내용은 단백질 구조 데이터베이스를 참조하십시오.

단백질 모델 데이터베이스

  • ModBase: 단백질 구조 비교 모델 데이터베이스(Sali Lab, UCSF)
  • 단백질 유사도 매트릭스(SIMAP): FASTA를 사용하여 계산된 단백질 유사도 데이터베이스
  • 스위스 모델: 단백질 구조 모델용 서버 및 저장소
  • AAindex: 아미노산 지수, 아미노산 돌연변이 매트릭스 및 쌍별 접촉 전위 데이터베이스

단백질-단백질 및 기타 분자상호작용

단백질 발현 데이터베이스

  • Human Protein Atlas: 세포, 조직 및 장기의 모든 인간 단백질을 매핑하는 것을 목표로 합니다.

신호 전달 경로 데이터베이스

대사 경로 및 단백질 기능 데이터베이스

분류 데이터베이스

수많은 데이터베이스가 종과 다른 분류 범주에 대한 정보를 수집합니다.생명 카탈로그는 약 150개의 전문화된 "글로벌 종 데이터베이스"(GSD)의 메타 데이터베이스로 기술되어 있고 알려진 모든 종에 대한 이름 및 기타 정보를 수집했기 때문에 특별한 경우입니다.

  • BacDive: 박테리아 및 고고생물 다양성에 대한 균주와 관련된 정보를 제공하는 박테리아 메타다베이스(분류법 정보 포함)
  • 생명의 카탈로그: 지구상의 모든 종들의 메타 데이터베이스
  • EzTaxon-e: 16S 리보솜 RNA 유전자 배열에 기초한 원핵생물 식별 데이터베이스
  • NCBI Taxonomy: NCBI에 의해 운영되며 DNA 염기서열을 사용할 수 있는 모든 분류군에 초점을 맞춘 분류 데이터베이스(이 염기서열은 NCBI에 의해 운영되는 다른 데이터베이스인 GenBank에 의해 저장된다).

이미지 데이터베이스

이미지는 인류학 표본의 이미지에서 동물학까지 생물의학에서 중요한 역할을 한다.그러나 iNaturalist와 같은 일부 프로젝트에서는 데이터의 주요 부분으로 사진을 수집하지만 이미지 수집 전용 데이터베이스는 상대적으로 적습니다."이미지"의 특별한 경우는 단백질 구조나 해부학적 구조의 3D 재구성 같은 3차원 영상입니다.이미지 데이터베이스에는 [18]다음이 포함됩니다.

추가 데이터베이스

엑소좀 데이터베이스

  • 엑소카르타
  • 세포외 RNA Atlas: 인간과 생쥐의 생체유체에서 추출된 작은 RNA-seq 및 qPCR 유래 exRNA 프로필 저장소

수학적 모델 데이터베이스

  • Biomodels Database: 생물학적 과정을 설명하는 발표된 수학적 모델

방사선 데이터베이스

항균 내성률 및 항생제 소비에 대한 데이터베이스

항균성 메커니즘 데이터베이스

Wiki 스타일 데이터베이스

특수 데이터베이스

  • 바코드 오브 라이프 데이터 시스템: DNA 바코드 데이터베이스
  • 암 게놈 아틀라스(TCGA): 유전자 발현 프로파일링, 복사 번호 변형 프로파일링, SNP 유전자형식, 게놈 전체 DNA 메틸화 프로파일링, 마이크로RNA 프로파일링 및 최소 1,200개 유전자의 엑손 시퀀싱과 같은 높은 처리량 기술을 사용하여 얻은 수백 개의 암 샘플 데이터를 제공합니다.
  • 셀로사우루스: 세포주에 대한 지식 자원
  • CTD(Comparative Toxic Genogenomics Database): 화학유전자병 상호작용 설명
  • DiProDB: 열역학, 구조 및 기타 디뉴클레오티드 특성을 수집하고 분석하기 위한 데이터베이스
  • HRT Atlas(Housekeeping and Reference Transcript Atlas) 웹 기반 도구로 qPCR 실험 정규화에 적합한 세포별 후보 참조 유전자/대본을 검색합니다.HRT Atlas는 또한 인간과 생쥐의 하우스키핑 유전자와 성과의 완전한 목록을 기술하고 있다.
  • Dryad: 기초 및 응용 바이오사이언스 과학 출판물의 기초가 되는 데이터
  • 에든버러 마우스 아틀라스
  • EPD 진핵생물 프로모터 데이터베이스
  • FINDbase(상속된 장애의 빈도 데이터베이스)
  • GigaDB: 생물 및 생물의학 연구의 과학적 출판물을 기반으로 하는 대규모 데이터 세트의 저장소
  • HGNC(HUGO 유전자 명명 위원회): 승인된 인간 유전자 명명 자료
  • International Human Epegenome Consortium:[22] 캐나다 CEEHRC,[23] 유럽 [24]청사진, 유럽 게놈-페놈 아카이브(EGA[25]), US ENCODENIH Roadmap, 독일 DIP,[26] 일본 [27]CREST, 한국 KNIH, 싱가포르 GIS 등 유명한 국가의 후생유전자 참조 데이터를 통합합니다.
  • MethBase: UCSC Genome Browser에서 시각화된 DNA 메틸화 데이터 데이터베이스
  • Minimotif Miner: 짧은 연속 기능성 펩타이드 모티브 데이터베이스
  • 종양유전학 데이터베이스: 암 연구에 도움이 되는 데이터베이스 편집
  • PubMed: 생명과학 및 생물의학 토픽에 관한 레퍼런스 및 요약
  • RIKEN 포유동물 통합 데이터베이스
  • TDR Targets: 열대성 질환의 약물 발견에 초점을 맞춘 화학유전체학 데이터베이스
  • TRASPAC: 진핵생물 전사인자, 그 게놈 결합부위 및 DNA 결합 프로파일에 대한 데이터베이스
  • JASPAR: 수동으로 큐레이션된 비장 트랜스크립션 팩터바인딩 프로파일의 데이터베이스.
  • MetOSite: 메티오닌 술폭시화 부위와 단백질에서의[29] 기능적 역할에 대한 데이터베이스
  • HCUP(Healthcare Cost and Utilization Project)는 미국 최대 규모의 병원 진료 데이터 수집입니다.여기에는 수억 명의 입원, 외래 및 응급 기록이 포함됩니다.
  • LEXAS는 PMC 기사에서 생물학적 실험에 대한 설명을 정리한다.
  • 대사물 데이터베이스는 알려진 소 대사물을 나열하는 무료 웹 데이터베이스입니다.

레퍼런스

  1. ^ Wren JD, Bateman A (October 2008). "Databases, data tombs and dust in the wind". Bioinformatics. 24 (19): 2127–8. doi:10.1093/bioinformatics/btn464. PMID 18819940.
  2. ^ "Volume 46 Issue D1 Nucleic Acids Research Oxford Academic". academic.oup.com. Retrieved 2018-09-04.
  3. ^ Lock A, Rutherford K, Harris MA, Hayles J, Oliver SG, Bähler J, Wood V (January 2019). "PomBase 2018: user-driven reimplementation of the fission yeast database provides rapid and intuitive access to diverse, interconnected information". Nucleic Acids Research. 47 (D1): D821–D827. doi:10.1093/nar/gky961. PMC 6324063. PMID 30321395.
  4. ^ Zhu B, Stülke J (January 2018). "SubtiWiki in 2018: from genes and proteins to functional network annotation of the model organism Bacillus subtilis". Nucleic Acids Research. 46 (D1): D743–D748. doi:10.1093/nar/gkx908. PMC 5753275. PMID 29788229.
  5. ^ Powell S, Forslund K, Szklarczyk D, Trachana K, Roth A, Huerta-Cepas J, et al. (January 2014). "eggNOG v4.0: nested orthology inference across 3686 organisms". Nucleic Acids Research. 42 (Database issue): D231-9. doi:10.1093/nar/gkt1253. PMC 3964997. PMID 24297252.
  6. ^ Huerta-Cepas J, Szklarczyk D, Heller D, Hernández-Plaza A, Forslund SK, Cook H, et al. (January 2019). "eggNOG 5.0: a hierarchical, functionally and phylogenetically annotated orthology resource based on 5090 organisms and 2502 viruses". Nucleic Acids Research. 47 (D1): D309–D314. doi:10.1093/nar/gky1085. PMC 6324079. PMID 30418610.
  7. ^ 어레이 익스프레스
  8. ^ 지역
  9. ^ "The Human Protein Atlas". www.proteinatlas.org. Retrieved 2019-05-27.
  10. ^ Dash S, Campbell JD, Cannon EK, Cleary AM, Huang W, Kalberer SR, et al. (January 2016). "Legume information system (LegumeInfo.org): a key component of a set of federated data resources for the legume family". Nucleic Acids Research. 44 (D1): D1181-8. doi:10.1093/nar/gkv1159. PMC 4702835. PMID 26546515.
  11. ^ "Saccharomyces Genome Database SGD". www.yeastgenome.org. Retrieved 2018-09-04.
  12. ^ Grant D, Nelson RT, Cannon SB, Shoemaker RC (January 2010). "SoyBase, the USDA-ARS soybean genetics and genomics database". Nucleic Acids Research. 38 (Database issue): D843-6. doi:10.1093/nar/gkp798. PMC 2808871. PMID 20008513.
  13. ^ a b Chen C, Huang H, Wu CH (2017). Wu CH, Arighi CN, Ross KE (eds.). "Protein Bioinformatics Databases and Resources". Methods in Molecular Biology. New York, NY: Springer New York. 1558: 3–39. doi:10.1007/978-1-4939-6783-4_1. ISBN 978-1-4939-6781-0. PMC 5506686. PMID 28150231.
  14. ^ Mir S, Alhroub Y, Anyango S, Armstrong DR, Berrisford JM, Clark AR, et al. (January 2018). "PDBe: towards reusable data delivery infrastructure at protein data bank in Europe". Nucleic Acids Research. 46 (D1): D486–D492. doi:10.1093/nar/gkx1070. PMC 5753225. PMID 29126160.
  15. ^ Kinjo AR, Bekker GJ, Suzuki H, Tsuchiya Y, Kawabata T, Ikegawa Y, Nakamura H (January 2017). "Protein Data Bank Japan (PDBj): updated user interfaces, resource description framework, analysis tools for large structures". Nucleic Acids Research. 45 (D1): D282–D288. doi:10.1093/nar/gkw962. PMC 5210648. PMID 27789697.
  16. ^ Rose PW, Prlić A, Altunkaya A, Bi C, Bradley AR, Christie CH, et al. (January 2017). "The RCSB protein data bank: integrative view of protein, gene and 3D structural information". Nucleic Acids Research. 45 (D1): D271–D281. doi:10.1093/nar/gkw1000. PMC 5210513. PMID 27794042.
  17. ^ Hermjakob H, Montecchi-Palazzi L, Lewington C, Mudali S, Kerrien S, Orchard S, et al. (January 2004). "IntAct: an open source molecular interaction database". Nucleic Acids Research. 32 (Database issue): D452-5. doi:10.1093/nar/gkh052. PMC 308786. PMID 14681455.
  18. ^ a b Ellenberg J, Swedlow JR, Barlow M, Cook CE, Sarkans U, Patwardhan A, et al. (November 2018). "A call for public archives for biological image data". Nature Methods. 15 (11): 849–854. doi:10.1038/s41592-018-0195-8. PMC 6884425. PMID 30377375.
  19. ^ Tendler BC, Hanayik T, Ansorge O, Bangerter-Christensen S, Berns GS, Bertelsen MF, et al. (March 2022). "The Digital Brain Bank, an open access platform for post-mortem imaging datasets". eLife. 11: e73153. doi:10.7554/eLife.73153. PMC 9042233. PMID 35297760.
  20. ^ Iudin A, Korir PK, Salavert-Torres J, Kleywegt GJ, Patwardhan A (May 2016). "EMPIAR: a public archive for raw electron microscopy image data". Nature Methods. 13 (5): 387–388. doi:10.1038/nmeth.3806. PMID 27067018.
  21. ^ Hounkpe BW, Chenou F, de Lima F, De Paula EV (January 2021). "HRT Atlas v1.0 database: redefining human and mouse housekeeping genes and candidate reference transcripts by mining massive RNA-seq datasets". Nucleic Acids Research. 49 (D1): D947–D955. doi:10.1093/nar/gkaa609. PMC 7778946. PMID 32663312.
  22. ^ (IHEC) 데이터 포털
  23. ^ CEEHRC
  24. ^ 청사진
  25. ^ EGA
  26. ^ 깊다
  27. ^ 크레스트
  28. ^ "Sharing epigenomes globally". Nature Methods. 15 (3): 151. 2018. doi:10.1038/nmeth.4630. ISSN 1548-7105.
  29. ^ Valverde H, Cantón FR, Aledo JC (November 2019). "MetOSite: an integrated resource for the study of methionine residues sulfoxidation". Bioinformatics. 35 (22): 4849–4850. doi:10.1093/bioinformatics/btz462. PMC 6853639. PMID 31197322.

외부 링크