GenBank

GenBank
내용
묘사	참고 문헌 및 생물학적 주석을 지원하는 300,000개 이상의 유기체에 대한 뉴클레오티드 배열.
데이터형; 발동.	뉴클레오티드 배열; 단백질 배열;
유기체	모든.
연락
연구소	엔씨비
주요 인용문	PMID 21071399
발매일	1982년; 40년 전 (
접근
data 형식	XML; ASN.1; Genbank 형식;
웹 사이트	엔씨비
다운로드 URL	ncbi ftp
웹 서비스 URL	기능; 비누.;
도구들
웹	폭발.
스탠드아론	폭발.
여러가지 종류의
면허증.	불명확하다

GenBank 배열 데이터베이스는 공개 가능한 모든 뉴클레오티드 배열과 그 단백질 번역에 대한 개방형 액세스, 주석 모음이다.이것은 국제 뉴클레오티드 배열 데이터베이스 콜라보레이션(INSDC)의 일부로서 미국 국립 생명공학정보센터(NCBI; National Institute of Health)에 의해 생산 및 관리된다.

GenBank와 그 협력자들은 공식적으로 기술된 500,000종 이상의 ^[2]종으로부터 전 세계 실험실에서 생성된 시퀀스를 받습니다.데이터베이스는 1982년 월터 고드와 로스 알라모스 국립 연구소에 의해 시작되었습니다.GenBank는 생물학 분야 연구의 중요한 데이터베이스가 되었으며, 최근 몇 년 ^[3]^[4]동안 18개월마다 약 두 배씩 기하급수적으로 성장했습니다.

2022년 6월에 발표된 릴리스 250.0은 2,450억 ^[5]개 이상의 염기서열에 17조 개 이상의 뉴클레오티드 염기를 포함하고 있다.GenBank는 개별 연구소에서 직접 제출하거나 대규모 시퀀싱 센터에서 대량 제출하여 구축됩니다.

투고

원본 시퀀스만 GenBank에 제출할 수 있습니다.웹 기반 양식인 BankIt 또는 독립형 제출 프로그램인 Sequin을 사용하여 GenBank에 직접 제출합니다.시퀀스 제출을 받은 GenBank 직원은 데이터의 원본성을 검사하고 시퀀스에 등록번호를 할당하여 품질보증 체크를 실시한다.다음으로 송신된 엔트리는 Entrez에 의해 취득되거나 FTP에 의해 다운로드될 수 있는 퍼블릭데이터베이스에 공개됩니다.대규모 염기서열 분석 센터에서는 EST(Expressed Sequence Tag), 염기서열 분석 사이트(STS), 게놈 조사 염기서열(GSS) 및 High-Throughput Genome Sequence(HTGS) 데이터를 대량 제출하는 경우가 가장 많습니다.GenBank의 직접 제출 그룹은 또한 완전한 미생물 게놈 ^[6]^[7]염기서열을 처리합니다.

역사

Los Alamos National Laboratory(LANL)의 이론생물학 및 생물물리학 그룹의 Walter Goad는 1979년에 Los Alamos Sequence Database를 구축했으며, 1982년에 공공 ^[8]GenBank가 설립되면서 그 정점에 도달했습니다.자금은 국립보건원, 국립과학재단, 에너지부, 국방부에서 제공되었다.LANL은 GenBank에서 Bolt, Beranek, Newman과 협업하여 1983년 말까지 2,000개 이상의 시퀀스가 저장되었습니다.

1980년대 중반 스탠포드 대학의 인텔리전트네틱스 생물정보학 회사는 LANL과 ^[9]협력하여 GenBank 프로젝트를 관리했습니다.GenBank 프로젝트는 최초의 인터넷 생물정보학 커뮤니티 프로젝트 중 하나로 생물학자 간의 개방적인 접근 통신을 촉진하기 위한 BIOSCI/Bionet 뉴스 그룹을 시작했습니다.1989년부터 1992년까지 GenBank 프로젝트는 새롭게 설립된 National Center for Biotechnology Information(NCBI)^[10]으로 이행했습니다.

Genbank와 EMBL: Nucleotide Sequences 1986/1987 제1권부터 제7권까지

Genbank v100의 CDROM

성장

1982년부터 2018년까지 GenBank 기반 쌍 증가(반로그 규모)

릴리스 250.0(2022년 6월)의 GenBank 릴리스 노트에는 "1982년부터 현재까지 GenBank의 거점 수는 약 18개월마다 2배 증가했다"^[5]^[11]고 기술되어 있다.2022년 6월 15일 현재, GenBank 릴리스 250.0은 보고된 2억3천900만 개의 ^[5]염기서열에서 2억3천900만 개의 로키, 1,39조 개의 뉴클레오티드 베이스를 가지고 있다.

GenBank 데이터베이스에는 메인 시퀀스 데이터 수집에서 기계적으로 구성된 추가 데이터 세트가 포함되어 있으므로 이 카운트에서 제외됩니다.

GenBank 상위 20개 생물 (릴리스 250)^[5]

유기체	염기쌍
트리티쿰 심미룸	2.15443744183×10^¹¹
사스-CoV-2	1.65771825746×10^¹¹
호데움 벌가레 서브스페어불량품	1.01344340096×10^¹¹
근골근	3.0614386913×10^¹⁰
호모 사피엔스	2.7834633853×10^¹⁰
에비나 사티바	2.1127939362×10^¹⁰
대장균	1.5517830491×10^¹⁰
클렙시엘라 폐렴	1.1144687122×10^¹⁰
다니오 레리오	1.0890148966×10^¹⁰
보스 황소자리	1.0650671156×10^¹⁰
트리티쿰 터기덤 아속두릅나무	9.981529154×10^⁹
제아메이스	7.412263902×10^⁹
아베나 섬	6.924307246×10^⁹
세칼레레알	6.749247504×10^⁹
노베기쿠스	6.548854408×10^⁹
아에길롭스롱기시마	5.920483689×10^⁹
루푸스 낯익은 개	5.776499164×10^⁹
아에길롭스샤로넨시스	5.272476906×10^⁹
서스스크로파	5.179074907×10^⁹
히나트레마비타툼	5.178626132×10^⁹

식별이 불완전함

National Center for Biotechnology Information Basic Local Alignment Search Tool(NCBI BLAST)을 사용하여 검색할 수 있는 공용 데이터베이스에는 동료 검토된 유형 균주의 시퀀스 및 비 유형 균주의 시퀀스가 없습니다.한편, 상용 데이터베이스는 잠재적으로 고품질의 필터링된 시퀀스 데이터를 포함하지만, 참조 시퀀스 수는 제한적이다.

임상 미생물학^[12] 저널(Journal of Clinical Microbiology)에 발표된 논문은 GenBank에서 분석된 16S rRNA 유전자 배열 결과를 EzTaxon-e^[13] 및 BIBI^[14] 데이터베이스와 같이 자유롭게 이용할 수 있고 품질 제어된 웹 기반 공공 데이터베이스와 함께 평가했다.그 결과, EzTaxon-e(카파 = 0.79)와 결합된 GenBank를 사용하여 수행된 분석은 GenBank(카파 = 0.66) 또는 다른 데이터베이스를 단독으로 사용하는 것보다 더 차별적이었다.

GenBank는 공개 데이터베이스로서 유기체의 초기 식별이 잘못되었기 때문에 특정 종에 잘못 할당된 시퀀스를 포함할 수 있다.게놈에 게재된 최근 기사에 따르면 미토콘드리아 시토크롬c 산화효소 I 서브유닛의 75%가 초기에 잘못 식별된 ^[15]개인의 배열의 지속적인 사용으로 인해 어류 Nemipterus mesoprion에 잘못 할당되었다.저자들은 잘못된 학명을 가진 공개적으로 이용 가능한 시퀀스의 추가 배포를 피하는 방법을 권고한다.

「」를 참조해 주세요.

레퍼런스

^ UCSC 다운로드 페이지에는 "NCBI는 GenBank 데이터의 사용 및 배포에 제한을 두지 않습니다.단, 일부 제출자는 제출한 데이터의 전부 또는 일부에 대해 특허, 저작권 또는 기타 지적재산권을 주장할 수 있습니다.NCBI는 이러한 청구의 유효성을 평가할 수 있는 위치에 있지 않기 때문에 GenBank에 포함된 정보의 사용, 복사 또는 배포에 관한 코멘트나 무제한 허가를 제공할 수 없습니다."
^ Eric W Sayers; Mark Cavanaugh; Karen Clark; Kim D Pruitt; Conrad L Schoch; Stephen T Sherry; Ilene Karsch-Mizrachi (7 January 2022). "GenBank". Nucleic Acids Archive. 50 (D1): D161–D164. doi:10.1093/nar/gkab1135.
^ Benson D; Karsch-Mizrachi, I.; Lipman, D. J.; Ostell, J.; Wheeler, D. L.; et al. (2008). "GenBank". Nucleic Acids Research. 36 (Database): D25–D30. doi:10.1093/nar/gkm929. PMC 2238942. PMID 18073190.
^ Benson D; Karsch-Mizrachi, I.; Lipman, D. J.; Ostell, J.; Sayers, E. W.; et al. (2009). "GenBank". Nucleic Acids Research. 37 (Database): D26–D31. doi:10.1093/nar/gkn723. PMC 2686462. PMID 18940867.
^ ^a ^b ^c ^d "GenBank release notes (Release 250)". NCBI. 15 June 2022. Retrieved 20 July 2022.
^ "How to submit data to GenBank". NCBI. Retrieved 20 July 2022.
^ "GenBank Submission Types". NCBI. Retrieved 20 July 2022.
^ Hanson, Todd (2000-11-21). "Walter Goad, GenBank founder, dies". Newsbulletin: obituary. Los Alamos National Laboratory.
^ LANL GenBank 이력
^ Benton D (1990). "Recent changes in the GenBank On-line Service". Nucleic Acids Research. 18 (6): 1517–1520. doi:10.1093/nar/18.6.1517. PMC 330520. PMID 2326192.
^ Benson, D. A.; Cavanaugh, M.; Clark, K.; Karsch-Mizrachi, I.; Lipman, D. J.; Ostell, J.; Sayers, E. W. (2012). "GenBank". Nucleic Acids Research. 41 (Database issue): D36–D42. doi:10.1093/nar/gks1195. PMC 3531190. PMID 23193287.
^ Kyung Sun Park; Chang-Seok Ki; Cheol-In Kang; Yae-Jean Kim; Doo Ryeon Chung; Kyong Ran Peck; Jae-Hoon Song; Nam Yong Lee (May 2012). "Evaluation of the GenBank, EzTaxon, and BIBI Services for Molecular Identification of Clinical Blood Culture Isolates That Were Unidentifiable or Misidentified by Conventional Methods". J. Clin. Microbiol. 50 (5): 1792–1795. doi:10.1128/JCM.00081-12. PMC 3347139. PMID 22403421.
^ EzTaxon-e Database eztaxon-e.ezbiocloud.net (2021년 3월 25일 접속)
^ leBIBI V5 pbil.univ-lyon1.fr (2021년 3월 25일 액세스 완료)
^ Ogwang, Joel; Bariche, Michel; Bos, Arthur R. (2021). "Genetic diversity and phylogenetic relationships of threadfin breams (Nemipterus spp.) from the Red Sea and eastern Mediterranean Sea". Genome. 64 (3): 207–216. doi:10.1139/gen-2019-0163.

이 문서에는 National Center for Biotechnology Information 문서의 퍼블릭 도메인 자료가 포함되어 있습니다.

외부 링크

GenBank
시퀀스 기록 예제, 헤모글로빈 베타에 대한
뱅크 잇
Sequin - 엔트리를 GenBank 시퀀스 데이터베이스에 제출 및 갱신하기 위해 NCBI가 개발한 스탠드아론 소프트웨어 도구입니다.
EMBOSS - 분자생물학용 무료 오픈소스 소프트웨어
GenBank, RefSeq, TPA 및 UniProt:이름에는 무엇이 있나요?

[1] UCSC 다운로드 페이지에는 "NCBI는 GenBank 데이터의 사용 및 배포에 제한을 두지 않습니다.단, 일부 제출자는 제출한 데이터의 전부 또는 일부에 대해 특허, 저작권 또는 기타 지적재산권을 주장할 수 있습니다.NCBI는 이러한 청구의 유효성을 평가할 수 있는 위치에 있지 않기 때문에 GenBank에 포함된 정보의 사용, 복사 또는 배포에 관한 코멘트나 무제한 허가를 제공할 수 없습니다."

[2] Eric W Sayers; Mark Cavanaugh; Karen Clark; Kim D Pruitt; Conrad L Schoch; Stephen T Sherry; Ilene Karsch-Mizrachi (7 January 2022). "GenBank". Nucleic Acids Archive. 50 (D1): D161–D164. doi:10.1093/nar/gkab1135.

[pmid18073190-3] Benson D; Karsch-Mizrachi, I.; Lipman, D. J.; Ostell, J.; Wheeler, D. L.; et al. (2008). "GenBank". Nucleic Acids Research. 36 (Database): D25–D30. doi:10.1093/nar/gkm929. PMC 2238942. PMID 18073190.

[pmid18940867-4] Benson D; Karsch-Mizrachi, I.; Lipman, D. J.; Ostell, J.; Sayers, E. W.; et al. (2009). "GenBank". Nucleic Acids Research. 37 (Database): D26–D31. doi:10.1093/nar/gkn723. PMC 2686462. PMID 18940867.

[ReleaseNotes-5] "GenBank release notes (Release 250)". NCBI. 15 June 2022. Retrieved 20 July 2022.

[6] "How to submit data to GenBank". NCBI. Retrieved 20 July 2022.

[7] "GenBank Submission Types". NCBI. Retrieved 20 July 2022.

[lanl2000-8] Hanson, Todd (2000-11-21). "Walter Goad, GenBank founder, dies". Newsbulletin: obituary. Los Alamos National Laboratory.

[lanl1994-9] LANL GenBank 이력

[pmid2326192-10] Benton D (1990). "Recent changes in the GenBank On-line Service". Nucleic Acids Research. 18 (6): 1517–1520. doi:10.1093/nar/18.6.1517. PMC 330520. PMID 2326192.

[11] Benson, D. A.; Cavanaugh, M.; Clark, K.; Karsch-Mizrachi, I.; Lipman, D. J.; Ostell, J.; Sayers, E. W. (2012). "GenBank". Nucleic Acids Research. 41 (Database issue): D36–D42. doi:10.1093/nar/gks1195. PMC 3531190. PMID 23193287.

[12] Kyung Sun Park; Chang-Seok Ki; Cheol-In Kang; Yae-Jean Kim; Doo Ryeon Chung; Kyong Ran Peck; Jae-Hoon Song; Nam Yong Lee (May 2012). "Evaluation of the GenBank, EzTaxon, and BIBI Services for Molecular Identification of Clinical Blood Culture Isolates That Were Unidentifiable or Misidentified by Conventional Methods". J. Clin. Microbiol. 50 (5): 1792–1795. doi:10.1128/JCM.00081-12. PMC 3347139. PMID 22403421.

[13] EzTaxon-e Database eztaxon-e.ezbiocloud.net (2021년 3월 25일 접속)

[14] BIBI V5 pbil.univ-lyon1.fr (2021년 3월 25일 액세스 완료)

[15] Ogwang, Joel; Bariche, Michel; Bos, Arthur R. (2021). "Genetic diversity and phylogenetic relationships of threadfin breams (Nemipterus spp.) from the Red Sea and eastern Mediterranean Sea". Genome. 64 (3): 207–216. doi:10.1139/gen-2019-0163.

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]

[15]

v t 생물정보학
데이터베이스	시퀀스 데이터베이스:GenBank, 유럽 뉴클레오티드 아카이브 및 일본 DNA 데이터 뱅크 보조 데이터베이스:UniProt, Swiss-Prot, TrEMBL 및 단백질 정보 자원을 함께 그룹화한 단백질 배열 데이터베이스 기타 데이터베이스: 단백질 데이터 뱅크, Ensembl 및 InterPro 전문 게놈 데이터베이스: BOLD, Saccharomyces Genome Database, FlyBase, VectorBase, WormBase, Rat Genome Database, PHI 기반, Arabidopsis Information Resource 및 Zebrafish 정보 네트워크
소프트웨어	폭발. 보타이 클러스터 엠보스 흐물흐물하다 근육 SAM툴 SOAP 스위트 톱햇
다른.	서버: ExPASy 온톨로지:진 온톨로지 Rosalind (교육 플랫폼)
기관	브로드 인스티튜트 중국국가진뱅크(CNGB) 컴퓨터 생물학부(CBD) Microsoft Research - Trento University Computational and Systems Biology(COSBI) 센터 생명과학 데이터베이스센터(DBCLS) 일본 DNA데이터은행(DDBJ) 유럽생물정보학연구소(EMBL-EBI) 유럽분자생물연구소(EMBL) 플랫 아이언 인스티튜트 J. Craig Venter Institute (JCVI) 막스플랑크 분자세포생물유전학연구소(MPI-CBG) 미국 국립생명공학정보센터(NCBI) 일본 유전학회 네덜란드 생물정보학센터(NBIC) 필리핀 게놈 센터(PGC) 스크립스 리서치 스위스 생물정보학연구소(SIB) 웰컴 생어 연구소 화이트헤드 연구소
단체들	아프리카 생물정보학 및 계산생물학회(ASBCB) 오스트레일리아 생물정보학 자원(EMBL-AR) 유럽 분자 생물학 네트워크(EMBnet) 국제 뉴클레오티드 배열 데이터베이스 콜라보레이션(INSDC) 국제 생물화 협회(ISB(International Society for Biocation(ISB) 국제계산생물학회(ISCB) 학생회(ISCB-SC) 유전체학 및 통합생물학연구소(CSIR-IGIB) 일본 생물 정보 학회
회의	바젤 컴퓨터 생물학 회의(BC)² 유럽계산생물학회의(ECCB) ISMB(Intelligent Systems for Molecular Biology) 국제생물정보학회의(InCoB) 생물정보학 및 생물통계학 계산지능방법 국제회의(CIBB) ISCB 아프리카 ASBCB 생물정보학 회의 태평양 생물계산 심포지엄(PSB) 컴퓨터 분자생물학(RECOMB) 연구
파일 형식	CRAM 형식 FASTA 포맷 FASTQ 형식 NeXML 형식 Nexus 형식 파일업 형식 SAM 포맷 스톡홀름 형식 VCF 형식
관련 토픽	계산생물학 바이오뱅크 목록 생물학적 데이터베이스 목록 분자 계통학 시퀀싱 시퀀스 데이터베이스 시퀀스 얼라인먼트
카테고리 공통

권한 관리
일반	WorldCat (국회도서관 경유)
국립도서관	이스라엘 미국

Search

GenBank

네임스페이스

더

목차

투고

역사

성장

식별이 불완전함

「」를 참조해 주세요.

레퍼런스

외부 링크

내용
묘사	참고 문헌 및 생물학적 주석을 지원하는 300,000개 이상의 유기체에 대한 뉴클레오티드 배열.
데이터형 발동.	뉴클레오티드 배열 단백질 배열
유기체	모든.
연락
연구소	엔씨비
주요 인용문	PMID 21071399
발매일	1982년; 40년 전 (2012년)
접근
data 형식	XML ASN.1 Genbank 형식
웹 사이트	엔씨비
다운로드 URL	ncbi ftp
웹 서비스 URL	기능 비누.
도구들
웹	폭발.
스탠드아론	폭발.
여러가지 종류의
면허증.	불명확하다^[1]

Search

GenBank

투고

역사

성장

식별이 불완전함

「 」를 참조해 주세요.

레퍼런스

외부 링크

「」를 참조해 주세요.