탄수화물 구조 데이터베이스
Carbohydrate Structure Database![]() | |
내용 | |
---|---|
묘사 | NMR, 서지 및 생물학적 주석이 있는 천연 탄수화물 구조. |
데이터형 발동. | 탄수화물 구조 및 관련 데이터 |
유기체 | |
연락 | |
연구소 | 젤린스키 유기화학연구소 |
작가들 | 필립 5세투카흐, 크세니아 S에고로바, 유리 에이니렐 등 |
주요 인용문 | 탄수화물 구조 데이터베이스 |
발매일 | 2005 |
접근 | |
웹 사이트 | http://csdb.glycoscience.ru/ |
다운로드 URL | 웹 인터페이스에서의 내보내기 기능 |
도구들 | |
웹 | |
여러가지 종류의 | |
버전 관리 | 네. |
데이터 릴리즈 빈도수. | 연간. |
버전 | 1 (표준) |
큐레이션 정책 | ○(수동 및 자동) |
탄수화물 구조 데이터베이스(CSDB)는 N.D.의 러시아 과학자 그룹이 2005년에[2] 시작한 글리코인 포매틱스의 무료 큐레이션 데이터베이스 및 서비스 플랫폼입니다. 젤린스키 유기화학 연구소, 러시아 과학 아카데미.CSDB는 천연 탄수화물 및 탄수화물 관련 분자에 대해 발표된 구조, 분류학, 서지학 및 NMR 분광 데이터를 저장합니다.
개요
CSDB에 저장된 주요 데이터는 세균, 곰팡이, 식물 유래의 탄수화물 구조이다.각 구조는 유기체에 할당되며, 그것이 기술된 대응하는 과학 출판물에 대한 링크가 제공된다.구조 데이터 외에도 CSDB는 NMR 스펙트럼, 특정 구조를 해독하는 데 사용되는 방법에 대한 정보 및 기타 [1][3]데이터도 저장한다.CSDB는 다음과 같은 탄수화물 관련 연구 도구에 대한 액세스를 제공합니다.
- 탄수화물의 1D 및 2D NMR 스펙트럼 시뮬레이션(GODESS: 글리칸 지향 데이터베이스 중심 경험 스펙트럼 시뮬레이션).[4][5][6]
- 자동화된 NMR 기반 구조 설명(GRASS: 당류 [7]구조의 생성, 순위 지정 및 할당).
- 생물[8][9] 글리콜의 구조적 특징 분포 통계적 분석
- 임의의 당류[10] 및 구성 맵의 하위 데이터베이스에 최적화된 원자 좌표 생성.
- 당류(탄수화물 기반 [8]생명의 나무)의 유사성에 기초한 분류군 군집화
- 글리코실전달효소서브데이터베이스(GT-explector)[11][12]
이력 및 자금 지원
2015년까지는 세균탄수화물구조 데이터베이스(BCSDB)와 식물&풍알탄수화물구조 데이터베이스(PFCSDB) 데이터베이스가 동시에 존재했다.2015년에는 단일 탄수화물 구조 데이터베이스(CSDB)[1]에 통합되었다.CSDB의 개발 및 유지보수는 국제과학기술센터(2005-2007), 러시아연방총재 조성 프로그램(2005-2006), 러시아 기초연구재단(2005-2007, 2012-2014, 2015-2017, 2018-2020), 독일 크렙스포르스첸츠룸(2006-2010)에서 자금을 조달하고 있다.8-2020).
데이터 소스 및 적용 범위
CSDB 데이터의 주요 소스는 다음과 같습니다.
- 과학 출판물은 NCBI Pubmed 및 Thomson Reuters Web Of Science(약 18000개의 레코드)를 포함한 전용 인용 데이터베이스에서 색인화되었습니다.
- CCSD(Carbbank) 데이터베이스(약).3000 레코드).
데이터는 원본 과학 출판물을 참조하여 CSDB에 수동으로 추가되고 선택됩니다.다른 데이터베이스에서 생성된 데이터는 오류 수정 및 승인 [14]절차를 따릅니다.2017년 현재, 박테리아와 고세균에 대한 적용 범위는 ca이다.과학 문헌에 발표된 탄수화물 구조의 80% 상대 데이터의 발행과 CSDB로의 축적 사이의 시간 차이는 약 18개월이다.식물은 1997년까지, 곰팡이는 [15]2012년까지 덮여있다.CSDB는 단세포 메타조아를 제외하고 동물영역의 데이터를 다루지 않는다.동물 탄수화물에 대한 많은 전용 데이터베이스가 있다.UniCarbKB 또는 GLYCOSCIENCES.de.[17]
CSDB는 글리코인 [18][19][20][21][22][23][24]포매틱스에서 가장 큰 프로젝트 중 하나로 보고되고 있다.그것은 천연[25][26][27] 탄수화물의 구조 연구 및 당 [28]프로파일에 사용된다.CSDB의 내용은 다른 글리코인 포매틱스 [29][30][31][32]프로젝트에서 데이터 소스로 사용되어 왔습니다.
퇴적물
- 글리칸, 당고분자 및 당결합체의 분자구조: 일차구조, 농약정보, 중합도 및 분자분류.구조범위는 글리코시드, 에스테르, 아미드, 케탈, 인산 또는 설포디스터 결합에 의해 결합된 잔류물(단당, 알디톨, 아미노산, 지방산 등)로 이루어진 분자로 구성되며, 적어도 1개의 잔류물이 단당 또는 그 유도체이다.
- 구조와 관련된 서지 목록: 서지 데이터베이스의 각인 데이터, 키워드, 추상, ID
- 구조의 생물학적 맥락: 관련 분류군, 변종, 혈청 그룹, 숙주 유기체, 질병 정보.대상 영역은 원핵생물, 식물, 곰팡이 및 선별된 병원성 단세포 메타조아입니다.데이터베이스는 이러한 도메인에서 유래하거나 그러한 글리칸의 화학적 변형을 통해 얻은 글리칸만을 포함한다.
- 할당된 NMR 스펙트럼 및 실험 조건.
- 분류군과 관련된 글리코실전달효소: 유전자 및 효소 식별자, 전체 구조, 기증자와 기질, 효소 활성 증명에 사용되는 방법, 신뢰성 수준.
- 다른 데이터베이스에 대한 참조
- 원본 출판물에서 수집한 기타 데이터
- 분자역학 시뮬레이션에서 도출된 이당류의 배치도.
다른 데이터베이스와의 상호 관계
CSDB는 단당DB, 글리코사이언스와 같은 다른 글리코믹스 데이터베이스와 [33][34]가교되어 있다.DE, NCBI Pubmed, NCBI Taxonomy, NLM 카탈로그, 국제질병분류11 등원어민 [35]표기법인 CSDB Linear 외에도 구조는 여러 탄수화물 표기법(SNFG,[36] SweetDB,[37] 글리코CT,[38] WURCS,[39] GLICAM [40]등)으로 제시된다.CSDB는 ProciRDF 온톨로지에 [41][42]따라 Resource Description Framework(RDF) 피드로 내보낼 수 있습니다.
외부 링크
- CSDB 웹사이트
- CSDB 사용 예시
- CSDB 테크니컬 문서
- CSDB Linear(구조 부호화 표기법)
- NAR 컬렉션에 등록된 탄수화물 데이터베이스
- 최근 10년간 탄수화물 데이터베이스(사용량)
레퍼런스
- ^ a b c d Toukach Ph.V.; Egorova K.S. (2016). "Carbohydrate structure database merged from bacterial, archaeal, plant and fungal parts". Nucleic Acids Research. 44 (D1): D1229–D1236. doi:10.1093/nar/gkv840. PMC 4702937. PMID 26286194.
- ^ Toukach F.V.; Knirel Y.A. (2005). "New database of bacterial carbohydrate structures". Glycoconjugate Journal. 22 (4–6): 216–217.
- ^ Harvey D.J. (2015). "Analysis of carbohydrates and glycoconjugates by matrix-assisted laser desorption/ionization mass spectrometry: An update for 2011-2012". Mass Spectrometry Reviews. 36 (3): 255–422. doi:10.1002/mas.21471. PMID 26270629.
- ^ Kapaev R.R.; Egorova K.S.; Toukach Ph.V. (2014). "Carbohydrate structure generalization scheme for database-driven simulation of experimental observables, such as NMR chemical shifts". Journal of Chemical Information and Modeling. 54 (9): 2594–2611. doi:10.1021/ci500267u. PMID 25020143.
- ^ Kapaev R.R.; Toukach Ph.V. (2015). "Improved carbohydrate structure generalization scheme for 1H and 13C NMR simulations". Analytical Chemistry. 87 (14): 7006–7010. doi:10.1021/acs.analchem.5b01413. PMID 26087011.
- ^ Kapaev R.R.; Toukach Ph.V. (2016). "Simulation of 2D NMR Spectra of Carbohydrates Using GODDESS Software". Journal of Chemical Information and Modeling. 56 (6): 1100–1104. doi:10.1021/acs.jcim.6b00083. PMID 27227420.
- ^ Kapaev R.R.; Toukach Ph.V. (2018). "GRASS: semi-automated NMR-based structure elucidation of saccharides". Bioinformatics. 34 (6): 957–963. doi:10.1093/bioinformatics/btx696. PMID 29092007.
- ^ a b Egorova K.S.; Kondakova A.N.; Toukach Ph.V. (2015). "Carbohydrate structure database: tools for statistical analysis of bacterial, plant and fungal glycomes". Database. 2015: ID bav073. doi:10.1093/database/bav073. PMC 4559136. PMID 26337239.
- ^ Herget S.; Toukach Ph.V.; Ranzinger R.; Hull W.E.; Knirel Y.; von der Lieth C.-W. (2008). "Statistical analysis of the Bacterial Carbohydrate Structure Data Base (BCSDB): Characteristics and diversity of bacterial carbohydrates in comparison with mammalian glycans". BMC Structural Biology. 8: ID 35. doi:10.1186/1472-6807-8-35. PMC 2543016. PMID 18694500.
- ^ Chernyshov I.Y.; Toukach Ph.V. (2018). "REStLESS: Automated Translation of Glycan Sequences from Residue-Based Notation to SMILES and Atomic Coordinates". Bioinformatics. 34 (15): 2679–2681. doi:10.1093/bioinformatics/bty168. PMID 29547883.
- ^ Toukach Ph.V.; Egorova K.S. (2017). "CSDB_GT: a new curated database on glycosyltransferases". Glycobiology. 27 (4): 285–290. doi:10.1093/glycob/cww137. PMID 28011601.
- ^ Egorova K.S.; Knirel Y.A.; Toukach Ph.V. (2019). "Expanding CSDB_GT glycosyltransferase database with Escherichia coli". Glycobiology. 29 (4): 285–287. doi:10.1093/glycob/cwz006. PMID 30759212.
- ^ Doubet S.; Albersheim P. (1992). "CarbBank". Glycobiology. 2 (6): 505–507. doi:10.1093/glycob/2.6.505. PMID 1472756.
- ^ Egorova K.S.; Toukach Ph.V. (2012). "Critical analysis of CCSD data quality". Journal of Chemical Information and Modeling. 52 (11): 2812–2814. doi:10.1021/ci3002815. PMID 23025661.
- ^ Egorova K.S.; Toukach Ph.V. (2013). "Expansion of coverage of Carbohydrate Structure Database (CSDB)". Carbohydrate Research. 389: 112–114. doi:10.1016/j.carres.2013.10.009. PMID 24680503.
- ^ Campbell M.P.; Packer N.H. (2016). "UniCarbKB: New database features for integrating glycan structure abundance, compositional glycoproteomics data, and disease associations". Biochimica et Biophysica Acta (BBA) - General Subjects. 1860 (8): 1669–1675. doi:10.1016/j.bbagen.2016.02.016. PMID 26940363.
- ^ Lütteke T.; Bohne-Lang A.; Loss A.; Goetz T.; Frank M.; von der Lieth C.-W. (2006). "GLYCOSCIENCES.de: an Internet portal to support glycomics and glycobiology research". Glycobiology. 16 (5): 71R–81R. doi:10.1093/glycob/cwj049. PMID 16239495.
- ^ Rigden D.J.; Fernández-Suárez X.M.; Galperin M.Y. (2016). "The 2016 database issue of Nucleic Acids Research and an updated molecular biology database collection". Nucleic Acids Research. 44 (D1): D1–D6. doi:10.1093/nar/gkv1356. PMC 4702933. PMID 26740669.
- ^ Aoki-Kinoshita K.F. (2013). "Using databases and web resources for glycomics research". Molecular & Cellular Proteomics. 12 (4): 1036–1045. doi:10.1074/mcp.R112.026252. PMC 3617328. PMID 23325765.
- ^ Frank M.; Schloissnig S. (2010). "Bioinformatics and molecular modeling in glycobiology". Cellular and Molecular Life Sciences. 67 (16): 2749–2772. doi:10.1007/s00018-010-0352-4. PMC 2912727. PMID 20364395.
- ^ Artemenko N.V.; McDonald A.G.; Davey G.P.; Rudd P.M. (2012). Databases and tools in glycobiology. Methods in Molecular Biology. Vol. 899. pp. 325–350. doi:10.1007/978-1-61779-921-1_21. ISBN 978-1-61779-920-4. PMID 22735963.
- ^ Lütteke T. (2012). "The use of glycoinformatics in glycochemistry". Beilstein Journal of Organic Chemistry. 8: 915–929. doi:10.3762/bjoc.8.104. PMC 3388882. PMID 23015842.
- ^ Zhulin I.B. (2015). "Databases for Microbiologists". Journal of Bacteriology. 197 (15): 2458–2467. doi:10.1128/JB.00330-15. PMC 4505447. PMID 26013493.
- ^ Yamada K.; Kakehi K. (2011). "Recent advances in the analysis of carbohydrates for biomedical use". Journal of Pharmaceutical and Biomedical Analysis. 55 (4): 702–727. doi:10.1016/j.jpba.2011.02.003. PMID 21382683.
- ^ Fontana C.; Zaccheus M.; Weintraub A.; Ansaruzzaman M.; Widmalm G. (2016). "Structural studies of a polysaccharide from Vibrio parahaemolyticus strain AN-16000". Carbohydrate Research. 432: 41–49. doi:10.1016/j.carres.2016.06.004. PMID 27392309.
- ^ Potekhina N.V.; Shashkov A.S.; Senchenkova S.N.; Dorofeeva L.V.; Evtushenko L.I. (2012). "Structure of hexasaccharide 1-phosphate polymer from Arthrobacter uratoxydans VKM Ac-1979(T) cell wall". Biochemistry (Moscow). 77 (11): 1294–1302. doi:10.1134/S0006297912110089. PMID 23240567. S2CID 9699031.
- ^ Chapot-Chartier M.P.; Vinogradov E.; Sadovskaya I.; Andre G.; Mistou M.Y.; Trieu-Cuot P.; Furlan S.; Bidnenko E.; Courtin P.; Péchoux C.; Hols P.; Dufrêne Y.F.; Kulakauskas S. (2010). "Cell surface of Lactococcus lactis is covered by a protective polysaccharide pellicle". Journal of Biological Chemistry. 285 (14): 10464–10471. doi:10.1074/jbc.M109.082958. PMC 2856253. PMID 20106971.
- ^ Walsh I.; Zhao S.; Campbell M.; Taron C.H.; Rudd P.M. (2016). "Quantitative profiling of glycans and glycopeptides: an informatics' perspective". Current Opinion in Structural Biology. 40: 70–80. doi:10.1016/j.sbi.2016.07.022. PMID 27522273.
- ^ Ranzinger R.; York W.S. (2015). GlycomeDB. Methods in Molecular Biology. Vol. 1273. pp. 109–124. doi:10.1007/978-1-4939-2343-4_8. ISBN 978-1-4939-2342-7. PMID 25753706.
- ^ Ranzinger R.; Herget S.; von der Lieth C.-W.; Frank M. (2011). "GlycomeDB - a unified database for carbohydrate structures". Nucleic Acids Research. 39 (Database issue): D373-376. doi:10.1093/nar/gkq1014. PMC 3013643. PMID 21045056.
- ^ Aoki-Kinoshita K.F.; et al. (2016). "GlyTouCan 1.0 - The international glycan structure repository". Nucleic Acids Research. 44 (D1): D1237-1242. doi:10.1093/nar/gkv1041. PMC 4702779. PMID 26476458.
- ^ Campbell M.P.; Ranzinger R.; Lütteke T.; Mariethoz J.; Hayes CA.; Zhang J.; Akune Y.; Aoki-Kinoshita K.F.; Damerell D.; Carta G.; York W.S.; Haslam S.M.; Narimatsu H.; Rudd P.M.; Karlsson N.G.; Packer N.H.; Lisacek F. (2014). "Toolboxes for a standardised and systematic study of glycans". BMC Bioinformatics. 15: Suppl 1:S9. doi:10.1186/1471-2105-15-S1-S9. PMC 4016020. PMID 24564482.
- ^ Ranzinger R.; Herget S.; Wetter T.; von der Lieth C.-W. (2008). "GlycomeDB - integration of open-access carbohydrate structure databases". BMC Bioinformatics. 9: ID 384. doi:10.1186/1471-2105-9-384. PMC 2567997. PMID 18803830.
- ^ Toukach Ph.V.; Joshi H.; Ranzinger R.; Knirel Y.; von der Lieth C.-W. (2007). "Sharing of worldwide distributed carbohydrate-related digital resources: online connection of the Bacterial Carbohydrate Structure DataBase and GLYCOSCIENCES.de". Nucleic Acids Research. 35 (Database issue): D280–D286. doi:10.1093/nar/gkl883. PMC 1899093. PMID 17202164.
- ^ Toukach Ph.V.; Egorova K.S. (2020). "New features of CSDB Linear, as compared to other carbohydrate notations". Journal of Chemical Information and Modeling. 60 (3): 1276–1289. doi:10.1021/acs.jcim.9b00744. PMID 31790229. S2CID 226214957.
- ^ Varki A.; et al. (2015). "Symbol Nomenclature for Graphical Representations of Glycans". Glycobiology. 25 (12): 1323–1324. doi:10.1093/glycob/cwv091. PMC 4643639. PMID 26543186.
- ^ Loss A.; Bunsmann P.; Bohne A.; Loss A.; Schwarzer E.; Lang E.; von der Lieth C.-W. (2002). "SWEET-DB: an attempt to create annotated data collections for carbohydrates". Nucleic Acids Research. 30 (1): 405–408. doi:10.1093/nar/30.1.405. PMC 99123. PMID 11752350.
- ^ Herget S.; Ranzinger R.; Maass K.; von der Lieth C.-W. (2008). "GlycoCT - a unifying sequence format for carbohydrates". Carbohydrate Research. 343 (12): 2162–2171. doi:10.1016/j.carres.2008.03.011. PMID 18436199.
- ^ Tanaka K.; Aoki-Kinoshita K.F.; Kotera M.; Sawaki H.; Tsuchiya S.; Fujita N.; Shikanai T.; Kato M.; Kawano S.; Yamada I.; Narimatsu H. (2014). "WURCS: the Web3 unique representation of carbohydrate structures". Journal of Chemical Information and Modeling. 54 (6): 1558–1566. doi:10.1021/ci400571e. PMID 24897372.
- ^ Kirschner K.N.; Yongye A.B.; Tschampel S.M.; González-Outeiriño J.; Daniels C.R.; Foley B.L.; Woods R.J. (2008). "GLYCAM06: a generalizable biomolecular force field. Carbohydrates". Journal of Computational Chemistry. 29 (4): 622–655. doi:10.1002/jcc.20820. PMC 4423547. PMID 17849372.
- ^ Ranzinger R.; Aoki-Kinoshita K.F.; Campbell M.P.; Kawano S.; Lütteke T.; Okuda S.; Shinmachi D.; Shikanai T.; Sawaki H.; Toukach Ph.V.; Matsubara M.; Yamada I.; Narimatsu H. (2015). "GlycoRDF: An ontology to standardize Glycomics data in RDF". Bioinformatics. 31 (6): 919–925. doi:10.1093/bioinformatics/btu732. PMC 4380026. PMID 25388145.
- ^ Aoki-Kinoshita K.F.; Bolleman J.; Campbell M.P.; Kawano S.; Kim J.; Lütteke T.; Matsubara M.; Okuda S.; Ranzinger R.; Sawaki H.; Shikanai T.; Shinmachi D.; Suzuki Y.; Toukach Ph.V.; Yamada I.; Packer N.H.; Narimatsu H. (2013). "Introducing glycomics data into the Semantic Web". Journal of Biomedical Semantics. 4 (1): ID 39. doi:10.1186/2041-1480-4-39. PMC 4177142. PMID 24280648.