케그

KEGG
케그
KEGG database logo.gif
내용
묘사게놈 해독을 위한 생물 정보학 자원
유기체모든.
연락
연구소교토 대학
실험실.가네히사 연구소
주요 인용문PMID 10592173
발매일1995
접근
웹 사이트www.kegg.jp
서비스 URL기타 "KEG API" 참조
도구들
KEGG 매퍼

KEGG(Kyoto Encyclopedia of Genes and Genomes)는 게놈, 생물학적 경로, 질병, 약물화학 물질다루는 데이터베이스 모음이다.KEGG는 유전체학, 메타게노믹스, 대사학 및 기타 오믹스 연구에서의 데이터 분석, 시스템 생물학에서의 모델링 및 시뮬레이션, 의약품 개발에서의 번역 연구를 포함한 생물 정보학 연구와 교육에 사용된다.

KEGG 데이터베이스 프로젝트는 1995년 교토대 화학연구소 가네히사 미노루 교수에 의해 당시 진행 중이던 일본 인간 게놈 [1][2]프로그램 하에서 시작되었다.게놈 배열 데이터의 생물학적 해석에 사용할 수 있는 컴퓨터화된 자원의 필요성을 예견하고, 그는 KEGG PATH 데이터베이스를 개발하기 시작했다.이것은 세포유기체의 신진대사와 다양한 다른 기능에 대한 실험 지식을 나타내는 수동으로 그려진 KEGG 경로 지도의 모음이다.각 경로 지도는 분자 상호작용과 반응의 네트워크를 포함하고 게놈의 유전자와 경로의 유전자 생성물(대부분 단백질)을 연결하도록 설계되었다.이를 통해 KEGG 경로 매핑이라고 불리는 분석이 가능해졌다. 이 분석에서는 게놈의 유전자 함량을 KEG PATH 데이터베이스와 비교하여 어떤 경로와 관련 기능이 게놈에 암호화될 가능성이 있는지를 조사한다.

개발자들에 따르면, KEGG는 생물학적 [3]시스템의 "컴퓨터 표현"이다.시스템의 구성 요소 및 배선도, 특히 유전자와 단백질의 유전적 구성 요소, 작은 분자와 반응의 화학적 구성 요소, 분자 상호 작용 및 반응 네트워크의 배선 다이어그램을 통합합니다.이 개념은 시스템,[4] 게놈, 화학 및 건강 정보로 분류되는 KEGG의 다음 데이터베이스에서 실현된다.

  • 시스템 정보
    • PATHROWE: 세포 및 생물 기능을 위한 경로
    • 모듈: 모듈 또는 유전자의 기능 단위
    • BRITE: 생물학적 실체의 계층적 분류
  • 게놈 정보
  • 화학 정보
  • 건강 정보

데이터베이스

시스템 정보

배선도 데이터베이스인 KEGG PATH 데이터베이스는 KEGG 자원의 핵심이다.이것은 유전자, 단백질, RNA, 화합물, 글리칸 및 화학 반응뿐만 아니라 질병 유전자와 약물 표적을 포함한 많은 실체를 통합한 경로 지도의 모음으로, KEGG의 다른 데이터베이스에 개별 항목으로 저장됩니다.경로 맵은 다음 섹션으로 분류됩니다.

대사 섹션에는 일반적인 대사 경로 맵과 더불어 전체적인 대사 그림을 보여주는 미적으로 그려진 글로벌 맵이 포함되어 있습니다.예를 들어, 저해상도 글로벌 맵을 사용하여 유전체 연구에서는 다른 유기체의 대사 용량과 메타게노믹스 연구에서는 다른 환경 샘플의 대사 용량을 비교할 수 있습니다.반대로, KEGG 모듈 데이터베이스의 KEG 모듈은 고해상도 국소 배선도이며, 특정 유기체 그룹 및 분자 복합체 사이에 보존된 서브 경로와 같이 경로 지도 내에서 보다 긴밀하게 기능하는 단위를 나타낸다.KEGG 모듈은 특정 대사 능력 및 기타 표현형 특성과 연계할 수 있는 특성 유전자 세트로 정의되어 게놈 및 메타게놈 데이터의 자동 해석에 사용될 수 있습니다.

KEGG PATH를 보완하는 또 다른 데이터베이스는 KEG BRITE 데이터베이스이다.유전자, 단백질, 유기체, 질병, 약물 및 화학 화합물을 포함한 다양한 실체의 계층적 분류를 포함하는 온톨로지 데이터베이스입니다.KEGG PATH는 이러한 실체의 분자 상호작용과 반응으로 제한되지만, KEGG BRITE는 다양한 유형의 관계를 통합한다.

게놈 정보

1995년 KEGG 프로젝트가 시작된 지 몇 달 후, 완전히 배열된 박테리아 게놈에 대한 첫 보고서가 발표되었습니다.[5]그 이후로 발표된 모든 완전한 게놈은 진핵생물원핵생물의 KEGG에 축적된다.KEG GENES 데이터베이스에는 유전자/단백질 수준 정보가 포함되어 있으며 KEG GENEME 데이터베이스에는 이들 게놈에 대한 생물 수준 정보가 포함되어 있다.KEG GENES 데이터베이스는 완전한 게놈을 위한 유전자 세트로 구성되며, 각 세트의 유전자는 KEG 경로도, KEG 모듈 및 BRITE 계층의 배선도에 대응하는 형태로 주석이 부여된다.

이러한 대응은 맞춤법 개념을 사용하여 이루어집니다.KEGG 경로 지도는 특정 유기체의 실험 증거를 바탕으로 그려지지만, 인간과 생쥐와 같은 다른 유기체는 종종 직교 유전자 또는 직교 유전자라고 불리는 기능적으로 동일한 유전자로 구성된 동일한 경로를 공유하기 때문에 다른 유기체에도 적용 가능하도록 설계되었다.KEG GENES 데이터베이스의 모든 유전자는 KEG GENESLOGY(KO) 데이터베이스에서 이러한 맞춤법으로 그룹화된다.KEGG 모듈 및 BRITE 계층뿐 아니라 KEG 경로 맵의 노드(유전자 제품)가 KO 식별자가 주어지기 때문에, KEGG의 [4]게놈 주석 절차에 의해 게놈의 유전자가 KO 식별자로 주석을 달면 대응이 확립된다.

화학 정보

KEGG 대사 경로 맵은 대사 네트워크의 이중 측면을 나타내기 위해 그려진다. 즉, 연속적인 반응을 촉매하기 위해 게놈 인코딩 효소가 어떻게 연결되는지에 대한 게놈 네트워크와 이러한 [6]반응에 의해 기질제품의 화학적 구조가 어떻게 변형되는지에 대한 화학적 네트워크이다.유전체의 효소 유전자 세트는 KEGG 경로 지도에 중첩될 때 효소 관계 네트워크를 식별하게 되며, 이는 다시 생합성생분해 가능성을 해석할 수 있는 화학 구조 변환 네트워크를 특징짓는다.또는 대사체에서 동정된 대사물 세트는 효소 경로와 관련된 효소 유전자의 이해를 이끌 것이다.

KEGG LIGAND라고 하는 화학 정보 카테고리의 데이터베이스는 화학 네트워크에 대한 지식을 수집하여 정리됩니다.KEGG 프로젝트 초기에 KEGG LIGAND는 세 가지 데이터베이스로 구성되었습니다: 화학 화합물에 대한 KEGG 화합물, 화학 반응에 대한 KEG 반응, 효소 명명법에 [7]대한 KEG 효소.현재 글리칸용[8] KEGG GLICAN과 RPIR(반응 쌍 정렬) 및 RCLASS(반응 클래스)[9]라고 하는 두 개의 보조 반응 데이터베이스가 추가되어 있다.KEGG 화합물은 대사물 외에 이종생물제 등 다양한 화합물을 함유하도록 확장되었다.

건강 정보

KEGG에서 질병은 유전적 요인과 환경적 요인의 섭동에 의해 발생하는 생물학적 시스템의 섭동 상태로 간주되며, 약물은 다른 유형의 섭동 요소로 [10]간주됩니다.KEGG PATH 데이터베이스는 생물학적 시스템의 정상 상태뿐만 아니라 교란 상태도 포함한다.그러나 분자 메커니즘이 잘 이해되지 않기 때문에 대부분의 질병에 대해 질병 경로도를 그릴 수 없다.KEGG 질병 데이터베이스에서 대체 접근법이 취해진다. KEGG 질병 데이터베이스에서는 알려진 유전적 요소와 질병의 환경적 요인을 간단히 분류한다.이러한 카탈로그는 결국 보다 완벽한 질병 배선도를 제공할 수 있습니다.

KEGG DRUG 데이터베이스에는 일본, 미국 및 유럽에서 승인된 의약품의 활성 성분이 포함되어 있습니다.이들은 화학 구조 및/또는 화학 성분으로 구분되며, KEGG 경로도와 BRITE 계층에서 표적 분자, 대사 효소 및 기타 분자 상호 작용 네트워크 정보와 관련된다.이를 통해 게놈 정보와 약물 상호작용의 통합 분석이 가능합니다.승인된 의약품의 범주 밖에 있는 생약 및 기타 건강 관련 물질은 KEGG ENVIENT 데이터베이스에 저장된다.건강정보 카테고리의 데이터베이스는 총칭하여 KEGG MEDICUS로 불리며, 일본에서 시판되는 모든 의약품의 패키지 삽입도 포함한다.

서브스크립션 모델

2011년 7월 KEGG는 정부 자금의 대폭 삭감을 이유로 FTP 다운로드용 서브스크립션 모델을 도입했습니다.KEGG는 웹사이트를 통해 계속 자유롭게 이용할 수 있지만, 구독 모델은 생물 정보학 데이터베이스의 [11][12]지속 가능성에 대한 논의를 불러일으켰다.

「 」를 참조해 주세요.

레퍼런스

  1. ^ Kanehisa M, Goto S (2000). "KEGG: Kyoto Encyclopedia of Genes and Genomes". Nucleic Acids Res. 28 (1): 27–30. doi:10.1093/nar/28.1.27. PMC 102409. PMID 10592173.
  2. ^ Kanehisa M (1997). "A database for post-genome analysis". Trends Genet. 13 (9): 375–6. doi:10.1016/S0168-9525(97)01223-7. PMID 9287494.
  3. ^ Kanehisa M, Goto S, Hattori M, Aoki-Kinoshita KF, Itoh M, Kawashima S, Katayama T, Araki M, Hirakawa M (2006). "From genomics to chemical genomics: new developments in KEGG". Nucleic Acids Res. 34 (Database issue): D354–7. doi:10.1093/nar/gkj102. PMC 1347464. PMID 16381885.
  4. ^ a b Kanehisa M, Goto S, Sato Y, Kawashima M, Furumichi M, Tanabe M (2014). "Data, information, knowledge and principle: back to metabolism in KEGG". Nucleic Acids Res. 42 (Database issue): D199–205. doi:10.1093/nar/gkt1076. PMC 3965122. PMID 24214961.
  5. ^ Fleischmann RD, Adams MD, White O, Clayton RA, Kirkness EF, Kerlavage AR, Bult CJ, Tomb JF, Dougherty BA, Merrick JM, et al. (1995). "Whole-genome random sequencing and assembly of Haemophilus influenzae Rd". Science. 269 (5223): 496–512. Bibcode:1995Sci...269..496F. doi:10.1126/science.7542800. PMID 7542800. S2CID 10423613.
  6. ^ Kanehisa M (2013). "Chemical and genomic evolution of enzyme-catalyzed reaction networks". FEBS Lett. 587 (17): 2731–7. doi:10.1016/j.febslet.2013.06.026. hdl:2433/178762. PMID 23816707. S2CID 40074657.
  7. ^ Goto S, Nishioka T, Kanehisa M (1999). "LIGAND database for enzymes, compounds and reactions". Nucleic Acids Res. 27 (1): 377–9. doi:10.1093/nar/27.1.377. PMC 148189. PMID 9847234.
  8. ^ Hashimoto K, Goto S, Kawano S, Aoki-Kinoshita KF, Ueda N, Hamajima M, Kawasaki T, Kanehisa M (2006). "KEGG as a glycome informatics resource". Glycobiology. 16 (5): 63R–70R. doi:10.1093/glycob/cwj010. PMID 16014746.
  9. ^ Muto A, Kotera M, Tokimatsu T, Nakagawa Z, Goto S, Kanehisa M (2013). "Modular architecture of metabolic pathways revealed by conserved sequences of reactions". J Chem Inf Model. 53 (3): 613–22. doi:10.1021/ci3005379. PMC 3632090. PMID 23384306.
  10. ^ Kanehisa M, Goto S, Furumichi M, Tanabe M, Hirakawa M (2010). "KEGG for representation and analysis of molecular networks involving diseases and drugs". Nucleic Acids Res. 38 (Database issue): D355–60. doi:10.1093/nar/gkp896. PMC 2808910. PMID 19880382.
  11. ^ Galperin MY, Fernández-Suárez XM (2012). "The 2012 Nucleic Acids Research Database Issue and the online Molecular Biology Database Collection". Nucleic Acids Res. 40 (Database issue): D1–8. doi:10.1093/nar/gkr1196. PMC 3245068. PMID 22144685.
  12. ^ Hayden, EC (2013). "Popular plant database set to charge users". Nature. doi:10.1038/nature.2013.13642.

외부 링크