dcGO
dcGO내용 | |
---|---|
묘사 | dcGO 데이터베이스는 단백질 도메인을 위한 포괄적인 도메인 중심 온톨로지 리소스입니다. |
데이터형 발동. | 단백질 도메인, 온톨로지 |
연락 | |
연구소 | 브리스톨 대학교 |
주요 인용문 | PMID 23161684 |
접근 | |
웹 사이트 | dcGO 웹사이트 |
다운로드 URL | dcGO 다운로드 |
도구들 | |
웹 | PSnet, sTOL, dcGOR, dcGO Predictor, dcGO 강화 |
dcGO는 단백질 [1]도메인을 위한 포괄적인 온톨로지 데이터베이스입니다.온톨로지 리소스로서 dcGO는 Gene Ontology와 같은 기능 정보부터 효소와 경로에 대한 다른 정보, 주요 모델 유기체의 표현형 정보부터 인간의 질병과 약물에 대한 정보까지 다양한 맥락에서 개방형 바이오메디컬 온톨로지를 통합합니다.단백질 도메인 자원으로서 dcGO는 개별 도메인과 초도메인(즉, 두 개 이상의 연속 도메인 조합) 모두에 대한 주석을 포함한다.
개념
dcGO에는 두 가지 주요 개념이 있습니다.첫 번째 개념은 단백질 도메인을 온톨로지, 예를 들어 Gene Ontology로 라벨링하는 것입니다.그래서 dcGO, 도메인 중심의 유전자 온톨로지라고 불립니다.두 번째 개념은 예를 들어 단백질 기능 예측을 위해 온톨로지 레이블 단백질 도메인을 사용하는 것이다.쉽게 말하면 첫 번째 개념은 dcGO 자원의 작성 방법에 관한 개념이고 두 번째 개념은 dcGO 자원의 사용 방법에 관한 개념입니다.
타임라인
- 2010년, dcGO의 [2]배후에 있는 알고리즘은 SUPERFAILY 데이터베이스의 개량으로서 최초로 공개되었습니다.
- 2011년, 'dcGO 예측 변수'는 Gene Ontology에 [3][4]적용되었을 때 2011 CAFA 대회에서 10위를 차지했다.이 프레딕터는 기계 학습이 없는 도메인 기반 방식일 뿐입니다.
- 2012년, 이 데이터베이스는 NAR 데이터베이스 호에서 공식적으로 공개되었다.
- 2013년에는 웹 서버가 dcGO 리소스를 사용하여 많은 분석을 지원하도록 개선되었습니다.
- 2014년 초, 'dcGO 예측 변수'는 기능과 표현형 예측 모두에 대해 제출되었으며, CAFA 표현형 예측에서 4위를 차지했다.
- 2014년 말, 온톨로지 및 단백질 도메인 주석을 분석하는 데 도움이 되는 오픈 소스 R 패키지 dcGOR이 개발되었다.
웹 서버
dcGO의 최근 용도는 교차학 [5]비교를 위한 기능적 관점에서 도메인 네트워크를 구축하고, 기능 및 [6]표현형에 대한 계통 발생학적 맥락을 제공하기 위해 생물 종(sTOL)과 결합하는 것이다.
소프트웨어
오픈소스 소프트웨어 dcGOR은 R 프로그래밍 언어를 사용하여 개발되어 도메인 [7]중심 온톨로지 및 주석을 분석합니다.지원되는 분석은 다음과 같습니다.
- 광범위한 온톨로지 및 그 도메인 중심 주석을 쉽게 이용할 수 있다.
- 맞춤형 온톨로지 및 주석을 구축할 수 있다.
- 도메인 기반 농축 분석 및 시각화
- 온톨로지 주석에 따른 도메인(유사성) 네트워크 구축.
- 랜덤 워커 알고리즘을 사용하여 컨택트(역학적 유의성) 네트워크를 추정하기 위한 유의성 분석
- 하이 퍼포먼스 병렬 컴퓨팅.
현재 개발 중인 기능은 다음과 같습니다.
- 도메인 중심의 온톨로지 주석을 작성하기 위한 알고리즘 및 구현
- 입력 단백질 도메인 아키텍처에 대한 온톨로지 용어 예측
- 최대우도/소비를 사용하여 조상의 이산 문자를 재구성합니다.
「 」를 참조해 주세요.
레퍼런스
- ^ Fang, H.; Gough, J. (2012). "DcGO: Database of domain-centric ontologies on functions, phenotypes, diseases and more". Nucleic Acids Research. 41 (Database issue): D536–D544. doi:10.1093/nar/gks1080. PMC 3531119. PMID 23161684.
- ^ De Lima Morais, D. A.; Fang, H.; Rackham, O. J. L.; Wilson, D.; Pethica, R.; Chothia, C.; Gough, J. (2010). "SUPERFAMILY 1.75 including a domain-centric gene ontology method". Nucleic Acids Research. 39 (Database issue): D427–D434. doi:10.1093/nar/gkq1130. PMC 3013712. PMID 21062816.
- ^ Fang, H.; Gough, J. (2013). "A domain-centric solution to functional genomics via dcGO Predictor". BMC Bioinformatics. 14 Suppl 3: S9. doi:10.1186/1471-2105-14-S3-S9. PMC 3584936. PMID 23514627.
- ^ Radivojac, P.; Clark, W. T.; Oron, T. R.; Schnoes, A. M.; Wittkop, T.; Sokolov, A.; Graim, K.; Funk, C.; Verspoor, K.; Ben-Hur, A.; Pandey, G.; Yunes, J. M.; Talwalkar, A. S.; Repo, S.; Souza, M. L.; Piovesan, D.; Casadio, R.; Wang, Z.; Cheng, J.; Fang, H.; Gough, J.; Koskinen, P.; Törönen, P.; Nokso-Koivisto, J.; Holm, L.; Cozzetto, D.; Buchan, D. W. A.; Bryson, K.; Jones, D. T.; et al. (2013). "A large-scale evaluation of computational protein function prediction". Nature Methods. 10 (3): 221–227. doi:10.1038/nmeth.2340. PMC 3584181. PMID 23353650.
- ^ Fang, H; Gough, J (2013). "A disease-drug-phenotype matrix inferred by walking on a functional domain network". Molecular BioSystems. 9 (7): 1686–96. doi:10.1039/c3mb25495j. PMID 23462907.
- ^ Fang, H.; Oates, M. E.; Pethica, R. B.; Greenwood, J. M.; Sardar, A. J.; Rackham, O. J. L.; Donoghue, P. C. J.; Stamatakis, A.; De Lima Morais, D. A.; Gough, J. (2013). "A daily-updated tree of (sequenced) life as a reference for genome research". Scientific Reports. 3: 2015. Bibcode:2013NatSR...3E2015F. doi:10.1038/srep02015. PMC 6504836. PMID 23778980.
- ^ Fang, H (2014). "DcGOR: An R package for analysing ontologies and protein domain annotations". PLOS Computational Biology. 10 (10): e1003929. Bibcode:2014PLSCB..10E3929F. doi:10.1371/journal.pcbi.1003929. PMC 4214615. PMID 25356683.