OBO 주조 공장

OBO Foundry
OBO 주조 공장
초점생물의학 온톨로지의 즉흥적 발현황
회원들
27
주요인
수잔나 루이스, 배리 스미스, 마이클 애슈버너
웹사이트obofoundry.org

OBO(Open Biological and Biomedical Ontology) Foundry생명과학과 관련된 온톨로지를 구축하고 유지하기 위해 헌신하는 사람들의 모임이다.[1]OBO Foundry는 생체 의학 영역에서 상호운용 가능한 참조 온톨로지 제품군을 만들기 위한 온톨로지 개발에 대한 일련의 원칙을 수립한다.현재 OBO Foundry 원칙을 따르는 온톨로지는 100개가 넘는다.null

OBO Foundry의 노력은 생물학적 정보학에서 생물학적 결과를 보다 쉽게 통합하고 분석을 수행할 수 있도록 한다.그것은 서로 다른 연구 분야와 그 상호연결(예: 마우스 모델의 표현형 및 제브라피쉬의 관련 표현형)에 대한 구조적 참조를 제공함으로써 그렇게 한다.[2]null

소개

Foundry 이니셔티브는 생명과학의 데이터 통합을 개선하는 것을 목표로 한다.통합에 대한 한 가지 접근방식은 통제된 어휘를 사용하여 다른 출처의 데이터를 주석하는 것이다.이상적으로, 그러한 통제된 어휘들은 온톨로지의 형태를 취하는데, 이것은 어휘의 용어를 사용하여 주석을 단 데이터에 대한 논리적 추론을 지원한다.null

특히 OBO Foundry의 일부인 Gene Ontology Consortium의 작업을 통해 바이오의학 영역에서 개념의 공식화를 알 수 있다.이를 통해 온톨로지 개발에 있어 제안된 모범 사례의 특정 원칙을 개발하게 되었으며, OBO Foundry 이니셔티브를 통해 현재 오픈 바이오메디컬 온톨로지 컨소시엄의 틀 안에서 실천에 옮기고 있다.OBO 온톨로지는 National Center for Biomedical Ontology의 자원의 일부를 형성하며, 여기서 그들은 NCBO의 BioPortal의 중심 구성요소를 형성한다.null

생물학적 및 생물학적 온톨로지 오픈

OBO(Open Biological and Biomedical Ontories, 이전 Open Biomedical Ontories)는 생물학적 및 의료적 영역에서 사용하기 위한 온톨로지(제어 어휘)를 만들기 위한 노력이다.원본 OBO 온톨로지의 하위집합은 OBO Foundry를 시작했으며, OBO는 2007년부터 OBO 노력을 주도하고 있다.[1]null

2001년에 OBO가 탄생한 것은 주로 Gene Ontology 프로젝트의 노력에 힘입은 바가 크다.[3]OBO는 미국 국립 생물의학 온톨로지 센터(NCB)의 자원의 일부를 구성한다.IO) 및 NCBO의 BioPortal의 중심 요소.OBO Foundry가 주도하는 이니셔티브다.null

참여규칙

OBO Foundry는 관심 있는 모든 개인이 참여할 수 있다.공식적으로 OBO Foundry에 참여하고자 하는 온톨로지는 "Foundry 코디네이터가 저널 편집자의 아날로그 역할을 할 때" OBO 원칙을 준수하고 구성원의 일련의 검토를 통과해야 한다.[1]독수리-i의 시약 응용 온톨로지처럼 OBO 원리를 따르지만 공식적으로 OBO의 일부가 아닌 온톨로지가 있다.[4]그리고 컨텍스트 온톨로지에서의 동물들.[5]null

후보 온톨로지를 표준화하기 위한 단계로 ToClean의 강성 이론 OBO와의 통합이 제안되었다.이러한 통합은 지원자를 자동으로 검사할 수 있는 소프트웨어를 쉽게 개발할 수 있게 해줄 것이다.[6]null

도구들

OBO Foundry 커뮤니티는 또한 온톨로지의 생성과 유지를 용이하게 하는 도구를 개발하는 데 전념하고 있다.OBO의 대부분의 온톨로지 개발자들은 온톨로지 구축에 프로토제 온톨로지 편집기와 웹 온톨로지 언어(OWL)를 사용한다.OBO Foundry는 온톨로지의 명령행 관리를 프로토제 및 올빼미 호환 형식으로 용이하게 하기 위해 도구 ROBOT(로봇은 OBO Tool)를 개발했다.ROBOT는 온톨로지 개발의 일상적인 작업에 대한 기능을 집계하고 오픈 소스로서, 명령줄을 통해 또는 자바 가상 머신의 모든 언어에 대한 라이브러리로 사용할 수 있다.[7]null

OBO 노력과 관련된 다른 도구는 Gene Ontology Consortium에서 자금을 지원하는 온톨로지 편집자 겸 추리자[8]OBO-Edit이다.반자동 온톨로지 발전기 DOG4DAG와 같이 온톨로지 개발을 촉진하는 OBO-Edit용 플러그인도 있다.[9]

OBO 파일 형식

OBO 파일 형식은 온톨로지를 구축하기 위한 생물 중심 언어다.웹 온톨로지 언어(Web Ontology Language, OWL)의 원리에 근거한다.null

커뮤니티의 노력으로 OBO(Open Biomedical Ontology) 형식과 OBWI(Open Biomedical Ontology) 형식 간의 무손실 왕복 변환을 위한 표준 공통 매핑이 만들어졌다.[10][11]이 연구에는 시멘틱 웹 스택과 유사하게 OBO용 레이어 케이크와 OBO의 각 구성물에 대한 체계적 검토가 포함되어 있다.[12]null

OBO Foundry Ontology

OBO Foundry ontologies의 초기 세트 성숙한 ontologies에 의해(그 진 온톨로지, 가, 그리고 Foundational 모형 해부학의, FMAO 같은), 이전의 기존 ontologies(전 남편:CellOntology,[13]CL, GO와 FMAO에 다른 전용 ontologies,[14][15]및 관련 부품으로 구성되어)의 인수와 새로운 ontolog의 발달로 인해에 의해서 작곡되었다.ies에 따라[16]주의null

원래의 온톨로지 세트는 또한 Zebrafish Anatomical Ontology[17] (Zebrafish Information Network의 일부분), Chebrafish Ontology, Disease Ontology, Plant Ontology, Sequence Ontology, 생물 의학 조사를 위한 온톨로지, 단백질 온톨로지 등을 포함했다.[16]null

OBO에서 온톨로지의 수는 수백 개까지 증가했으며, 그것들은 OBO Foundry 온톨로지의 목록에 모아져 있다.null

OBO 주조 공장 및 Wikidata

Wikidata 지식 그래프에도 다양한 OBO Foundry 온톨로지가 통합되었다.[18][19]이는 OBO 구조화된 온톨로지를 비 OBO 데이터베이스의 다른 데이터로 통합하는 결과를 가져왔다.예를 들어, 위키다타에 대한 인간 질병 온톨로지[20] 통합은 자원 셀로사우루스세포선 설명에 대한 연계를 가능하게 했다.[21]OBO Foundry를 Wikidata에 통합하는 목표 중 하나는 비온톨로지가 온톨로지에 기여하고 사용할 수 있는 장벽을 낮추는 것이었다.위키다타는 전통적인 온톨로지 모델(높은 수준의 구체적인 전문지식이 필요한 모델)보다 이해와 이용이 거의 더 쉽다.[22]null

원칙

OBO 호환 생명과학 온톨로지 개발을 위한 OBO 주조 공장 원칙[23] 요약:

오프니스

온톨로지는 공개적으로 이용가능하며, CC-BY 3.0 또는 CC0(공용 도메인) 아래에서 공개되어야 한다.[24]예를 들어, 온톨로지의 개방성은 Gene Ontology(OBO 원칙을 따르는 온톨로지 중 하나)에서 Wikidata 프로젝트로 용어를 가져올 수 있게 했다.[25]null

공통형식

온톨로지는 공통의 공식 언어로 이용 가능해야 한다.실제로, 이는 OBO 주조 공장의 일부인 온톨로지가 상호운용성을 극대화하기 위해 RDF/XML 구문을 사용하여 OWL/OWL2 또는 OBO 형식을 해제하는 항목을 설명해야 함을 의미한다.[26]null

직교성

각 항목에 고유한 OBO ID에서 OBO URI([10]Unified Resource Identifier)로 매핑.

용어는 OBO 공간에서 고유해야 하며, 이는 각 항목이 고유한 온톨로지 접두사(CHEBI, GO, PRO 등)와 온톨로지 내에 로컬 숫자 식별자를 가지고 있다는 것을 의미한다.[27]자원의 유지와 진화를 개선하기 위해 숫자 ID를 선택했다.[28]OBO Foundry에 참여하기 위해서는 온톨로지가 직교해야 하며, 온톨로지가 OBO 내에서 모델화되는 개념은 고유해야 하므로 각 개념은 단일 URI(Uniform Resource Identifier)를 가지고 있다.새로운 온톨로지는 다른 노력에서 수행된 작업을 재사용한다.[28]null

용어의 고유성과 상호운용성의 이상에도 불구하고, 실제로 이것은 시행하기가 어려워서 용어 중복이 발생하게 된다.더욱이 일부 온톨로지는 용어를 재사용하거나 부적절하게 재사용하지 않는다.[29]null

버전 지정

온톨로지는 그들의 특정 영역에 대한 지식의 진보에 따라 개념과 설명을 정제하면서 시간에 따라 진화한다.[30]OBO는 새로운 버전이 업데이트되지만 이전 버전의 온톨로지를 사용하는 툴은 여전히 작동하고 있음을 보장하기 위해 버전 관리 시스템 시스템을 시행하는데, 각 온톨로지 버전은 날짜나 번호 지정 시스템, 메타데이터 dag 등의 형식으로 고유한 식별자를 수신한다.[31]null

범위

온톨로지는 명확하게 명시된 범위(그 범위를 포함하려는 도메인)를 가져야 한다.[32]null

텍스트 정의 포함

온톨로지는 사람이 읽을 수 있는 방식으로 각 항목에 대한 텍스트 정의를 가져야 한다.즉, 각 항목에 대한 영숫자 식별 외에 존재론 내에서 고유한 방식으로 아리스토텔레스 논리에 따른 논리적 확언에 의해 자연어로 기술되어야 한다는 것을 의미한다.[33]null

표준화된 관계 및 관련 온톨로지(RO)

온톨로지는 RO(Relationship Ontology)의 항목들 사이의 관계를 사용해야 한다.이를 통해 서로 다른 온톨로지가 원활하게 통합될 수 있으며, 이는 논리적 추론에 특히 중요하다.[34]null

RO(Relative Ontology)는 서로 다른 생물의학 개념들 사이의 관계를 나타내도록 고안된 온톨로지다.[35]많은 OBO Foundry 온톨로지에 의해 재사용되는 "part_of", "location_in" 및 "preced_by"와 같은 관계를 엄격하게 설명한다.null

문서화

OBO 온톨로지를 철저히 문서화할 필요가 있다.이러한 작업은 특정 온톨로지에 대한 GitHub 저장소를 통해 자주 이루어진다(OBO Foundry 온톨로지의 목록 참조).[36]null

사용자 복수성

온톨로지는 여러 사람에게 유용해야 하며 온톨로지 개발자는 사용 증거를 문서화해야 한다.이 기준은 검토 과정에 중요하다.사용 예로는 다른 온톨로지에 의한 용어와 연결, 의미 웹 프로젝트에서의 사용, 주석 또는 기타 연구 애플리케이션에서의 사용을 들 수 있다.[37]null

협업에 대한 개방성

온톨로지는 다른 OBO Foundry 회원들과 협력할 수 있는 방식으로 개발되어야 한다.[38]null

권위의 로쿠스

온톨로지는 공동체와의 상호작용을 매개하는 온톨로지를 담당하는 한 사람을 두어야 한다.[39]null

명명 규칙

OBO 온톨로지 명명 규칙은 기본 라벨을 온톨로지 내부(그리고 가급적 OBO 내부) 내에서 명확하고 고유한 것으로 만드는 것을 목표로 한다.라벨과 동의어는 밑줄낙타 케이스를 사용하지 않고 영어로 작성해야 한다.[40]OBO는 여러 시스템에서 라벨을 허용하는 위키다타와는 대조적으로 다국어 지원을 위한 메커니즘이 부족하다.OBO의 이름 지정 시스템은 현재 온톨로지의 이름 지정 규칙을 분류할 때 일련의 조사를 기반으로 하며, 이러한 규칙과 관련된 문제를 발견한다.[41]null

유지 관리

온톨로지는 과학적 합의의 변화와 관련하여 갱신되어야 한다.OBO Foundry는 과학적 합의를 "1년에 걸쳐 독립 연구소에 의한 복수의 간행물도 같은 결론에 도달하고, 같은 시기에 발표된 의견에는 이의(<10%)이 없거나 제한적으로 존재한다"[42]고 정의한다.null

참고 항목

참조

  1. ^ a b c Smith B, Ashburner M, Rosse C, Bard J, Bug W, Ceusters W, et al. (November 2007). "The OBO Foundry: coordinated evolution of ontologies to support biomedical data integration". Nature Biotechnology. 25 (11): 1251–5. doi:10.1038/nbt1346. PMC 2814061. PMID 17989687.
  2. ^ Mungall, Christopher J; Gkoutos, Georgios V; Smith, Cynthia L; Haendel, Melissa A; Lewis, Suzanna E; Ashburner, Michael (2010). "Integrating phenotype ontologies across multiple species". Genome Biology. 11 (1): R2. doi:10.1186/gb-2010-11-1-r2. ISSN 1465-6906. PMC 2847714. PMID 20064205.
  3. ^ Shimoyama, Mary; Dwinell, Melinda; Jacob, Howard (2009-08-05). "Multiple Ontologies for Integrating Complex Phenotype Datasets". Nature Precedings. doi:10.1038/npre.2009.3554. ISSN 1756-0357.
  4. ^ Brush MH, Vasilevsky N, Torniai C, Johnson T, Shaffer C, Haendel M (2011). "Developing a reagent application ontology within the OBO foundry framework". CEUR Workshop Proceedings. 833: 234–236.
  5. ^ Santamaria SL (2012). Development the Animals in Context ontology (PDF). Proceedings of the International Conference on Biomedical Ontology. Graz.
  6. ^ Seyed, Patrice, and Stuart C. Shapiro. (2011). Applying Rigidity to Standardizing OBO Foundry Candidate Ontologies (PDF). Proceedings of the International Conference on Biomedical Ontology (CEUR 993).{{cite conference}}: CS1 maint : 복수이름 : 작성자 목록(링크)
  7. ^ Jackson RC, Balhoff JP, Douglass E, Harris NL, Mungall CJ, Overton JA (July 2019). "ROBOT: A Tool for Automating Ontology Workflows". BMC Bioinformatics. 20 (1): 407. doi:10.1186/s12859-019-3002-3. PMC 6664714. PMID 31357927.
  8. ^ Day-Richter J, Harris MA, Haendel M, Lewis S (August 2007). "OBO-Edit--an ontology editor for biologists". Bioinformatics. 23 (16): 2198–200. doi:10.1093/bioinformatics/btm112. PMID 17545183.
  9. ^ Wächter T, Schroeder M (June 2010). "Semi-automated ontology generation within OBO-Edit". Bioinformatics. 26 (12): i88-96. doi:10.1093/bioinformatics/btq188. PMC 2881373. PMID 20529942.
  10. ^ a b Tirmizi, Syed; Aitken, Stuart; Moreira, Dilvan A; Mungall, Chris; Sequeda, Juan; Shah, Nigam H; Miranker, Daniel P (2011). "Mapping between the OBO and OWL ontology languages". Journal of Biomedical Semantics. 2 (Suppl 1): S3. doi:10.1186/2041-1480-2-s1-s3. ISSN 2041-1480. PMC 3105495. PMID 21388572.
  11. ^ Golbreich, Christine; Horridge, Matthew; Horrocks, Ian; Motik, Boris; Shearer, Rob (2007), "OBO and OWL: Leveraging Semantic Web Technologies for the Life Sciences", The Semantic Web, Springer Berlin Heidelberg, vol. 4825, pp. 169–182, Bibcode:2007LNCS.4825..169G, doi:10.1007/978-3-540-76298-0_13, ISBN 978-3-540-76297-3
  12. ^ Antezana, E.; Egana, M.; De Baets, B.; Kuiper, M.; Mironov, V. (2008). "ONTO-PERL: An API for supporting the development and analysis of bio-ontologies". Bioinformatics. 24 (6): 885–887. doi:10.1093/bioinformatics/btn042. PMID 18245124.
  13. ^ Diehl, Alexander D.; Meehan, Terrence F.; Bradford, Yvonne M.; Brush, Matthew H.; Dahdul, Wasila M.; Dougall, David S.; He, Yongqun; Osumi-Sutherland, David; Ruttenberg, Alan; Sarntivijai, Sirarat; Van Slyke, Ceri E. (2016-07-04). "The Cell Ontology 2016: enhanced content, modularization, and ontology interoperability". Journal of Biomedical Semantics. 7 (1): 44. doi:10.1186/s13326-016-0088-7. ISSN 2041-1480. PMC 4932724. PMID 27377652.
  14. ^ Bard, Jonathan; Rhee, Seung Y.; Ashburner, Michael (2005-01-14). "An ontology for cell types". Genome Biology. 6 (2): R21. doi:10.1186/gb-2005-6-2-r21. ISSN 1474-760X. PMC 551541. PMID 15693950.
  15. ^ Kelso, J. (2003-05-12). "eVOC: A Controlled Vocabulary for Unifying Gene Expression Data". Genome Research. 13 (6): 1222–1230. doi:10.1101/gr.985203. ISSN 1088-9051. PMC 403650. PMID 12799354.
  16. ^ a b Smith, Barry; Ashburner, Michael; Rosse, Cornelius; Bard, Jonathan; Bug, William; Ceusters, Werner; Goldberg, Louis J; Eilbeck, Karen; Ireland, Amelia; Mungall, Christopher J; Leontis, Neocles (November 2007). "The OBO Foundry: coordinated evolution of ontologies to support biomedical data integration". Nature Biotechnology. 25 (11): 1251–1255. doi:10.1038/nbt1346. ISSN 1087-0156. PMC 2814061. PMID 17989687.
  17. ^ Van Slyke, Ceri E.; Bradford, Yvonne M.; Westerfield, Monte; Haendel, Melissa A. (2014-02-25). "The zebrafish anatomy and stage ontologies: representing the anatomy and development of Danio rerio". Journal of Biomedical Semantics. 5 (1): 12. doi:10.1186/2041-1480-5-12. ISSN 2041-1480. PMC 3944782. PMID 24568621.
  18. ^ Waagmeester, Andra; Stupp, Gregory; Burgstaller-Muehlbacher, Sebastian; Good, Benjamin M; Griffith, Malachi; Griffith, Obi L; Hanspers, Kristina; Hermjakob, Henning; Hudson, Toby S; Hybiske, Kevin; Keating, Sarah M (2020-03-17). Rodgers, Peter; Mungall, Chris (eds.). "Wikidata as a knowledge graph for the life sciences". eLife. 9: e52614. doi:10.7554/eLife.52614. ISSN 2050-084X. PMC 7077981. PMID 32180547.
  19. ^ Turki, Houcemeddine; Shafee, Thomas; Hadj Taieb, Mohamed Ali; Ben Aouicha, Mohamed; Vrandečić, Denny; Das, Diptanshu; Hamdi, Helmi (2019-11-01). "Wikidata: A large-scale collaborative ontological medical database". Journal of Biomedical Informatics. 99: 103292. doi:10.1016/j.jbi.2019.103292. ISSN 1532-0464. PMID 31557529.
  20. ^ Schriml, Lynn M.; Mitraka, Elvira; Munro, James; Tauber, Becky; Schor, Mike; Nickle, Lance; Felix, Victor; Jeng, Linda; Bearer, Cynthia; Lichenstein, Richard; Bisordi, Katharine (2019-01-08). "Human Disease Ontology 2018 update: classification, content and workflow expansion". Nucleic Acids Research. 47 (D1): D955–D962. doi:10.1093/nar/gky1032. ISSN 0305-1048. PMC 6323977. PMID 30407550.
  21. ^ "HeLa". www.wikidata.org. Retrieved 2020-05-04.
  22. ^ Jacobsen, Annika; Waagmeester, Andra; Kaliyaperumal, Rajaram; Stupp, Gregory S.; M. Schriml, Lynn; Thompson, Mark; I. Su, Andrew; Roos, Marco (2018-12-04). "Wikidata as an intuitive resource towards semantic data modeling in data FAIRification". Figshare. doi:10.6084/m9.figshare.7415282.v2.
  23. ^ "Overview". obofoundry.org. Retrieved 2020-02-06.
  24. ^ "Open (principle 1)". obofoundry.org. Retrieved 2020-02-06.
  25. ^ Burgstaller-Muehlbacher S, Waagmeester A, Mitraka E, Turner J, Putman T, Leong J, et al. (2016-01-01). "Wikidata as a semantic framework for the Gene Wiki initiative". Database. 2016: baw015. doi:10.1093/database/baw015. PMC 4795929. PMID 26989148.
  26. ^ "Common Format (principle 2)". obofoundry.org. Retrieved 2020-02-06.
  27. ^ "URI/Identifier Space (principle 3)". obofoundry.org. Retrieved 2020-02-06.
  28. ^ a b Courtot M, Mungall C, Brinkman RR, Ruttenberg A (2010). Building the OBO Foundry-One Policy at a Time. CEURS Proceedings: International Conference on Biomedical Ontologies.
  29. ^ Ghazvinian A, Noy NF, Musen MA (May 2011). "How orthogonal are the OBO Foundry ontologies?". Journal of Biomedical Semantics. 2 Suppl 2 (Suppl 2): S2. doi:10.1186/2041-1480-2-s2-s2. PMC 3102891. PMID 21624157.
  30. ^ Groß, Anika; Pruski, Cédric; Rahm, Erhard (2016). "Evolution of biomedical ontologies and mappings: Overview of recent approaches". Computational and Structural Biotechnology Journal. 14: 333–340. doi:10.1016/j.csbj.2016.08.002. ISSN 2001-0370. PMC 5018063. PMID 27642503.
  31. ^ "Versioning (principle 4)". obofoundry.org. Retrieved 2020-02-06.
  32. ^ "Scope (principle 5)". obofoundry.org. Retrieved 2020-02-06.
  33. ^ "Textual Definitions (principle 6)". obofoundry.org. Retrieved 2020-02-06.
  34. ^ "Relations (principle 7)". obofoundry.org. Retrieved 2020-02-06.
  35. ^ Smith, Barry; Ceusters, Werner; Klagges, Bert; Köhler, Jacob; Kumar, Anand; Lomax, Jane; Mungall, Chris; Neuhaus, Fabian; Rector, Alan L; Rosse, Cornelius (2005). "Relations in biomedical ontologies". Genome Biology. 6 (5): R46. doi:10.1186/gb-2005-6-5-r46. PMC 1175958. PMID 15892874.
  36. ^ "Documentation (principle 8)". obofoundry.org. Retrieved 2020-02-06.
  37. ^ "Documented Plurality of Users (principle 9)". obofoundry.org. Retrieved 2020-02-06.
  38. ^ "Commitment To Collaboration (principle 10)". obofoundry.org. Retrieved 2020-02-06.
  39. ^ "Locus of Authority (principle 11)". obofoundry.org. Retrieved 2020-02-06.
  40. ^ "Naming Conventions (principle 12)". obofoundry.org. Retrieved 2020-02-06.
  41. ^ Schober, Daniel; Smith, Barry; Lewis, Suzanna E; Kusnierczyk, Waclaw; Lomax, Jane; Mungall, Chris; Taylor, Chris F; Rocca-Serra, Philippe; Sansone, Susanna-Assunta (2009). "Survey-based naming conventions for use in OBO Foundry ontology development". BMC Bioinformatics. 10 (1): 125. doi:10.1186/1471-2105-10-125. ISSN 1471-2105. PMC 2684543. PMID 19397794.
  42. ^ "Maintenance (principle 16)". obofoundry.org. Retrieved 2020-02-06.

외부 링크