BioCompute 객체

BioCompute Object
BioCompute 객체
약어BCO
상태활성 IEEE 작업 그룹
관련규격공통 워크플로우 언어
면허증BSD-3-폐쇄
웹사이트osf.io/h59uh/


BCO(BioCompute Object) 프로젝트고투과 시퀀싱(HTS - 차세대 시퀀싱 또는 대규모 병렬 시퀀싱이라고도 함)에서 생성된 연산 및 분석을 표준화하고 공유하기 위한 프레임워크를 구축하기 위한 커뮤니티 주도의 이니셔티브다. 이후 프로젝트는 IEEE 2791-2020으로 표준화되었으며, 프로젝트 파일은 오픈 소스 저장소에 보관된다. [1] The July 22nd, 2020 edition of the Federal Register announced that the FDA now supports the use of BioCompute (officially known as IEEE 2791-2020) in regulatory submissions, and the inclusion of the standard in the Data Standards Catalog for the submission of HTS data in NDAs, ANDAs, BLAs, and INDs to CBER, CDER, and CFSAN.

당초 조지워싱턴대식품의약품안전청(FDA)의 협력계약으로 시작된 이 사업은 20여 개 대학, 생명공학회사, 민관협력회사, 세븐브릿지, 하버드 의대 등 제약회사 등이 참여하는 규모로 성장했다.[2] BCO는 FDA, 제약회사, 계약연구기관, 생물정보 플랫폼 제공업체, 학술연구자 등 다양한 기관 간의 HTS 워크플로우 교환을 완화하는 것을 목표로 하고 있다. 규제 제출의 민감한 성격 때문에 자료의 직접적인 참조는 거의 출판할 수 없다. 그러나 이 프로젝트는 현재 FDA 검토자와 관리자가 BCO를 읽고 해석할 수 있도록 교육하기 위한 자금 지원을 받고 있으며, 현재 4개의 간행물이 제출되었거나 거의 제출되어 있다.

배경

생물정보학에서 가장 큰 난제 중 하나는 계산과 그 결과를 동료 검토 또는 신뢰성 있게 재현할 수 있는 방식으로 과학적 작업흐름을 문서화하고 공유하는 것이다.[3] 생물정보 파이프라인은 일반적으로 여러 개의 소프트웨어를 사용하며, 각 소프트웨어에는 일반적으로 사용 가능한 여러 버전, 다중 입력 매개 변수, 다중 출력 및 플랫폼별 구성이 있다. 실험실 프로토콜의 실험 매개변수와 마찬가지로, 계산 매개변수의 작은 변화는 결과의 과학적 타당성에 큰 영향을 미칠 수 있다. BioCompute Framework는 파이프라인의 세부 사항과 사용 방법을 포함하는 BCO를 구축, 디지털 서명 및 공유할 수 있는 객체 지향 설계를 제공한다. BioCompute 개념은 원래 유전체 데이터의 평가, 검증 및 검증을 위한 FDA 규제 연구 및 검토 요구를 충족시키기 위해 개발되었다. 그러나, 바이오컴퍼트 프레임워크는 FAIR 데이터 원칙을[4] 따르고 있으며, 서로 다른 플랫폼, 산업, 과학자 및 규제[5] 기관 간의 통신과 상호운용성을 제공하는 데 광범위하게 사용될 수 있다.

효용

유전체 데이터의 표준화로서 바이오컴퓨팅 오브젝트는 1) 새로운 유전자 실험을 수행하는 학술 연구자, 2) 규제 검토를 위해 FDA에 작업을 제출하고자 하는 제약/바이오텍 회사, 3) 유전자 테스트와 개인화된 의약품을 제공하는 임상 설정(병원 및 실험실)의 3가지 사용자 그룹에 주로 유용하다. 학문적 연구자들의 효용은 실험 데이터를 더 정확하고 불확실성을 적게 가지고 재생산할 수 있는 능력이다. FDA에 작업을 제출하고자 하는 기업들에게 효용성은 효율화된 접근방식이며, 불확실성은 줄이고 작업을 보다 정확하게 재현할 수 있는 능력을 가지고 있다. 임상 설정의 경우 HTS 데이터와 임상 메타데이터를 정확한 방법으로, 이상적으로는 규제 파트너를 포함한 모든 이해관계자가 읽을 수 있는 표준화된 방법으로 전송하는 것이 중요하다.

포맷

BioCompute Object는 json 형식이며 최소한 계산 파이프라인을 평가하거나 확인하는 데 필요한 모든 소프트웨어 버전과 파라미터를 포함하고 있다. 또한 입력 데이터를 파일 또는 링크, 참조 게놈 또는 실행 가능한 도커 구성요소로 포함할 수 있다. BioCompute Object는 Provenance Resource로서 HL7 FHIR와 통합될 수 있다.[6] 또한 CWL(CWL의 공동창업자와의 적극적인 정부 자금후원 공공계약의 일부로서 공동 BCO-CWL에 대한 문서화 및 작성, 예시 등)과 RO를 포함하여 BCO의 보고서 중심 형식을 활용하는 여러 공동 구현도 개발 중에 있다.[7]

BCO 컨소시엄

BioCompute Object 작업 그룹은 다른 이해관계자들이 BCO에 대한 현재 실무에 대한 의견을 제공할 수 있는 수단을 제공한다. 이 실무단은 2017년 규제과학 워크숍 HTS 전산표준 작성 과정에서 구성됐으며, 초기에는 워크숍 참가자로 구성됐다. 컴퓨터 HTS 데이터 처리의 표준화에 있어 모든 관심 있는 커뮤니티의 다양한 이해관계자들 사이의 상호작용의 직접적인 결과로서 BCO 작업 그룹의 지속적인 성장이 있었다. 대학, 민간 게놈 데이터 기업, 소프트웨어 플랫폼, 정부 및 규제 기관 사이에 형성된 민관 협력은 BCO 프로젝트에 신규 개인 또는 기관이 대상의 모범 사례에 대한 논의에 참여할 수 있는 쉬운 진입점이었다.

구현

간단한 R 패키지 바이오컴퍼트는[8] BioCompute Objects를 생성, 검증 및 내보낼 수 있다. Genomics Compliance Suite는 모든 현대적인 텍스트 편집기에서 발견되는 정규 표현식과 유사한 기능을 제공하는 Shiny 앱이다. BioCompute 사양을 구현하는 내부적으로 개발된 오픈 소스 소프트웨어 패키지 및 웹 애플리케이션은 여러 가지가 있으며, 이 중 3개는 공개적으로 액세스할 수 있는 AWS EC2 클라우드에 구축되었다. 여기에는 고성능 통합 가상 환경의 인스턴스, 바이오컴퓨트 포털[9](IEEE-279-2020 표준에 기반한 바이오컴퓨트 오브젝트 생성 및 편집이 가능한 폼 기반 웹 애플리케이션, 바이오컴퓨트 호환 갤럭시 인스턴스 등이 포함된다.

참조

  1. ^ 시모얀 5세, 괴크 J, 마줌더 R. 생체역학 객체—생물 의학 계산의 평가와 검증을 위한 한 단계. PDA 의약 과학 기술 저널. 2017;71(2):1998. doi:10.5731/pdajpst.2016.006734.
  2. ^ "BioCompute Objects specifications to advance genomic data analysis". www.europeanpharmaceuticalreview.com. Retrieved 2017-12-21.
  3. ^ Sandve, Geir Kjetil; Nekrutenko, Anton; Taylor, James; Hovig, Eivind (24 October 2013). "Ten Simple Rules for Reproducible Computational Research". PLOS Computational Biology. 9 (10): e1003285. doi:10.1371/journal.pcbi.1003285. PMC 3812051. PMID 24204232.
  4. ^ Wilkinson, Mark D.; Dumontier, Michel; Aalbersberg, IJsbrand Jan; Appleton, Gabrielle; Axton, Myles; Baak, Arie; Blomberg, Niklas; Boiten, Jan-Willem; Santos, Luiz Bonino da Silva (2016-03-15). "The FAIR Guiding Principles for scientific data management and stewardship". Scientific Data. 3: 160018. doi:10.1038/sdata.2016.18. PMC 4792175. PMID 26978244.
  5. ^ Alterovitz, Gil; Dean, Dennis A.; Goble, Carole; Crusoe, Michael R.; Soiland-Reyes, Stian; Bell, Amanda; Hayes, Anais; King, Charles Hadley H.; Johanson, Elaine; Thompson, Elaine E.; Donaldson, Eric; Tsang, Hsinyi S.; Goecks, Jeremy; Almeida, Jonas S.; Guo, Lydia; Walderhaug, Mark; Walsh, Paul; Kahsay, Robel; Bloom, Toby; Lai, Yuching; Simonyan, Vahan; Mazumder, Raja (21 September 2017). "Enabling Precision Medicine via standard communication of NGS provenance, analysis, and results". bioRxiv: 191783. doi:10.1101/191783 – via www.biorxiv.org.
  6. ^ "Provenance-example-biocompute-object". HL7 FHIR Release 3 (STU).
  7. ^ Soiland-Reyes, Stian (2020-09-01), hive-cwl-examples: Packaging BioCompute Objects using RO-Crate
  8. ^ "CRAN - Package biocompute". cran.r-project.org. Retrieved 2019-11-28.
  9. ^ "BioCompute Portal". github.com/biocompute-objects. Retrieved 2020-06-25.

외부 링크