케플러 과학 워크플로우 시스템
Kepler scientific workflow system안정된 릴리스 | 2.5 / 2015-10-28[1] |
---|---|
저장소 | |
기입처 | 자바 |
운영 체제 | Linux, Mac OS X, Windows |
유형 | 과학적 워크플로우 시스템 |
면허증. | BSD 라이선스 |
웹 사이트 | kepler-project.org |
케플러는 과학적 [2][3][4]워크플로우를 설계, 실행, 재사용, 진화, 보관 및 공유하기 위한 자유 소프트웨어 시스템입니다.케플러의 시설은 프로세스 및 데이터 모니터링, 출토 정보 및 고속 데이터 이동을 제공합니다.일반적으로 워크플로우, 특히 과학적 워크플로우는 노드가 개별 계산 구성요소를 나타내며, 가장자리는 구성요소 [5]간에 데이터와 결과가 흐를 수 있는 경로를 나타내는 방향 그래프입니다.케플러에서, 노드들은 '액터'라고 불리고 모서리는 '채널'이라고 불린다.Kepler는 데스크톱 환경에서 워크플로우를 구성하기 위한 그래피컬 사용자 인터페이스, 명령줄에서 독립적으로 GUI 내에서 워크플로우를 실행하기 위한 런타임 엔진 및 워크플로우 태스크를 컴퓨터 클러스터 또는 컴퓨팅 그리드의 컴퓨팅 노드 간에 분산할 수 있는 분산 컴퓨팅 옵션을 포함합니다.케플러 시스템은 주로 특정한 과학적 분석과 모델링 목표를 지향하는 계산 작업을 구성하기 위한 워크플로우 은유의 사용을 목표로 합니다.따라서, 케플러의 과학적 워크플로우는 일반적으로 과학적 목표를 달성하는 일련의 계산에서 한 단계에서 다른 단계로 이동하는 데이터의 흐름을 모델링합니다.
과학적 워크플로우
과학적 워크플로우는 데이터와 프로세스를 구성 가능한 구조화된 일련의 단계로 결합하여 과학적 문제에 대한 반자동 계산 솔루션을 구현하는 프로세스입니다.과학적 워크플로우 시스템은 종종 그래픽 사용자 인터페이스를 제공하여 다양한 기술과 효율적인 사용 방법을 결합하여 과학자들의 효율성을 높입니다.
과학적 데이터에 대한 접근
케플러는 일반적으로 사용되는 많은 자료 보관소에 보관된 과학적 데이터에 대한 직접적인 접근을 제공합니다.예를 들어, KNB(Knowledge Network for Biocomplexity) 메타캣[6] 서버에 저장된 데이터에 대한 액세스를 제공하고 생태 메타데이터 언어를 사용하여 설명합니다.지원되는 추가 데이터 소스에는 DiGR 프로토콜, OPeNDAP 프로토콜, GridFTP, JDBC, SRB 등을 사용하여 액세스할 수 있는 데이터가 포함됩니다.
계산 모델
케플러는 워크플로우 모델의 구조와 계산 모델을 분리하여 워크플로우 계산의 다른 모델을 주어진 워크플로우 그래프에 결합할 수 있다는 점에서 다른 많은 생물정보학 워크플로우 관리 시스템과 다릅니다.케플러는 동기 데이터 흐름(SDF), 연속 시간(CT), 프로세스 네트워크(PN), 동적 데이터 흐름(DDF) 등 프톨레마이오스 시스템으로부터 몇 가지 공통 계산 모델을 상속받습니다.
계층 워크플로우
케플러는 워크플로우의 계층을 지원하므로 복잡한 작업을 보다 단순한 구성요소로 구성할 수 있습니다.이 기능을 통해 워크플로우 작성자는 다양한 워크플로우에서 사용하기 위해 저장할 수 있는 재사용 가능한 모듈식 구성요소를 작성할 수 있습니다.
워크플로우 의미론
케플러는 온톨로지로부터 도출된 용어를 사용하여 워크플로우 구성요소의 의미적 주석을 위한 모델을 제공합니다.이러한 주석은 향상된 검색 기능, 자동화된 워크플로우 검증, 향상된 워크플로우 편집 [7]등 많은 고급 기능을 지원합니다.
워크플로우 공유
케플러 구성요소는 워크플로우 또는 구성요소를 Java에서 JAR 파일 형식의 확장자인 KAR(Kepler Archive) 파일로 내보내서 공유할 수 있습니다.KAR 파일이 생성되면 동료에게 이메일로 전송되거나 웹 사이트에서 공유되거나 Kepler Component Repository에 업로드될 수 있습니다.구성요소 저장소는 웹 포털과 웹 서비스 인터페이스를 통해 액세스할 수 있는 케플러 워크플로우를 공유하기 위한 중앙 집중식 시스템입니다.사용자는 Kepler Workflow Composition GUI 내에서 저장소의 구성요소를 직접 검색하여 활용할 수 있습니다.
프로벤스
Provenance는 과학자가 결과의 출처를 이해하고 실험을 반복하며 데이터 제품을 [8]도출하는 데 사용된 프로세스를 검증할 수 있도록 하기 때문에 과학 워크플로우에서 중요한 개념입니다.워크플로우를 재생성하려면 데이터의 출처, 데이터의 변경 방법, 사용된 구성 요소와 매개 변수 설정을 나타내는 출처 정보를 기록해야 합니다.이것은 다른 과학자들이 [9]그 결과를 확인하면서 실험을 다시 할 수 있게 해줄 것이다.특히 고급 워크플로우 실행 모델이 단순한 DAG(프로세스 네트워크)[10]를 넘어서는 경우 최종 사용자가 과학적으로 의미 있는 방법으로 프로바이던스 정보를 조회할 수 있도록 현재 시스템에서는 거의 지원되지 않습니다.
케플러의 역사
케플러 프로젝트는 2002년 생태지식을 위한 과학환경(SEEK) 프로젝트와 과학데이터관리(SDM) 프로젝트의 회원들에 의해 만들어졌다.이 프로젝트는 샌타바바라 캘리포니아 대학의 국립생태분석합성센터(NCEAS)와 샌디에이고 캘리포니아 대학의 샌디에이고 슈퍼컴퓨터 센터의 연구자들에 의해 설립되었습니다.Kepler는 UC Berkeley에서 개발된 동시 실시간 임베디드 시스템의 모델링, 시뮬레이션 및 설계를 위한 소프트웨어 시스템인 Ptolemy II를 확장했습니다.다양한 과학 분야의 구성원들이 분석과 모델링을 위한 과학적 워크플로우의 이점을 깨닫고 시스템에 기여하기 시작하면서 케플러에 대한 협업이 빠르게 증가했습니다.2008년 현재, 케플러의 협력자들은 생태학, 분자 생물학, 유전학, 물리학, 화학, 보존 과학, 해양학, 수문학, 도서관 과학, 컴퓨터 과학 등을 포함한 많은 과학 분야 출신이다.Kepler는 작업 흐름을 훨씬 쉽게 만드는 데 사용되는 작업 흐름 조정 엔진입니다.
「 」를 참조해 주세요.
- 아파치 터버나
- 디스커버리 넷
- VisTrails(비주얼트레일)
- LONI 파이프라인
- 생물정보학 워크플로우 관리 시스템
- Data ONE Investigator 툴킷
레퍼런스
- ^ https://kepler-project.org/users/whats-new/kepler-2.5-released[데드링크]
- ^ Ludéscher B., Altintas I., Berkley C., Higgins D., Jaeger-Frank E., Jones M., Lee E., Tao J., Zhao Y. 2006.과학적 워크플로우 관리 및 케플러 시스템.특별호:그리드 시스템의 워크플로우.동시성과 계산: 연습과 경험 18(10): 1039-1065.
- ^ Altintas I, Berkley C, Jaeger E, Jones M, Ludéscher B, Mock S. 2004.케플러:과학 워크플로우의 설계 및 실행을 위한 확장 가능한 시스템입니다.그리드 데이터 환경의 미래 절차, 글로벌 그리드 포럼 10.
- ^ a b 미치너, 윌리엄 K, 제임스 H. 비치, 매튜 B.존스, 버트람 루다셰르, 디아나 D페닝턴, 리카르도 S페레이라, 아르콧 라자세카르, 마크 실다우어.2007. '생물다양성과 생태과학에 관한 지식환경', 인텔리전트 정보시스템 저널, 29(1): 111-126.doi: 10.1007/s10844-006-0034-8
- ^ 테일러, I.J.; 딜먼, E.; 간논, D.B.;Shields, M. (Eds.) , "e-Science용 워크플로우:그리드에 대한 과학적 워크플로우", 530 페이지, 스프링거. ISBN978-1-84628-519-6.
- ^ 존스, 매튜 B., C. 버클리, J. 보질로바, M. 쉴드하우어2001. 과학적 메타데이터 관리.IEEE 인터넷 컴퓨팅 5(5): 59~68.
- ^ 버클리, 채드, 숀 바우어스, 매튜 B2005년 Jones, Bertram Ludaescher, Mark Schildhauer, Jing Tao.Scientific Workflow Authoring에 의미론 통합.제17회 과학 및 통계 데이터베이스 관리 국제회의.IEEE 컴퓨터 협회
- ^ "Archived copy". Archived from the original on 2008-07-06. Retrieved 2009-04-06.
{{cite web}}
: CS1 maint: 제목으로 아카이브된 복사(링크) - ^ http://www.adambarker.org/papers/ppam08.pdf[베어 URL PDF]
- ^ 숀 바우어스, 티모시 맥필립스, 버트람 루다셔, 셜리 코헨, 수잔 B데이비드슨 2006.파이프라인 과학 워크플로우에서 사용자 지향 데이터 입증 모델.
외부 링크
- 케플러 프로젝트 웹사이트
- 케플러 컴포넌트
- 프톨레마이오스 2세 프로젝트 웹사이트
- KNB(Knowledge Network for Biocomplexity) 데이터 아카이브
- Data ONE 웹 사이트의 워크플로우와 관련된 소프트웨어[permanent dead link] 도구 목록