FAIR 데이터

FAIR data
FAIR 데이터 및 영구 식별자에 대한 소개.
FAIR data principles.jpg

FAIR 데이터는 검색성, 접근성, 상호운용성재사용성[1][2]원칙을 충족하는 데이터입니다.약어와 원칙은 과학자들과 [1]단체들로 구성된 컨소시엄이 2016년 3월 학술지 Scientific Data에 발표한 논문에서 정의되었다.

FAIR 원칙은 기계 작동성(즉, 인간이 전혀 또는 최소한의 개입 없이 데이터를 찾고, 액세스하고, 상호 운용하고, 재사용하는 계산 시스템의 용량)을 강조하는데,[3] 이는 인간이 데이터의 볼륨, 복잡성 및 생성 속도의 증가로 인해 데이터를 처리하기 위해 점점 더 계산 지원에 의존하기 때문이다.

FAIR/O 데이터라는 약어는 해당 데이터 집합이나 데이터베이스가 FAIR 원칙을 준수하고 명시적인 데이터 지원 개방형 라이센스를 수반함을 나타내기 위해 가끔 사용됩니다.

GO FAIR에서 발표한 FAIR 원칙

검색 가능

데이터를 사용하는 첫 번째 단계는 데이터를 찾는 것입니다.메타데이터와 데이터는 인간과 컴퓨터 모두 쉽게 찾을 수 있어야 합니다.머신 판독 가능한 메타데이터는 데이터셋 및 서비스의 자동 검출에 필수적이므로 FAIRifification 프로세스의 필수 컴포넌트입니다.

F1. (Meta) 데이터에는 글로벌하게 일의적이고 영속적인 식별자가 할당되어 있습니다.

F2. 데이터는 풍부한 메타데이터로 기술되어 있습니다(아래의 R1에 정의되어 있습니다.

F3. 메타데이터는 그들이 기술하는 데이터의 식별자를 명확하고 명시적으로 포함한다.

F4. (Meta) 데이터는 검색 가능한 리소스에 등록되거나 색인화됩니다.

액세스 가능

사용자가 필요한 데이터를 찾으면 인증 및 인가포함하여 액세스 방법을 알아야 합니다.

A1. (메타) 데이터는 표준화된 통신 프로토콜을 사용하여 식별자에 의해 검색될 수 있다.

A1.1 프로토콜은 개방적이고 무료이며 보편적으로 구현 가능하다.

A1.2 프로토콜은 필요한 경우 인증 및 인가 절차를 허용한다.

A2. 데이터를 더 이상 사용할 수 없는 경우에도 메타데이터에 액세스할 수 있습니다.

상호 운용 가능

일반적으로 데이터는 다른 데이터와 통합되어야 합니다.또한 데이터는 분석, 저장처리위해 애플리케이션 또는 워크플로우와 상호 운용되어야 합니다.

I1. (Meta) 데이터는 지식 표현에 널리 적용되는 공식적이고 접근 가능한 공유된 언어를 사용합니다.

I2. (메타)데이터는 FAIR 원칙을 따르는 어휘를 사용한다.

I3. (메타) 데이터에는 다른 (메타) 데이터에 대한 정규 참조가 포함됩니다.

재사용 가능

FAIR의 궁극적인 목표는 데이터의 재사용을 최적화하는 것입니다.이를 실현하기 위해서는 메타데이터와 데이터가 서로 다른 설정으로 복제 및/또는 결합될 수 있도록 적절하게 설명되어야 합니다.

R1. (Meta) 데이터는 정확하고 관련성이 높은 복수의 속성으로 풍부하게 기술되어 있다.

R1.1. (Meta) 데이터는 명확하고 접근 가능한 데이터 사용 라이선스와 함께 출시됩니다.

R1.2. (메타) 데이터는 상세한 성과와 관련되어 있습니다.

R1.3. (메타)데이터가 도메인 관련 커뮤니티 표준을 충족합니다.

원칙은 데이터(또는 디지털 객체), 메타데이터(디지털 객체에 대한 정보) 및 인프라스트럭처의 3가지 유형의 엔티티를 말합니다.예를 들어 원칙 F4는 메타데이터와 데이터 모두 검색 가능한 자원(인프라 구성 요소)에 등록 또는 색인화된다고 정의한다.

--

FAIR 데이터 원칙 수용 및 구현

FAIR 이전에는 2007년 [4]논문은 데이터 접근성과 관련된 유사한 아이디어를 논의한 최초의 논문이었습니다.

2016년 G20 항저우 정상회의에서 G20 정상들은 연구에 [5][6]FAIR 원칙을 적용하는 것을 지지하는 성명을 발표했다.

2016년 호주의 한 단체들은 연구 산출물에 대한 원칙을 보다 [7]일반적으로 확장하는 것을 목적으로 한 '호주 연구 산출물에 대한 공정 접근에 관한 성명서(Statement on FAIR Access to Australia's Research Outputs)'를 개발하였다.

2017년 독일, 네덜란드, 프랑스는 FAIR 이니셔티브를 지원하는 국제 사무소인 GO FAIR 국제 지원 조정 사무소를 설립하기로 합의했다[8].

CODATA 또는 Research Data Alliance(RDA)와 같이 연구 데이터 생태계에서 활동 중인 다른 국제 조직도 지역사회에 의한 FAIR 구현을 지원합니다.FAIR 원칙 이행 평가는 RDA의 [9]FAIR 데이터 성숙도 모델 작업 그룹에 의해 검토되고 있으며, CODATA의 전략 데카달 프로그램 "Data for Planet: Makeing decadal programs for demain disks"[10]는 FAIR 데이터 원칙을 데이터 중심 과학의 기본 가능 요소로 언급하고 있다.

"FAIR 데이터 원칙 구현 – 라이브러리의 역할", 가이드

유럽연구도서관협회는 FAIR [11]원칙의 사용을 권고하고 있다.

FAIR 데이터 옹호자들의 2017년 논문에 따르면 FAIR 개념에 대한 인식은 다양한 연구자와 연구소에서 증가하고 있지만, 서로 다른 사람들이 [12]서로 다른 관점을 적용함에 따라 개념에 대한 이해가 혼란스러워지고 있다.

FAIR 데이터 프랙티스 구현 가이드에는 FAIR 데이터 프랙티스를 준수하는 데이터 관리 계획의 비용이 총 연구 [13]예산의 5%여야 한다고 명시되어 있습니다.

2019년 Global Native Data Alliance(GIDA)는 보완 [14]가이드로 CARE Principle for Native Data Governance를 발표했습니다.CARE 원칙은 FAIR 데이터에 요약된 원칙을 집합적 이익, 통제 권한, 책임 및 윤리로 확장하여 데이터 지침이 과거의 맥락과 힘의 차이를 다루도록 보장합니다.네이티브 데이터 거버넌스를 위한 CARE 원칙은 2018년 11월 8일 보츠와나 가보로네에서 열린 국제 데이터 주간 및 리서치 데이터 얼라이언스 본회의 공동 주최 행사 "네이티브 데이터 주권 원칙"에서 초안을 작성했다.

가이드라인을 어떻게 이행할 것인지에 대한 정보가 부족하기 때문에 [15]가이드라인에 대한 해석이 일관되지 않고 있다.

2020년 1월, 전 세계 9개 대학 대표들은 FAIR 데이터에 대한 헌신을 포함한 연구 데이터 [16]권리에 관한 소르본 선언을 제출하고 이를 [17]가능하게 하기 위한 지원을 정부에 요청했다.

2021년에 연구자들은 FAIR 원칙을 데이터 카탈로그 소프트웨어 도구의 개념적 구성요소로서 확인하였고, 다른 구성요소로는 메타데이터 관리, 비즈니스 컨텍스트 및 데이터 책임 [18]역할이 있었습니다.

2022년 4월, Matthias Scheffler와 동료들은 데이터 마이닝과 인공지능[19]데이터에서 유용한 과학 정보를 추출할 수 있도록 FAIR 원칙이 "필수"라고 Nature에서 주장했다.

「 」를 참조해 주세요.

레퍼런스

  1. ^ a b Mark D. Wilkinson; Michel Dumontier; IJsbrand Jan Aalbersberg; et al. (15 March 2016). "The FAIR Guiding Principles for scientific data management and stewardship". Scientific Data. 3 (1): 160018. doi:10.1038/SDATA.2016.18. ISSN 2052-4463. PMC 4792175. PMID 26978244. Wikidata Q27942822.
  2. ^ Annika Jacobsen; Ricardo de Miranda Azevedo; Nick Juty; et al. (31 January 2020). "FAIR Principles: Interpretations and Implementation Considerations". Data Intelligence: 10–29. doi:10.1162/DINT_R_00024. ISSN 2641-435X. Wikidata Q76394974.
  3. ^ "FAIR Principles". GO FAIR. Retrieved 2020-02-16. CC-BY icon.svg 자료는 Creative Commons Attribution 4.0 International License에 따라 제공되는 이 소스로부터 복사되었습니다.
  4. ^ Sandra Collins; Franceoise Genova; Nataly Harrower; Simon Hodson; Sarah Jones; Leif Laaksonen; Daniel Mietchen; Ruta Petrauskaité; Peter Wittenburg (2018년 6월 7일), "EU 위원회 전문가 그룹으로부터의 데이터 실현: Fair 데이터에 관한 중간 보고서, Fair"
  5. ^ G20 leaders (5 September 2016). "G20 Leaders' Communique Hangzhou Summit". europa.eu. European Commission.
  6. ^ "European Commission embraces the FAIR principles – Dutch Techcentre for Life Sciences". Dutch Techcentre for Life Sciences. 20 April 2016.
  7. ^ "Australian FAIR Access Working Group". www.fair-access.net.au. Retrieved 2020-04-03.
  8. ^ Ministerie van Onderwijs, Cultuur en Wetenschap (2017-12-01). "Progress towards the European Open Science Cloud – GO FAIR – News item – Government.nl". www.government.nl (in Dutch). Retrieved 2020-02-15.{{cite web}}: CS1 maint :url-status (링크)
  9. ^ "FAIR Data Maturity Model WG". RDA. 2018-09-23. Retrieved 2020-02-16.
  10. ^ "Decadal Programme – CODATA". www.codata.org. Retrieved 2020-02-16.
  11. ^ Association of European Research Libraries (13 July 2018). "Open Consultation on FAIR Data Action Plan – LIBER". LIBER.
  12. ^ Barend Mons; Cameron Neylon; Jan Velterop; Michel Dumontier; Luiz Olavo Bonino da Silva Santos; Mark D. Wilkinson (7 March 2017). "Cloudy, increasingly FAIR; revisiting the FAIR Data guiding principles for the European Open Science Cloud". Information Services & Use. 37 (1): 49–56. doi:10.3233/ISU-170824. ISSN 0167-5265. Wikidata Q29051495.
  13. ^ Science Europe (May 2016). "Funding research data management and related infrastructures" (PDF).
  14. ^ "CARE Principles of Indigenous Data Governance". Global Indigenous Data Alliance. Retrieved 2019-09-30.
  15. ^ Annika Jacobsen; Ricardo de Miranda Azevedo; Nick Juty; et al. (31 January 2020). "FAIR Principles: Interpretations and Implementation Considerations". Data Intelligence: 10–29. doi:10.1162/DINT_R_00024. ISSN 2641-435X. Wikidata Q76394974.
  16. ^ 연구 데이터 권리에 관한 소르본 선언, 2020년 1월 27일
  17. ^ 오픈 데이터 오픈 액세스보다 '더 큰' '마인드셋 변경' 필요, Times Higher Education, 2020년 1월 31일
  18. ^ Ehrlinger, Lisa; Schrott, Johannes; Melichar, Martin; Kirchmayr, Nicolas; Wöß, Wolfram (2021), Kotsis, Gabriele; Tjoa, A Min; Khalil, Ismail; Moser, Bernhard (eds.), "Data Catalogs: A Systematic Literature Review and Guidelines to Implementation", Database and Expert Systems Applications - DEXA 2021 Workshops, Cham: Springer International Publishing, vol. 1479, pp. 148–158, doi:10.1007/978-3-030-87101-7_15, ISBN 978-3-030-87100-0, retrieved 2022-06-26
  19. ^ Scheffler, Matthias; Aeschlimann, Martin; Albrecht, Martin; Bereau, Tristan; Bungartz, Hans-Joachim; Felser, Claudia; Greiner, Mark; Groß, Axel; Koch, Christoph T.; Kremer, Kurt; Nagel, Wolfgang E. (2022-04-28). "FAIR data enabling new horizons for materials research". Nature. 604 (7907): 635–642. doi:10.1038/s41586-022-04501-x. ISSN 0028-0836.

외부 링크