데이터 공유

Data sharing
데이터 공유 여부 및 방법은 종종 연구자에게 달려 있습니다.

데이터 공유는 학술적 연구에 사용되는 데이터를 다른 연구자가 사용할 수 있도록 하는 관행입니다.투명성과 개방성이 과학적 방법의 일부로 간주되기 때문에 많은 자금 조달 기관,[1] 기관 및 출판 장소는 데이터 공유에 관한 정책을 가지고 있다.

많은 자금 조달 기관과 과학 저널은 동료 검토 논문의 작성자에게 공개된 연구를 이해, 개발 또는 재생산하는 데 필요한 보충 정보(원시 데이터, 통계 방법 또는 소스 코드)를 공유하도록 요구한다.많은 과학적 연구에는 데이터 공유 요건이 적용되지 않으며, 이러한 정책 중 상당수는 자유로운 예외를 두고 있습니다.구속력 있는 요건이 없는 경우, 데이터 공유는 과학자 자신의 재량에 달려 있습니다.또한 특정 상황에서는[2] 정부 및 기관이 독점적 이익, 국가 보안 및 대상/환자/피해자의 기밀성을 보호하기 위해 데이터 공유를 금지하거나 엄격하게 제한합니다.또한 기관과 과학자가 정치적 목적으로 데이터를 사용하지 못하도록 데이터 공유를 제한할 수도 있습니다.

자료 및 방법은 출판 후 수년 후에 저자에게 요청할 수 있다.데이터[3] 공유를 장려하고 데이터의 손실이나 손상을 방지하기 위해 많은 자금 조달 기관과 저널이 데이터 아카이브에 대한 정책을 수립했습니다.공개 아카이브된 데이터에 대한 접근은 통신 및 정보기술의 기술적 진보에 의해 가능해진 과학 역사의 최근 발전이다.현대의 신속한 커뮤니케이션을 최대한 활용하려면 각각의 기여에 대한 상호 인정의 기초가 되는 기준에 대한 합의된 합의가 필요할 수 있다.긴급 감염병 위협에 보다 효과적으로 대응하기 위해 데이터의 적시 공유를 개선한 것으로 인정된 모델에는 GISAID [4][5]이니셔티브에 의해 도입된 데이터 공유 메커니즘이 포함된다.

데이터 공유 및 아카이브에 대한 정책에도 불구하고 데이터 보류는 여전히 발생합니다.작성자가 데이터 아카이브에 실패하거나 데이터의 일부만 아카이브할 수 있습니다.데이터만 아카이브할 수 없다고 해서 데이터가 보류되는 것은 아닙니다.연구자가 추가 정보를 요청하면 저자가 [6]제공하기를 거부하는 경우가 있다.저자들이 이런 자료를 보류하면 과학계의 [7]신뢰를 잃을 위험이 있다.2022년 연구에서는 데이터를 이용할 수 있다는 문장이 포함된 약 3500개의 연구 논문을 확인했지만, 요청과 추가 데이터 찾기에 따라 94%의 [8]논문에 사용할 수 없는 것으로 나타났다.

데이터 공유는 또한 소셜 미디어 플랫폼에서 개인 정보를 공유하는 것을 나타낼 수도 있습니다.

미국 정부의 정책

연방법

2007년 8월 9일 부시 대통령은 민간 연방기관이 정부기관 간 데이터 및 연구의 개방적 교환을 촉진하고 최적화하기 위해 가이드라인, 정책 및 절차를 제공하도록 요구하는 America Creating Opportunities Act(또는 "기술, 교육, 과학 분야의 우수성을 의미 있게 촉진하는 미국의 기회 창출법")에 서명했다.s, 공공 및 정책 입안자.섹션 1009를 [9]참조하십시오.

NIH 데이터 공유 정책

'미국 국립보건원(NIH) 보조금 정책 성명'은 "데이터"를 기록할 수 있는 형식이나 매체에 관계없이 기록된 정보"로 정의하며, 문서, 영화, 녹음, 그림 복제, 도면, 디자인 또는 기타 그래픽 표현, 절차 매뉴얼, 양식, 다이어그램, 작업 흐름도, e를 포함한다.인용 설명, 데이터 파일, 데이터 처리 또는 컴퓨터 프로그램(소프트웨어), 통계 기록 및 기타 연구 데이터."’

--

NIH 연구 데이터 공유 최종 성명에는 다음과 같이 기재되어 있습니다.

'NIH는 데이터 공유의 개념에 대한 지지를 재확인합니다.'연구 결과를 지식, 제품, 절차로 신속하게 변환하여 인간의 건강을 향상시키기 위해서는 데이터 공유가 필수적이라고 생각합니다.NIH는 이러한 중요한 과학적 목표를 달성하기 위해 최종 연구 데이터를 공유하는 것을 지지한다.NIH는 NIH가 지원하는 연구의 최종 연구 데이터를 다른 연구자가 사용할 수 있도록 시기적절하게 공개하고 공유할 수 있도록 지원하고 있다.'NIH는 데이터를 수집하는 조사관들이 시간과 노력을 투자함으로써 이익을 얻는 데 정당한 관심을 가지고 있다는 것을 인식하고 있습니다.'따라서 우리는 최종 데이터 집합에서 주요 조사 결과를 공개하기 위해 늦어도 수락할 때까지 "적시 공개 및 공유"에 대한 정의를 수정했다.NIH는 최초 조사자들이 최초에 계속 사용할 경우 이익을 얻을 수 있지만 장기간 독점적으로 사용할 경우 이익을 얻을 수 없을 것으로 계속 기대하고 있다.'

--

일반 조건 부여로부터의 NSF 정책

36. 조사결과, 데이터 및 기타 연구제품 공유

a. NSF …조사자는 작업 과정에서 생성되거나 수집된 데이터, 샘플, 물리적 수집 및 기타 보조 자료를 합리적인 시간 내에 추가 비용으로 다른 연구자와 공유해야 합니다.또한 수상자가 소프트웨어 및 발명을 공유하거나, 소프트웨어 및 발명이 구현한 혁신을 폭넓게 유용하고 유용하게 사용할 수 있도록 행동하도록 장려합니다.

b. 개인 및 주체의 권리, 결과의 유효성 또는 수집의 무결성을 보호하거나 조사관의 정당한 이익을 수용하기 위해 조정 및 예외(필수인 경우)를 허용할 수 있다.

--

연구청렴실

의학 연구의 부정행위에 대한 혐의는 심각한 결과를 초래한다.미국 보건복지부는 데이터 원천징수를 포함한 부정행위 혐의에 대한 조사를 감독하기 위해 사무소를 설치했다.웹사이트에서 미션을 정의합니다.

"Office of Research Integrity(ORI; 연구 무결성)는 전 세계 약 4,000개 기관에서 미국 공중 보건 서비스(PHS)의 지원을 받는 생물의학 및 행동 연구의 무결성을 촉진합니다.ORI는 연구 부정에 대한 기관 조사를 모니터링하고 교육, 예방 및 규제 활동을 통해 책임 있는 연구 수행(RCR)을 촉진합니다."

--

데이터 공유의 이상

일부 연구 기관에서는 데이터 공유에 대해 특히 강하게 느끼고 있습니다.스탠포드 대학의 Wave Lab은 재현 가능한 연구와 재현에 필요한 모든 알고리즘 및 소스 코드를 공개하는 것에 대한 철학을 가지고 있습니다.저자들은 '웨이브랩과 재현 가능한 연구'라는 제목의 논문에서 일정 기간이 지난 후 자신들의 연구를 재현하려다 마주친 문제점 중 몇 가지를 설명한다.많은 경우, 너무 어려워서 그들은 노력을 포기했다.이러한 경험을 통해 [12]소스코드 공개의 중요성을 깨닫게 되었습니다.그 이념은 다음과 같습니다.

그 아이디어는: 과학 출판물의 컴퓨터 과학에 관한 기사는 장학금 그 자체가 아니라 단지 장학금의 광고일 뿐이다.실제 장학금은 완전한 소프트웨어 개발 환경과 수치를 생성한 명령어 세트입니다.[13][14]

Data Observation Network for Earth(DataONE) 및 Data[15] Conservancy는 연구 과학자 간의 데이터 공유를 장려 및 촉진하고 메타 분석을 보다 효과적으로 지원하기 위해 미국 국립과학재단이 지원하는 프로젝트입니다.환경과학에서는 연구자가 데이터 공유의 기술적 장벽뿐만 아니라 역사적으로 확립된 제도적, 사회학적 [16]장벽도 극복해야 한다는 것을 연구계는 인식하고 있습니다.리처드 J. 박사국립노화연구소 소장인 호즈는 "연구원들이 그들의 데이터를 조심스럽게 보호했던 오래된 모델은 더 이상 적용되지 않는다"[17]고 말했다.

납세자 접근을 위한 동맹은 정부가 후원하는 연구에 대한 개방적인 접근을 지원하는 단체입니다.이 그룹은 오픈 액세스가 [18]중요하다고 생각하는 이유를 설명하는 "원칙서"를 표명했습니다.또, 다수의 국제 퍼블릭액세스 [19]정책도 일람표시됩니다.이는 건강 [20]비상사태에 효과적으로 대응하기 위해 필수적인 정보를 시기적절하게 전달하는 것과 같다.공공 도메인 아카이브는 주로 공식 출판물을 게시하는 데이터 저장용으로 채택되어 왔지만, 에볼라 및 [22][23]지카 발생을[21] 포함한 건강 비상사태 시 신속한 데이터 공유를 장려하는 데는 실패했다.인플루엔자의 긴급한 위협에 대응하기 [24][25]위해 GISAID 이니셔티브가 채택한 것과 같은 연구 및 실제 적용을 위해 데이터를 자유롭게 사용하고(사전 출판) 데이터를 생성하는 사람들의 이익을 인식하기 위해서는 보다 명확하게 정의된 원칙이 필요하다.

국제 정책

학계의 데이터 공유 문제

유전학

데이터를 보류하는 것은 유전학에서 너무나 흔한 일이 되어 매사추세츠 종합병원의 연구원들이 이 주제에 대한 저널 기사를 발표했다.연구 결과, "데이터 접근이 거부되었기 때문에 유전학자의 28%가 발표된 [26]연구를 확인할 수 없었다고 보고했다."

심리학

2006년 연구에서 미국 심리학회(APA) 경험적 기사의 출판물 저자 141명 중 103명(73%)이 6개월 [27]동안 자신의 데이터로 응답하지 않은 것으로 관찰되었다.2015년에 발표된 추적 조사에서는 APA 저널의 논문 저자에게 연락한 394명 중 246명이 요청 시 데이터를 공유하지 않은 것으로 나타났다(62%).[28]

고고학

2018년 한 연구는 고고학 과학 저널(Journal of Archiological Science)에 2017년 2월부터 5월까지 발표된 48개 논문의 무작위 표본 연구에 대해 보고했으며, 18개 논문(53%)에 대해 공개적으로 이용할 수 있는 원시 데이터를 발견했으며, 구성 및 날짜 데이터가 가장 자주 공유되는 유형이다.이 연구는 또한 2009년과 2015년에 출판된 석조 유물 실험 기사를 저자들에게 이메일로 보내 출판물과 관련된 데이터를 요청했다.이들은 23개 기사의 저자와 접촉해 15개의 답변을 받아 70%의 응답률을 보였다.데이터 파일을 포함한 5개의 응답을 받아 전체 공유율이 20%[29]였습니다.

훈련 중인 과학자

훈련 중인 과학자들을 대상으로 한 연구는 많은 사람들이 이미 데이터 [30]유보를 경험했다는 것을 보여준다.이 연구는 미래 세대의 과학자들이 기존의 관행을 따르지 않을 것이라는 두려움을 불러일으켰다.

분야마다 다른 접근법

데이터 공유 요건은 물리 과학보다 의학 및 생물 과학 기관, 자금 조달 기관 및 출판 장소에서 더 일반적으로 부과됩니다.데이터를 공유해야 하는지 여부, 데이터를 공유해야 하는 사람, 데이터 공유 비용을 부담해야 하는 사람에 따라 요건이 크게 다릅니다.

NIH 및 NSF와 같은 자금 조달 기관은 더 많은 데이터 공유를 요구하는 경향이 있지만, 이러한 요구사항조차도 환자 기밀성, 데이터 공유에 따른 비용 및 [31]요청의 정당성에 대한 우려를 인정하는 경향이 있다.사적 이익과 국가 안보 이익(국방 및 법 집행)을 가진 공공 기관은 종종 비공개 계약을 통한 데이터 및 방법의 공유를 방해합니다.

데이터 공유는 참여 모니터링 이니셔티브(예: 산림 커뮤니티가 지역 사회 및 환경 조건에 대한 데이터를 수집하는 경우)에 특정 과제를 제기한다.이 경우, 데이터 공유 프로토콜 개발에 대한 권리 기반 접근법은 자유, 사전정보에 근거한 동의 원칙에 기초할 수 있으며, 데이터를 생성한 사람 및/또는 데이터 [32]공유의 잠재적 영향을 받는 사람의 권리 보호를 우선시한다.

「 」를 참조해 주세요.

레퍼런스

  1. ^ "A Global Health Epidemic Is A Ticking Time Bomb - But Virus Databases Can And Are Helping To Save Lives". HuffPost UK. 12 January 2017. Retrieved 2017-09-06.
  2. ^ "A shot of transparency". The Economist. 2006-08-10. ISSN 0013-0613. Retrieved 2017-09-06.
  3. ^ "How to encourage the right behaviour". Nature. 416 (6876): 1. 2002. Bibcode:2002Natur.416R...1.. doi:10.1038/416001b. PMID 11882850.
  4. ^ McCauley, John W. (2017-02-23). "Viruses: Model to accelerate epidemic responses". Nature. 542 (7642): 414. Bibcode:2017Natur.542..414M. doi:10.1038/542414b. PMID 28230113.
  5. ^ "No Free Lunch, G20 Health Ministers Find At First Meeting". Intellectual Property Watch. 2017-05-20. Retrieved 2017-09-06.
  6. ^ Savage CJ, Vickers AJ (2009). "Empirical Study of Data Sharing by Authors Publishing in PLoS Journals". PLOS ONE. 4 (9): e7078. Bibcode:2009PLoSO...4.7078S. doi:10.1371/journal.pone.0007078. PMC 2739314. PMID 19763261.
  7. ^ "출판과 개방", "과학자가 되는 것에 대하여:'연구에서의 책임 있는 행동', 국립과학아카데미.
  8. ^ Gabelica, Mirko; Bojčić, Ružica; Puljak, Livia (May 2022). "Many researchers were not compliant with their published data sharing statement: mixed-methods study". Journal of Clinical Epidemiology. 150: 33–41. doi:10.1016/j.jclinepi.2022.05.019. PMID 35654271. S2CID 249213574.
  9. ^ 미국 경쟁법
  10. ^ Wayback Machine에서 2007년 5월 26일에 아카이브된 연구 데이터액세스와 보존:권리와 책임.", 페이지 5. 정부관계심의회, 2006년 3월.
  11. ^ "NIH 데이터 공유 정책"
  12. ^ WaveLab과 Jonathan B의 Replicatible Research.Buckheit와 David L. 도노호
  13. ^ Wave Lab850 웹사이트
  14. ^ Rimmer, Matthew (2005-09-01). "Japonica Rice: Intellectual Property, Scientific Publishing and Data‐sharing". Prometheus. 23 (3): 325–347. doi:10.1080/08109020500235180. ISSN 0810-9028. S2CID 153908749.
  15. ^ "Data Conservancy Data Conservancy is devoted to developing institutional solutions for the challenges of data collection, preservation and re-use".
  16. ^ Reichman O.J.; Jones M.B.; Schildhauer M.P. (2011). "Challenges and Opportunities of Open Data in Ecology". Science. 331 (6018): 703–705. Bibcode:2011Sci...331..703R. doi:10.1126/science.1197962. PMID 21311007. S2CID 22686503.
  17. ^ Alzheimers 연구에 대한 공유 데이터의 가치에 대한 NY Times 기사
  18. ^ 납세자 접근을 위한 연합 웹사이트
  19. ^ 공공기금을 통한 연구에 대한 공공 접근에 대한 전 세계적인 추진력
  20. ^ Shu, Yuelong; McCauley, John (2017). "GISAID: Global initiative on sharing all influenza data – from vision to reality". Eurosurveillance. 22 (13). doi:10.2807/1560-7917.es.2017.22.13.30494. PMC 5388101. PMID 28382917.
  21. ^ Yozwiak, Nathan L.; Schaffner, Stephen F.; Sabeti, Pardis C. (2015-02-26). "Data sharing: Make outbreak research open access". Nature. 518 (7540): 477–479. Bibcode:2015Natur.518..477Y. doi:10.1038/518477a. PMID 25719649.
  22. ^ "When research goes off the rails". The Hindu. Retrieved 2017-09-06.
  23. ^ "Benefits of sharing". Nature. 530 (7589): 129. 2016-02-11. Bibcode:2016Natur.530Q.129.. doi:10.1038/530129a. PMID 26863943.
  24. ^ Elbe, Stefan; Buckland-Merrett, Gemma (2017-01-01). "Data, disease and diplomacy: GISAID's innovative contribution to global health". Global Challenges. 1 (1): 33–46. doi:10.1002/gch2.1018. ISSN 2056-6646. PMC 6607375. PMID 31565258.
  25. ^ "CDC Races to Create a Vaccine for China's Latest Bird Flu Strain". Bloomberg.com. 2013-04-10. Retrieved 2017-09-06.
  26. ^ Campbell EG, Clarridge BR, Gokhale M, et al. (2002). "Data withholding in academic genetics: evidence from a national survey". JAMA. 287 (4): 473–80. doi:10.1001/jama.287.4.473. PMID 11798369.
  27. ^ Wicherts, J. M.; Borsboom, D.; Kats, J.; Molenaar, D. (2006). "The poor availability of psychological research data for reanalysis". American Psychologist. 61 (7): 726–728. doi:10.1037/0003-066X.61.7.726. PMID 17032082.
  28. ^ Vanpaemel, W.; Vermorgen, M.; Deriemaecker, L.; Storms, G. (2015). "Are we wasting a good crisis? The availability of psychological research data after the storm" (PDF). Collabra. 1 (1): 1–5. doi:10.1525/collabra.13.
  29. ^ Marwick, Ben; Birch, Suzanne E. Pilaar (5 April 2018). "A Standard for the Scholarly Citation of Archaeological Data as an Incentive to Data Sharing". Advances in Archaeological Practice. 6 (2): 125–143. doi:10.1017/aap.2018.3.
  30. ^ Vogeli C, Yucel R, Bendavid E, et al. (February 2006). "Data withholding and the next generation of scientists: results of a national survey". Acad Med. 81 (2): 128–36. doi:10.1097/00001888-200602000-00007. PMID 16436573.
  31. ^ "NIH Data Sharing Policy and Implementation Guidance". grants.nih.gov. Retrieved 2021-04-09.
  32. ^ 디 사보갈.2015. 커뮤니티 기반 산림 모니터링 데이터 공유: 가이아나로부터의 교훈.글로벌 캐노피 프로그램.http://forestcompass.org/how/resources/data-sharing-community-based-forest-monitoring-lessons-guyana

문학.

Committee on Issues in the Transborder Flow of Scientific Data, National Research Council (1997). Bits of Power: Issues in Global Access to Scientific Data. Washington, D.C: National Academy Press. doi:10.17226/5504. ISBN 978-0-309-05635-9. 자연과학 분야에서의 국제적 데이터 교환에 대해 설명합니다.

외부 링크