데이터 관리 계획
Data management plan데이터 관리 계획 또는 DMP는 연구 프로젝트 기간과 프로젝트 완료 후 데이터 처리 방법을 개략적으로 설명하는 공식 문서다.[1]데이터 관리 계획의 목표는 프로젝트가 시작되기 전에 데이터 관리, 메타데이터 생성, 데이터 보존 및 분석의 많은 측면을 고려하는 것이다.[2] 이는 현재 데이터를 잘 관리하고 향후 보존을 위해 준비할 수 있다.[citation needed][2]
DMP는 원래 1966년에 항공 및 엔지니어링 프로젝트의 데이터 수집 및 분석을 관리하는 데 사용되었고, 1970년대와 1980년대에 공학 및 과학 분야로 확대되었다.2000년대 초반까지 DMP는 "기술적으로 매우 복잡한 프로젝트와 제한된 중간 연구 데이터 수집 및 처리 목적"에 사용되었다.[3]2000년대 이후 전자 연구와 경제 정책이 DMP의 개발과 흡수를 견인했다.[3]
중요도
데이터를 수집하기 전에 데이터 관리 계획을 준비하는 것은 데이터가 올바른 형식이고 잘 정리되며 주석을 더 잘 달도록 하기 위함입니다.[4]이것은 데이터에 대한 세부사항을 기억하거나 재구성할 필요가 없기 때문에 장기적으로 시간을 절약할 수 있다.또한 향후 데이터 수집기와 다른 연구자 모두가 잘 알려진 데이터를 이해하고 사용할 수 있을 것이기 때문에 연구 효율을 높인다는 주장도 있다.데이터 관리 계획의 한 가지 구성요소는 데이터 보관과 보존이다.데이터 수집기는 사전에 아카이브를 결정함으로써 수집 중에 데이터를 포맷하여 향후 데이터베이스 제출을 쉽게 할 수 있다.데이터가 보존되면 다른 연구자가 재사용할 수 있어 관련성이 높다.또한 데이터 수집기가 데이터 요청을 개별적으로 주소 지정이 아닌 데이터베이스로 지시할 수 있도록 한다.보존에 찬성하는 주장이 자주 나오는 것은 보존된 데이터가 새롭고 예상치 못한 발견으로 이어질 수 있는 잠재력을 가지고 있으며, 이미 행해진 과학 연구의 중복을 방지한다는 점이다.또한 데이터 아카이빙은 데이터 수집기에 의한 손실에 대비한 보험도 제공한다.
2010년대 들어,[3] 자금 조달 기관은 데이터 관리 계획의 유효성에 대한 증거가 거의 없거나 전혀 없음에도 불구하고,[5] 제안 및 평가 과정의 일부로 데이터 관리 계획을 점점 더 필요로 했다.[3]
주요 구성 요소
"연구 프로젝트를 위해 DMP에서 다루어야 할 일반적이고 결정적인 주제 목록은 없다."[6] 그리고 연구자들은 DMP를 어떻게 작성해야 하는지에 대해 종종 그들 자신의 기기에 맡겨진다.[2]
데이터 및 데이터 형식에 대한 정보
- 프로젝트에서 생성할 데이터에 대한 설명.[7]여기에는 다음과 같은 데이터가 포함될 수 있지만 이에 국한되지는 않는다.
- 실험적인
- 관측
- 원시 또는 파생된
- 물리적 컬렉션
- 모델
- 시뮬레이션
- 커리큘럼 자료
- 소프트웨어
- 이미지들
- 데이터는 어떻게 획득될 것인가?언제 어디서 취득할 것인가.
- 수집 후 데이터는 어떻게 처리될 것인가?에 대한 정보 포함
- 사용된 소프트웨어
- 알고리즘
- 과학적 워크플로우
- 사용할 파일 형식, 해당 형식 정당성 및 사용되는 명명 규칙 설명.[8]
- 시료채취, 분석, 가공 시 취할 품질보증 및 품질관리 조치.
- 기존 데이터를 사용할 경우 그 출처는 무엇인가?수집된 데이터를 기존 데이터와 어떻게 결합할 것인가?수집된 데이터와 기존 데이터의 관계는 무엇인가?
- 단기적으로 데이터는 어떻게 관리될 것인가?다음을 고려하십시오.
메타데이터 컨텐츠 및 형식
메타데이터는 데이터 사용에 중요한 정보를 포함한 상황별 세부사항이다.여기에는 시간 및 공간 세부사항, 기기, 매개변수, 단위, 파일 등에 대한 설명이 포함될 수 있다.메타데이터는 일반적으로 "데이터에 관한 데이터"[10]라고 불린다.고려해야 할 문제에는 다음이 포함된다.
- 데이터를 의미 있게 만들기 위해 메타데이터는 얼마나 상세해야 하는가?
- 메타데이터를 어떻게 생성 및/또는 캡처할 것인가?예를 들어 랩 노트북, GPS 핸드헬드 장치, 자동 저장 장치 등이 있다.
- 메타데이터에 사용할 형식을 선택하십시오.각각의 과학분야에서 일반적으로 사용되는 메타데이터 표준은 무엇인가?선택한 형식에 대한 정당성이 있어야 한다.
액세스, 공유 및 재사용 정책
- 수집된 데이터를 공유하기 위해 존재하는 의무에 대해 설명하십시오.여기에는 자금 조달 기관, 기관, 기타 전문 기관의 의무 및 법적 요건이 포함될 수 있다.
- 데이터 액세스 시기, 데이터 사용 가능 기간, 액세스 획득 방법, 데이터 수집기가 데이터 사용을 위해 보유하는 모든 권한을 포함하여 데이터를 공유하는 방법에 대한 정보를 포함하십시오.
- 데이터 공유와 관련된 윤리적 또는 개인 정보 문제 해결
- 지적 재산권과 저작권 문제를 해결하십시오.저작권은 누가 소유하고 있는가?지적 재산과 관련된 기관, 출판사 및/또는 자금 조달 기관 정책은 무엇인가?정치적, 상업적, 특허적 이유로 금수조치가 있는가?
- 데이터의 향후 용도/사용자에 대해 설명
- 다른 사람이 데이터를 어떻게 인용해야 하는지 표시한다.끈질긴 인용 문제는 어떻게 다뤄질 것인가?예를 들어, 데이터가 공개 보관소에 보관될 경우 데이터 집합에 디지털 개체 식별자(doi)가 할당될 것인가?
장기 스토리지 및 데이터 관리
- 연구자들은 자신의 데이터를 장기간 보존하기 위해 적절한 아카이브를 식별해야 한다.프로젝트 초기에 아카이브를 식별함으로써 데이터를 적절하게 포맷, 변환 및 문서화할 수 있어 아카이브의 요구사항을 충족할 수 있다.연구자들은 가장 적절한 데이터베이스를 결정하기 위해 자신의 분야 동료와 전문적 사회와 상의해야 하며, 첫 번째 선택이 존재하지 않을 경우에 대비하여 데이터 관리 계획에 백업 아카이브를 포함시켜야 한다.
- 프로젝트 초기에 1차 연구자는 어떤 데이터를 아카이브에 보존할 것인지 파악해야 한다.일반적으로 데이터 파생상품과 제품도 보존할 수 있지만 가장 원시적인 형태로 데이터를 보존하는 것이 바람직하다.
- 개인은 보관된 데이터의 주요 연락 담당자로 식별되어야 하며, 데이터에 대한 데이터나 정보에 대한 요청이 있을 경우 연락처 정보가 항상 최신 상태로 유지되도록 해야 한다.
예산
프로젝트의 성격에 따라 데이터 관리 및 보존 비용이 상당할 수 있다.연구자들은 미리 비용을 예측함으로써 데이터가 적절하게 관리되고 보관될 것을 보장한다.고려되어야 할 잠재적 비용은 다음과 같다.
- 데이터 준비, 관리, 문서화 및 보존을 위한 직원 시간
- 데이터 관리, 백업, 보안, 문서 및 보존에 필요한 하드웨어 및/또는 소프트웨어
- 데이터를 아카이브에 제출하는 것과 관련된 비용
데이터 관리 계획에는 이러한 비용을 어떻게 지불할 것인가가 포함되어야 한다.
NSF 데이터 관리 계획
NSF에 제출된 모든 보조금 제안은 2페이지 이하인 데이터 관리 계획을 포함해야 한다.[11]이는 보충 자료(15페이지 제안서의 일부가 아님)이며 제안서가 시상 및 관리 가이드(아래 참조) 정책에 어떻게 부합하는지 설명해야 한다.여기에는 다음이 포함될 수 있다.
- 데이터 유형
- 데이터 및 메타데이터 형식 및 컨텐츠에 사용할 표준
- 액세스 및 공유 정책
- 재사용을 위한 정책 및 규정
- 데이터 아카이빙 계획
NSF 시상 및 관리 가이드 섹션 4([12]연구 결과의 공개 및 공유):
- 적절한 저작권으로 신속하게 출판
- 데이터, 샘플, 물리적 수집 및 지원 자료를 타인과 합리적인 시간 내에 공유
- 소프트웨어 및 발명품 공유
- 수사관들은 그들의 지적 재산에 대한 법적 권리를 유지할 수 있지만, 그들은 여전히 그들의 결과, 자료, 수집품을 다른 사람들이 이용할 수 있도록 만들어야 한다.
- 정책을 구현하는 방법
- 제안검토
- 시상 협상 및 조건
- 지지/인텐시브
ESRC 데이터 관리 계획
1995년부터 영국의 경제사회연구위원회(ESRC)는 연구 데이터 정책을 시행하고 있다.현행 ESRC 연구 데이터 정책은 ESRC가 자금을 지원받아 만든 연구 데이터를 장기 보존과 고품질 데이터 관리를 통해 과학계가 최대한 공개해야 한다고 규정하고 있다.[13]
ESRC는 새로운 데이터가 생성되고 있는 모든 연구 대상 애플리케이션에 대한 데이터 관리 계획을 요구한다.이러한 계획은 데이터 라이프사이클 전체에 걸쳐 데이터 관리에 대한 구조화된 접근방식을 촉진하여 공유 및 재사용을 위해 아카이브할 준비가 된 더 나은 품질의 데이터를 제공하도록 설계된다.ESRC의 대표 데이터 서비스인 영국데이터서비스는 영국 및 전 세계 사회과학 연구자에게 적합한 연구 데이터 관리 계획에 대한 실질적인 지침을 제공하고 있다.[14][15]
ESRC는 에섹스 대학교에 소재한 영국 데이터 아카이브와 오랫동안 연구 데이터를 보관하는 장소로 계약을 맺고 있으며 수상자는 영국 데이터 서비스를 통해 연구 보조금에서 도출된 데이터를 제공해야 한다.[16]아카이브는 데이터를 보존하고 연구 및 교육 커뮤니티에 데이터를 제공함으로써 데이터 재사용을 가능하게 한다.
혜택들
DMP의 편익 측면에서는 문헌에서 확인된 3가지 주요 주제가 있는데, 바로 전문적 혜택, 경제적 혜택, 제도적 혜택이다.[3]DMP는 종종 도서관의 도움을 받아 연구자들의 데이터 사용능력과 데이터 관리 관행을 향상시키는 촉매를 형성할 수 있다는 주장이 제기되었다.[3]
실제로
그러나 실제로 DMP는 종종 명시된 목표에 미치지 못한다.2012년 연구 기금 모금자들이 DMP 정책을 검토한 결과 DMP에 대한 디지털 큐레이션 센터의 기준 목록에서 몇 가지 요소가 누락된 것으로 나타났다.[17] 연구자들은 DMP 텍스트를 공유했다.[18]DMP는 연구과정의 '중요한 부분이라기보다는 행정적 연습'으로 간주되는 경우가 많은데,[19] DMP는 좋은 데이터 관리 관행을 보장하지 않는다는 점이 인정됐다.[20]대부분의 자금 조달자는 보조금을 지급한 후 DMP를 요구하지 않으므로, 이해관계자들에게 적극적인 DMP가 될 수 있는 강력한 도구를 강탈한다.최선의 방법은 "수상 후 및 연구의 활성 단계 동안 데이터 관리 계획의 유지보수를 요구한다"[6]는 것이다.현재는 자금조달자에 대한 데이터 관리 계획보다 데이터 공유 계획이 더 중요하다.[6]
참고 항목
참조
- ^ "Research Data Management - University of Virginia Library Research Data Services + Sciences". www2.lib.virginia.edu.
- ^ a b c Burnette, Margaret; Williams, Sarah; Imker, Heidi (16 September 2016). "From Plan to Action: Successful Data Management Plan Implementation in a Multidisciplinary Project". Journal of EScience Librarianship. 5 (1): e1101. doi:10.7191/jeslib.2016.1101.
- ^ a b c d e f Smale, Nicholas; Unsworth, Kathryn; Denyer, Gareth; Barr, Daniel (17 October 2018). "The History, Advocacy and Efficacy of Data Management Plans". bioRxiv: 443499. doi:10.1101/443499. S2CID 91931719.
- ^ "Why manage & share your data? - Data management". libraries.mit.edu.
- ^ "Data Management & Sharing Frequently Asked Questions (FAQs)". Archived from the original on 2017-07-11. Retrieved 2018-04-06.
- ^ a b c Williams, Mary; Bagwell, Jacqueline; Nahm Zozus, Meredith (July 2017). "Data management plans: the missing perspective". Journal of Biomedical Informatics. 71: 130–142. doi:10.1016/j.jbi.2017.05.004. PMC 6697079. PMID 28499952.
- ^ "Elements of a Data Management Plan". www.icpsr.umich.edu. Retrieved 2015-09-30.
- ^ "Archived copy" (PDF). libraries.mit.edu. Archived from the original (PDF) on 4 May 2018. Retrieved 12 January 2022.
{{cite web}}
: CS1 maint: 타이틀로 보관된 사본(링크) - ^ https://www.fosteropenscience.eu/sites/default/files/pdf/1382.pdf
- ^ 미치너,WK와 JW 브룬트.2000. 생태 데이터: 설계, 관리 및 처리.블랙웰 사이언스, 180p.
- ^ "GPG Chapter II". www.nsf.gov.
- ^ "Dissemination and Sharing of Research Results - NSF - National Science Foundation". www.nsf.gov.
- ^ ESRC 연구 데이터 정책 2010
- ^ 데이터 준비 및 관리: 영국 데이터 서비스의 지침
- ^ "Managing and Sharing Research Data - SAGE Publications Inc". www.sagepub.com. Archived from the original on 2014-04-07. Retrieved 2014-04-01.
- ^ "UK Data Archive - WHO CAN DEPOSIT?". www.data-archive.ac.uk.
- ^ Dietrich, Dianne; Adamus, Trisha; Miner, Alison; Steinhart, Gail (2012). "De-Mystifying the Data Management Requirements of Research Funders". Issues in Science and Technology Librarianship. 70. doi:10.5062/F44M92G2.
- ^ Parham, Susan Wells; Doty, Chris (October 2012). "NSF DMP content analysis: What are researchers saying?". Bulletin of the American Society for Information Science and Technology. 39 (1): 37–38. doi:10.1002/bult.2012.1720390113.
- ^ Miksa, Tomasz; Simms, Stephanie; Mietchen, Daniel; Jones, Sarah (28 March 2019). "Ten principles for machine-actionable data management plans". PLOS Computational Biology. 15 (3): e1006750. doi:10.1371/journal.pcbi.1006750. PMC 6438441. PMID 30921316. S2CID 85563774.
- ^ Donelly, Martin (2012). "Data management plans and planning". In Pryor, Graham (ed.). Managing research data. London: Facet Publishing. pp. 83–104. ISBN 9781856048910.
추가 읽기
Pryor, Graham (2014). Delivering research data management services. Facet Publishing. ISBN 9781856049337.
외부 링크
- 데이터 관리 마법사: FARE Open Science를 위한 스마트 데이터 관리 계획 수립
- 데이터ONE
- DMP온라인
- 디지털 큐레이션 센터
- NSF 허가 제안 지침
- LTER 블로그:데이터 관리 계획 작성 방법
- 영국 데이터 서비스:데이터 준비 및 관리: 사회과학 연구자를 위한 지침 및 도구
- Plan de Gettion de Datos PaGoDa: 마드리드 지역 대학 및 UNED 도서관 협력 컨소시엄의 DMP 툴킷(Madrono - 스페인)