다윈 코어 아카이브

Darwin Core Archive

다윈 코어 아카이브(Dwarwin Core Archive, DwC-A)는 다윈 코어 용어를 사용하여 종 발생, 체크리스트, 샘플링 이벤트 또는 재료 샘플 데이터를 위한 단일 독립 데이터 세트를 생성하는 생물 다양성 정보 데이터 표준이다.본질적으로 그것은 당신의 파일이 어떻게 구성되는지 다른 사람들에게 알리기 위해 간단한 설명자(meta.xml)가 있는 CSV 파일의 집합이다.이 형식은 다윈 핵심 텍스트 지침에 정의되어 있다.[1]GBIF 네트워크에 데이터를 게시하기 위해 선호되는 형식이다.

다윈 코어

다윈 코어 표준은[2] GBIF 네트워크 내에서 대부분의 표본 발생 및 관측 기록을 동원하기 위해 사용되어 왔다.[3]다윈 코어 표준은 원래 현대 생물학적 표본, 그 주취적 일시적 발생, 수집품(물리적 또는 디지털)에 수록된 뒷받침되는 증거에 대한 정보의 발견, 검색 및 통합을 용이하게 하기 위해 고안되었다.

오늘날 다윈 핵은 범위가 더 넓다.생물학적 다양성에 관한 정보를 공유하기 위한 안정적이고 표준적인 참조를 제공하는 것을 목표로 한다.용어집으로서 다윈 코어는 다양한 맥락에서 최대한 재사용할 수 있다는 목표와 함께 안정적인 의미 정의를 제공한다.이는 다윈 코어가 역사적으로 사용되어 온 방식과 동일한 방식으로 여전히 사용될 수 있지만, 공통의 용어를 통해 상호운용성을 보장하는 동시에 보다 복잡한 교환 형식을 구축하는 기반이 될 수도 있다는 것을 의미한다.

보관 형식

아카이브의 중심 개념은 데이터 파일이 별처럼 논리적으로 배열되며, 하나의 핵심 데이터 파일이 임의의 수의 '확장'으로 둘러싸인다는 것이다.각 확장자 레코드(또는 '확장 파일 행')는 코어 파일에 있는 레코드를 가리킨다. 이러한 방식으로, 각 단일 코어 레코드에 대해 0에서 많은 확장자 레코드가 존재할 수 있으며, 그렇지 않으면 많은 빈 셀을 포함할 수 있는 단일 테이블에 모든 데이터를 포함하는 것보다 공간 효율적인 데이터 전송 방법이 더 효과적이다.

권장 확장에 대한 자세한 내용은 각 하위 섹션에서 확인할 수 있으며 사용 가능한 모든 확장의 목록을 작성하는 GBIF 레지스트리에 광범위하게 문서화된다.

DiGIR 및 TAPIR와 같은 페이지 가능한 웹 서비스를 사용하는 대신 전체 데이터셋을 공유하면 훨씬 간편하고 효율적인 데이터 전송이 가능하다.예를 들어 TAPIR을 통해 260,000개의 레코드를 검색하는 데 약 9시간이 걸리며 500MB의 XML 형식 데이터를 전송하기 위해 1,300개의 http 요청을 발행한다.DwC-A로 인코딩되고 압축된 정확히 동일한 데이터 세트가 3MB 파일이 된다.따라서 GBIF는 DwC-A를 생성할 때 ZIP 또는 GZIP를 사용하여 아카이브를 압축할 것을 적극 권장한다.

아카이브에는 핵심 레코드에 대한 안정적인 식별자가 필요하지만, 확장에는 필요하지 않다.따라서 모든 종류의 공유 데이터에 대해 어떤 종류의 로컬 레코드 식별자를 보유해야 한다.기록 삭제 후에도 시간이 지남에 따라 안정적이고 재사용되지 않는 식별자를 원본 데이터와 함께 유지하는 것이 좋다.가능한 경우 로컬 식별자 대신 글로벌 고유 식별자를 제공하십시오.

아카이브 설명자

완성한다.


데이터 집합 메타데이터

다윈 코어 아카이브는 전체 데이터 집합을 설명하는 메타데이터를 포함하는 파일을 포함해야 한다.를 위한 가장 일반적인 형식은 생태 메타데이터 언어(EML)이지만 간단한 더블린 코어 파일도 사용되고 있다.

참조

  1. ^ 다윈 핵심 텍스트 지침
  2. ^ Wieczorek, John; D. Bloom; R. Guralnick; S. Blum; M. Döring; R. De Giovanni; T. Robertson; D. Vieglais (2012). "Darwin Core: An Evolving Community-developed Biodiversity Data Standard". PLoS ONE. 7 (1): e29715. Bibcode:2012PLoSO...729715W. doi:10.1371/journal.pone.0029715. PMC 3253084. PMID 22238640.
  3. ^ Darwin Core Archives –

외부 링크