독일 참조 코퍼스

German Reference Corpus

독일 참조 코퍼스(원문:Deutsches Referencezkorpus; 약칭: DeReKo)는 현대 독일어 문자의 전자 기록 보관소다.1964년에 처음 만들어졌으며, 독일 만하임의 독일어 언어 연구소(IDS)에서 주최한다.말뭉치 보관소는 지속적으로 업데이트되고 확장된다.현재 40억 개 이상의 단어 토큰(2010년 8월 기준)으로 구성되어 있으며, 언어학적으로 동시대 독일어 문헌 중 가장 큰 비중을 차지하고 있다.오늘날, 그것은 독일어 문자의 연구를 위한 전 세계의 주요 자원 중 하나이다.

대체 이름

독일어 참조 코퍼스는 종종 만하임 코퍼사, IDS 코퍼사, COSMAS 코퍼스와 해당 독일어 번역과 같은 다른 이름으로 언급된다.Deutsches Referencezkorpus(DeReKo)라는 명칭은 원래 현재 보관소의 특정 부분에 사용되었으며, 1999년부터 2002년 사이에 다수의 기관이 동일한 이름으로 공동 프로젝트에서 수집하였다.2004년 이후, Deutsches Referencezkorpus (DeReKo)는 전체 말뭉치 보관소의 공식 명칭이다.

구상 및 구성

독일 레퍼런스 코퍼스는 허구적, 학술적 텍스트, 많은 수의 신문 텍스트, 그리고 몇 가지 다른 텍스트 유형으로 구성되어 있다.본문은 1950년경부터 현재까지의 시간범위를 다루고 있다.

그러나 다른 잘 알려진 기업 및 말뭉치 문서(영국 국립 말뭉치 등)와는 대조적으로 독일 참조 코퍼스는 분명히 균형 잡힌 말뭉치로 설계되지 않았다.시간 또는 텍스트 유형에 걸친 DeReKo 텍스트의 분포가 일부 사전 정의된 백분율과 일치하지 않는다.

이 개념은 주어진 말뭉치가 균형 잡힌 언어 샘플을 구성하는지 또는 심지어 대표적인 언어 샘플을 구성하는지 아닌지를 특정 언어 영역(즉, 통계 모집단)에 대해서만 평가할 수 있다는 사실을 준수한다.서로 다른 언어 조사가 일반적으로 다른 언어 영역을 목표로 하기 때문에, 독일어 참조 코퍼스의 선언된 목적은 말퍼스 사용자들이 전문 하위표본( 이른바 가상표본)을 그릴 수 있는 현대 독일어의 다용도 초초표본 또는 원시표본(독일어: Ur-Stichprobe)의 역할을 하는 것이다.조사하고자 하는 언어 영역을 대표한다.

접근

저작권 및 라이센스 제한으로 인해 DeReKo 보관소는 복사되거나 다운로드용으로 제공되지 않을 수 있다.COSMAS II 시스템을 통해 무료로 조회 및 분석할 수 있음 - 최종 사용자는 이름으로 등록하고 비상업적, 학술적 목적으로만 말뭉치 데이터를 사용하는 데 동의해야 한다.COSMAS II는 사용자들이 DeReKo로부터 그들의 특정한 연구 질문에 적합한 가상 말뭉치를 컴파일할 수 있게 해준다.

참고 항목

참조

외부 링크