코퍼스어
Corpus language말뭉치 언어는 살아 있는 화자가 없는 언어지만, 원어민 화자의 실제 제작물 중 상당수는 어떤 식으로든 보존되어 있다(보통 서면 기록).[1] 말뭉치 언어의 예로는 고대 그리스어, 라틴어, 이집트어, 고대 영어, 엘라마이트 등이 있다.
일부 말뭉치 언어는 고대 그리스어나 라틴어와 같이 매우 큰 말뭉치를 남겼으며, 따라서 발음의 일부 세부사항이 불분명할 수 있음에도 불구하고 완전히 재구성될 수 있다. 그런 언어는 산스크리트어와 라틴어의 경우와 마찬가지로 오늘날에도 사용될 수 있다. 다른 사람들은 말뭉치가 너무 제한적이어서, 예를 들어 몇몇 대명사 같은 중요한 단어들은 말뭉치에서 찾을 수 없다. 이것의 예로는 우가라이트와 고딕이 있다. 단지 몇 개의 단어, 종종 이름, 그리고 몇 개의 구절(독일 언어학에서는 Trümmersprachen이라 불리며 문자 그대로 "러블 언어"라고 불림)만으로 증명되는 언어는 매우 제한적인 방법으로만 재구성될 수 있으며 종종 다른 언어와 그들의 유전적 관계가 불명확한 상태로 남아 있다. 예를 들면 롬바르드어(Lombardic language)와 다다야어(Dadanic)는 고전 아랍어에 가까울 수 있는 셈어(Semiatic language)이다.
말뭉치 언어는 말뭉치 언어학의 방법을 사용하여 연구되지만 말뭉치 언어학은 살아 있는 언어의 기록적인 생산에 대한 연구에 사용될 수 있고(그리고 일반적으로 사용된다).
많은 언어가 사라졌기 때문에 모든 멸종된 언어가 "corpus 언어"는 아니다. 그 이유는 많은 언어가 그들의 스피커의 녹음된 생산을 남겨두지 않았기 때문이다.
참조
- ^ Langslow, D.R. 2002년 제임스 노엘 아담스, 마크 얀세, 사이먼 스웨인(edd)의 "말뭉치 언어의 이중언어 접근" 고대사회의 이중언어주의: 언어연락과 옥스퍼드문자: OUP