트리 모델

Tree model
마야어족의 분장적 표현으로 4000년 전으로 거슬러 올라간다(이 숫자는 공통시대에 제안된 역사적 연대를 나타낸다).

역사언어학에서 나무 모델(Stambaum, 유전학 또는 분지학 모델)은 계통수의 개념과 유사한 언어의 진화 모델, 특히 종의 생물학적 진화에서 계통수이다.종과 마찬가지로, 각 언어는 한 부모 또는 "어머니" 언어에서 발전한 것으로 추정되며, 공통 조상을 공유하는 언어는 같은 어족에 속합니다.

1853년 [1][2]독일의 언어학자 August Schleicher에 의해 대중화된 이 나무 모형은 처음 시도된 이래 항상 언어 사이의 유전적 관계를 묘사하는 흔한 방법이었습니다.그것은 인도유럽조어인도유럽어족과 같은 각 어족에 조상이 된 가상의 언어들을 식별하고 설명하기 위해 알려진 언어들과 관찰된 언어의 특징 진화 규칙들로부터 증거를 사용하는 것을 포함하는 비교 언어학 분야의 중심이다.그러나, 이것은 대체로 이론적이고 질적인 추구이며, 언어학자들은 언어 진화에서 수평 전달에 의해 차용어부터 여러 모국어를 [1]가진 크리올 언어까지 큰 역할을 하기 때문에 나무 모델의 고유한 한계를 항상 강조해왔다.이 파동 모델은 Schleicher의 학생인 Johannes Schmidt에 의해 1872년에 수평 [3]전달을 통합한 나무 모델의 대안으로 개발되었다.

나무 모형은 또한 생물학의 링 언어의 방언 연속과 같은 예외를 포함하는 연속적인 현상을 수량화하는 종 문제에 있어서 생물 분류학과 같은 한계를 가지고 있다.연계 개념은 이에 대응하여 개발되었으며 단일 [2]언어의 언어적으로 고립된 하위 언어에서 발전한 언어 그룹을 가리킨다.

역사

성서 부족의 가계도

구약성서와 성서아우구스티누스

히포의 아우구스티누스는 노아의 후손이 나라를 세우고 각 민족에게 고유의 언어를 부여한다고 가정했다.아시리아어아수르어, 히브리어는 헤베르어 등입니다.[4]그는 72개 국가, 부족 창시자, 언어를 모두 확인했다.이 혼란과 분산은 헤벨의 아들이며, 의 아들이며,[5][6] 노아의 아들이며, 헤벨의 아들인 벨렉의 시대에 일어났다.아우구스티누스는 후대의 역사언어학자들의 가설과 다르지 않게, 헤버 가문은 "합리적으로 인종의 공용어라고 믿어지지 않는 언어를 보존했다...그래서 히브리어로 명명되었다.그러나 72개 언어의 대부분은 헤버 이후 여러 세대로 거슬러 올라간다.성 아우구스티누스는 신이 [7]: 123 72세를 정했을 때 430년을 산 헤버가 살아 있었다고 가정함으로써 이 첫 번째 문제를 해결한다.

우르스프라체, 낙원의 언어

성 아우구스티누스의 가설은 천 년 이상 큰 의문 없이 서 있었다.그 후, 1684년에 출판된, 다양한 믿음, 특히 성경에 대한 회의를 표현한 일련의 글에서, 토마스 브라운 경은 다음과 같이 [8]썼다.

홍수가 나기 전 지구에는 많은 인구가 살고 있었지만...그러나 1600년이라는 시간이 흐른 후에 인류가 모든 부분에서 그렇게 통일된 언어를 유지했는지는 의심할 여지가 없다."

어스프래쉬의 고향인 에덴 동산

그때까지, 신대륙의 발견과 극동 탐험은 세인트루이스가 계산한 72개의 언어를 훨씬 뛰어넘는 새로운 언어의 수를 가져왔다.어거스틴아메리카 원주민 언어를 인용하면서 브라운은 "처음에는 시나르에 있는 바벨의 작품에만 언어의 혼동이 있었다"고 제안합니다. "산기슭 근처, 방주가 쉬었던 곳...그들의 원시 언어는 시간이 지나면 유럽과 아시아의 여러 지역으로 뻗어나갈지도 모른다…."[9] 이것은 나무의 힌트이다.브라운의 관점에 따르면 히브리어보다 더 큰 원주민 언어로부터의 단순화는 언어의 차이를 설명할 수 있다.그는 고대 중국어를 제안하는데, 다른 중국어는 "혼란, 혼선, 부패"[10]에 의해 유래되었다.나중에 그는 "혼합과 변화"[11]를 일으킨다.

브라운은 당대 [12]학자들의 재건 활동에 대해 다음과 같이 보고하고 있습니다.

카사우본은 그리스어에서 파생된 단어만 색슨어로 대화가 구성될 수 있다고 생각한다.베르스테간은 영국, 네덜란드, 동 프리스란더가 이해할 수 있는 편지를 고안해 낼 수 있다는 것을 의심치 않았다.그리고 만약 Buxhornius의 주장처럼 스키타이어는 모국어로서 유럽 각국에 퍼져 있고, 심지어 페르시아까지, 많은 나라들 사이의 많은 단어에 대한 공동체는 어느 나라보다 더 합리적인 무역을 가지고 있고, 오히려 그들 모두를 통해 퍼진 공통 언어로부터 파생될 수 있다.그것도 중고품으로 빌려서 보유하고 있다.

따라서 바벨탑의 혼란은 그것을 제쳐두고 장애물로 제거되었다.모든 언어에서 유사점을 찾으려는 시도는 다른 모든 언어에서 유래한 고대 마스터 언어의 점진적인 발견을 가져왔다.브라운은 의심할 여지 없이 1684년 이전에 그의 글과 생각을 잘 했다.같은 혁명 세기의 영국에서 제임스 하웰은 유효한 역사적 정보를 포함한 왕국의 중요한 사람들에게 준소설 서한인 호엘리아내 제2권을 출판했다.LVII에서 언어 트리의 은유는 전문 언어학자의 [13]견해와는 거리가 먼 것으로 보입니다.

"나는 이제 네덜란드를 향해 항해한다. 네덜란드는 영어와 같은 방언으로 처음부터 그랬다. 둘 다 높은 네덜란드어에서 유래한 것이다[하웰은 여기서 틀렸다].덴마크인도 같은 나무의 가지일 뿐인데...하이네덜란드어 또는 튜토닉혀는 유럽에서 가장 널리 쓰이는 모국어 중 하나입니다.그것은 고트족반달족의 언어였고, 폴란드와 헝가리의 가장 큰 부분에서도 계속되었다.그들은 저속한 언어 때문에 그녀의 사투리를 가지고 있다...그녀의 작가들 중 일부는 그녀가 낙원에서 사용되는 언어라고 믿게 만들 것이다."

"낙원의 언어"에 대한 탐구는 유럽의 모든 언어학자들 사이에서 시작되었다.라틴어로 쓴 사람들은 그것을 링구아 프리마, 링구아 프리마 또는 링구아 프리마라고 불렀다.영어에서 그것은 아다믹 언어였고, 독일어에서는 히브리어라고 믿으면 우르스프라체 또는 헤브래이스프라체였다.이 신비로운 언어는 순수함과 청렴함의 아우라를 가지고 있었고, 그러한 자질들이 후보자를 선정하는 데 사용되는 기준이었다.어스프레이슈의 개념은 신 문법학자들이 그들의 원어를 위해 그것을 채택하기 훨씬 전에 사용되었습니다.서로 크게 다른 언어군 사이의 차이는 여전히 [citation needed]좁혀지지 않고 있었다.

인도-유럽 모델

1786년 2월 2일 윌리엄 존스 경은 힌두교를 주제로 한 그의 3주년 담화를 회장으로서 아시아 협회에 전달했다.이 책에서 그는 나무 모델의 논리를 그리스어, 라틴어, 산스크리트어 3개 언어에 적용했지만, 역사상 처음으로 순수 언어적 근거에 근거해 "동사의 어근과 문법 형태 모두에서 우연히 만들어졌을 수 있는 것보다 더 강한 유사성"을 지적하며 나무 모델의 논리가 기원이라고 계속해서 가정했다."아마도 더 이상 존재하지 않는 공통 소스입니다."그는 그들에게 고딕, 켈트족, 페르시아어를 "같은 가족"[14]으로 추가했다.

존스는 그의 "공통 출처"를 밝히거나 그 아이디어를 더 발전시키지는 않았지만, 그것은 당시의 언어학자들이 채택했다.1813년 후반-1814년의 (런던) 분기 리뷰에서, 토마스 영은 요한 크리스토프 아델룽미트리다테스, oder allgemeine Sprachenkunde ("Mithridates, 또는 언어의 일반사")에 대한 리뷰를 발표했는데, 그 중 1권은 1806년과 1809년 사이에 나왔다.아델룽의 작품은 약 500개의 "언어들과 방언들"을 묘사했고 카슈미르 중심부에 위치한 카슈미르에서 500개의 총 범위에 이르는 천국의 언어로부터 보편적인 혈통을 가정했다.영은 아델룽이 콘라드 게스너의 미트리다테스, 1555년 디디피아의 링구아룸, 그리고 그 이후의 [15]언어와 알파벳 카탈로그에 빚을 진 것을 지적하는 것으로 시작한다.

카슈미르(빨간색), 아델룽의 에덴 위치

영은 아델룽의 분류를 발표한다.단음절형은 아담이 에덴에서 나가는 방향으로 에덴 동쪽에 있는 아시아에서 가장 오래되고 원시적인 유형이다.그 후 존스의 그룹은 여전히 이름은 없지만 존스의 탓으로 돌린다: "또 다른 고대 광범위한 언어 클래스는 완전히 우연일 수 있는 것보다 더 많은 유사성에 의해 결합된다.이 수업에서 그는 인도유럽이라는 이름을 제공하는데,[16] 인도유럽이라는 단어는 처음 알려진 언어 사용법이지만 처음 알려진 용법은 아니다.영국 동인도 회사는 인도와 [17]유럽 사이의 상품 무역을 의미하기 위해 "인도-유럽 무역"을 사용했다.영이 조상 집단에 대해 인용한 모든 증거들은 가장 유사한 단어들이다: 어머니, 아버지 등.

아델룽의 추가 계층은 타타르족, 아프리카인, 미국인으로, 지리학과 에덴에서 추정된 혈통에 의존했다.영은 천국의 언어에 대한 아델룽의 열정을 공유하지 않고 주로 투기적인 것으로 [citation needed]낙인찍는다.

영어에서 성공한 영의 지명은 1810년과 1867년 사이에 제안된 여러 후보들 중 하나일 뿐이었다: 인도-게르마니크(Conrad Malte-Brun, 1810년), 자페티스크(Rasmus Christian Rask, 1815년), 인도-게르마니쉬(Julius Claproth, 1823년), 무차별-ch-tsch-tschenner(Sch, 1826년).아리오에우로페오(Graziadio Isaia Ascoli, 1854), 아리안(Max Muller, 1861) 및 아리아케(H. Chavé, 1867).이 사람들은 모두 다국어이고 언어 천재였다.존스의 무비판적인 방법을 비판한 성공적인 독일어 후보 인도 게르마니쉬의 저자 클라프로스는 중국어, 일본어, 티베트어 등 많은 언어를 대본으로 알고 있었다.성서적 어스프래쉬의 개념은 그들의 상상력에 호소했다.점차 그것을 찾을 수 있다는 희망이 사라지자, 그들은 유라시아 평원의 유목 부족들이 말하는 공통 인도-유럽어라는 개념에 의존하게 되었고, 그들은 이 언어가 비교 언어학의 방법으로 추론될 수 있다는 좋은 주장을 펼쳤지만, 사실은 그렇게 된 것이 아니다.그것은 어스프래쉬를 찾기 위한 그들의 노력이 [citation needed]성공한 유일한 사례였다.

네오그라마리아 모형

그 모형은 네오그라미아인들에게 가장 엄격한 공식화 되어 있다. 모델은 음향 법칙의 예외성과 프로세스의 규칙성을 추가하여 윌리엄 존스, 프란츠 밥, 아우구스트 슐라이허초기 개념에 의존합니다.다윈주의와의 연관성을 확립하는 데 가장 책임이 있는 언어학자는 아마도 아우구스트 슐라이허였을 것이다.

Schleicher의 나무 모형

그러나 그가 1863년 에른스트 해켈에게 쓴 공개 서한에 의해 그가 그의 스탬바움, 즉 언어의 가계도를 다윈의 발표 직후에 비교했다는 것이 입증되었다.1869년, 헤켈은 그가 [citation needed]종의 기원을 읽을 것을 제안했다.

슐라이허는 그것을 읽은 후 "다위니시즘은 언어의 [18]과학에 의해 시험되었다"고 Die Darwinische Theorie and die Sprachwissenschaft를 썼다.진화 발견에 대한 다윈과 월러스 사이의 상황을 연상시키는 시나리오(둘 다 독립적으로 발견)에서 슐라이허는 다윈의 발표를 지지했지만 어떤 종도 삽입하지 않았다고 비판했다.그리고 나서 그는 언어 스탬바움(Stambaum)을 발표했는데, 이것이 그가 처음 [citation needed]출판한 것은 아니었다.

언어의 진화는 다윈의 진화론의 근원이 아니었다.그는 갈라파고스 제도의 핀치(finch)에서 관찰한 것과 같은 종의 변이에 근거했다.그들은 공통 조상의 변형으로 보였다.새로운 품종을 생산하기 위해 국내 종을 선택한 것도 그의 결론에 한몫했다.1859년 '의 기원' 초판에서는 분류라는 주제 아래 언어 나무를 마치 de novo처럼 다루고 있다.다윈은 [citation needed]린네가 고안한 동기 방식을 비판하면서 진화에 기초한 "자연적 배열"로 대체할 것을 제안한다.그는 말한다:[19]

언어의 경우를 예로 들어 분류에 대한 이 관점을 설명하는 것이 가치가 있을 수 있습니다.만약 우리가 인류의 완벽한 혈통을 가지고 있다면, 인류 종족의 계보 배열은 현재 전 세계에서 사용되는 다양한 언어의 가장 좋은 분류를 제공할 것이다; 그리고 모든 멸종 언어, 그리고 모든 중간 그리고 천천히 변화하는 방언이 포함되어야 한다면, 그러한 배열은, 내가 생각하기에, 유일하게 가능할 것이다.e. 그러나 일부 매우 오래된 언어는 거의 변하지 않고 새로운 언어가 거의 생겨나지 않은 반면, 다른 언어들은 (공통인종의 후손인 여러 종족의 확산과 고립과 문명 상태를 야기하여) 많이 변화하여 많은 새로운 언어와 사투리가 생겨났을 수도 있다.같은 종족에서 언어의 다양한 차이는 그룹에 종속된 그룹에 의해 표현되어야 할 것이다; 그러나 적절한 또는 심지어 가능한 배열은 여전히 계보일 것이다; 그리고 이것은 완전히 자연스러울 것이다, 사멸과 현대, 모든 언어를 가장 가까운 친족에 의해 연결시키고, 그리고 gii.각 혀의 모태와 기원을 파악한다.

슐라이처는 헤켈이 다윈을 슐라이처의 눈에 띄기 전까지 다윈에 대해 들어본 적이 없었다.그는 1859년 종의 기원 초판 6년 전인 1853년 기사에서 스탬바움에 관한 자신의 작품을 발표했다.언어의 혈통이라는 개념은 결코 새로운 것이 아니었다.독실한 언어학자 토마스 제퍼슨은 신조어의 지속적인 필요성은 언어가 "진보" 또는 "진보"[20]해야 한다는 것을 의미한다고 제안했다.이러한 생각들은 생물학적 종이나 언어의 진화를 예시하지만, 슐라이허와 다윈의 생각, 그리고 아마도 다윈이 역사 언어학자들과 접촉한 이후, 진화와 언어의 변화는 불가분의 관계가 되었고, 분류의 기초가 될 것이다.그때와 같이, 주요 문제는 특정한 혈통을 증명하고,[citation needed] 분기점을 확인하는 것이다.

계통수

이 오래된 은유는 1950년경 시작된 일련의 에세이에서 조셉 해롤드 그린버그에 의해 옛 이름으로 완전히 새로운 의미를 부여받았다.언어학자들이 가계도 은유를 채택한 이후, 진화 개념은 찰스 다윈에 의해 제안되었고 생물학에서 일반적으로 받아들여졌다.생물 분류인 분류법은 이미 칼 린네에 의해 발명되었다.그것은 모든 알려진 살아있는 유기체에 종명속명을 할당하기 위해 이항 명명법을 사용했다.이것들은 궁극적으로 다양한 종으로 갈라지는 여러 개의 식물군, 혹은 대부분의 일반적인 집단 아래 생물학적 계층 구조로 배열되었다.이러한 생물학적 분류의 근거는 관찰된 종의 [citation needed]공통적인 신체적 특징이었다.

그러나 다윈은 또 다른 고대 은유인 생명의 나무를 부활시키면서 린네 분류군(오늘날의 분류군)이 가장 단순한 것에서 가장 복잡한 것으로 시간이 지남에 따라 나무 구조에서 내려왔다는 가설을 세웠다.린네의 계층적 나무는 동기적이었고 다윈은 공통 혈통의 연대기적 과정을 상상했다.린네가 계급을 정했던 에서 다윈은 계급정했다.다윈 이후 수십 년 동안 린네의 계급은 혈통과 정확히 일치하지 않는다는 것이 분명해졌다.분류학의 주요 목표는 분류법을 발견하고 이를 반영하여 분류를 변경하는 것이었는데, 이는 국제기구가 종과 다른 분류법을 재분류하는 제안을 승인하고 발행하기 위해 보관하는 규칙서인 명명법 코드의 전반적인 지침에 따라 이루어졌다.새로운 접근법은 계통발생학이라고 불리며, "필라의 세대"라고 불리며, 이것은 새로운 나무 비유인 계통수를 고안했다.나무의 한 단위와 모든 자손 단위는 분지였고 분지의 발견은 [citation needed]분지학이었다.

아프리카어족 분류

그린버그는 계통학이 나중에 이용할 수 있는 도구가 부족했던 시기에 글을 쓰기 시작했다: 컴퓨터(컴퓨터 계통학)와 DNA 염기서열 분석(분자 계통학).클래디스트 관계를 발견하기 위해 연구자들은 정의되고 표로 작성될 수 있는 종들 사이의 많은 형태학적 유사성에 의존했다.통계적으로 유사성의 수가 많을수록 같은 계통 내에 있을 가능성이 더 높았다.이 접근방식은 언어적 보편성을 발견하는 데 관심이 있었던 그린버그에게 어필했습니다.가계도를 계통수로 만들기 위해 나무 모델을 바꾼다.[21]

"어떤 언어든 소리와 의미를 모두 가진 수천 개의 형태로 구성되어 있습니다...어떤 소리든 어떤 의미든 표현할 수 있어요따라서 두 언어가 상당수의 항목에서 일치한다면 우리는 반드시 공통의 역사적 기원에 대한 결론을 도출할 수 있다.이런 유전자 분류는 자의적인 게 아니라...생물 분류에 대한 유추는 생물학에서 우리가 같은 속이나 높은 단위로 종을 분류하는 것과 같이 매우 유사하다. 왜냐하면 유사성은 공통 혈통의 가설을 암시하는 것과 같기 때문이다. 언어의 유전적 가설과 같다."

이 비유에서 어족은 분지, 언어는 , 조어는 조상 분류군, 언어 트리는 계통수, 언어와 방언은 종과 변종과 같습니다.그린버그는 아프리카, 아메리카, 인도네시아, 유라시아 북부 등 지금까지 방치된 언어들의 특징을 표로 만들어 유사성에 따라 분류했다.그는 이 접근방식을 비교언어학[22]아닌 기술언어학으로 도달한 "일반적 분류"라고 불렀다.

날짜 및 글로또 연대기

비교 방법은 역사 언어학자들이 이산 어휘, 형태학, 음운학 데이터를 이용하여 나무 모델을 조각내기 위해 사용되어 왔다.연대를 찾을 수 있지만 이 시스템을 이용한 절대적인 날짜 추정은 없습니다.

Glottochronology는 절대적인 날짜를 추정할 수 있게 해준다.공통 동족어(역사적 기원을 공통으로 갖는다는 의미 인지)는 발산 시간을 계산한다.그러나 이 방법은 데이터를 신뢰할 수 없기 때문에 나중에 신뢰성이 떨어진 것으로 밝혀졌다.이러한 역사적 언어학자들이 인도유럽어족의 나이를 정확히 파악하는 데 어려움을 겪고 있다.언어의 흥망성쇠에서 비롯된 Dixon에 따르면 4000 BP에서 40,000 BP 사이 또는 그 사이의 날짜 중 어느 쪽이든 가능합니다(Cambridge University Press).[23]여기 [24]기사에서 보듯이.

글루토 연대학에서 가능한 해결책은 계산 계통학적 방법 때문에 제시될 것이다.진화 모델을 사용하는 등의 기술은 나뭇가지 길이와 토폴로지의 정확도를 향상시킵니다.거기서, 계산 계통학적 방법을 사용하는 것은, 연구자들이 진화생물학의 언어 데이터를 분석할 수 있게 해준다.이것은 또한 쿠르간 이론과 아나톨리아 이론과 같은 이론들을 서로 시험하는 데 도움을 주는데, 둘 다 인포-유럽 [24]언어의 기원을 주장한다.

역사언어학에서의 계산 계통학

비교 방법은 여러 언어의 특징을 비교하여 한 언어가 다른 언어와 얼마나 유사한지 평가합니다.이러한 평가의 결과는 데이터 지향적입니다.즉, 결과는 비교한 기능의 수와 언어의 수에 따라 달라집니다.컴퓨터가 역사 언어학계에 등장하기 전까지는 두 경우 모두 수가 적을 수밖에 없었습니다.그 효과는 적은 수의 큰 픽셀 또는 사진 단위를 사용하여 사진을 묘사하려고 시도하는 것이었습니다.나무 모형의 한계들은 너무나 고통스럽게 명백했고, 주요 역사 언어학자들의 불만을 야기했다.[citation needed]

20세기 후반에 언어학자들은 언어를 분류하기 위해 생물학적 분류를 위한 소프트웨어를 사용하기 시작했다.프로그램과 방법은 점점 더 정교해졌다.21세기 초 역사언어학자들의 컨소시엄인 CPHL(Computational Phylogenetics in Historical Languageology) 프로젝트는 미국 국립과학재단으로부터 계통학을 [25]연구하기 위한 자금을 받았다.인도-유럽어족은 주요 연구 주제이다.2012년 1월 현재, 그들은 "음운론 문자 22개, 형태론 문자 13개, 어휘 문자 259개"의 "스크린된" 데이터베이스와 더 많은 데이터베이스를 수집하고 코드화했다.24개의 인도-유럽어족 언어들의 단어 목록이 포함되어 있다.기능 및 언어의 수가 많을수록 특정 기준을 충족할 경우 정확도가 높아집니다.특수 컴퓨터 소프트웨어를 사용하여, 그들은 유전적인 [citation needed]혈통에 의해 성격을 설명할 수 있는 능력에 대한 다양한 계통학적 가설을 테스트합니다.

모델의 제한 사항

트리 모델의 고유 제한 중 하나는 그 기초가 되는 바로 그 추정입니다.그것은 languages.or에 근거한 분류가 필요하며, 보다 일반적으로는 언어 품종에 관한 분류가 필요합니다.다양성은 언어적 특징의 전체로부터 추상화를 나타내기 때문에 (등손 지도에서) 데이터를 트리로 변환하는 동안 정보가 손실될 수 있습니다.예를 들어, 사투리 continua의 문제가 있다.이들은 분명히 한 가지 또는 다른 언어가 아닌 여러 가지 특징을 가진 품종을 제공한다.그들이 어떻게 분류되는지에 대한 문제는 고리종이 [citation needed]생물학에서 종 분류의 개념에 제시하는 문제와 유사하다.

나무 모델의 한계, 특히 방언 연속에서 공유된 혁신의 비이산 분포를 처리할 수 없는 한계들은 비클래디즘적(비나무 기반) 방법론의 개발을 통해 해결되었다.여기에는 Wave 모델, 그리고 최근에는 [3]링크 개념이 포함됩니다.

트리 모델의 추가 제한은 혼합 언어 및 하이브리드 언어뿐만 아니라 트리 모델이 분산을 허용하는 일반적인 언어 혼합을 포함합니다.예를 들어, 주커만(2009:63)[26]에 따르면, 가 셈토-유럽의 잡종으로 간주하는 현대 히브리어에 대한 그의 용어인 "이스라엘"은 "언어적 기원의 현실이 단순한 가계도 시스템이 허용하는 것보다 훨씬 더 복잡하다는 것을 보여준다.'복귀된' 언어에는 한 부모만 있을 것 같지 않다.

완벽한 계통 발생

계통발생 소프트웨어의 목적은 클래드그램(ladogram)을 생성하는 것입니다.클래드그램은 링크가 분기되는 특수한 종류의 트리입니다.즉, 같은 방향의 노드에서는 2개의 분기만 제공됩니다.입력 데이터는 현재 (1) 또는 부재(0)와 같이 서로 다른 언어로 상태를 할당할 수 있는 문자 집합입니다.따라서 언어는 고려된 모든 문자의 상태 값으로 구성된 고유한 좌표 집합에 의해 기술될 수 있습니다.이들 좌표는 서로 비슷할 수도 있고 비슷할 수도 있습니다.가장 많은 상태를 공유하는 언어들은 서로 [citation needed]가장 유사하다.

소프트웨어는 모든 언어의 모든 문자의 상태를 여러 수학적 방법 중 하나로 마사지하여 각 언어와 나머지 언어를 쌍으로 비교합니다.그런 다음 유사도에 따라 분해도(cradogram)를 구성한다. 예를 들어, 서로 가장 가까운 가설 언어 a와 b는 공통 조상 a-b를 가지고 있다고 가정한다.다음으로 가까운 언어인 c는 a-b 등과 공통의 조상을 가지고 있다고 가정합니다.그 결과 전체 공통 조상(근원)에서 언어(잎)로 이어지는 일련의 역사적 경로가 투영됩니다.각 경로는 고유합니다.경로 간 링크는 없습니다.각 리프 및 노드에는 상위 항목이 하나뿐입니다.모든 주는 다른 주로부터의 혈통에 의해 설명된다.이러한 요구 사항을 준수하는 분지도는 완벽한 [27]계통발생학이다.

처음에는 관련성이 있다고 추정되는 요소를 바꾸는 시험에서 결과의 일관성이 거의 없어 보였다.새로운 분지도는 어떤 변화에서 비롯되었으며, 이는 이 방법이 언어의 근본적인 진화를 포착하는 것이 아니라 연구자들의 즉석적 판단만을 반영하는 것임을 시사했다.계통 발생과 관련이 있는 요인을 찾기 위해 연구진은 결과의 정확성을 측정할 필요가 있었다. 즉, 알려진 계통 발생에 대해 결과를 보정해야 했다.그들은 가장 안전한 인도-유럽 계통 발생에 가장 가까운 것을 찾는 다른 가정을 사용하여 실험을 실행했다.그러한 가정은 인도-유럽 계통 발생의 문제 영역에 더 [citation needed]큰 확신을 가지고 사용될 수 있다.

합리적으로 유효한 계통 발생을 얻기 위해서는 음운학, 어휘학, 형태학 세 가지 문자 모두를 입력할 필요가 있다는 것을 연구진은 발견했는데, 이 문자들은 계통 발생을 계산하기 위해 충분히 상세한 그림을 제시하는데 모두 필요했다.오직 질적인 캐릭터만이 의미 있는 결과를 만들어냈다.반복 상태는 소프트웨어에 의해 올바르게 해석되기에는 너무 모호했다.따라서 포메이션과 병렬 개발의 대상이 되는 문자를 각각 이전 상태로 되돌리거나 다른 문자로 진화한 상태를 채택한 문자를 입력 [28]데이터 세트에서 스크리닝했다.

완벽한 계통 네트워크

CPHL에 의해 포지셔닝된 많은 시스템 생성 네트워크 중 하나.계통수가 검은 선으로 표시됩니다.접점 가장자리는 빨간색 선입니다.여기에는 인도-유럽어족에게 실현 가능한 네트워크를 만들기 위해 필요한 가장 인색한 숫자인 세 가지가 있다.

충분한 숫자로 최고의 질적 문자를 코드화하려는 그들의 관심에도 불구하고, 연구원들은 인도-유럽어족의 게르만어족과 알바니아어족과 같은 일부 그룹에 대한 완벽한 계통 발생을 얻을 수 없었다.그들은 그룹의 계산된 조상의 유전적 혈통으로는 설명할 수 없는 상당한 수의 문자가 차용되었다고 추론했다.아마도 차용에 대해 설명한 파동모형이 그룹의 특징을 완전히 설명한 것이라면, 그것에 대한 계통 발생을 전혀 찾을 수 없을 것이다.두 모델이 부분적으로 효과적이라면 트리가 존재하지만 비유전학적 설명으로 보완해야 한다.따라서 연구원들은 빌리는 [29]가능성을 포함하기 위해 소프트웨어와 방법을 수정했다.

연구진은 이 실험에 계면의 개념을 도입했다.즉, 성격 상태가 흐를 수 있는 경계를 허용했다.부모와 자식 사이에 단방향 인터페이스(엣지)가 존재했습니다.만약 한 언어의 모든 상태의 존재를 설명하기에 단방향 가장자리만 충분하다면, 완벽한 계통 발생을 넘어서는 것을 볼 필요는 없었다.그렇지 않으면 하나 이상의 접점 가장자리 또는 양방향 인터페이스가 계통 발생에 추가될 수 있습니다.따라서 언어에는 여러 상태 소스(부모 언어 또는 연락처 언어)[citation needed]가 있을 수 있습니다.

이렇게 수정된 트리는 더 이상 트리가 아닙니다. 뿌리에서 잎으로 가는 경로가 여러 개 있을 수 있습니다.연구자들은 이 배치를 네트워크라고 불렀다.캐릭터의 상태는 여전히 루트부터 리프까지 고유한 경로를 따라 진화했지만, 그 기원은 고려 중인 루트 또는 연락처 언어일 수 있습니다.만약 실험의 모든 상태가 네트워크에 의해 설명될 수 있다면, 그것은 완벽한 계통 [30]발생 네트워크라고 불렸습니다.

호환성 및 실현 가능성

네트워크의 생성에는 2개의 단계가 필요했습니다.첫 번째 단계에서, 연구원들은 적합성을 테스트하기 위해 후보 나무라고 불리는 많은 계통 발생학을 고안했다.생성된 [31]계통 발생으로 기원을 설명할 때 캐릭터가 호환됩니다.완벽한 계통 발생으로 모든 캐릭터가 호환되며 트리도 100% 호환됩니다.절약, 즉 Occam's 면도기의 원리에 따르면 네트워크는 보증되지 않습니다.후보 나무는 먼저 인도-유럽어 데이터 세트(성격 상태의 문자열)를 입력으로 사용하여 계통 발생 소프트웨어를 실행한 다음,[citation needed] 결과 트리를 테스트할 다른 가설로 수정하여 얻었다.

원래의 후보 나무들 중 어떤 것도 완벽한 계통수는 아니었지만, 그 안에 있는 하위 나무들 중 일부는 그랬다만.다음 단계에서는 인터페이스를 1개씩 추가하고 호환성이 가장 높은 인터페이스를 선택하여 호환성 점수가 가장 높은 트리에서 네트워크를 생성하여 충분한 호환성이 확보될 때까지 네트워크를 생성합니다.즉, 네트워크의 호환성이 가장 높습니다.결과적으로 생성된 호환 네트워크의 수는 없음에서 12개가 넘을 수 있습니다.다만, 사용 가능한 모든 인터페이스가 역사적으로 실현 가능한 것은 아닙니다.일부 언어 간의 인터페이스는 지리적으로나 연대적으로 그리 많지 않았습니다.결과를 조사하면서, 연구원들은 실행 불가능한 인터페이스를 호환성 [citation needed]점수 순으로 배열할 수 있는 실행 가능한 네트워크 목록만 남을 때까지 제외했다.

인도-유럽어족에게 가장 적합한 네트워크

연구진은 우선 인도-유럽어 후보 나무 5그루, 알파벳 A-E, 계통발생 소프트웨어에서 생성된 나무 1그루, 2그루, 그리고 역사언어학자이자 인도-유럽어학자 크레이그 멜체르트가 제안한 나무 2그루로 시작했다.나무들은 주로 가장 애매한 집단인 게르만어족과 알바니아어의 배치에 차이가 있었는데, 이 언어들은 정확히 그것을 배치하기에 충분한 특징을 가지고 있지 않았다.트리 A에는 호환되지 않는 문자 B, 19, C, 17, D, 21, E, 18이 14개 포함되어 있습니다.트리 A와 C는 호환성 점수가 가장 우수했습니다.비호환성은 모두 어휘적이었고, A는 C의 [32]하위 집합이었다.

후속 세대의 네트워크에서는 트리E를 제외한 모든 비호환성은 최소 3개의 접점 엣지로 해결할 수 있습니다.호환성이 높지 않아 제외했다.트리 A에는 16개의 네트워크가 있으며, 실현 가능성 검사에서는 3개로 축소되었습니다.트리 C는 하나의 네트워크를 가지고 있었지만 슬라브어가 아닌 발트어와의 인터페이스가 필요했기 때문에 [33]실현 가능하지 않았습니다.

가장 적합하고 실현 가능한 나무인 나무 A는 기원전 4000년에서 2250년 사이에 인도유럽조어에서 분리된 7개의 그룹을 다음과 같이 가정한다.[34]

  • 가장 먼저 분리된 것은 기원전 4000년 경 아나톨리아였다.
  • 토카리안은 기원전 약 3500년에 그 뒤를 이었다.
  • 그 직후, 약 3250년, 이탈리아 켈트족(서인도-유럽)이 분리되어 기원전 2500년에 이탈리아 켈트족과 켈트족이 되었다.
  • 약 3000년에 알바노-게르만 조어가 분리되었고, 약 2000년에 알바니아어와 게르만조어가 되었다.
  • 약 3000년에 그리스조어(남부 인도-유럽어)가 갈라져 1800년에 그리스조어와 아르메니아조어가 되었다.
  • 발트 슬라브어는 약 2500년경에 나타나며, 약 1000년에 발트조어와 슬라브조어로 나뉜다.
  • 마침내 인도유럽조어는 약 2250년에 인도-이란조어가 되었다.

나무 B와 E는 게르만어-발토-슬라브어(북부 인도-유럽어)의 대체어를 제공하여 알바니아어를 독립어파로 만든다.작가들이 보증하는 유일한 날짜는 얌나 문화, 안드로노보 문화 및 알려진 인도-아리아어 사용 문화의 연속성에 기초해 볼 때 마지막 날짜입니다.다른 모든 것들은 "사산"[35]으로 묘사된다.

최상의 호환성을 가진 계통 발생 A를 고려할 때 호환성을 완료하려면 세 개의 접점 가장자리가 필요합니다.대여 이벤트가 [35]가장 적은 에지 그룹입니다.

  • 첫째, 주어진 데이트 체계에 따르면 2000년 이후에 시작된 이탈리아조어와 게르만조어 사이의 경계입니다.
  • 두 번째 접촉 가장자리는 이탈리아 원어와 아르메니아 원어 사이의 것으로, 2500년 이후에 시작되었을 것이다.
  • 세 번째 접점은 게르만조어와 발트조어 사이의 것으로 1000년 이후에 시작되었을 것이다.

트리 A는 가장자리 위에 설명하고 있는 모든 PPNs에서"최선을 조달 계획 번호."[36]로 저자들에 의한 묘사된다, 이것은 비록 초기 파생 언어 상대적인 고립 상태에서 독특하게 되었다는 그 그룹들의 후기 진화로 교환하는 모드로 열린다 다른 언어와 가까운 곳에 있는 진화에 의해서만 설명될 수 있는 것은 명백하다.l.

「 」를 참조해 주세요.

메모들

  1. ^ a b List, Johann-Mattis; Nelson-Sathi, Shijulal; Geisler, Hans; Martin, William (2014). "Networks of lexical borrowing and lateral gene transfer in language and genome evolution". BioEssays. 36 (2): 141–150. doi:10.1002/bies.201300096. ISSN 0265-9247. PMC 3910147. PMID 24375688.
  2. ^ a b 프랑수아(2014).
  3. ^ a b Bloomfield 1933, 311페이지, Hegarty et al. (2010); Francois (2014) 참조.
  4. ^ Saint Augustine. "XVI: 9-11". City of God.
  5. ^ 창세기 10:25
  6. ^ 1 연대기 1장 19절.
  7. ^ Saint Augustine (Bishop of Hippo.) (1871). The Works of Aurelius Augustine: A New Translation. T. & T. Clark.
  8. ^ 브라운 1684, 페이지 223–241
  9. ^ 브라운 1684, 페이지 224
  10. ^ 브라운 1684, 페이지 225
  11. ^ 브라운 1684, 페이지 228
  12. ^ 브라운 1684, 페이지 226–228
  13. ^ Howell, James (1688) [1645]. "Letter LVIII To the Right Honourable the Earl R.". Epistolae Ho-Elianae, Familiar Letters, Domestic and Forren, Divided into Four Books, Partly Historical, Political, Philosophical, Upon Emergent Occasions. Vol. II (6th ed.). London: Thomas Guy. p. 356.
  14. ^ Jones, William (1807) [1786], "Third Anniversary Discourse, on the Hindus", in Lord Teignmouth (ed.), The Works of Sir William Jones with the life of the Author, in Thirteen Volumes, vol. III, London: John Stockdale and John Walker, p. 34
  15. ^ 청년 1813, 페이지 251
  16. ^ 영 1813, 페이지 255
  17. ^ Grant, Robert (1813). A sketch of the history of the East-India company, from its first formation to the passing of the Regulating act of 1773; with a summary view of the changes that have taken place since that period in the internal administration of British India. London: Black, Parry, and Co. [etc.] pp. xxxiv–xxxv.
  18. ^ D M Williams, D.M.; Malte C Ebach; Gareth J Nelson (2008). Foundations of systematics and biogeography. New York, NY: Springer. p. 45.
  19. ^ Darwin, Charles (1860). On the origin of species by means of natural selection, or, The preservation of favoured races in the struggle for life. London: J. Murray. p. 422. it may be worth while to illustrate this view of classification by taking the case of languages Darwin.
  20. ^ Post, David G (2009). In search of Jefferson's moose: notes on the state of cyberspace. Oxford; New York: Oxford University Press. p. 125.
  21. ^ Greenberg, Joseph H. (1990) [1954], "A Quantitative Approach to the Typological Morphology of Language", in Denning, Keith M.; Kemmer, Suzanne (eds.), On language: selected writings of Joseph H. Greenberg, Stanford: Stanford University Press, pp. 3–4
  22. ^ Greenberg, Joseph Harold (1971). Language, culture, and communication. Stanford: Stanford University Press. p. 113.
  23. ^ Dixon, R. M. W. (1997). The Rise and Fall of Languages by R. M. W. Dixon. Cambridge Core. doi:10.1017/CBO9780511612060. ISBN 9780511612060. Retrieved 2017-09-26.
  24. ^ a b D, Gray, Russell; D, Atkinson, Quentin (2003-11-27). "Language-tree Divergence Times Support the Anatolian Theory of Indo-European Origin". Nature. Nature Publishing Group. 426 (6965): 435–9. doi:10.1038/nature02029. PMID 14647380. S2CID 42340.
  25. ^ "CPHL: Computational Phylogenetics in Historical Linguistics". 2004–2012.
  26. ^ 주커만, 길라드2009. "하이브리드재생성: 복수 인과관계, 형태, 패턴." 언어연락 저널, Varia 2:40-67.
  27. ^ 2005년 나클레, 페이지 383
  28. ^ Nakhleh 2005, 384-385페이지.
  29. ^ 사용된 알고리즘의 기술적 세부사항은 Nakhleh 2005, 부록 A에 명시되어 있다.데이터 집합의 세부 사항은 부록 B에 명시되어 있습니다.
  30. ^ Nakhleh 2005, 388-391페이지.
  31. ^ 2005년 나클레, 페이지 387
  32. ^ 2005년 나클레, 페이지 396
  33. ^ 2005년 나클레, 페이지 400
  34. ^ 2005년 나클레, 페이지 398
  35. ^ a b 2005년 나클레, 페이지 401
  36. ^ 2005년 나클레, 페이지 407

참고 문헌

외부 링크

  • Labov, William (2010). "15. The Diffusion of Language from Place to Place". Principles of Linguistic Change. Vol. 3: Cognition and Cultural Factors. UK: Wiley-Blackwell – via Scribd.
  • Santorini, Beatrice; Kroch, Anthony (2007). "Node Relations". The syntax of natural language: An online introduction using the Trees program. University of Pennsylvania.