코레퍼런스

Coreference

언어학에서 상호 참조는 때때로 두 개 이상의 표현이 같은 사람 또는 사물을 지칭할 때 발생합니다; 그들은 같은 참조를 가집니다.를 들어, 빌은 앨리스가 도착할 것이라고 말했고, 그녀는 앨리스와 그녀가 같은 [1]사람을 가리킨다는 을 했다.

공동 참조는 종종 결정하기가 쉽지 않습니다.를 들어, 빌이 오겠다고 했을 때, 그가 빌을 지칭할 도 있고 그렇지 않을 수도 있다.어떤 표현이 상호 참조인지 결정하는 것은 의미를 분석하거나 이해하는 데 중요한 부분이며, 종종 문맥, 실제 지식, 예를 들어 특정 종(Rover), 아티팩트 종류(Titanic), 문법적 성별 또는 다른 속성과 관련된 일부 이름의 경향으로부터 정보를 필요로 한다.

언어학자들은 이 올 것이라고 말한i처럼i 관련성을 알리기 위해 색인을 사용하는 것이 일반적이다.이러한 표현은 공색인화 되어 있기 때문에 상호 연관성이 있다고 할 수 있습니다.

표현이 핵심인 경우 가장 먼저 나타나는 형식은 전체 형식 또는 설명 형식(예: 제목 및 역할 포함 전체 개인 이름)이며, 이후 형식에서는 짧은 형식(예: 지정된 이름, 성 또는 대명사)이 사용됩니다.앞의 것은 선행(precedent)이라고 하며, 다른 것은 (proform, anaphor 또는 reference)라고 불립니다.그러나 대명사는 때때로 "그녀가 집에 도착했을 때, Alice는 잠을 잤다"와 같이 앞말을 나타낼 수 있다.이러한 경우 상호 참조는 무지외교적이라기보다는 격변적이라 불린다.

구문 분야에서의 바인딩 현상에 대해서는 코어레퍼런스가 중요합니다.결속 이론은 문장과 텍스트의 핵심적 표현 사이에 존재하는 구문적 관계를 탐구한다.

종류들

상호 선호를 탐구할 때, 아나포라, 카타포라, 분할 선행어, 상호선호 명사구 [2]등 수많은 구별을 할 수 있다.이러한 보다 구체적인 현상 중 몇 가지를 다음에 나타냅니다.

아나포라
ai. 음악이 너무 커서 즐길i 수 없었다.-이것이 참조하는 표현(이전)에 따르는 애너포어.
우리 이웃들은 음악i 싫어한다.그들이 화가 나면 경찰i 곧 나타날 것이다.애너포어는 그것이 참조하는 표현(이전)을 따릅니다.
카타포라
만약 그들i 음악에 화가 나면, 이웃들i 경찰을 부를 것이다.– 참조하는 표현(후행) 앞에 있는 표식.
b. 그녀의 어려움에도 불구하고i, 윌마i 요점을 이해하게 되었다.caphor는 그것이 참조하는 표현 앞에 있다(후행).
분할 선행 요소
캐롤i 밥에게 파티에 참석하라고 말했다i.그들i 함께 도착했다. – 캐롤 밥 둘 대해 언급하는 두 가지 전조가 있다.
b. 캐롤이 i 밥이 캐롤을 도울ii 때, 그들i 어떤 일이든 해낼i 수 있다.CarolBob을 모두 지칭하는 Anaphor에는 분할 선행어가 있습니다.
명사 구문의 연관성
a. 프로젝트i 리더가 도움을 거부합니다.i 멍청이는 자기 생각만 한다.– 두 번째 명사 구는 첫 번째 명사 구에 대한 서술어입니다.
b. 우리 동료들1일부는 지지할 것입니다.이런 사람들1 우리의 감사를 받을 것이다.– 두 번째 명사 구는 첫 번째 명사 구에 대한 서술어입니다.

한계 변수와의 관계

의미론자와 논리학자들은 때때로 상호 참조와 결합 [3]변수로 알려진 것을 구별한다.바운드 변수는 프로포름의 선행자가 무한정 수량화된 식일 때 발생합니다.[4][clarification needed]

  1. 모든i 학생은 성적을 받았다i.대명사 his는 결합 변수의 예입니다.
  2. 어떤i 학생도 그의 성적에 i 나지 않았다.대명사 his는 결합 변수의 예입니다.

모든 학생 및 학생 없음과 같은 수량화된 표현은 참조 표현으로 간주되지 않습니다.이 표현들은 문법적으로 특이하지만 담화나 현실에서 하나의 참조어를 골라내는 것은 아니다.그러므로 이러한 예에서 그의 선행자는 적절하게 참조되지 않으며 그의 것도 아니다.대신 선행 변수에 의해 구속되는 변수로 간주됩니다.그것의 참조는 담화 세계의 학생들 중 누구를 생각하느냐에 따라 달라집니다.바운드 변수의 존재는 다음 예제를 통해 더욱 명확해질 수 있습니다.

  1. 만이i 그의 성적을 좋아한다i.대명사 his는 결합 변수일 수 있습니다.

이 문장은 애매하다.그것은 잭이 그의 성적을 좋아하지만 다른 사람들은 모두 잭의 성적을 싫어한다는 것을 의미할 수도 있고, 잭을 제외하고는 아무도 자신의 성적을 좋아하지 않는다는 것을 의미할 수도 있다.첫 번째 의미에서는, 의 말은 상호 연관성이 있고, 두 번째 의미에서는, 그것의 기준이 모든 학생들의 집합에 걸쳐 다르기 때문에 그것은 구속 변수이다.

코인덱스 표기법은 두 경우 모두 일반적으로 사용됩니다.즉, 두 개 이상의 식을 동시에 색인화하면 하나가 상호 참조 또는 바인딩 변수를 처리하는지(또는 마지막 예에서와 같이 해석에 따라 결정되는지) 알 수 없습니다.

상호 참조 해결

컴퓨터 언어학에서 상호 참조 해결은 담화에서 잘 연구된 문제이다.텍스트의 올바른 해석을 이끌어내거나 심지어 언급된 다양한 주어의 상대적 중요성을 추정하기 위해서, 대명사와 다른 참조 표현은 올바른 개인과 연결되어야 한다.상호 참조를 해결하기 위한 알고리즘은 일반적으로 참조 표현과 호환되는 가장 가까운 개인을 먼저 찾습니다.예를 들어, 그녀여자같은 앞의 표현에 애착을 가질 수 있지만, 아마도 빌에게는 애착이 가지 않을 것이다.그와 같은 대명사는 훨씬 더 엄격한 제약을 가지고 있다.많은 언어 태스크와 마찬가지로 정밀도와 리콜 사이에는 트레이드오프가 있습니다.상호 참조 해결 알고리즘을 평가하는 데 일반적으로 사용되는 클러스터 품질 메트릭에는 랜드 지수, 조정된 랜드 지수 및 다양한 상호 정보 기반 방법이 포함됩니다.

영어 상호 참조 해결의 특별한 문제는 대명사인데, 대명사는 많은 용도를 가지고 있다.그것일반적으로 무생물을 지칭한다는 것을 제외하면 그와 그녀처럼 말할 수 있다. 규칙은 실제로 더 복잡하다: 동물은 그 하나일 수 있다; 배는 전통적으로 그녀일 수 있다; 허리케인은 보통 남자 이름에도 불구하고 그것이다., 예를 들면, 존재보다는 추상화를 예로 들 수 있음)를 참조할 수도 있습니다.그는 최저임금을 받았지만 개의치 않는 것 같았다.마지막으로, 특정 용도를 지칭하지 않는 다항성 용도가 있습니다.

  1. 가 온다.
  2. 정말 아쉽다.
  3. 성공하려면 많은 노력이 필요하다.
  4. 때로는 가장 큰 영향력을 가진 사람이 가장 시끄럽다.

다발성 용도는 참조로 간주되지 않으므로 상호 [5]참조의 일부가 아니다.

상호 참조 해결에 대한 접근방식은 크게 언급 쌍, 언급 순위 또는 실체 기반 알고리즘으로 나눌 수 있다.언급 쌍 알고리즘은 주어진 두 개의 언급 쌍이 같은 엔티티에 속할 경우 이진 결정을 수반합니다.성별과 같은 개체 전체의 제약은 고려되지 않으며, 이는 오류 전파로 이어진다.를 들어, 대명사는 선생님과의 상호 연관성이 높지만 상호 연관성이 있을 수는 없습니다.언급 순위 알고리즘은 이 아이디어를 확장하지만, 대신 하나의 언급이 하나의 언급과 (이전) 언급만 상호 연관될 수 있도록 규정한다.그 결과, 각각의 이전 언급에 점수를 부여해야 하며, 가장 높은 점수를 받은 언급(또는 언급 없음)이 링크됩니다.마지막으로, 실체 기반 방법에서 언급은 개별 언급 대신 전체 상호 참조 사슬의 정보에 기초하여 연결된다.가변 폭 체인의 표현은 언급 기반 방법보다 더 복잡하고 계산 비용이 많이 든다. 이는 이러한 알고리즘이 대부분 뉴럴 네트워크 아키텍처에 기초하게 한다.

「 」를 참조해 주세요.

메모들

  1. ^ 상호 참조의 정의에 대해서는, 예를 들면, Crystal(1997:94) 및 Radford(2004:332)를 참조해 주세요.
  2. ^ 이러한 구별(아나포라, 카타포라, 분할 선행어, 명사구 등)은 Jurafsky와 Martin(2000:669ff)에서 논의된다.
  3. ^ 바인드 변수에 대한 자세한 내용은 instance Portner(2005:102ff.)를 참조해 주세요.
  4. ^ 여기에 나와 있는 변수와 같은 바인딩 변수의 예를 보려면 Jurafsky 및 Martin(2000:701)을 참조하십시오.
  5. ^ 리 등(2009년)는 를 분류하는 데 높은 정확성을 보여주었으며, 이 성공으로 상호 참조 분해능의 정확성을 전반적으로 개선할 수 있을 것으로 기대된다.

레퍼런스

  • 크리스탈, D. 1997언어학 및 음성학 사전.제4판케임브리지, 매사추세츠: 블랙웰 출판사.
  • Jurafsky, D.와 H. Martin 2000.음성 및 언어 처리:자연어 처리, 컴퓨터 언어학, 음성 인식 소개.인도, 뉴델리: 피어슨 교육.
  • 포트너, 페이지 2005의미론이란?형식적 의미론의 기초.Malden, MA: Blackwell Publishing.
  • 래드포드, A. 2004영어 구문: 소개.케임브리지, 영국: 케임브리지 대학 출판부.
  • Li, Y, P. Musilek, M. Format, L.Wyard-Scott 2009.웹을 사용한 다발성 경화 식별.인공지능 연구 저널 34, 339–389.