콤비네이션 분류 문법

Combinatory categorial grammar

결합 분류 문법(CCG)은 효율적으로 구문 분석할 수 있지만 언어학적으로 표현되는 문법 형식주의다. 술어-인수 구조, 정량화, 정보 구조를 포함한 표면 구문과 기초적인 의미 표현 사이의 투명한 인터페이스를 가지고 있다. 형식주의는 (상속성에 기반한 것과 반대되는) 선거구 기반 구조를 생성하며, 따라서 (상속 문법에 반대되는) 구문 구조 문법의 한 유형이다.

CCG는 람다 미적분과 표현력은 같지만 표현력은 다르게 만드는 결합 논리에 의존한다. 스티드만과 스자볼csi는 콤비네이터의 문법을 기초로 한 최초의 언어적, 심리학적 논거를 제시했다.

이 접근법의 최근 저명한 지지자는 Pauline JacobsonJason Baldridge이다. 이러한 새로운 접근법에서 콤비네이터 B(컴비네이터)는 '메리가 누구를 말하고 있다고 생각하느냐'에서와 같이 장거리 종속성을 만들 때 유용하며, 콤비네이터 W(복제자)는 '메리가 자신에 대해 말한다'에서와 같이 반사 대명사의 어휘 해석으로서 유용하다. I(아이덴티티 매핑) 및 C(퍼머레이터)와 함께 이것들은 원시적이고 상호 정의할 수 없는 결합기 세트를 형성한다. 제이콥슨은 개인 대명사를 콤비네이터 1로 해석하고, 이들의 결합은 '메리가 길을 잃었다'에서처럼 복잡한 콤비네이터 Z에 의해 도움을 받는다. Z는 W와 B를 사용하여 정의할 수 있다.

형식주의의 일부

CCG 형식주의는 많은 조합자를 정의한다(응용프로그램, 구성, 형식 상승이 가장 일반적이다). 이것들은 구문형식의 어휘목록에서 작동하는데, 자연적 차감 방식의 증명서를 사용한다. 증명서의 목적은 일련의 어휘적 항목에 결합기를 적용하는 방법을 찾는 것이다. 단서적 항목이 교정에서 사용되지 않을 때까지 말이다. 증명이 완료된 후 결과로 나타나는 유형은 전체 표현식의 유형이다. 따라서 어떤 단어들의 순서가 어떤 언어의 문장이라는 것을 증명하는 것은 그 단어가 S형까지 줄어든다는 것을 증명하는 것과 같다.

통사형

어휘 항목의 통사적 형식S, N 또는 NP와 같은 원시 형식이거나 S\NP 또는 NP/N과 같은 복합 형식일 수 있다.

X/YX\Y로 도식화할 수 있는 복잡한 형식은 Y 유형의 인수를 취하고 X 유형의 객체를 반환하는 펑터 유형을 나타낸다. 슬래시는 인수가 오른쪽에 나타나야 함을, 백슬래시는 인수가 왼쪽에 나타나야 함을 의미한다. 어떤 유형이든 여기서 XY를 대표할 수 있어 CCG의 구문형식은 재귀형 시스템이 된다.

응용 프로그램 결합기

전진적용 및 후진적용에 대해서는 >로 표기하는 경우가 많은 응용 프로그램 콤비네이터는 적절한 유형을 가진 인수에 펑터형 어휘 항목을 적용한다. 적용의 정의는 다음과 같이 주어진다.

컴포지션 콤비네이터

합성 콤비네이터는 포워드 구성의 > 후진구성의 경우 B < {}}로 표기되는 경우가 많으며 수학의 함수 구성과 유사하며 다음과 같이 정의할 수 있다.

유형 상승 결합기

The type-raising combinators, often denoted as for forward type-raising and for backward type-raising, take argument types (usually primitive types) to functor types, which take as their argument the functors that, before type-raising, would have taken them as arguments.

"개 물린 존"이라는 문장은 가능한 많은 다른 증거들을 가지고 있다. 아래는 그들 중 몇 명이다. 다양한 증거들은 CCG에서 문장의 다른 모델들처럼 문장이 하나의 구조를 가지고 있지 않다는 사실을 보여준다.

이러한 어휘 항목의 유형은 다음과 같다.

우리는 다음과 같이 가장 간단한 증명(간단함을 위해 표기법을 약간 바꾸는 것)을 수행할 수 있다.

타이핑을 선택하고 일부를 구성하면 완전히 증분하여 왼쪽에서 오른쪽으로 증거를 얻을 수 있을 것이다. 그러한 증거를 구성할 수 있는 능력은 CCG의 심리 언어적 타당성에 대한 주장인데, 청취자들은 실제로 그들이 완성되기 전에 발언의 부분적 해석(합리적, 의미적)을 구성하기 때문이다.

형식 특성

CCGs는 n : ^{n}n: 0비 컨텍스트-자유 인덱스 언어임)를 생성할 수 있는 것으로 알려져 있다. 이 언어의 문법은 Vijay-Shanker와 Weir(1994)에서 찾을 수 있다.[1]

Vijay-Shanker와 Weir(1994)는 [1]Linear Indexed Grammars, Combinative Categorial Grammars, Tree-adjection Grammars, Head Grammar가 모두 동일한 문자열 언어를 정의한다는 점에서 약하게 동등한 형식임을 입증한다. Kuhlmann 외 연구진(2015)[2]은 이러한 동등성과, 에서 설명되지 않은 방식으로 조합 규칙의 사용을 특정 범주로 제한하는 능력에 결정적으로 의존하는 n d {을(를) 기술하는 CCG의 능력을 보여준다

참고 항목

참조

  1. ^ a b 비제이 생커, K. 와이어, 데이비드 J. 1994. 컨텍스트 그래머의 네 가지 확장자의 동등성. 수학 시스템 이론 27(6): 511–546.
  2. ^ Kuhlmann, M, Koller, A, Satta, G. 2015. CCG어휘화생성력. 컴퓨터 언어학 41(2): 215-247.

추가 읽기

  • Michael Moortgat, Categial Type Logics, 제2장 J. van Benthem과 A. ter Meulen (eds) 논리언어 핸드북. 엘스비에, 1997년 ISBN0-262-22053-9
  • homepages.inf.ed.ac.uk

외부 링크