코로케이션 추출

Collocation extraction

코로케이션 추출컴퓨터를 사용하여 코퍼스에서 코로케이션을 자동으로 추출하는 작업입니다.

코로케이션 추출을 수행하는 전통적인 방법은 각 단어 쌍에 관련된 점수를 계산하기 위해 해당 단어들의 통계 수량에 기초한 공식을 찾는 것입니다.제안된 공식은 상호 정보, t-검정, z 검정, 카이-제곱 검정 및 우도비입니다.[1]

말뭉치 언어학 영역 내에서, 연관성은 우연에 의해 예상되는 보다 더 자주 발생하는 단어 또는 용어의 시퀀스로 정의된다.'Crystal clear', 'middle management', '핵가족', '미용수술'은 단어 조합의 예시이다.어떤 단어들은 복합명사를 구성하기 때문에 종종 함께 발견되는데, 예를 들어 '승마화'나 '오토바이 사이클리스트'가 그것이다.

「 」를 참조해 주세요.

외부 링크

레퍼런스

  1. ^ Manning, C. D.; Schütze, H. (1999). Foundations of statistical natural language processing. Cambridge, MA: MIT Press. ISBN 978-0-262-13360-9.