워드 센스

Word sense

언어학에서 단어 감각은 단어의 의미 중 하나이다. 단어는 두 세트로 나뉘는데, 다의미(단어의 감각)를 가진 큰 집합과 하나의 의미(단어의 감각)만을 가진 작은 집합이다. 예를 들어 사전은 "놀이"라는 단어에 대한 50개 이상의 다른 감각을 가지고 있을 수 있는데, 이들 각 단어는 다음과 같이 문장에서 사용되는 단어의 맥락에 기초하여 다른 의미를 갖는다.

우리는 극장에 연극 로미오와 줄리엣을 보러 갔다.

감독은 원정팀을 수세에 몰아넣는 멋진 플레이를 고안했다.

아이들은 공원에 놀러 나갔다.

각 문장에서 우리는 문장의 나머지 부분이 우리에게 주는 힌트에 기초하여 "놀이"라는 단어의 다른 의미를 연관시킨다.

사람과 컴퓨터는 단어를 읽을 때 단어의 정확한 의미를 찾기 위해 단어감각해소라는[1][2] 과정을 사용해야 한다. 이 과정은 가능한 감각들을 가능한 감각들로 좁히기 위해 문맥을 이용한다. 문맥에는 인접한 단어와 인근 구절로 전달되는 아이디어, 대화나 문서의 목적과 등록부, 암묵적이거나 표현된 방향(시간과 장소) 등이 포함된다. 그 혼란은 따라서 문맥에 민감하다.

고급 의미 분석은 소생(sub-disterial)을 초래했다. 단어 감각은 세메(의미에서 가장 작은 단위)나 세메(의미에서 더 큰 단위)에 깔끔하게 대응하며, 구절의 다세미는 여러 개의 의미 또는 세메를 가지고, 따라서 여러 개의 감각을 갖는 속성이다.

감각간의 관계

종종 단어의 감각은 의미 분야 내에서 서로 연관되어 있다. 일반적인 패턴은 한 감각은 더 넓고 또 다른 감각은 더 좁다는 것이다. 기술 전문용어에서는 흔히 이런 경우가 있는데, 대상 청중일반적인 청중이 보다 넓은 의미로 받아들이기 쉬운 말의 좁은 의미를 사용한다. 예를 들어, 캐주얼한 사용에서 "정형"은 보통 "말하기"로 얼버무리지만, 언어 사용에서 "말하기"는 "말하기"의 하이퍼니임이다. 그러나 전문용어 외에 일반적인 어휘에서도 그 패턴이 일반적이다. 그 예로는 "목모"라는 용어와 "콩"이라는 용어의 감각의 변화가 있다. 이 패턴은 자연 언어가 종종 저포니, 하이퍼니미에 대한 기술력이 결여될 수 있다는 것을 수반한다. 프로그래밍 언어가 하는 것보다 훨씬 더, 그것은 탐구성 대신 문맥에 의존한다; 의미는 문맥 안에 내포되어 있다. 일반적인 예는 다음과 같다.

  • 더 이상의 명세가 없는 당뇨병이라는 단어는 대개 당뇨병을 가리킨다.
  • 더 이상의 명세가 없는 "앙기나"라는 단어는 보통 협심증을 가리킨다.
  • 추가 명세서 없이 '투과성 결핵'이라는 단어는 대개 폐결핵을 가리킨다.
  • 더 이상의 명세가 없는 "암피세마"라는 단어는 보통 폐폐세포를 가리킨다.
  • 더 이상의 명세가 없는 '서빅스'라는 말은 대개 자궁경부를 가리킨다.

"센서"의 사용 라벨과 한정자("엄격한 의미에서") 또는 "센서 라토" ("넓은 의미에서")와 같은 한정자를 더한 사용 라벨은 텍스트가 의미하는 바를 명확히 하기 위해 가끔 사용된다.

어원과의 관계

폴리세미는 단어나 구에 공통된 역사적 뿌리를 두고 있다. 일반적으로 특정 조건이나 해부학적 위치의 유형에 관련된 용어처럼 한정자가 따르는 광범위한 의학 용어는 다혈질이며, 오래된 개념 단어들은 다혈질(그리고 대개 유사 의미의 음영을 넘어 모호한 영역)을 가진 예외가 거의 없다.

동음이의어는 두 개의 분리된 뿌리 단어(lexeme)가 같은 철자와 발음을 갖는 곳이다.

참고 항목

참조

  1. ^ N. Ide and J. Véronis (1998). "Word Sense Disambiguation: The State of the Art" (PDF). Computational Linguistics. 24: 1–40. Archived from the original (PDF) on 2006-01-06.
  2. ^ R. 네비글리. Word Sense Discambigation: A Survey, ACM Computing Survey, 41(2), 2009년, 페이지 1-69.

외부 링크