공동발생

Co-occurrence

언어학에서, 공동발생 또는 공동발생 빈도는 일정한 순서로 서로 나란히 있는 텍스트 말뭉치에서 두 용어(우연 또는 동시발생이라고도 한다)가 발생 빈도를 초과하는 빈도수다. 이러한 언어적 의미에서의 공존은 의미적 근접성이나 관용적 표현에 대한 지표로 해석될 수 있다. 말뭉치 언어학과 그 통계 분석은 언어 내에서 공통 발생의 패턴을 보여주고 어휘적 항목에 대한 전형적인 조합을 알아낼 수 있다. 공통 발생 제한은 언어적 요소가 함께 발생하지 않을 때 식별된다. 이러한 제한에 대한 분석은 언어의 구조와 발전에 대한 발견으로 이어질 수 있다.[1]

공동 발생은 더 높은 차원으로 단어 계산의 확장을 볼 수 있다. 공동 발생은 상관관계상호 정보와 같은 조치를 사용하여 정량적으로 설명할 수 있다.

참고 항목

참조

  1. ^ Kroeger, Paul (2005). Analyzing Grammar: An Introduction. Cambridge: Cambridge University Press. p. 20. ISBN 978-0-521-01653-7.
  2. ^ Bordag, Stefan. "A Comparison of Co-occurrence and Similarity Measures as Simulations of Context". CiteSeerX 10.1.1.471.5863. {{cite journal}}: Cite 저널은 필요로 한다. journal= (도움말)