게르마넷

GermaNet

게르마넷(GermaNet)은 독일어의미 네트워크다.그것은 같은 개념을 표현하는 어휘 단위를 신셋으로 분류하고 이들 신셋 사이의 의미적 관계를 정의함으로써 명사, 동사, 형용사를 의미론적으로 연관시킨다.[1]게르마넷은 면허증 서명 후 학술용도로 무료로 이용할 수 있다.게르마넷은 영어 워드넷과 많은 공통점을 가지고 있으며 온라인에서 saurus 또는 경량 온톨로지라고 볼 수 있다.게르마넷은 1997년부터 일반 및 전산언어학 연구그룹 내에서 튀빙겐 대학에서 개발 및 유지되고 있다.다국어 어휘-대서양 데이터베이스인 EuroWordNet에 통합되었다.[2]

데이터베이스

내용물

게르마넷은 어휘 공간을 의미적 관계에 의해 상호 연결된 일련의 개념으로 분할한다.의미 개념은 신셋에 의해 모델링된다.신셋(synset)은 모든 단어들이 거의 같은 의미 또는 거의 같은 의미를 가지도록 취해지는 단어들의 집합이다.따라서 synset은 하나의 정의, 즉 "gloss"에 따라 그룹화된 동의어 집합이다.

광택 외에도 신셋에는 구문 함수가 표시되며 신셋에서 각각의 고유한 의미에 대한 예제 문장이 첨부된다.[3]워드넷에서와 마찬가지로 각 단어 범주에 대해 의미 공간은 의미 네트워크의 주요 노드와 밀접하게 관련된 다수의 의미 분야로 나뉜다.오르트, 또는 "위치", 쾨르퍼 또는 "몸"[2] 등.

GermaNet은 버전 15.0(2020년 5월 출시)을 기준으로 다음을 포함한다.[2]

  • 신셋: 144113
  • 어휘 단위: 185,000
  • 리터럴: 169521
  • 개념 관계: 157921
  • 어휘 관계(동기어 제외): 12203
  • 분할 화합물: 98905
  • ILI(Interlingual Index) 기록: 28564
  • Wiktionary 감각 설명: 29548

포맷

모든 GermaNet 데이터는 Postgre에 저장됨SQL 관계형 데이터베이스.데이터베이스 스키마는 제르마넷의 내부 구조를 따른다: 신셋, 어휘 단위, 개념적 및 어휘적 관계 등을 저장하는 테이블이 있다.[3]GermaNet 데이터는 이 데이터베이스 형식과 XML 파일로 배포된다.XML 데이터에서 두 가지 파일 형식( 하나는 synsets용이고 다른 하나는 관계를 위한 파일)은 GermaNet 데이터베이스에서 사용할 수 있는 모든 데이터를 나타낸다.[4]

인터페이스

Java, Python, JavaScript, Perl에 사용할 수 있는 소프트웨어 라이브러리와 API가 있다.[5][6]이 프로그램들은 무료 소프트웨어 라이센스로 배포되며 다양한 버전의 GermaNet의 모든 정보에 쉽게 접근할 수 있다.

게르마넷로버는 제르마넷에서 신셋을 검색하고, 그것과 관련된 데이터를 탐색하며, 신셋 쌍의 의미적 유사성을 계산하는 데 사용할 수 있는 온라인 애플리케이션이다.그것은 신셋 검색을 위한 하이퍼니엠 관계의 시각화와 고급 필터링 옵션을 특징으로 한다.

면허증

GermaNet 15.0(2020년 5월 출시)은 다음 유형의 라이센스 계약에 따라 배포할 수 있다.[7]

  • 학술연구면허계약서: 학술기관에서의 연구를 목적으로 한다.학술용도의 면허료는 없다.자격증은 개별 학생에게 주어지지 않으며, 자격증을 취득하려는 학생들은 지도교수와 상담해야 한다.
  • 연구 개발 면허 계약: 비학술 기관 및 연구 컨소시엄에 적용된다.기술개발과 내부연구에 엄격히 활용한다.
  • 상권 계약: 비학술 기관 및 상업 기업에 적용된다.그것은 기술 개발과 내부 연구를 허용하고 파생된 제품이나 서비스를 배포하고 판매할 수 있는 비독점적 권리를 부여한다.

대안

오픈데 워드넷은 워드넷과 호환되는 게르마넷 대신 자유롭게 이용할 수 있다.[8]

어학 응용 프로그램

GermaNet은 다음을 포함한 다양한 애플리케이션에 사용되어 왔다.

  • 의미 분석[9]
  • 암묵적 문서 구조의[9] 얕은 인식
  • 복합 분석[9]
  • 부분 선호[10] 분석
  • 단어감각의[11] 혼란.

참고 항목

참조

  1. ^ Petra Storjohann (23 June 2010). Lexical-semantic relations: theoretical and practical perspectives. John Benjamins Publishing Company. pp. 165–. ISBN 978-90-272-3138-3. Retrieved 16 November 2011.
  2. ^ a b c "GermaNet - an Introduction". uni-tuebingen.de. Retrieved October 1, 2020.
  3. ^ a b V. 헨리히, E. 힌리히스2010. GernEdiT - The GermaNet 편집 도구.인: 제7차 국제 언어 자원평가에 관한 회의의 진행.
  4. ^ "Data format". Retrieved October 1, 2020.
  5. ^ "Applications and Tools". uni-tuebingen.de. Retrieved October 1, 2020.
  6. ^ "GermaNet::Flat". metacpan.org. Retrieved October 1, 2020.
  7. ^ "Licenses". uni-tuebingen.de. Retrieved October 1, 2020.
  8. ^ "GitHub - hdaSprachtechnologie/odenet: Open German WordNet". November 14, 2019. Retrieved November 20, 2019 – via GitHub.
  9. ^ a b c 마누엘라 쿤제와 디트마르 뢰스너.2004. GermaNet을 실제 애플리케이션에서 리소스로 활용하기 위한 문제
  10. ^ 사빈 슐테 임 월드, 2004.의미론적 동사 군집화에서 선택적 선호로서의 GermaNet Synsets.
  11. ^ 사이토 외, 2002년GermanNet의 평가: 자동 워드 센스 해체를 위한 GermaNet을 이용한 문제점.

외부 링크