어휘 자원

Lexical resource

디지털 사전, 자연어 처리디지털 인문학에서 어휘 리소스는 예를 들어 데이터베이스 [1]형태로 하나 이상의 언어어휘관한 데이터로 구성된 언어 자원이다.

특성.

어휘 자원의 기계 언어로 된 판에 각기 다른 기준, 예를 들어 존재한다면 어휘 마크업 틀, 추상 데이터 모델과 XMLserialization,[2]과 OntoLex-Lemon, 웹에 관한 지식을 그래프, 예로 어휘 자원을 발행하기 위한 자원 기술 체계 어휘로 구성된, 언어로 어휘 자원의 인코딩은 ISO표준(백혈구 유사 분열 인자).Linked 오픈 [3]데이터

대응되는 언어의 종류에 따라 어휘 자원은 단일 언어, 이중 언어 또는 다국어로 인정될 수 있습니다.이중언어 및 다국어 어휘 자원에 대해서는 한 언어에서 다른 언어로 단어가 연결되거나 연결되지 않을 수 있습니다.연결된 경우 언어에서 다른 언어로의 동등성은 이중언어 링크(예를 들어 OnLex-Lemonvartrans: translatableAs 관계 사용 등) 또는 다국어 표기(예를 들어 같은 언어에서 다른 언어로의 참조 등)를 통해 수행됩니다.OnLex-Lemon의 [4]개념).

또한 동일한 언어의 다른 사전으로 구성된 사전 자원을 구축하고 관리할 수 있습니다. 예를 들어, 일반 단어용 사전 하나와 다른 전문 도메인용 사전 하나 또는 여러 개입니다.

기계에서 읽을 수 있는 사전과NLP 딕셔너리

디지털 사전에서 어휘 자원은 종종 MRD(Machine Readable Dictionary)라고 불리며 종이에 인쇄되지 않고 기계(컴퓨터) 데이터로 저장된 사전입니다.전자사전 및 사전 데이터베이스입니다.MRD라는 용어는 종종 NLP 사전과 대조되는데, 그 이유는 MRD가 종이 위에 인쇄된 사전의 전자 형태이기 때문이다.두 가지 모두 프로그램에서 사용되지만, 반대로 사전이 NLP를 [5]염두에 두고 처음부터 작성된 경우에는 NLP 사전이라는 용어가 선호됩니다.

어휘 데이터베이스

어휘 데이터베이스는 내용에 대한 액세스를 허용하는 연관된 소프트웨어 환경 데이터베이스를 가진 어휘 리소스입니다.데이터베이스는 사전 정보를 위해 맞춤 설계되거나 사전 정보가 입력된 범용 데이터베이스를 사용할 수 있다.

일반적으로 어휘 데이터베이스에 저장되는 정보는 단어의 철자, 어휘 범주동의어뿐만 아니라 다른 단어 또는 단어 집합 간의 의미 및 음운학적 관계를 포함한다.

「 」를 참조해 주세요.

레퍼런스

  1. ^ SARMA, Shikhar Kr 등워드넷을 사용한 다국어 어휘 자원 구축: 구조, 설계구현.: 제3회 렉시콘 인지적 측면에 관한 워크숍 진행.2012년 S. 161-170
  2. ^ Francopoulo, Gil; Bel, Nuria; George, Monte; Calzolari, Nicoletta; Monachini, Monica; Pet, Mandy; Soria, Claudia (2009-03-01). "Multilingual resources for NLP in the lexical markup framework (LMF)" (PDF). Language Resources and Evaluation. 43 (1): 57–70. doi:10.1007/s10579-008-9077-5. ISSN 1574-0218. S2CID 7697316.
  3. ^ Cimiano, Philipp; Chiarcos, Christian; McCrae, John P.; Gracia, Jorge (2020), Linguistic Linked Data: Representation, Generation and Applications, Springer International Publishing, pp. 45–59, doi:10.1007/978-3-030-30225-2_4, ISBN 978-3-030-30225-2, S2CID 214148590
  4. ^ Cimiano, Phillip; McCrae, John P.; Buitelaar, Paul. "Lexicon Model for Ontologies: Community Report, 10 May 2016 Final Community Group Report 10 May 2016". W3C. Retrieved 6 December 2019.
  5. ^ Gil Francopoulo (편집자) LMF Lexical Markup Framework, ISSE / Wiley 2013 (ISBN 978-1-84821-430-9)

외부 링크