언어 소프트웨어

LanguageWare

LanguageWare는 응용 프로그램이 자연어 텍스트를 처리할 수 있도록 IBM이 개발한 NLP(자연어 처리) 기술입니다.언어 식별, 텍스트 분할/토큰화, 정규화, 엔티티 및 관계 추출, 의미 분석 및 명확화 등 다양NLP 기능을 제공하는 Java 라이브러리 세트로 구성됩니다.분석 엔진은 여러 레벨에서 Finite State Machine 접근 방식을 사용하여 상당히 작은 설치 공간을 유지하면서 성능 특성을 지원합니다.

시스템의 동작은 처리된 언어의 특징과 영역을 기술하는 일련의 구성 가능한 사전 의미 리소스에 의해 구동됩니다.기본 리소스 세트는 LanguageWare의 일부로 제공되며, 이러한 리소스 세트는 모폴로지 등의 네이티브 언어 특성과 언어의 기본 어휘를 설명합니다.추가 어휘, 용어, 규칙 및 문법을 캡처할 수 있는 추가 리소스가 생성되었습니다.이러한 리소스는 언어에 따라 일반적이거나 하나 이상의 도메인에 고유할 수 있습니다.

Eclipse 기반 사용자 지정 도구 세트인 LanguageWare Resource Workbench는 IBM의 alphaWorks[1] 사이트에서 사용할 수 있으며, 도메인 지식을 이러한 리소스로 컴파일하여 분석 프로세스에 통합할 수 있습니다.

LanguageWare는 UIMA 인증 주석, Eclipse 플러그인 또는서비스로 배포할 수 있습니다.

「 」를 참조해 주세요.

레퍼런스

  1. ^ "alphaWorks Community". alphaworks.ibm.com. 20 October 2009.

외부 링크

관련 문서