유니버설 네트워킹 언어

Universal Networking Language

UNL(Universal Networking Language)은 자연어 텍스트에서 추출한 의미 데이터를 나타내기 위해 특별히 고안된 선언적 공식 언어다. 언어간 기계번역 시스템에서는 피벗 언어로, 정보 검색 애플리케이션에서는 지식 표현 언어로 사용할 수 있다.

범위 및 목표

UNL은 기계와 인간의 언어에 독립적인 형태로 정보와 의미의 가장 중심적인 측면을 표현하기 위한 간단한 기반을 구축하기 위해 고안되었다. 언어에 독립적인 형식주의로서 UNL은 정보가 표현된 원래 언어와 독립적으로 코드화, 저장, 전파, 검색하는 것을 목표로 한다. 그런 의미에서 UNL은 언어 장벽을 극복하기 위한 도구를 체계적으로 제공하고자 한다.

얼핏 보면 UNL은 일종의 인터링구아(interlingua)인 것 같은데, 대상 언어로 번역되기 전에 소스 텍스트가 변환된다. 사실, 그것은 이런 목적으로 사용될 수 있고, 매우 효율적으로 사용될 수도 있다. 그러나, 그것의 진짜 강점은 지식 표현이며, 그것의 주된 목표는 이미 존재하거나 어떤 주어진 언어로 존재할 수 있는 지식을 다룰 수 있는 인프라를 제공하는 것이다.

그럼에도 불구하고, 현재 어떤 언어에 대해 어떤 단어나 문장, 텍스트의 "완전한" 의미를 대변한다고 주장하는 것은 어리석은 짓이라는 것을 유념하는 것이 중요하다. 의도와 해석의 미묘함이 "완전한 의미"를 만들어내지만, 우리는 그것을 상상할 수도 있고, 어떤 체계적인 치료에도 너무 가변적이고 주관적이다. 따라서 UNL은 문장이나 본문의 "완전한 의미"를 표현하려는 함정을 피하고 대신 가장 자주 그들에게 귀속되는 "핵심" 또는 "합의"를 목표로 한다. 이런 의미에서 시, 은유, 비유, 비유어, 빈뇨, 기타 복잡하고 간접적인 의사소통 행동의 상당부분은 UNL의 현재 범위와 목표를 벗어난다. 대신 UNL은 실질적인 일상적 환경에서 대부분의 인간 의사소통의 구체적이고 구체적인 근거로 직접적인 의사소통 행동과 문자 그대로의 의미를 목표로 한다..

구조

UNL 접근법에서 자연어로 전달되는 정보는 개념의 의미를 갖는 노드나 하이퍼노드(Universal Words, 또는 단순히 UWs) 사이의 링크(관계라고 칭함)라는 지시된 이진법 집합으로 구성된 하이퍼그래프로 문장으로 표현된다. 또한 UW는 상황에 맞는 정보를 나타내는 속성으로 주석을 달 수 있다.

일례로 '하늘은 파랗니?'라는 영문 문장은 다음과 같이 UNL로 나타낼 수 있다.

UNLGraph.svg

In the example above, "sky(icl>natural world)" and "blue(icl>color)", which represent individual concepts, are UWs; "aoj" (= attribute of an object) is a directed binary semantic relation linking the two UWs; and "@def", "@interrogative", "@past", "@exclamation" and "@entry" are attributes modifying UWs.

UW는 보편적인 개념을 표현하기 위한 것이지만, 사람이 읽을 수 있도록 영어 단어 또는 다른 자연 언어로 표현된다. 그들은 "헤드워드"(UW 루트)와 "기묘한 리스트"( 괄호 사이의 UW 접미사)로 구성되는데, 여기서 헤드워드가 전달하는 일반적인 개념을 모호하게 만드는 데 제약을 사용한다. UWs 집합은 UNL 온톨로지(Ontology)에 정리되어 있는데, 상위 개념은 「icl」(=의 일종), 「iof」(=의 한 예), 「equ」(=는 동일) 관계를 통해 하위 개념과 관련된다.

관계는 모든 기존 언어의 단어들 사이의 의미적 연관성을 나타내기 위한 것이다. 그것들은 존재론적(예: "icl" 및 "iof"), 논리적(예: "and" 및 "or"), 주제(예: "agt" = 에이전트, "ins" = 기기, "tim" = 시간, "plc" = 장소 등)일 수 있다. UNL 사양에는 현재 46개의 관계가 있다. 그들은 공동으로 UNL 구문을 정의한다.

속성은 UW와 관계에 의해 전달될 수 없는 정보를 나타낸다. 일반적으로 시간과 관련된 정보("@past", "@future" 등), 참조("@def", "@indef" 등), 모달리티("@can", "@must" 등), 초점("@topic", "@focus" 등) 등을 나타낸다.

UNL 프로그램 내에서 자연어 문장을 UNL 그래프로 표현하는 과정을 UNLization이라고 하며, UNL 그래프로 자연어 문장을 생성하는 과정을 NLization이라고 한다. 자연어 분석과 이해가 수반되는 UNLization은 반자동(즉, 컴퓨터 보조장치가 있는 인간에 의해)으로, NLization은 완전히 자동으로 수행되도록 되어 있다.

역사

UNL 프로그램은 1996년 일본 도쿄에 있는 국제연합대학 고등연구소의 주도 하에 시작되었다. 2001년 1월, 유엔대학교는 UNL 프로그램의 개발과 관리를 담당할 독립 기구인 UNL 재단을 설립하였다. 비영리 국제기구인 이 재단은 유엔과 특별한 연계를 맺고 있지만 유엔대학으로부터 독립적인 정체성을 갖고 있다. 그것은 UNU/IAS로부터 그 임무를 완수할 수 있도록 UNL 프로그램 시행의 권한을 물려받았다.

그 프로그램은 이미 중요한 이정표를 넘었다. UNL 시스템의 전반적인 아키텍처는 그 기능에 필요한 기본 소프트웨어와 도구 세트를 가지고 개발되었다. 이것들은 시험되고 개선되고 있다. UNL 표현뿐만 아니라 이미 개발되고 있는 다양한 토착 언어로부터 방대한 양의 언어 자원이 지난 몇 년 동안 축적되어 왔다. 더욱이, 이러한 자원을 확장하기 위한 기술적 인프라가 이미 마련되어 있어, 이제부터 UNL 시스템에 더 많은 언어의 참여를 촉진한다. UNL에 관한 과학 논문과 학술 논문이 매년 증가하고 있다.

지금까지 가장 눈에 띄는 성과는 2002년 5월 세계지식재산권기구(WIPO)를 통해 획득한 UNL의 혁신적 특성과 산업적 적용가능성에 대한 특허협력조약(PCT)의 인정이다. UNL의 특허권(미국 특허권 6,704,700, 7,107,206)을 취득하는 것은 유엔 내에서 완전히 새로운 성과다.

참고 항목

외부 링크

UNL 소사이어티