워드넷
WordNetWordNet 자체 정의의 스냅샷입니다. | |
개발자 | 프린스턴 대학교 |
---|---|
초기 릴리즈 | 1980년대 중반 |
안정된 릴리스 | 3.1 / 2011년 6월, [1] 전( |
기입처 | 프롤로그 |
운영 체제 | Unix, Linux, Solaris, Windows |
크기 | 16MB(총 207,016개의 워드-센스 쌍으로 구성된 175,979개의 Synset으로 구성된 155,327개의 워드 포함) |
이용가능기간: | 200개 이상의 언어 |
유형 | 어휘 데이터베이스 |
라이선스 | BSD와 같은 |
웹 사이트 | wordnet |
WordNet은 200개 이상의 [2]언어로 된 단어 간의 의미 관계에 대한 사전 데이터베이스입니다.WordNet은 단어들을 동의어, 하이포옴, 그리고 순어를 포함한 의미적 관계에 연결시킨다.동의어는 짧은 정의 및 사용 예제와 함께 synset으로 그룹화됩니다.따라서 WordNet은 사전과 시소러스의 조합과 확장으로 볼 수 있다.웹 브라우저를 [3]통해 인간 사용자가 액세스할 수 있지만, 주로 자동 텍스트 분석 및 인공지능 애플리케이션에 사용됩니다.WordNet은 처음에 영어로[4] 작성되었으며 영어 WordNet 데이터베이스와 소프트웨어 툴은 BSD 스타일의 라이선스로 출시되었으며 WordNet 웹사이트에서 무료로 다운로드할 수 있습니다.
이력 및 팀원
워드넷은 1985년부터 심리학과 조지 아미티지 밀러 교수의 지시로 프린스턴대 인지과학연구소에서 영어로만 만들어졌고 이후 크리스티아네 펠바움이 감독을 맡았다.이 프로젝트는 처음에는 미국 해군 연구소에서 자금을 지원받았고 나중에는 DARPA, 국립과학재단, 파괴적 기술국(이전에는 Advanced Research and Development Activity), REFLICE를 포함한 다른 미국 정부 기관에서 자금을 지원받았습니다.George Miller와 Christiane Fellbaum은 워드넷을 사용한 공로로 2006년 안토니오 잠폴리상을 수상했다.
Global WordNet Association은 전 세계 모든 언어에 대해 WordNet에 대한 토론, 공유 및 연결을 위한 플랫폼을 제공하는 비영리 단체입니다.크리스티아네 펠바움과 Pik Th.J.M. Vossen이 공동 회장을 [5]맡고 있다.
데이터베이스 내용
데이터베이스에는 총 207 016개의 워드-센스 쌍에 대해 175 979개의 Synset으로 구성된 155개의 327개의 워드가 포함되어 있습니다.압축된 형식의 경우 크기는 [6]약 12MB입니다.
WordNet은 명사, 동사, 형용사 및 부사를 포함하지만 전치사, 결정자 및 기타 함수 단어를 무시합니다.
거의 동의어인 동일한 어휘 카테고리의 단어들은 synset으로 그룹화 됩니다.Synset에는 간단한 단어뿐만 아니라 "외식"과 "카풀"과 같은 코로케이션이 포함됩니다.다의어 형식의 다른 감각은 다른 합성 집합에 할당됩니다.Synset의 의미는 짧은 정의 광택과 하나 이상의 사용 예를 통해 더욱 명확해집니다.형용사 신셋의 예는 다음과 같습니다.
- 좋다, 맞다, 잘 익었다 – (특정 목적에 가장 적합하거나 적합하다; "토마토를 심기에 좋은 시기"; "행동하기에 적절한 시기"; "큰 사회학적 변화를 위한 시기")
모든 synset은 의미 관계를 통해 다른 synset에 연결됩니다.모든 어휘 범주가 공유하는 것은 아니지만, 이러한 관계에는 다음이 포함된다.
이러한 의미 관계는 링크된 synset의 모든 구성원 간에 유지됩니다.또, 개개의 synset 멤버(워드)를 어휘 관계와 관련지을 수도 있습니다.예를 들어, 명사 "director"는 "morphosemantic" 링크를 통해 파생된 동사 "direct"와 연결된다.
데이터베이스와 함께 배포되는 소프트웨어의 형태학 함수는 사용자의 입력으로부터 단어의 보조어 또는 어간 형태를 추론하려고 한다.불규칙한 형태는 목록에 저장되며, 예를 들어 "ate"를 조회하면 "eat"가 반환됩니다.
지식 구조
명사와 동사는 모두 하이퍼니임 또는 IS A 관계에 의해 정의된 계층 구조로 구성됩니다.예를 들어 hypernym 계층에 따라 dog라는 단어의 의미가 하나 있는데, 같은 수준의 단어는 synset 멤버를 나타냅니다.각 동의어 집합에는 고유한 인덱스가 있습니다.
- 개, 길들여진 개, Canis reviousis
- 개, 개과
- 육식동물
- 태반, 태반 포유동물, 부테리안, 부테리안 포유동물
- 포유동물
- 척추동물, 두개골
- 코드레이트
- 동물, 동물, 동물, 동물, 동물, 동물
- ...
- 동물, 동물, 동물, 동물, 동물, 동물
- 코드레이트
- 척추동물, 두개골
- 포유동물
- 태반, 태반 포유동물, 부테리안, 부테리안 포유동물
- 육식동물
- 개, 개과
최상위 수준에서는 이러한 계층이 명사의 경우 25개의 초급 "트리"와 동사의 경우 15개(유지관리 수준에서는 사전 파일이라고 함)로 구성됩니다.모두, 독자적인 초보자 동기 세트 「엔티티」에 링크되어 있습니다.명사 계층은 동사 계층보다 훨씬 더 깊다.
형용사는 계층적 트리로 정리되지 않는다.대신, "뜨거운"과 "차가운"과 같은 두 개의 "중앙" 반의어는 이진 극을 형성하고, "찜질"과 "칠리"와 같은 "위성" 동의어는 "유사성" 관계를 통해 각각의 극과 연결된다.형용사는 이런 식으로 "나무"가 아닌 "덤벨"로 시각화할 수 있다.
심리언어학적 측면
WordNet 프로젝트의 초기 목표는 1960년대 후반에 개발된 인간 의미 기억 이론과 일치하는 어휘 데이터베이스를 구축하는 것이었다.심리학적 실험들은 화자들이 개념에 대한 지식을 경제적, 계층적 방식으로 체계화한다는 것을 보여주었다.개념적 지식에 접근하기 위해 필요한 검색 시간은 화자가 지식에 접근하기 위해 "이동"해야 하는 계층 수와 직접 관련이 있는 것으로 보였다.따라서 카나리아가 노래하는 새이기 때문에 카나리아가 노래할 수 있다는 것을 스피커가 더 빨리 확인할 수 있었지만 카나리아가 날 수 있다는 것을 확인하는 데 약간 더 많은 시간이 걸렸고 (카나리아가 상위 수준에서 "새"라는 개념에 접근할 수 있다는 것을) 카나리아가 피부를 가지고 있다는 것을 확인하는 데 더 많은 시간이 필요했다(여러 단계의 하이포니미에서 "동물"까지).") 이러한 심리언어학적 실험과 기초 이론은 비판의 대상이 되어 왔지만, WordNet의 조직 중 일부는 실험적인 증거와 일치한다.[7]예를 들어 비정상적인 실어증은 특정 의미 범주인 WordNet 계층에서 단어를 생성하는 화자의 능력에 선택적으로 영향을 미칩니다.반의어 형용사(덤벨 구조에서 WordNet의 중심 형용사)는 우연보다 훨씬 더 자주 발생하는 것으로 밝혀졌는데, 이는 많은 언어에서 유지되고 있는 사실로 밝혀졌다.
어휘적 온톨로지로서
WordNet은 때때로 온톨로지라고 불리는데, 이는 WordNet의 창작자가 하지 않는 지속적인 주장이다.명사 synset들 사이의 hypernym/hyponym 관계는 개념 범주들 간의 특수화 관계로 해석될 수 있다.즉, WordNet은 컴퓨터 과학의 의미에서 어휘적 온톨로지로서 해석되고 사용될 수 있다.그러나 그러한 온톨로지는 (i) 배타적 카테고리에 대한 공통적인 전문화 및 (ii) 전문화 계층에 중복성 등 수백 가지의 기본적인 의미 불일치를 포함하기 때문에 사용하기 전에 수정되어야 한다.또한 WordNet을 지식 표현에 사용할 수 있는 어휘적 온톨로지로 변환하려면 일반적으로 (i) 전문화 관계를 하위 유형 Of 및 인스턴스 Of 관계로 구분하고 (ii) 직관적인 고유 식별자를 각 범주에 연관시켜야 한다.WordNet 1.7을 WebKB-2의 [8]공동 업데이트 가능한 지식 기반에 통합하는 과정에서 이러한 수정 및 변환이 수행되고 문서화되어 있지만, 대부분의 프로젝트에서는 WordNet을 지식 기반 애플리케이션(일반적으로 지식 지향 정보 검색)에 재사용한다고 주장하는 프로젝트에서는 WordNet을 단순히 직접 재사용할 뿐입니다.
또한 WordNet은 하이브리드 보텀업 하향식 방법론을 통해 정식 사양으로 변환되어 WordNet에서 자동으로 연관 관계를 추출하고 DOLCE 기본 [9]온톨로지에 공식적으로 정의된 일련의 개념적 관계 측면에서 이러한 연관성을 해석합니다.
WordNet을 온톨로지에 통합했다고 주장하는 대부분의 작품에서 WordNet의 내용은 단순히 필요할 때 수정되는 것이 아니라 WordNet이 필요할 때마다 크게 재해석되고 업데이트되고 있습니다.예를 들어, WordNet의 최상위 온톨로지가 OnClean 기반 접근법에 따라 재구성되거나[10] WordNet이 SENSUS 온톨로지의 하위 클래스를 구성하기 위한 주요 소스로 사용된 경우입니다.
제한 사항
WordNet(및 ImageNet과 같은 관련 리소스)의 가장 널리 논의되는 제한은 일부 의미 관계가 추상적인 [11]개념보다 구체적인 개념에 더 적합하다는 것입니다.예를 들어, "침엽수"가 "나무"의 일종이고, "나무"가 "식물"의 일종이고, "식물"이 "장기"의 일종이라는 것을 포착하기 위해 하이포니임/하이퍼니엠 관계를 만드는 것은 쉽지만, "공포"나 "행복"과 같은 감정을 똑같이 깊고 명확하게 정의된 하이포니엠/하이퍼니 관계로 분류하기는 어렵다.
WordNet의 많은 개념은 특정 언어에 고유하며 언어 간의 가장 정확한 매핑은 94%[12]입니다.동의어, 하이포니, 머니임 및 반의어는 지금까지 WordNet을 사용하는 모든 언어에서 발생하지만 다른 의미 관계는 언어마다 다릅니다.[13]이것에 의해, 언어간의 상호 운용성이 제한됩니다.그러나 WordNet은 언어 간의 차이를 강조하고 연구하기 위한 리소스로도 활용되기 때문에 반드시 모든 사용 사례에 제한이 있는 것은 아닙니다.
워드넷에는 어원이나 단어의 발음에 대한 정보는 포함되어 있지 않으며 사용법에 대한 제한된 정보만 포함되어 있습니다.WordNet은 대부분의 일상적인 단어를 다루는 것을 목표로 하며 도메인별 용어가 많이 포함되어 있지 않습니다.
WordNet은 WSD(word-sense dismblicization)를 위해 가장 일반적으로 사용되는 영어 계산 사전으로,[14] 텍스트 내의 단어에 컨텍스트에 적합한 의미(즉, 동기 집합 멤버)를 할당하는 것을 목적으로 하는 작업입니다.그러나 WordNet이 지나치게 세분화된 감각적 차이를 암호화한다는 주장이 제기되어 왔다.이 문제는 WSD 시스템이 문맥에서 단어와 일치하는 감각을 선택하는 작업에 항상 동의하는 것은 아닌 인간과 동등한 수준의 성능을 달성하는 것을 막습니다.세분화 문제는 동일한 [15][16][17]단어에 대한 유사한 의미를 자동으로 그룹화하는 클러스터링 방법을 제안함으로써 해결되었습니다.
불쾌한 내용
WordNet에는 경멸적이거나 [18]모욕적인 단어들이 포함되어 있습니다.단어에 대한 해석은 시간이 지남에 따라 그리고 사회 집단 간에 바뀔 수 있기 때문에, 워드넷이 단어를 "조시적" 또는 "비방적"으로 분리하여 정의하는 것이 항상 가능한 것은 아니다.그러므로, 워드넷을 사용하는 사람들은 불쾌하거나 경멸적인 단어들을 식별하기 위해 그들만의 방법을 적용해야 한다.
그러나, 이러한 제한은 사전이나 시사우루스와 같은 다른 어휘 자원에도 해당되며, 여기에는 경멸적이고 모욕적인 단어들도 포함되어 있다.일부 사전은 경멸적인 단어들을 나타내지만, 단어들이 다른 사회 집단에게 받아들여지거나 불쾌하게 될 수 있는 모든 문맥을 포함하지는 않는다.그러므로 사전을 사용하는 사람들은 그들만의 방법을 적용하여 모든 불쾌한 단어들을 식별해야 한다.
라이선스 대WordNet을 열다
그 후 다른 언어용으로 만들어진 워드넷도 있습니다.2012년 조사에서는 워드넷과 그 [19]가용성이 나열됩니다.WordNet 사용을 전파하기 위해 글로벌 WordNet 커뮤니티는 연구자와 개발자가 WordNet에 쉽게 접근하여 자연어 처리(NLP) 작업에서 온톨로지 및 어휘적 지식을 제공하기 위한 언어 리소스로 사용할 수 있는 오픈 도메인에 WordNet을 천천히 재라이센스하고 있었습니다.
Open Multilinguage[20] WordNet은 다양한 언어로 라이선스가 부여된 워드넷에 액세스할 수 있으며 모두 Princeton Wordnet of English(PWN)에 링크되어 있습니다.목표는 여러 언어로 된 워드넷을 쉽게 사용할 수 있도록 하는 것이다.
적용들
WordNet은 워드센스 명확화, 정보 검색, 자동 텍스트 분류, 자동 텍스트 요약, 기계 번역 및 자동 크로스워드 퍼즐 생성 등 정보 시스템에서 다양한 용도로 사용되어 왔습니다.
WordNet의 일반적인 용도는 단어 간의 유사성을 확인하는 것입니다.WordNet 그래프 구조에서 단어 간 거리 측정과 synset 간 에지 수를 세는 등 다양한 알고리즘이 제안되었다.직감적으로 두 단어나 합성어가 가까울수록 의미가 더 가깝습니다.WordNet이라는 이름의 Perl 패키지에는 WordNet 기반의 단어 유사성 알고리즘이 다수 구현되어 있습니다.유사성 [21]및 NLTK라는 [22]Python 패키지에 포함되어 있습니다.다른 보다 정교한 WordNet 기반 유사 기술로는 ADW가 [23]있는데, ADW는 Java에서 구현이 가능합니다.WordNet은 또한 다른 어휘들을 [24]상호 연결하기 위해 사용될 수 있습니다.
인터페이스
Princeton은 다양한 프로그래밍 언어와 환경을 사용하여 WordNet에 액세스하기 위해 널리 사용되는 일부 애플리케이션 프로그래밍 인터페이스에 대한 링크를 포함하는[25] 관련 프로젝트 목록을 관리하고 있습니다.WordNet 데이터를 사용하여 사용자에게 친숙한 인터페이스를 제공하는 lengusa.com 또는 lookwayup.com 등의 웹 인터페이스도 있습니다.
관련 프로젝트 및 확장
WordNet은 시멘틱 웹의 여러 데이터베이스에 연결되어 있습니다.또한 WordNet은 WordNet synset과 온톨로지의 카테고리 간의 매핑을 통해 일반적으로 재사용됩니다.대부분의 경우 WordNet의 최상위 카테고리만 매핑됩니다.
글로벌 WordNet 어소시에이션
Global WordNet Association(GWA)[26]은 전 세계 모든 언어의 워드넷에 대해 논의, 공유 및 접속하기 위한 플랫폼을 제공하는 공공 및 비영리 단체입니다.GWA는 또한 언어 간 워드넷의 표준화를 촉진하여 인간 언어에서 synset을 열거하는 데 있어 통일성을 확보한다.GWA는 [27]전 세계에서 개발된 워드넷 목록을 보유하고 있다.
기타 언어
- 아랍어 워드넷:[28][29] 아랍어용 워드넷.
- 아랍어 온톨로지 - 워드넷과 동일한 구조를 가지고 매핑된 언어 온톨로지입니다.
- BalkaNet 프로젝트는[30] 6개의 유럽 언어(불가리아어, 체코어, 그리스어, 루마니아어, 터키어, 세르비아어)에 대한 WordNet을 제작했습니다.이 프로젝트를 위해 무료로 사용할 수 있는 XML 기반의 WordNet 에디터가 개발되었습니다.이 에디터(VisDic)는 현재 개발 중이 아니지만 다양한 WordNet을 만드는 데 사용됩니다.후속 버전인 DEBVisDic은 클라이언트 서버 애플리케이션으로 현재 여러 WordNets(네덜란드어, 폴란드어, 헝가리어, 여러 아프리카 언어, 중국어)의 편집에 사용되고 있습니다.
- BulNet은 불가리아 [31]과학 아카데미 불가리아 언어 연구소 전산 언어학부에서 개발된 불가리아어 버전입니다.
- 국립 대만 [32]대학에서 지원하는 CWN(중국어 Wordnet 또는 中國어 Wordnet).
- EuroWordNet 프로젝트는[33] 여러 유럽 언어용 WordNet을 제작하여 서로 연결하였으나, 이러한 WordNet은 자유롭게 사용할 수 없습니다.Global Wordnet 프로젝트는 모든 [34]언어에 대해 "워드넷"의 제작과 연결을 조정하려고 합니다.옥스포드 영어사전의 출판사인 옥스포드 대학 출판부는 워드넷에 [citation needed]대한 그들만의 온라인 경쟁자를 만들 계획을 표명했다.
- FinnWordNet은 원래 영어 WordNet의 모든 엔트리가 [35]번역된 WordNet의 핀란드 버전입니다.
- GermaNet은 [36]Tübingen 대학이 개발한 독일어판 WordNet입니다.
- IndoWordNet은[37] 인도 viz., Asamese, Bangla, Bodo, Gujarati, 힌디어, Kannada, Kashimiri, Konkani, Mayalam, Meitei(Manipuri), Marathi, 네팔, Odia, Punjabi의 18개 예약 언어의 어휘 기반입니다.
- JAWS(Just Another WordNet Subset), Wiktionary 및 시멘틱 공간을 사용하여 구축된 또 다른 프랑스어 버전 WordNet[38]
- WordNet Bahasa:난양공과대학이 개발한 말레이어 및 인도네시아어용 워드넷.
- 코친과학기술대학이 개발한 Malayalam WordNet.[39]
- 다국어 중앙 저장소(MCR)는 스페인어, 카탈로니아어, 바스크어, 갈리시아어,[40] 포르투갈어에서 영어까지 동일한 EuroWordNet 프레임워크 워드넷으로 통합됩니다.
- MultiWordNet 프로젝트는 [41]프린스턴 WordNet과 밀접하게 연계된 이탈리아어 WordNet 제작을 목적으로 하는 다국어 WordNet 프로젝트입니다.
- OpenDutchWordNet은 [42]네덜란드 어휘 의미 데이터베이스입니다.
- OpenWN-PT는 CC-BY-SA [43]라이선스로 무료로 다운로드할 수 있는 오리지널 WordNet의 브라질 포르투갈 버전입니다.
- plWordNet은[44] Wrocwaw University of Technology에 의해 개발된 폴란드어 버전의 WordNet입니다.
- PolNet은[45] Adam Mickiewicz University in Pozna (에 의해 개발된 폴란드어 버전의 WordNet입니다(CC BY-NC-ND 3.0 라이선스로 배포).
BalkaNet 및 EuroWordNet과 같은 프로젝트에서는 원본에 링크된 독립형 워드넷을 만들 수 있었습니다.그러한 프로젝트 중 하나는 S.A.가 이끄는 Petersburg State University of Communications가[46] 후원하는 러시아어 WordNet이었다.Yablonsky 또는[47] Russnet[48] by Saint Petersburg State University
- UWN은 자동으로 구축된 다국어 어휘 지식 기반이며 WordNet을 확장하여 다양한 언어로 [49]백만 개 이상의 단어를 지원합니다.
- WOLF(WordNet Libre du Francais), WordNet [50]프랑스어 버전.
링크된 데이터
- BabelNet은 자동 매핑 알고리즘을 사용하여 WordNet과 Wikipedia를 통합함으로써 수백만 개의 개념을 가진 매우 큰 다국어 시맨틱 네트워크입니다.[51]
- SMO 온톨로지에서는[52], 모든 WordNet synset(명사, 동사, 형용사, 부사 포함)와 SMO 클래스와의 매핑을 작성했습니다.최근 추가된 매핑은 MILO(Mid-Level Ontology)에서 보다 구체적인 모든 용어에 대한 링크를 제공하며, 이는 SMO를 확장합니다.
- OpenCyc는 [53]일상적인 상식 지식의 오픈 온톨로지 및 지식 기반이며 WordNet 동의어 집합에 연결된 12,000개의 용어를 가지고 있습니다.
- DOLCE는 [54]WonderWeb Foundational Ontologies Library(WFOL)의 첫 번째 모듈입니다.이 상층학은 철학적 전통에서 영감을 얻어 언어와 인식에 대한 명확한 방향을 가지고 엄격한 존재론적 원리에 비추어 개발되었습니다.ToWordNet은[55] 실험적으로 WordNet의 상위 레벨을 DOLCE에 맞춘 결과입니다.이러한 정렬은 개념적으로 더 엄격하고 인지적으로 투명하며 여러 애플리케이션에서 효율적으로 이용 가능한 "온리적으로 달콤한" 워드넷으로 이어질 수 있습니다.
- 구조화된 정보의 데이터베이스인 DBpedia는 [56]WordNet에 연결되어 있습니다.
- eXtended[57] WordNet은 텍사스 댈러스 대학의 프로젝트입니다.이 프로젝트는 용어집을 의미적으로 해석함으로써 WordNet의 개선을 목표로 하고 있습니다.이것에 의해, 이러한 정의에 포함되는 정보가 자동 지식 처리 시스템으로 이용 가능하게 됩니다.WordNet과 유사한 라이선스로 자유롭게 이용할 수 있습니다.
- GCIDE 프로젝트는 1913년의 공개 도메인 웹스터 사전과 자원봉사자들이 제공한 WordNet 정의 및 자료를 결합하여 사전을 제작했습니다.카피레프트 라이선스 GPL로 출시되었습니다.
- ImageNet은 WordNet 계층(현재는 명사만)에 따라 구성된 이미지 데이터베이스로, 계층의 각 노드가 수백, 수천 개의 [58]이미지로 표시됩니다.현재 노드당 평균 500개 이상의 이미지가 있습니다.
- 바이오 워드넷,[59] 바이오메디컬 확장 워드넷은 버전에 대한 안정성 문제로 인해 폐기되었다.
- WikiTax2WordNet: WordNet Synset과 Wikipedia 카테고리 [60]간의 매핑.
- WordNet++는 Wikipedia에서 수집된 수백만 개 이상의 시멘틱 에지를 포함하고 WordNet Synset [61]쌍을 연결하는 리소스입니다.
- SentiWordNet은 모든 WordNet 3.0 동기 세트를 예측된 긍정도, 부정도 및 [62]중립도에 따라 태그하여 얻은 의견 마이닝 애플리케이션을 지원하기 위한 리소스입니다.
- ColorDict는 Wordnet 데이터베이스와 Wikipedia와 같은 다른 것을 사용하는 휴대 전화용 안드로이드 애플리케이션입니다.
- UBY-LMF는 WordNet을 포함한 10개의 리소스로 구성된 데이터베이스입니다.
관련 프로젝트
- FrameNet은 WordNet과 몇 가지 유사점을 공유하고 참조하는 어휘 데이터베이스입니다.
- LMF(Lexical Markup Framework)는 WordNet을 포함한 어휘 구축을 위한 공통 표준화 프레임워크를 정의하기 위해 ISO/TC37 내에서 지정된 ISO 표준입니다.Wordnet용 LMF의 서브셋을 Wordnet-LMF라고 부릅니다.KYTO 프로젝트 [63]내에서 인스턴스화가 이루어졌습니다.
- UNO 주최의 UNO 프로젝트는 기계 번역 및 정보 추출 시스템에 사용되는 여러 언어의 사전 분석 데이터를 통합하는 것을 목적으로 한다.
- Saiming Monkey는 WordNet 데이터베이스에 기반한 무료 온라인 무료 사전입니다.
배포
WordNet 데이터베이스는 다음 소프트웨어용 사전 패키지(일반적으로 단일 파일)로 배포됩니다.
「 」를 참조해 주세요.
레퍼런스
- ^ "WordNet News".
- ^ "WordNets in the World". Global WordNet Association. Retrieved 19 January 2020.
- ^ "WordNet Search - 3.1".
- ^ G. A. 밀러, R. 벡위드, C. D. 펠바움, D.역겨워, K. 밀러1990. WordNet: 온라인 사전 데이터베이스.내국어 사전. 3, 4, 페이지 235~244
- ^ "About Global WordNet Association". Global WordNet. Retrieved 19 January 2020.
- ^ "WordNet Statistics". Wordnet.princeton.edu. Retrieved 2018-06-22.
- ^ 콜린스 A., 퀼리언 M. R. 1972년의미 기억과 언어 이해에 관한 실험.학습과 기억의 인지.와일리, 뉴욕
- ^ "Integration of WordNet 1.7 in WebKB-2". Webkb.org. Retrieved 2014-03-11.
- ^ Gangemi, A.; Navigli, R.; Velardi, P. (2003). The OntoWordNet Project: Extension and Axiomatization of Conceptual Relations in WordNet (PDF). Proc. of International Conference on Ontologies, Databases and Applications of SEmantics (ODBASE 2003). Catania, Sicily (Italy). pp. 820–838.
- ^ Oltramari, A.; Gangemi, A.; Guarino, N.; Masolo, C. (2002). Restructuring WordNet's Top-Level: The OntoClean approach. OntoLex'2 Workshop, Ontologies and Lexical Knowledge Bases (LREC 2002). Las Palmas, Spain. pp. 17–26. CiteSeerX 10.1.1.19.6574.
- ^ Rudnicka, Ewa; Bond, Francis; Grabowski, Łukasz; Piasecki, Maciej; Piotrowski, Tadeusz (2018). "Lexical Perspective on Wordnet to Wordnet Mapping". Proceedings of the 9th Global WordNet Conference (GWC 2018): 210.
- ^ Bond, Francis; Foster, Ryan (2013). "Linking and Extending an Open Multilingual Wordnet" (PDF). Proceedings of the 51st Annual Meeting of the Association for Computational Linguistics: 1352–1362. Retrieved 20 January 2020.
- ^ Fellbaum, Christiane; Vossen, Piek (2012). "Challenges for a multilingual wordnet". Language Resources and Evaluation. 46 (2): 313–326. doi:10.1007/s10579-012-9186-z. S2CID 10117946.
- ^ R. 네비게이션Word Sense 명확화: A Survey, ACM Computing Surveies, 41(2), 2009, 페이지 1~69
- ^ E. 아지레, O. 로페즈2003. 클러스터화 WordNet Word Sens.불가리아 보로베츠 자연어 최근 진보에 관한 회의(LANLP'03)의 대리, 페이지 121-130.
- ^ R. 네비게이션의미 있는 감각의 클러스터링은 제21회 컴퓨터 언어학 국제회의(COLING-ACL 2006), 호주 시드니, 2006년 7월 17일~105페이지와 공동으로 제44회 컴퓨터 언어학 협회 연차총회에서 단어 의미 명확화 성능을 향상시키는 데 도움이 됩니다.
- ^ R. Snow, S. Prakash, D. Jurafsky, A. Y. Ng. 2007.체코 프라하 자연언어 처리 및 계산 자연언어 학습(EMNLP-CoNLL)의 경험적 방법에 관한 2007 공동 회의의 대리점 단어 감각을 병합하는 학습 1005-1014페이지.
- ^ 줄리아 캐리 웡, 2019년바이러스성 셀카 앱인 ImageNet Roulette는 나를 인종차별주의자라고 부르기 전까지는 재밌어 보였다.가디언
- ^ 프란시스 본드와 백경희 2012a.워드넷과 그 라이선스에 대한 조사.제6회 Global WordNet Conference(GWC 2012)의 속행.마츠에.64–71
- ^ "Open Multilingual Wordnet". compling.hss.ntu.edu.sg. Retrieved 10 April 2018.
- ^ "Ted Pedersen - WordNet::Similarity". D.umn.edu. 2008-06-16. Retrieved 2014-03-11.
- ^ Python NLTK/를 사용하는 NLP
- ^ M. T. 필레바, D.쥬겐스와 R.항해사정렬, 명확화 및 걷기: 의미 유사성을 측정하는 통합 접근법..2013년 8월 4-9일 불가리아 소피아에서 열린 제51회 컴퓨터 언어학 협회 연차총회(ACL 2013), 1341-1351페이지.
- ^ Ballatore A, et al. (2014). "Linking geographic vocabularies through WordNet". Annals of GIS. 20 (2): 73–84. arXiv:1404.5372. Bibcode:2014arXiv1404.5372B. doi:10.1080/19475683.2014.904440. S2CID 9246582.
- ^ "Related projects - WordNet - Related projects". Wordnet.princeton.edu. 2014-01-06. Retrieved 2018-06-22.
- ^ The Global WordNet Association (2010-02-04). "globalwordnet.org". globalwordnet.org. Retrieved 2014-03-11.
- ^ "Wordnets in the World". Archived from the original on 2011-10-21.
- ^ Black W., Elkateb S., Rodrigue H., Alkhalifa M., Vossen P., Pease A., Bertran M., Felbaum C, (2006) 아랍어 WordNet 프로젝트, LREC 2006의 진행
- ^ Lahsen Abouenour, Karim Bouzoubaaa, Paolo Rosso (2013) 아랍어 WordNet의 적용 범위와 사용성의 평가와 개선, 언어 자원 및 평가 47(3) 페이지 891–917
- ^ D. Tufis, D.크리스티아, S. 스타무2004. 발칸: 목적, 방법, 결과 및 관점. 개요루마니아인 J. Sci 기술. 정보. (발칸 특집호), 7(1-2), 9-43페이지.
- ^ "BulNet". dcl.bas.bg. Retrieved 2015-05-07.
- ^ 국립 대만 대학 중국어 Wordnet 공식 페이지
- ^ P. Vossen, 1998년판EuroWordNet: Lexical Semantic Networks를 갖춘 다국어 데이터베이스.클루베르, 도르드레흐트, 네덜란드
- ^ "The Global WordNet Association". Globalwordnet.org. 2010-02-04. Retrieved 2014-01-05.
- ^ "FinnWordNet – The Finnish WordNet - Department of General Linguistics". Ling.helsinki.fi. Retrieved 2014-01-05.
- ^ "GermaNet". Sfs.uni-tuebingen.de. Retrieved 2014-03-11.
- ^ Pushpak Bhattacharyya, IndoWordNet, Lexical Resources Engineering Conference 2010(LREC 2010), 몰타, 2010년 5월
- ^ C. Mouton, G. de Chalendar2010.JAWS: 그냥 다른 WordNet 서브셋.TALN 2010의 대리인.
- ^ 웹 사이트
- ^ "MCR 3.0 Adimen". Adimen.si.ehu.es. Retrieved 2022-03-21.
- ^ E. Pianta, L. Bentivogli, C.지라디.2002. MultiWordNet: 정렬된 다국어 데이터베이스 개발.제1회 글로벌 워드넷 국제회의 대리, 인도 마이소어, 21-25페이지.
- ^ "Open Dutch WordNet". Wordpress.let.vupr.nl. 2015-10-28. Retrieved 2022-03-21.
- ^ "arademaker/openWordnet-PT — GitHub". Github.com. Retrieved 2014-01-05.
- ^ 공식 웹 페이지
- ^ 공식 웹 페이지
- ^ "Русский WordNet". Pgups.ru. Retrieved 2014-01-05.
- ^ Balkova, Valentina; Sukhonogov, Andrey; Yablonsky, Sergey (2003). "Russian WordNet From UML-notation to Inter net/Intranet Database Implementation" (PDF). GWC 2004 Proceedings: 31–38. Retrieved 12 March 2017.
- ^ "RussNet: Главная страница". Project.phil.spbu.ru. Retrieved 2014-03-11.
- ^ "UWN: Towards a Universal Multilingual Wordnet - D5: Databases and Information Systems (Max-Planck-Institut für Informatik)". Mpi-inf.mpg.de. 2011-08-14. Retrieved 2014-01-05.
- ^ S. Benott, F.다르자, 2008년다국어 리소스에서 무료 프랑스어 워드넷을 만듭니다.Ontlex 2008 Proc., Marakech, Maroc의 대리점.
- ^ R. 나발리, S. P. 폰제토BabelNet: 대규모 다국어 시멘틱 네트워크 구축.스웨덴, 웁살라, 2010년 7월 11-16일, 제48회 컴퓨터 언어학 협회 연차총회(ACL 2010), 페이지 216-225.
- ^ A. Pease, I. Niles, J. Li. 2002.권장되는 상위 온톨로지: Semantic Web과 그 애플리케이션을 위한 대규모 온톨로지.캐나다 에드먼턴, 온톨로지 및 시멘틱 웹에 관한 AAAI-2002 워크숍의 대리.
- ^ S. 리드와 D.레나트, 2002년Ontologies를 Cyc에 매핑합니다.AAAI 2002 시멘틱 웹 온톨로지 컨퍼런스 워크숍 대리, 캐나다 에드먼턴, 2002
- ^ Masolo, C., Borgo, S., Gangemi, A., Guarino, N., Oltramari, A., Schneider, 2002.Wonder Web 성과물 D17. WonderWeb Library of Foundational Ontologies 및 DOLCE 온톨로지.보고서 (버전 2.0, 15-08-2002)
- ^ Gangemi, A., Guarino, N., Masolo, C., Oltramari, A. 2003 스위트닝 워드넷 with DOLCE.AI 매거진 24(3): 2003년 가을, 페이지 13~24
- ^ C. 바이저, J. 레만, G. 코빌라로프, S.Auer, C.Becker, R. Cyganiak, S.Hellmann, DBpedia – 데이터 웹 결정점웹 시멘틱스, 7(3), 2009, 페이지 154~165
- ^ S. M. 하라바기우, G. A. 밀러, D.I. 몰도반1999. WordNet 2 – 형태학적 및 의미적으로 강화된 리소스.「ACL SIGLEX 워크숍」의 「프로세서: 어휘 자원의 표준화」(P.1-8).
- ^ J. 덩, W. 동, R.소처, L. 리, K. 리, L. 페이페이ImageNet: 대규모 계층 이미지 데이터베이스.2009년 IEEE 컴퓨터 비전 및 패턴 인식 컨퍼런스
- ^ M. Poprat, E. Beisswanger, U. Han. 2008.WORDNET의 데이터 형식과 WORDNET의 소프트웨어 인프라스트럭처를 사용한BIORDNET 구축– 실패 사례자연어 처리를 위한 소프트웨어 엔지니어링, 테스트 및 품질 보증 워크숍의 대리, 페이지 31-39.
- ^ S. 폰제토, R. 네비게리2009년 7월 14-17일 캘리포니아 패서디나에서 열린 제21회 인공지능 국제공동회의(IJCAI 2009)의 대리인 위키피디아 구조조정 및 통합을 위한 대규모 분류법 지도. 페이지 2083–2088.
- ^ S. P. 폰제토, R. Navigli지식이 풍부한 Word Sense 감독 시스템에 필적하는 모호성 해소.컴퓨터 언어학 협회(ACL) 제48회 연차총회 대리, 2010, 페이지 1522–1531.
- ^ S. 바키아넬라, A. 에술리, F.세바스찬.SentiWordNet 3.0: 감성 분석 및 의견 마이닝을 위한 강화된 어휘 리소스.제7차 언어자원 및 평가에 관한 회의(LREC'10)의 속보에서 발레타, MT, 2010, 페이지 2200–2204.
- ^ Pikek Vossen, Claudia Soria, Monica Monachini:Wordnet-LMF: LMF Lexical Markup Framework에서 다국어 워드넷의 표준 표현, Gil Francopoulo ISTE / Wiley 2013 편집(ISBN 978-1-84821-430-9)
- ^ "Babylon WordNet". Babylon.com. Retrieved 2014-03-11.
- ^ "GoldenDict - Browse /dictionaries at Sourceforge.net". Sourceforge.net. 2010-12-01. Retrieved 2014-01-05.
- ^ "Lingoes WordNet". Lingoes.net. 2007-11-16. Retrieved 2014-03-11.
외부 링크
- 공식 웹사이트
- "Malayalam WordNet". Computer Science. Cochin University of Science & Technology.
- Pilato, Maria. "Adjectives, Intensifiers, Negations (AIN) Thesaurus". Italian Sentiment.