오픈 마인드 상식
Open Mind Common Sense오픈마인드 상식(OMCS)은 매사추세츠공대(MIT) 미디어랩에 본사를 둔 인공지능 프로젝트로, 웹을 가로지르는 수많은 사람들의 기여로 대규모 상식 지식 기반을 구축하고 활용하는 것이 목표다. 1999년부터 2016년까지 활동했다.
창사 이래, 그것은 다른 언어의 지식 기반 외에도 15,000명 이상의 기고자들로부터 백만 개 이상의 영어 사실들을 축적해 왔다. OMCS의 소프트웨어의 대부분은 세 가지 상호연결된 표현, 즉 사람들이 직접 상호작용하는 자연어 말뭉치, ConceptNet이라고 하는 이 말뭉치로부터 구축된 의미 네트워크, 차원성 축소를 이용하여 새로운 지식을 유추할 수 있는 ConceptNet의 매트릭스 기반 표현에 기초하여 구축된다.[1] 오픈마인드 상식(Open Mind Commonse)이 수집한 지식은 MIT 등지에서 연구 프로젝트를 가능하게 했다.
역사
이 프로젝트는 마빈 민스키, 푸시 싱, 캐서린 하바시 등이 고안한 것이다. 개발 작업은 1999년 9월부터 시작되며, 1년 후부터는 인터넷에 개방된다. 하바시는 자신의 논문에서 "...을 위한 시도"라고 설명했다. 당시 초기 단계에 불과했던 인터넷의 분산된 인간 컴퓨팅 능력을 활용한다."[2] OMCS는 웹 사이트 Everything2와 그 전임자의 영향을 받아, 구글에서 영감을 얻은 미니멀리즘 인터페이스를 제시한다.
푸시 싱은 2007년 상식 컴퓨팅 그룹을 이끌 MIT 미디어 랩의 교수가 되어 2006년 2월 28일 화요일 자살할 때까지 활동할 예정이다.[3]
이 프로젝트는 현재 캐서린 하바시 산하의 MIT 미디어 랩에서 디지털 직감 그룹이 운영하고 있다.[citation needed]
데이터베이스 및 웹 사이트
OMCS에는 많은 다양한 종류의 지식이 있다. 몇몇 진술들은 자연 언어의 단순한 구절로 표현되는 사물이나 사건들 간의 관계를 전달한다: "코트는 따뜻하게 하기 위해 사용된다", "태양은 매우 뜨겁다", 그리고 "저녁을 요리할 때 가장 마지막에 하는 것은 설거지" 등이 있다. 데이터베이스에는 '친구들과 시간을 보내면 행복해진다' '차 사고 현장에 들어가면 화가 난다'는 등의 상황의 감정적 내용에 대한 정보도 담겨 있다. OMCS에는 '사람들은 존중받고 싶어 한다', '사람들은 좋은 커피를 원한다'[1] 등 크고 작은 사람들의 욕망과 목표에 대한 정보가 담겨 있다.
원래 이러한 문장은 나중에 구문 분석해야 하는 제한되지 않은 텍스트 문장으로 웹 사이트에 입력될 수 있었다. 현재 버전의 웹 사이트는 더 구조화된 빈칸 채우기 템플리트를 사용해서만 지식을 수집한다. OMCS는 또한 목적이 있는 게임에서 수집한 데이터를 사용한다.[4]
OMCS 데이터베이스는 그 본래의 형태에서, 단지 어떤 공통의 지식을 전달하는 이러한 짧은 문장의 집합체일 뿐이다. 이 지식을 계산적으로 이용하기 위해서는 좀 더 구조화된 표현으로 변모시켜야 한다.
콘셉트넷
ConceptNet은 OMCS 데이터베이스의 정보를 기반으로 하는 의미 네트워크다. ConceptNet은 노드가 개념이고, 노드의 가장자리가 이러한 개념에 대한 상식의 주장인 방향화된 그래프로 표현된다. 개념은 명사구, 동사구, 형용사구 또는 절이 될 수 있는 밀접하게 관련된 자연어 구들의 집합을 나타낸다.[5]
콘셉트넷은 OMCS의 자연어 주장에서 얄팍한 파서를 이용한 패턴과 매칭하여 만들어진다. 주장은 두 개념 사이의 관계로서 표현되며, 가능한 관계의 제한된 집합에서 선택된다. 다양한 관계는 OMCS 말뭉치에서 발견되는 일반적인 문장 패턴을 나타내며, 특히 지식 수집 웹 사이트에서 사용되는 모든 "빈칸 채우기" 템플릿은 특정 관계와 연관되어 있다.[5]
ConceptNet을 구성하는 데이터 구조는 2007년에 대폭 개편되어 ConceptNet 3으로 발표되었다.[5] 소프트웨어 에이전트 그룹은 현재 새로운 버전 4.0을 위한 데이터베이스와 API를 배포한다.[6]
2010년에는 로빈 스피어, 데니스 클라크, 제이슨 알론소와 함께 OMCS 공동 창업자 겸 이사인 캐서린 하바시가 컨셉넷을 기반으로 하는 텍스트 분석 소프트웨어 회사인 루미노소를 만들었다.[7][8][9][10] 기업이 설문 조사, 제품 리뷰, 소셜 미디어 등 방대한 양의 질적 데이터를 이해하고 통찰력을 도출할 수 있도록 돕기 위해 ConceptNet을 기본 어휘 리소스로 사용한다.[7][11][12]
기계 학습 도구
콘셉트넷의 정보는 머신러닝 알고리즘의 기반으로 활용될 수 있다. AcludeSpace라고 불리는 한 표현은 단수 가치 분해를 사용하여 AI 애플리케이션에서 사용할 수 있는 방식으로 ConceptNet 지식의 패턴을 일반화하고 표현한다. 이 회사의 크리에이터들은 텍스트 컴퍼니를 기반으로 머신러닝을 수행하기 위한 파이썬 머신러닝 툴킷인 디비시를 배포하고, 콘셉트넷과 같은 구조화된 지식기반, 이 두 가지를 조합해 판매하고 있다.
다른 프로젝트와의 비교
그 밖에 유사한 프로젝트로는 지식수집과 참여 인센티브 제공에 대한 대안적 접근방식을 탐구한 '절대언어 학습', '마인드픽셀'(계속), '사이크', '학습자', '센티넷', '자유기반', 'YAGO', 'DBPEDIA', '오픈마인드 1001 질문' 등이 있다.
오픈마인드 상식 프로젝트는 형식적인 논리구조를 이용하기보다는 영어 문장으로 수집한 상식지식을 표현하는 데 주력해 왔기 때문에 싸이크와 다르다. ConceptNet은 그것의 "공식적인 언어-리거보다 비공식적인 개념 연결성에 대한 강조" 때문에 그것의 창시자 중 한 명인 Hugo 류에 의해 Cyc보다 워드넷과 더 유사한 구조로 묘사된다.[14]
상카를로스 연방대학교(LIA-UFSCAR)의 어드밴스트 인터랙션 랩(Advanced Interaction Lab)이 주도하는 브라질 오픈 마인드 상식(OMCS-Br)이라는 브라질 이니셔티브도 있다. 본 프로젝트는 2005년 MIT 미디어랩의 소프트웨어 에이전트 그룹과 협력하여 브라질 포르투갈어로 기술된 상식을 수집하여 ConceptNet에서 문화 프로필의 지식을 추출하여 문화적으로 민감한 소프트웨어 응용프로그램을 개발하는 데 사용하는 것이 주요 목표다. 이는 문화적으로 문맥화된 콘텐츠 소프트웨어로 개발자와 사용자를 도와 최종 애플리케이션을 보다 유연하고, 적응하고, 접근 가능하고, 사용할 수 있도록 하기 위한 것이다. 주요 애플리케이션의 초점은 교육과 의료다.[citation needed]
참고 항목
참조
- ^ a b 로빈 스피어, 캐서린 하바시, 헨리 리버먼. RefluenceSpace: Wayback Machine에 보관된 상식 지식의 차원성 감소 2010-07-09. AAAI 2008.
- ^ 캐서린 하바시. 단수 값 분해 기반 기법을 사용하여 의미론적 관계 발견 Brandeis University의 2009년 6월 박사 논문.
- ^ MIT News Office (2006-03-08). "Memorial service slated tomorrow for Pushpinder Singh". MIT Tech Talk. Retrieved 2009-10-07.
- ^ "Profile for verbosity". Open Mind Commons Sense. Archived from the original on 2010-06-25.
- ^ a b c 캐서린 하바시, 로빈 스피어, 제이슨 알론소. ConceptNet 3: 상식 지식을 위한 유연하고 다국어 의미 네트워크. Natural Language Processing, 2007. ConceptNet 3:... 웨이백 머신에 2015-05-29 보관
- ^ Commonsense Computing Initiative (2009-02-24). "ConceptNet API in Launchpad". Retrieved 2009-10-07.
- ^ a b Lohr, Steve (27 June 2014). "The U.S.-Germany Match Through a Social Media Lens". New York Times. Retrieved 3 March 2015.
- ^ Rusli, Evelyn (14 April 2014). "Firms Use Artificial Intelligence to Tap Shoppers' Views". The Wall Street Journal. Retrieved 3 March 2015.
- ^ Alba, Davey (12 February 2015). "The Startup That Helps You Analyze Twitter Chatter in Real Time". Wired. Retrieved 3 March 2015.
- ^ Noyes, Katherine (11 February 2015). "Luminoso to enterprises: Here's what all that chatter really means". PC World. Retrieved 3 March 2015.
- ^ Miller, Ron (2 July 2014). "Luminoso Lands $6.5M In Series A To Keep Building Cloud Text Analytics Service". TechCrunch. Retrieved 3 March 2015.
- ^ Darrow, Barb (11 February 2015). "Luminoso brings its text analysis smarts to streaming data". GigaOm. Retrieved 3 March 2015.
- ^ Commonsense Computing Initiative (2009-02-24). "Divisi in Launchpad". Retrieved 2009-10-07.
- ^ "The ConceptNet Project V2.1". Retrieved 2008-12-17.
외부 링크
- 오픈 마인드 상식
- 오픈 마인드 상식 메타리포지토리 기투브
- 콘셉트넷
- 유추공간
- 디비시 추론 툴킷
- Commonsense Computing Initiative의 웹 페이지(사이트가 존재하지 않음)
- Open Mind Initiative(사이트가 존재하지 않음
- OMCSNetCPP - OMCSNet 데이터를 사용하여 소스 C++ 추론 엔진 열기
- 브라질 오픈 마인드 상식(사이트 파손)
- 고급 상호작용 실험실