자연어 이해

Natural-language understanding

자연언어 이해(NLU) 또는 자연언어 통역(NLI)[1]기계 판독 이해다루는 인공지능의 자연언어 처리 하위 주제입니다.자연어 이해는 AI의 난해한 [2]문제로 꼽힌다.

분야는 자동추론,[3] 기계번역,[4] [5]질문응답, 뉴스수집, 텍스트분류, 음성활성화, 아카이브 및 대규모 콘텐츠 분석에 적용되기 때문에 상업적 관심이 상당히 높습니다.

역사

1964년 대니얼 보브로가 MIT 박사학위 논문을 위해 작성한 이 프로그램은 컴퓨터에 [6][7][8][9][10]의한 자연어 이해를 위한 최초의 시도 중 하나이다.맥카시인공지능이라는 용어를 만든 지 8년 후, 보브로의 논문(컴퓨터 문제 해결 시스템을 위한 자연어 입력)은 컴퓨터가 대수 단어 문제를 해결하기 위해 어떻게 간단한 자연어 입력을 이해할 수 있는지를 보여주었다.

1년 후인 1965년 MIT의 조셉 와이젠바움은 ELIZA를 썼다.ELIZA는 어떤 주제든 영어로 대화하는 인터랙티브 프로그램이며 가장 인기 있는 것은 심리치료이다.ELIZA는 간단한 구문 분석과 키워드의 통조림 어구 치환으로 작업했고, Weizenbaum은 프로그램에 실제 지식 데이터베이스나 풍부한 어휘를 제공하는 문제를 피했다.그러나 ELIZA는 장난감 프로젝트로 놀라운 인기를 얻었으며 [11]Ask.com에서 사용되는 것과 같은 현재의 상용 시스템의 매우 초기 단계라고 볼 수 있다.

1969년 스탠포드 대학의 로저 생크는 자연어 [12]이해를 위한 개념 의존 이론을 도입했다.시드니 램의 작품에서 부분적으로 영향을 받은 이 모델은 로버트 윌렌스키, 웬디 레너트, 자넷 콜로드너같은 예일 대학의 샹크의 학생들에 의해 광범위하게 사용되었습니다.

1970년에 윌리엄 A. 우즈는 자연어 [13]입력을 나타내기 위해 증강 전이 네트워크(ATN)를 도입했다.ATN은 구문 구조 규칙 대신 반복적으로 호출되는 동등한 유한 상태 자동 데이터 집합을 사용했습니다.ATN과 "일반화된 ATN"이라고 불리는 더 일반적인 형식은 몇 년 동안 계속 사용되었습니다.

1971년, Terry Winograd는 MIT에서 박사 논문을 위해 SHRDLU의 집필을 마쳤다. SHRDLU는 제한된 어린이 블록의 세계에서 간단한 영어 문장을 이해하고 로봇팔로 물건을 움직이게 할 수 있었다.SHRDLU의 성공적인 시연은 [14][15]이 분야의 지속적인 연구에 상당한 모멘텀을 제공했다.Winograd[16]인지 과정으로서의 언어라는 책을 출판하면서 계속해서 그 분야에서 큰 영향력을 행사했습니다.스탠포드에서 Winograd는 나중에 구글을 공동 설립Larry Page에게 조언을 해줄 것이다.

1970년대와 1980년대에 SRI International의 자연어 처리 그룹은 이 분야의 연구개발을 계속했다.연구에 기초한 많은 상업적 노력이 이루어졌습니다.예를 들어 Gary Hendrix는 1982년에 원래 개인용 컴퓨터의 데이터베이스 쿼리를 위한 자연 언어 인터페이스를 개발하기 위한 회사로 Symantec Corporation을 설립했습니다.그러나 마우스 기반의 그래피컬 사용자 인터페이스의 등장으로 Symantec은 방향을 바꿨습니다.Larry R과 같은 많은 상업적 노력이 비슷한 시기에 시작되었다.인공지능 코퍼레이션의 Harris와 Cognitive Systems Corporation의 [17][18]Roger Shank와 그의 학생.1983년 마이클 다이어는 예일대에서 로저 생크와 W. G. 레너트의 [19]작업과 유사한 BORIS 시스템을 개발했다.

3천 년대에는 IBM Watson과 같이 텍스트 분류에 기계 학습을 사용하는 시스템이 도입되었습니다.그러나 전문가들은 그러한 시스템이 얼마나 "이해"를 보여주는지 논쟁한다. 예를 들어 설에 따르면 왓슨은 질문조차 이해하지 [20]못했다.

인지 과학자이자 패텀 이론의 발명가인 John Ball은 이 평가를 지지합니다.자연어 처리는 서비스나 전자상거래에 있어서의 인간의 생산성을 서포트하는 애플리케이션에 침투하고 있지만, 이것은 애플리케이션의 범위를 좁힘으로써 실현되고 있다.인간의 언어로 무언가를 요구할 수 있는 방법은 수천 가지가 있지만 여전히 기존의 자연어 처리를 거스르고 있다.기계와 의미 있는 대화를 하는 것은 세 살짜리 아이가 추측 없이 하는 것처럼 문장 속의 다른 단어의 의미를 바탕으로 모든 단어를 올바른 의미와 일치시킬 때만 가능합니다.

범위 및 컨텍스트

"자연어 이해"라는 포괄적 용어는 간단한 명령어부터 로봇에 이르기까지 작고 비교적 간단한 작업부터 신문 기사나 시 구절의 완전한 이해와 같은 매우 복잡한 작업까지 다양한 컴퓨터 애플리케이션에 적용될 수 있다.많은의 실세계 적용 두개의 양 극단 사이, 이 메일을 자동 분석과 한 기업에 있지만 simpl의 관리보다 훨씬 많은 단어를 알고 더 다양한 구문에 대처해야 있는 text,[21] 깊은 이해 요구하지 않는 적합한 부서에 라우팅을 위해 인스턴스를 텍스트 분류 되었다.equeries에서 데이터베이스 테이블로 이동합니다.

몇 년 동안 컴퓨터에 표시되는 자연어 또는 영어 같은 문장을 처리하려는 다양한 시도는 다양한 수준의 복잡성으로 이루어졌습니다.시스템에 대한 이해가 깊어지지는 않았지만 시스템 전체의 조작성에 도움이 되는 경우도 있습니다.를 들어, Wayne Ratliff는 원래 Star Trek에서 영어로 말하는 컴퓨터를 모방하기 위해 영어 같은 구문을 가진 벌컨 프로그램을 개발했다.Vulcan은 나중에 사용하기 쉬운 구문이 효과적으로 퍼스널 컴퓨터 데이터베이스 [22][23]산업을 시작한 dBase 시스템이 되었습니다.그러나 사용하기 쉽거나 영어와 유사한 구문을 가진 시스템은 풍부한 어휘를 사용하고 자연어 문장의 의미에 대한 내부 표현(종종 1차 논리로서)을 포함하는 시스템과는 상당히 다르다.

따라서 시스템이 지향하는 '이해'의 폭과 깊이에 따라 시스템의 복잡성(및 암묵적인 과제)과 처리할 수 있는 애플리케이션의 유형이 결정됩니다.시스템의 "빵"은 어휘와 문법의 크기로 측정됩니다."깊이"는 그 이해도가 유창한 원어민 수준의 정도에 의해 측정된다.가장 좁고 얕게는 영어형 명령어 인터프리터는 최소한의 복잡성이 필요하지만 응용 프로그램의 범위는 좁습니다.좁지만 깊이 있는 시스템은 [24]이해 메커니즘을 탐색하고 모델화하지만 여전히 적용 범위가 한정되어 있습니다.단순한 키워드 매칭을 넘어 뉴스 릴리즈 등의 문서 내용을 이해하고 사용자에 대한 적합성을 판단하려는 시스템은 광범위하며 상당한 [25]복잡성이 요구되지만 아직 다소 얄팍하다.매우 광범위하고 깊이 있는 시스템은 현재 기술 수준을 넘어섰습니다.

컴포넌트와 아키텍처

사용하는 접근방식에 관계없이 대부분의 자연언어 이해 시스템은 몇 가지 공통 컴포넌트를 공유합니다.이 시스템은 언어 사전과 문장을 내부 표현으로 나누기 위한 파서문법 규칙을 필요로 한다.적절한 온톨로지를 가진 풍부한 어휘를 구축하려면 상당한 노력이 필요하다. 예를 들어, 워드넷 어휘는 많은 인년의 [26]노력이 필요했다.

이 시스템은 또한 이해를 이끌기 위해 의미론으로부터의 이론이 필요하다.언어 이해 시스템의 해석 능력은 사용하는 의미 이론에 따라 달라집니다.경쟁하는 언어의 의미론은 컴퓨터 자동 [27]의미 해석의 기초로서 적합성에 있어 특정한 트레이드오프가 있다.이것들은 [28][29][30]순진한 의미론이나 확률적 의미론 분석에서부터 컨텍스트에서 의미를 도출하기 위한 실용론의 사용에 이르기까지 다양하다.의미 파서는 자연어 텍스트를 형식적인 의미 [31]표현으로 변환합니다.

자연어 이해의 고급 응용 프로그램도 논리적 추론을 그들의 프레임워크에 포함시키려고 시도한다.이것은 일반적으로 파생된 의미를 술어 논리에서의 일련의 주장으로 매핑하고, 결론에 도달하기 위해 논리적 추론을 사용함으로써 달성된다.따라서 Lisp와 같은 기능언어에 기반한 시스템은 논리어사션을 나타내는 서브시스템을 포함할 필요가 있는 반면 Prolog 언어를 사용하는 논리 지향 시스템은 일반적으로 내장된 논리 표현 프레임워크의 [32][33]확장에 의존합니다.

자연어 이해에서의 컨텍스트 관리는 특별한 문제를 일으킬 수 있습니다.다양한 예와 반례는 각각 특정한 강점과 [34][35]약점을 가진 컨텍스트의 형식적 모델링에 대한 여러 가지 접근방식을 낳았다.

「 」를 참조해 주세요.

메모들

  1. ^ 세만, P. (2012년)자연어 생성: 개요Journal of Computer Science & Research (JCSCR)-ISSN, 50-57
  2. ^ 로만 5세Yampolskiy.AI-완전성을 정의하는 특징으로서의 튜링 테스트.인공지능, 진화계산, 메타휴리스틱스(AIECM) -- 앨런 튜링의 발자취를 따라.양신사 (편집) 페이지 3-17 (1장)스프링거, 런던2013년 http://cecs.louisville.edu/ry/TuringTestasaDefiningFeature04270003.pdf
  3. ^ 반 하멜렌, 프랭크, 블라디미르 리프시츠, 브루스 포터입니다지식 표현 핸드북.Vol.1. Elsevier, 2008.
  4. ^ 매케리, 클라우스, 프란츠 요제프 오흐, 헤르만 네이."통계 기계 번역을 이용한 자연어 이해"제7회 유럽 음성 통신 기술 회의2001.
  5. ^ 허쉬먼, 리넷, 로버트 가이자우스카스입니다"자연어 질문 답변: 여기서 본 풍경"자연어 공학 7.4(2001) : 275-300.
  6. ^ 미국 인공지능 협회 AI의 역사 [1]
  7. ^ 컴퓨터 문제 해결 시스템을 위한 대니얼 보브로 박사 논문 자연어 입력.
  8. ^ Pamela McCorduck 2004가 생각하는 기계 ISBN1-56881-205-1 286페이지
  9. ^ Russell, Stuart J., Norvig, Peter(2003), 인공지능: 현대적 접근 프렌티스 홀, ISBN 0-13-790395-2, http://aima.cs.berkeley.edu/, 페이지 19
  10. ^ 컴퓨터 사이언스 로고 스타일: Brian Harvey 1997년 ISBN 0-262-5850-7페이지 278의 Beyon 프로그래밍을 넘어
  11. ^ Weizenbaum, Joseph(1976).컴퓨터 파워와 인간의 이유: 판단부터 계산까지 W. H. Freeman and Company.ISBN 0-7167-0463-3페이지 188-189
  12. ^ Roger Schank, 1969, 자연어를 위한 개념 의존성 파서 1969년 Söng-Séby, 스웨덴 Söby 컴퓨터 언어학 회의의 진행 1-3페이지
  13. ^ 우즈, 윌리엄 A(1970)."자연 언어 분석을 위한 Transition Network Grammars"ACM 13(10): 591~606 [2]
  14. ^ 인공지능: 중요 개념, 제1권 Ronald Chrisley, Sander Begeer 2000 ISBN 0-415-19332-X 페이지 89
  15. ^ Stanford SHRDLU의 Terry Winograd의 SHRDLU 페이지
  16. ^ Winograd, Terry(1983), 인지 과정으로서의 언어, Addison-Wesley, Reading, MA.
  17. ^ 래리 R.Harris, 인공지능 회사 연구실입니다.ACM SIGART Bulletin, 제79호, 1982년 1월 [3]
  18. ^ Christopher K의 내부 사건 기반 추리.Riesbeck, Roger C.Schank 1989 ISBN 0-89859-767-6페이지
  19. ^ 심층 이해: 내러티브 이해를 위한 통합 프로세스 모델..마이클 G.다이어 MIT 프레스입니다ISBN 0-262-04073-5
  20. ^ Searle, John (23 February 2011). "Watson Doesn't Know It Won on 'Jeopardy!'". Wall Street Journal.
  21. ^ Zoubida Kedad, Nadira Lammari 2007 ISBN 3-540-73350-7에 의해 편집된 자연어 처리정보 시스템의 Peifeng Li 등에 의한 계층적 이메일 분류 접근법
  22. ^ InfoWorld, 1989년 11월 13일, 144페이지
  23. ^ Info World, 1984년 4월 19일, 71페이지
  24. ^ James Mason 2010의 제한된 실용 영역에서의 완전한 자연 언어 이해 작업 모델 구축 [4]
  25. ^ 마이닝: Soumen Chakrabarti 2002 ISBN 1-55860-754-4 페이지 289의 하이퍼텍스트 데이터에서 지식 발견
  26. ^ G. A. 밀러, R. 벡위드, C. D. 펠바움, D.역겨워, K. 밀러1990. WordNet: 온라인 사전 데이터베이스.내국어 사전집 3, 4, 페이지 235-244
  27. ^ 언어학에서의 컴퓨터 사용: John Lawler의 실용 가이드, Helen Aristar Dry 198 ISBN 0-415-16792-2 페이지 209
  28. ^ Kathleen Dahlgren 1988 ISBN 0-89838-287-4에 의한 자연어 이해를 위한 순진한 의미론
  29. ^ 볼프강 밍커, 알렉스 와이벨, 조셉 마리안리의 1999 ISBN 0-7923-8571-3에 의한 확률 기반 의미 분석
  30. ^ Georgia M에 의한 실용학과 자연어 이해.녹색 1996 ISBN 0-8058-2166-X
  31. ^ 왕, 육화, 레이먼드 무니."통계 기계 번역을 통한 의미 해석 학습"계산언어학회 북미지부 인간언어기술회의 본회의 의사록.컴퓨터 언어학 협회, 2006.
  32. ^ 내추럴 언어 프로세싱 프롤로그 프로그래머 by Natural Language Prolog Programmers.코빙턴, 1994년 ISBN 0-13-629478-2
  33. ^ Gerald Gazdar, Christopher S. Mellish 1989 ISBN 0-201-18053-7의한 프롤로그 자연어 처리
  34. ^ Ashwin Ram의 언어 이해, Kenneth Moorman 1999 ISBN 0-262-18192-4 페이지 111
  35. ^ Pierre Bonzon et al 2000 ISBN 0-7923-6350-7에 의한 문맥의 형식적 측면
  36. ^ 자연어를 사용한 프로그래밍이 실제로 기능하고 있는 Wolfram 블로그
  37. ^ Van Valin, Jr, Robert D. "From NLP to NLU" (PDF).
  38. ^ Ball, John. "multi-lingual NLU by Pat Inc". Pat.ai.