시멘틱 해석

Semantic parsing

의미 해석자연스러운 언어 발화를 논리적형태로 변환하는 작업입니다. 즉,[1] 의미를 기계적으로 이해할 수 있는 표현입니다.따라서 의미 파싱은 발화의 정확한 의미를 추출하는 것으로 이해될 수 있다.시멘틱 파싱에는 기계 번역,[2] 질문 응답,[1][3] 온톨로지 유도, 자동 [5]추론,[4] 코드 [6][7]생성 등이 있습니다.이 문구는 1970년대에 Yorick Wilks에 의해 의미적 [8]표현만으로 작동하는 기계 번역 프로그램의 기초로 처음 사용되었습니다.

컴퓨터 비전에서 의미 해석은 3D [9][10]객체에 대한 분할 과정입니다.

종류들

얕다

얄팍한 의미 해석은 발언에서 실체를 식별하고 실체가 수행하는 역할로 실체에 라벨을 붙이는 것과 관련이 있다.얕은 의미 해석은 이론적인 기초가 관련된 개념과 역할의 프레임을 떠올리는 프레임 의미론에서 비롯되었기 때문에 슬롯 채우기 또는 프레임 의미 해석으로 알려져 있기도 합니다.슬롯 충전 시스템은 [11][12]발화에 의해 유발되는 프레임을 식별하는 메커니즘으로 볼 수 있는 인텐트 분류기와 함께 가상 어시스턴트에서 널리 사용된다.슬롯 채우기를 위한 인기 있는 아키텍처는 주로 인코더/디코더 모델의 변형이며, 여기서 두 개의 반복 신경 네트워크(RNN)는 공동으로 발화를 벡터로 인코딩하고 그 벡터를 일련의 [13]슬롯 라벨로 디코딩하도록 훈련된다.이 모델은 Amazon Alexa 구어 이해 [11]시스템에서 사용됩니다.

깊다

구성 의미 파싱이라고도 알려진 심층 의미 파싱은 상당한 구성성[14]포함할 수 있는 발화의 정확한 의미 표현을 생성하는 것과 관련이 있습니다.얕은 시맨틱 파서는 "보스턴에서 달라스로 가는 비행"과 같은 표현을 "목록 비행"으로 분류하고 "소스"와 "목적지"를 각각 "보스턴"과 "달라스"로 채움으로써 해석할 수 있다.단, 얕은 의미 해석은 "보스턴에서 주노로 가는 항공편이 있는 곳까지 항공편을 보여달라"와 같은 임의의 구성 표현을 해석할 수 없다.심층 시맨틱 해석은 일반적으로 이러한 표현을 형식적인 의미 표현 언어로 변환하여 해석하려고 시도합니다.

표현 언어

이른 의미 파서 languages,[15]나중에 시스템 Prolog,[16] 같은 좀 더 확장성 언어를 사용하여 고도로 영역 특수적 의미 표현 사용되 calculus,[17]람다dependency-based 합성 의미론(λ-DCS)[18]SQL,[19][20]Python,[21]Java,[22]은 알렉사 의미 표현 Language,[11]고 추상 의미 Repr 람다.esentation(IMT20003GPP-AMR).쿼리 그래프,[23] 의미 [24]그래프 또는 벡터 [25]표현과 같은 보다 이국적인 의미 표현을 사용한 작업도 있습니다.

모델

대부분의 현대 딥 시맨틱 파싱 모델은 차트 파서를 위한 정식 문법을 정의하거나 RNN을 이용하여 자연 언어에서 의미 표현 언어로 직접 번역하는 데 기초하고 있습니다.정식 문법에 기반한 시스템의 예로는 코넬 시멘틱 파싱 프레임워크,[26] 스탠포드 대학의 시멘틱 파싱 with Execution(SEMPRE),[3] 워드 얼라인먼트 기반의 시멘틱 파서(WASP)[27] 등이 있습니다.

데이터 세트

통계적 의미 해석 모델을 교육하는 데 사용되는 데이터 세트는 응용 프로그램에 따라 기술 자료 쿼리를 통한 질문 답변에 사용되는 데이터 세트와 코드 생성에 사용되는 데이터 세트의 두 가지 주요 클래스로 나뉩니다.

질문에 대한 답변

의미 해석을 통한 질문 답변의 표준 데이터 세트는 ATIS(Air Travel Information System) 데이터 세트입니다. 이 데이터 세트에는 향후 비행 및 해당 [19]SQL에 대한 질문과 명령이 포함되어 있습니다.또 다른 벤치마크 데이터 세트는 GeoQuery 데이터 세트입니다.이 데이터 세트에는 미국 지역에 대한 질문이 해당 Prolog와 [16]함께 포함되어 있습니다.오버나잇 데이터 세트는 시멘틱 파서가 여러 도메인에 걸쳐 얼마나 잘 적응하는지 테스트하는 데 사용됩니다. 이 데이터 세트에는 대응하는 "-DCS [28]표현과 쌍을 이루는 8개의 다른 도메인에 대한 자연 언어 쿼리가 포함됩니다.

코드 생성

코드 생성에 널리 사용되는 데이터 세트에는 카드에 표시되는 텍스트를 해당 카드를 정확하게 나타내는 코드에 연결하는 두 개의 트레이딩 카드 데이터 세트가 포함됩니다.하나는 Magic을 링크하여 구축되었습니다. Gathering 카드 텍스트는 Java 스니펫으로, 다른 하나는 Hearthstone 카드 텍스트를 Python [22]스니펫으로 링크하는 입니다.IFTT 데이터[29] 집합은 짧은 조건부 명령과 함께 특수한 도메인별 언어를 사용합니다.Django 데이터[30] 집합은 Python 스니펫을 설명하는 영어 및 일본어 의사 코드와 쌍을 이룹니다.RoboCup[31] 데이터 세트는 영어 규칙과 가상 축구 경기 로봇이 이해할 수 있는 도메인별 언어로 표현합니다.

「 」를 참조해 주세요.

레퍼런스

  1. ^ a b Jia, Robin; Liang, Percy (2016-06-11). "Data Recombination for Neural Semantic Parsing". arXiv:1606.03622 [cs.CL].
  2. ^ 안드레아스, 제이콥, 안드레아스 블라코스, 스티븐 클락.기계번역으로서의 의미파싱.컴퓨터 언어학 협회 제51회 연차총회(제2권: 단문).제2권 2013년
  3. ^ a b 베란트, 조나단 등"질문-답변 쌍에서 프리베이스에 대한 의미파싱." EMNLP. Vol. 2. No. 5. 2013.
  4. ^ 푼, 호이풍, 페드로 도밍고스."텍스트에서 감독되지 않은 온톨로지 유도"컴퓨터 언어학 협회의 제48회 연차총회 의사록.컴퓨터 언어학 협회, 2010.
  5. ^ 칼리시크, 세자리, 요제프 어반, 지이 비스코칠."수학의 통계적 의미적 해석에 의한 형식화 자동화"인터랙티브 정리 증명에 관한 국제 회의스프링거, 참, 2017년
  6. ^ Rabinovich, Maxim; Stern, Mitchell; Klein, Dan (2017-04-25). "Abstract Syntax Networks for Code Generation and Semantic Parsing". arXiv:1704.07535 [cs.CL].
  7. ^ Yin, Pengcheng; Neubig, Graham (2017-04-05). "A Syntactic Neural Model for General-Purpose Code Generation". arXiv:1704.01696 [cs.CL].
  8. ^ Wilks, Y. and Fass, D. (1992) 응용 프로그램이 있는 컴퓨터와 수학에서의 선호 의미론 패밀리, 제23권, 2-5호, 205-221페이지.
  9. ^ 아르메니아, 이로 등"대규모 실내 공간의 3D 의미 해석"컴퓨터 비전과 패턴 인식에 관한 IEEE 회의의 진행 상황. 2016년.
  10. ^ Qi, Charles R. 등"포인트넷: 3D 분류세분화를 위한 포인트 세트에 대한러닝."컴퓨터 비전과 패턴 인식에 관한 IEEE 회의의 진행.2017.
  11. ^ a b c 쿠마르, 안지슈누 등"Just ASK: 확장 가능한 셀프 서비스 구어 이해를 위한 아키텍처 구축." arXiv 프리프린트 arXiv: 1711.00549(2017).
  12. ^ Bapna, Ankur 등"도메인 확장을 위한 제로샷 프레임 시멘틱 해석 방향." arXiv 프리프린트 arXiv:1707.02363(2017)
  13. ^ 류, 빙, 이안 레인."공동 의도 검출슬롯 채우기를 위한 주의 기반 반복 뉴럴 네트워크 모델." arXiv 프리프린트 arXiv:1609.01454 (2016).
  14. ^ 량, 퍼시, 크리스토퍼 포츠."머신러닝과 구성적 의미론 통합." Annu. 언어학자 1.1 (2015) : 355-376.
  15. ^ Woods, William A.질의응답 시스템의 의미론입니다.제27권, 갈랜드 술집, 1979년
  16. ^ a b 젤리, 존 M., 레이먼드 무니."유도 로직 프로그래밍을 사용하여 데이터베이스 쿼리를 해석하는 방법을 학습합니다."1996년 인공지능에 관한 전국회의의 진행상황.
  17. ^ 왕, 육화, 레이먼드 무니."람다 미적분을 사용하여 의미 해석을 위한 동기 문법 학습"컴퓨터 언어학 협회 제45회 연차총회 의사록.2007.
  18. ^ 량, 퍼시"Lambda 의존성 기반 구성 의미론." arXiv 프리프린트 arXiv:1309.4408(2013).
  19. ^ a b 헴필, 찰스 T., 존 J. 고드프리, 조지 R.도딩턴."ATIS 구어 시스템이 말뭉치를 시험하고 있습니다."스피치 및 자연어: 1990년 6월 24-27일 펜실베니아 히든 밸리에서 열린 워크숍의 진행.
  20. ^ Iyer, Srinivasan 등"사용자 피드백을 통해 신경 의미 분석기를 학습합니다." arXiv 프리프린트 arXiv:1704.08760(2017).
  21. ^ 인, 펑청, 그레이엄 노빅."범용 코드 생성을 위한 구문 신경 모델." arXiv 프리프린트 arXiv:1704.01696(2017).
  22. ^ a b 링, 왕 등"코드 생성을 위한 대기 예측 네트워크." arXiv 프리프린트 arXiv:1603.06744 (2016).
  23. ^ 이, 스콧 웬타우 등"단계별 쿼리 그래프 생성을 통한 의미 해석: Knowledge Base에 의한 질문 답변」(2015).
  24. ^ 레디, 시바, 미렐라 라파타, 그리고 마크 스티드만."질문-답변 쌍이 없는 대규모 의미 해석"컴퓨터 언어학 협회 2.1(2014): 377-392.
  25. ^ 구우, 켈빈, 존 밀러, 퍼시 량."벡터 공간에서의 지식 그래프 이동." arXiv 프리프린트 arXiv:1506.01094(2015).
  26. ^ 아트지, 요브"Cornell SPF: Cornell 의미 해석 프레임워크." arXiv 프리프린트 arXiv: 1311.3011 (2013).
  27. ^ Wong, Yuk Wah; Mooney, Raymond J. (2006-06-04). Learning for semantic parsing with statistical machine translation. Proceedings of the main conference on Human Language Technology Conference of the North American Chapter of the Association of Computational Linguistics -. Association for Computational Linguistics. pp. 439–446. CiteSeerX 10.1.1.135.7209. doi:10.3115/1220835.1220891.
  28. ^ 왕, 유시, 조나단 베란트, 퍼시 량.'밤사이 의미 분석기 구축' 제53회 컴퓨터언어학협회 연차총회 제7회 자연언어처리 국제공동회의(제1권: 논문).제1권 2015년
  29. ^ Quirk, Chris, Raymond Mooney, Michel Galley."Language to code: if-this-then-the-requipe를 위한 의미파서 학습"제53회 컴퓨터언어학협회 연차총회 및 제7회 자연언어처리에 관한 국제공동회의(제1권: 장문의 논문).제1권 2015년
  30. ^ 오다, 유스케 등"통계 기계 번역을 사용하여 소스 코드에서 의사 코드를 생성하는 방법 학습(t)" 자동 소프트웨어 엔지니어링(ASE), 2015년 제30회 IEEE/ACM 국제회의 개최.IEEE, 2015.
  31. ^ 쿨만, 그레고리 등「자연어 어드바이스를 통해, 강화 학습 강화: 로보컵 축구의 초기 결과"학습적응 시스템의 감독 제어에 관한 AAAI-2004 워크숍.2004.