대화 시스템

Dialogue system
웹 사이트의 자동 온라인 길잡이 - 대화 시스템이 주요 구성 요소인 예

대화 시스템, 즉 대화 에이전트(CA)는 인간과 대화하기 위한 컴퓨터 시스템이다.대화 시스템은 입력 채널과 출력 채널 모두에서 하나 이상의 텍스트, 음성, 그래픽, 합틱, 제스처 및 기타 모드를 사용하여 통신하였다.

대화 시스템의 요소는 이 아이디어가 연구 중이기 때문에 정의되지 않지만,[citation needed] 그것들은 챗봇과 다르다.[1]일반적인 GUI 마법사는 일종의 대화 상자에 참여하지만, 일반적인 대화 시스템 구성 요소를 거의 포함하지 않으며, 대화 상태는 사소한 것이다.

배경

60년대 초반부터 서면 텍스트 처리에만 기반을 둔 대화 시스템 이후,[2] 1977년 미국의 DARPA 프로젝트에 의해 최초의 말하기 대화 시스템이 발표되었다.[3]이 5개년 프로젝트가 끝난 후, 몇몇 유럽 프로젝트들은 많은 언어들을 말할 수 있는 최초의 대화 시스템을 발행했다.[4]이러한 최초의 시스템은 통신 산업에서 자동화된 의제 및 열차 테이블 서비스와 같은 특정 영역에서 다양한 전화 서비스를 제공하기 위해 사용되었다.

구성 요소들

대화 시스템에 포함되는 요소 집합과 그러한 요소들이 책임을 나누는 방법은 시스템마다 다르다.대화 시스템의 주체는 대화 상자의 상태를 관리하는 구성 요소인 대화 상자 관리자 및 대화 전략이다.대화 시스템의 일반적인 활동 주기는 다음과 같은 단계를 포함한다.[5]

  1. 사용자가 말하고, 시스템 입력 인식자/디코더에 의해 입력은 일반 텍스트로 변환되며, 다음과 같은 내용이 포함될 수 있다.
  2. 본문은 자연어 이해(NLU) 단위로 분석되며, 여기에는 다음이 포함될 수 있다.
  3. 의미적 정보는 대화 관리자의 분석으로 대화 내역과 상태를 유지하고 대화의 전반적인 흐름을 관리한다.
  4. 일반적으로 대화 상자 관리자는 특정 태스크 도메인에 대한 지식이 있는 하나 이상의 태스크 관리자에게 연락한다.
  5. 대화상자 관리자는 출력 발생기를 사용하여 출력을 생성하며, 다음과 같은 항목이 포함될 수 있다.
  6. 마지막으로, 출력 렌더러를 사용하여 출력을 렌더링하며, 여기에는 다음이 포함될 수 있다.

텍스트 전용 인터페이스(예: 텍스트 기반 채팅)에 기반을 둔 대화 시스템에는 2~5단계만 포함된다.

시스템 유형

대화 시스템은 다음과 같은 범주에 속하며, 여기에는 몇 가지 차원을 따라 나열되어 있다.많은 범주가 겹치고 구분이 잘 설정되지 않을 수 있다.

자연 대화 시스템

"자연 대화 시스템은 인간의 행동을 모방함으로써 사용성과 사용자 만족도를 향상시키려 하는 대화 시스템의 한 형태" (Berg, 2014)인간 대 인간 대화(예: 하위 대화 및 주제 변경)의 특징을 다루며, 인간과 기계의 상호작용을 위한 대화 시스템에 통합하는 것을 목표로 한다.시스템이 매우 제한된 어휘만을 이해할 수 있고, 주제 변화에 반응할 수 없으며, 사용자가 대화 흐름에 영향을 줄 수 없기 때문에 종종 (언어) 대화 시스템은 사용자가 시스템에 적응할 것을 요구한다.혼성 이니셔티브는 사용자가 질문에 답변만 하는 대신 대화에 적극적으로 참여할 수 있도록 하는 방법이다.그러나 단순히 혼연일체가 존재하는 것만으로는 자연스러운 대화체제로 분류할 수 없다.그 밖의 중요한 측면은 다음과 같다.[6]

  • 시스템의 적응성
  • 암묵적 확인 지원
  • 검증 질문의 사용
  • 이미 제공된 정보를 수정할 수 있는 가능성
  • 과도한 정보 제공(요청된 정보보다 더 많은 정보 제공)
  • 지지부정
  • 담화 및 아나포라 분석을 통해 참조 이해
  • 단조롭고 반복되는 프롬프트를 방지하기 위한 자연 언어 생성
  • 적응형 및 상황 인식 공식화
  • 사회적 행동(조심, 사용자와 동일한 수준의 격식, 공손함)
  • 음성 인식 및 합성 품질

이러한 측면은 대부분 다양한 연구과제의 문제임에도 불구하고, 이러한 주제를 다루는 대화 시스템의 개발을 지원하는 도구는 부족하다.[7]쌍방향 음성 응답 시스템에 초점을 맞추고 산업 내 많은 음성 대화 시스템(고객 지원 애플리케이션)의 기반이 되는 VoiceXML과 A.L.I.C.E. 챗봇으로 유명한 AIML을 제외하면, 이러한 언어적 특징들 중 대화 행위나 언어 생성과 같은 통합적인 것은 없다.따라서 NADIA(연구 프로토타입)는 그 공백을 어떻게 메울 것인가에 대한 아이디어를 주고 앞에서 언급한 자연어 생성, 적응형 공식화, 하위 대화와 같은 몇 가지 측면을 결합시킨다.

퍼포먼스

일부 저자들은 문장의 모델(이 조치를 개념문장[8] 정확성 또는 문장[4] 이해라고 한다)을 비교함으로써 문장의 비율이 완전히 옳다는 관점에서 대화 시스템의 성과를 측정한다.

적용들

대화 시스템은 기업, 교육, 정부, 의료 및 엔터테인먼트에서 광범위한 애플리케이션을 지원할 수 있다.[9]예를 들면 다음과 같다.

  • 회사 웹 사이트 또는 인트라넷 포털을 통해 제품 및 서비스에 대한 고객의 질문에 응답
  • 고객 서비스 에이전트 기술 자료:에이전트가 고객의 질문을 입력하고 응답으로 안내할 수 있도록 허용
  • 안내 판매:특히 초보 고객에게 판매되는 복잡한 제품에 대해 판매 과정에서 답변과 안내를 제공하여 거래 촉진
  • 헬프 데스크: 내부 직원 질문에 응답(예: 인사 질문에 응답)
  • 웹 사이트 탐색:고객에게 복잡한 웹 사이트의 관련 부분을 안내 - 웹 사이트 컨시어지
  • 기술 지원: 제품 또는 장치의 문제 진단과 같은 기술 문제에 대한 대응
  • 개인화된 서비스:대화 에이전트는 내부 및 외부 데이터베이스를 활용하여 계정 잔액에 대한 질문 답변, 포트폴리오 정보 제공, 빈번한 전달 또는 구성원 정보 제공과 같은 상호 작용을 개인화할 수 있다.
  • 교육 또는 교육:사용자가 학습하는 동안 문제 해결 조언을 제공할 수 있다.
  • 콜센터의 인적 작업량을 줄이기 위해 간단한 대화 시스템이 널리 사용된다.이것과 다른 산업 전화 애플리케이션에서, 대화 시스템에 의해 제공되는 기능성은 대화형 음성 응답 또는 IVR이라고 알려져 있다.
  • 데이터 조작 및 분석 작업(예: 유전체학)에서 과학자를 지원하십시오.[10]

회화 에이전트가 인공 문자를 이용해 사용자와 상호작용할 수 있는 경우도 있다.이 에이전트들을 구체화된 에이전트라고 부른다.

툴킷 및 아키텍처

대화 시스템을 정의하기 위한 현재 프레임워크, 언어 및 기술에 대한 조사.

이름 & 링크 시스템 유형 설명 소속[s] 환경[s] 평.
아이밀 채터봇어 자연 언어 소프트웨어 에이전트를 만들기 위한 XML 언어 리처드 월리스, 판도라봇, 주식회사
챗스크립트 채터봇어 자연 언어 소프트웨어 에이전트를 만드는 언어/엔진 브루스 윌콕스
CSLU 툴킷
주 기반 음성 인터페이스 프로토타이핑 환경 OGI 이공계 대학
M. 맥테어
론 콜
출판물은 1999년에 출판되었다.
NLUI 서버 도메인 독립형 툴킷 자연어 사용자 인터페이스 시스템 구축을 위한 완전한 다국어 프레임워크 링구아시스 혼합 대화 상자의 즉시 사용 가능 지원
올림푸스 구어 대화 시스템 구현을 위한 완전한 틀 카네기 멜론 대학교 [1]
넥스트노바 멀티모달 플랫폼 멀티모달 소프트웨어 응용 프로그램 개발을 위한 플랫폼.상태 차트 XML(SCXML) 기반 폰비아 테크놀로지, 주식회사
VXML
음성XML
구어 대화 상자 다중 모드 대화 상자 표시 언어 AT&T가 초기에 개발한 후 산업 컨소시엄에 의해 관리되고 최종적으로 W3C 명세서가 작성된다. 주로 전화용이다.
소금 마크업 언어 다중 모드 대화 상자 표시 언어 마이크로소프트 "표준 프로세스에서 VoiceXML의 성숙도에 도달하지 못했다."
Quack.com - QXML 개발 환경 AOL이 사들인 회사
오픈다이얼 도메인 독립형 툴킷 자바에서 구현된 음성 대화 시스템을 위한 혼합 심볼/통계학적 프레임워크 오슬로 대학교
나디아 대화 상자 엔진 및 대화 상자 모델링 자연 대화/대화 시스템 생성대화 행위, 혼합 이니셔티브, NLG. 자바에서 구현. 마르쿠스 M. 버그 XML 기반 대화 파일 생성, 그래머를 지정할 필요 없음, 출판물은 2014년부터 제공됨

참고 항목

참조

  1. ^ 클뤼워, 티나"챗봇에서 대화 시스템으로."대화 에이전트 및 자연 언어 상호 작용:기법 및 유효 관행.IGI Global, 2011. 1-22.
  2. ^ McTear, Michael, Zoraida Callejas 및 David Griol, 대화 인터페이스: 스프링거, 2016년 스마트 기기대화 중.
  3. ^ Giancarlo Pirani (edd), 음성 이해위한 고급 알고리즘아키텍처, Vol. 1. Springer Science & Business Media, 2013.
  4. ^ a b Alberto Ciaramella, 시제품 성능 평가 보고서, Sundial 작업 패키지 8000 (1993).
  5. ^ Juarafsky & Martin (2009년), 음성 및 언어 처리.Pearson International Edition, ISBN978-0-13-504196-3, 24장
  6. ^ a b Berg, Markus M. (2014), Modelling of Natural Dialogues in the Context of Speech-based Information and Control Systems, Akademische Verlagsgesellschaft AKA, ISBN 978-3-89838-508-4
  7. ^ Berg, Markus M. (2015), "NADIA: A Simplified Approach Towards the Development of Natural Dialogue Systems", Natural Language Processing and Information Systems, Lecture Notes in Computer Science, vol. 9103, pp. 144–150, doi:10.1007/978-3-319-19581-0_12, ISBN 978-3-319-19580-3
  8. ^ 방갈로르, 스리니바스, 그리고 마이클 존스턴."다중 모드 인터페이스에서 강력한 이해"컴퓨터 언어학 35.3 (2009): 345-397.
  9. ^ Lester, J.; Branting, K.; Mott, B. (2004), "Conversational Agents" (PDF), The Practical Handbook of Internet Computing, Chapman & Hall
  10. ^ Crovari; Pidò; Pinoli; Bernasconi; Canakoglu; Garzotto; Ceri (2021), "GeCoAgent: a conversational agent for empowering genomic data extraction and analysis", ACM Transactions on Computing for Healthcare (HEALTH), ACM New York, NY, doi:10.1145/3464383

추가 읽기