음성 XML
VoiceXMLVoiceXML(VXML)은 사용자와 컴퓨터 간의 대화 미디어 및 음성 대화상자를 지정하기 위한 디지털 문서 표준입니다.이는 은행 시스템 및 자동화된 고객 서비스 포털과 같은 오디오 및 음성 응답 애플리케이션 개발에 사용됩니다.VoiceXML 어플리케이션은 웹 브라우저가 웹 서버로부터 수신한Hypertext Markup Language(HTML; 하이퍼텍스트마크업 언어)를 해석하고 시각적으로 렌더링하는 것과 같은 방법으로 개발 및 전개됩니다.VoiceXML 문서는 음성 브라우저에 의해 해석되며 일반적인 배치 아키텍처에서는 사용자가 Public Switched Telephone Network(PSTN; 공중전화 교환망)를 통해 음성 브라우저와 대화합니다.
VoiceXML 문서 형식은 Extensible Markup Language(XML; 확장 마크업 언어)를 기반으로 합니다.이것은 월드 와이드 웹 컨소시엄(W3C)에 의해 개발된 표준이다.
사용.
VoiceXML 애플리케이션은 많은 산업 및 상업 부문에서 일반적으로 사용됩니다.이러한 애플리케이션에는 주문 문의, 패키지 추적, 운전 길, 긴급 알림, 기상, 비행 추적, 이메일 음성 액세스, 고객 관계 관리, 처방전 보충, 오디오 뉴스 잡지, 음성 다이얼, 부동산 정보 및 전국 전화번호 지원 애플리케이션이 포함됩니다.[citation needed]
VoiceXML에는 음성 브라우저에 음성 합성, 자동 음성 인식, 대화 상자 관리 및 음성 재생을 지시하는 태그가 있습니다.다음으로 VoiceXML 문서의 예를 나타냅니다.
<vxml version="2.0" xmlns="http://www.w3.org/2001/vxml"> <form> <block> </block> Hello world! </vxml> </vxml>
VoiceXML 인터프리터에 의해 해석되면 합성 음성으로 "Hello world"가 출력됩니다.
일반적으로 HTTP는 VoiceXML 페이지를 가져오기 위한 전송 프로토콜로 사용됩니다.정적 VoiceXML 페이지를 사용하는 응용 프로그램도 있고 Tomcat, Weblogic, IIS, WebSphere 등의 응용 프로그램서버를 사용한 동적 VoiceXML 페이지 생성에 의존하는 응용 프로그램도 있습니다.
지금까지 VoiceXML 플랫폼벤더는 다양한 방법으로 표준을 구현하고 독자적인 기능을 추가해 왔습니다.그러나 2004년 3월 16일 W3C 권장사항으로 채택된 VoiceXML 2.0 표준은 대부분의 차이점을 명확히 했습니다.VoiceXML Forum은 이 표준의 사용을 촉진하는 업계 그룹으로서 벤더의 실장이 적합함을 증명하는 적합성 테스트 프로세스를 제공하고 있습니다.
역사
AT&T Corporation, IBM, Lucent 및 Motorola는 음성 대화상자를 지정하기 위한 표준 마크업 언어를 개발하기 위해 1999년 3월에 VoiceXML Forum을 결성했습니다.1999년 9월까지 포럼은 멤버 코멘트를 위해 VoiceXML 0.9를 공개하고 2000년 3월에 VoiceXML 1.0을 공개했습니다.곧이어 포럼은 W3C에 [1]표준의 통제를 넘겼다.W3C는 VoiceXML 2.0의 여러 중간 버전을 제작하여 2004년 [2]3월에 최종 "권장" 단계에 도달했습니다.
VoiceXML 2.1은 2.0 표준 구현으로부터의 피드백을 바탕으로 비교적 작은 기능 세트를 VoiceXML 2.0에 추가하였습니다.VoiceXML 2.0과의 하위 호환성이 있으며 [3]2007년6월에 W3C Recommendation 상태에 도달했습니다.
표준의 미래 버전
VoiceXML 3.0은 새로운 주요 기능을 갖춘 VoiceXML의 다음 메이저릴리즈가 될 거예요여기에는 SCXML이라는 새로운 XML 스테이트차트 기술 언어가 포함되어 있습니다.
관련 기준
W3C의 음성 인터페이스 프레임워크에서는 VoiceXML과 밀접하게 관련된 다른 표준도 정의되어 있습니다.
SRGS 및 SISR
음성인식문법사양서(SRGS)는 음성인식자에게 어떤 문장의 패턴이 들릴지 알려주기 위해 사용됩니다.이러한 패턴을 문법이라고 부릅니다.음성 인식기가 가장 듣기 쉬운 문장을 결정하면 해당 문장에서 의미적 의미를 추출하여 VoiceXML 인터프리터에 반환해야 합니다.이 의미 해석은 음성 인식을 위한 의미 해석(SISR) 표준을 통해 지정된다.SRGS 내에서 SISR은 문법, 즉 음성 인식자에 의해 반환되는 의미 구조를 만드는 ECMAScript 할당의 세트와 관련된 의미 결과를 지정하기 위해 사용됩니다.
SSML
음성 합성 마크업 언어(SSML)는, 텍스트 프롬프트를 합성 음성으로 최적으로 렌더링 하는 방법(예를 들면, 사용하는 음성 신시사이저 음성, 또는 보다 큰 음성, 또는 부드러운 음성)에 관한 정보로 장식하기 위해서 사용됩니다.
제발
발음 Lexicon Specification(PLS)은 단어의 발음 방법을 정의하는 데 사용됩니다.생성된 발음 정보는 음성 브라우징 어플리케이션에서 음성 인식자와 음성 신시사이저에 의해 사용되는 것을 의미합니다.
CCXML
Call Control eXtensible Markup Language(CCXML; 콜제어 eXtensible 마크업 언어)는 보완적인 W3C 표준입니다.CCXML 인터프리터는 일부 VoiceXML 플랫폼에서 발신자와 음성 브라우저 간의 초기 콜셋업을 처리하고 음성 브라우저로의 착신 전송이나 절단 등의 텔레포니서비스를 제공하기 위해 사용됩니다.CCXML은 VoiceXML 이외의 컨텍스트에서도 사용할 수 있습니다.
MSML, MSCML, MediaCTRL
미디어 서버 애플리케이션에서는, 멀티 파티의 회의 등, 복수의 콜 레그가 서로 대화할 필요가 있는 경우가 많습니다.이 어플리케이션의 VoiceXML에서 몇 가지 결함이 발견되었기 때문에 기업은 이 환경에 대처하기 위해 특정 스크립트 언어를 설계했습니다.MSML(Media Server Markup Language)은 Convedia의 솔루션이었고 MSCML(Media Server Control Markup Language)은 Snowshore의 솔루션이었습니다.스노우쇼어는 현재 Dialogic이 소유하고 있으며 Convedia는 Radisys가 소유하고 있다.또, 이러한 언어에는, IVR 기능이 필요한 콜 레그상에서 외부 스크립트(VoiceXML 등)를 실행할 수 있도록, 「훅」도 포함되어 있습니다.
이러한 스크립팅 시스템의 후계자를 위한 IETF 작업 그룹("미디어 제어")이 있었습니다.이 그룹은 개방적이고 널리 채택된 [4]표준으로 진행될 것으로 기대됩니다.Mediactrl 작업 그룹은 [5]2013년에 종료되었습니다.
「 」를 참조해 주세요.
- ECMAScript: VoiceXML에서 사용되는 스크립트 언어
- OpenVXI – 오픈소스 VoiceXML 인터프리터 라이브러리
- SCXML – 상태 차트 XML
레퍼런스
- ^ "Introduction – VoiceXML". Voicexml.org. Retrieved 2017-02-23.
- ^ Schwartz, Ephraim (2004-03-17). "W3C recommends VoiceXML 2.0". InfoWorld. Retrieved 2017-02-23.
- ^ "Voice Extensible Markup Language (VoiceXML) 2.1". W3.org. Retrieved 2017-02-23.
- ^ "Media Server Control (mediactrl)". Archived from the original on 2009-01-30. Retrieved 2009-01-18.
- ^ "Media Server Control (Mediactrl) -".
- ^ "OpenVXI". voip-info.org. 2018-07-31. Retrieved 2019-06-03.
외부 링크
- W3C 음성 브라우저 작업 그룹, 공식 VoiceXML 표준
- VoiceXML 포럼, VoiceXML 상표권자
- Curlie에서의 VoiceXML
- VoiceXML 튜토리얼