음성 합성 마크업 언어

Speech Synthesis Markup Language

음성합성 마크업 언어(SSML)는 음성합성 응용 프로그램용 XML 기반 마크업 언어입니다.이것은 W3C의 Voice Browser Working Group의 권장 사항입니다.SSML은 대화식 텔레포니시스템을 구동하기 위해 VoiceXML 스크립트에 포함되어 있는 경우가 많습니다.그러나 오디오북 작성 등 단독으로 사용할 수도 있습니다.데스크톱 응용 프로그램의 경우 Apple의 내장 음성 명령 및 Microsoft의 TTS(SAPI Text to Speech) 마크업(XML 언어) 등 다른 마크업 언어가 널리 사용됩니다.또한 Azure Cognitive Services의 Text to Speech API를 통해 또는 Google Assistant 또는 Amazon Alexa를 위한 서드파티 기술을 작성할 때 사운드를 생성하는 데 사용됩니다.

SSML은 Sun Microsystems에 의해 개발된 Java Speech Markup Language(JSML)에 기초하고 있지만, 현재의 권장사항은 대부분 음성 합성 벤더에 의해 개발되었습니다.일부 영역이 지정되지 않은 상태이지만, 사실상 통합의 모든 측면을 망라하고 있기 때문에 각 벤더는 서로 다른 언어의 변형을 받아들입니다.또, 마크업이 없는 경우, 신시사이저는 텍스트의 독자적인 해석을 실시할 것으로 예상된다.

다음으로 SSML 문서의 예를 나타냅니다.

<?xml version="1.0"?> <speak xmlns="http://www.w3.org/2001/10/synthesis" xmlns:dc="http://purl.org/dc/elements/1.1/" version="1.0"> <speak> <dc:syslog xml="en">전화 메뉴: 레벨 1 </dc:lang> </p> <s xml:lang="en-US"> <voice name="David" gender="male" age="25"> 영어의 경우는, 1  누릅니다.</voice> </s> <s xml:lang="es-MX"> <voice name="Miguel" gender="male" age="25"> 파라 에스파놀, oprima el </dos> dos.</voice> </s> </p> </speak>

특징들

SSML은 운율의 적절한 마크업을 지정합니다.이것은 위의 예에서는 알 수 없습니다.여기에는 의 마크업도 포함됩니다.

  • 피치
  • 윤곽선
  • 피치 범위
  • 평가하다
  • 지속
  • 용량

「 」를 참조해 주세요.

레퍼런스

외부 링크