CereProc

CereProc
CereProc
CereProcLogo 2.png
개발자CereProc Ltd, 영국
초기 릴리즈2005년, 17년 전(2005년)
안정된 릴리스
2013년 7월, 9년 전(2013-07)
기입처C/Python
운영 체제크로스 플랫폼
이용가능기간:영어, 독일어, 프랑스어, 스페인어, 이탈리아어, 네덜란드어, 카탈로니아어, 루마니아어, 일본어, 포르투갈어, 스코틀랜드 게일어, 스웨덴어, 폴란드어, 아일랜드어, 덴마크어, 노르웨이어
유형텍스트/스피치
라이선스상업의
웹 사이트www.cereproc.com

CereProc(/ssrəprkk/SERR-prok)는 2005년에 설립된 스코틀랜드 에든버러에 본사를 둔 음성 합성 회사입니다.이 회사는 자연스럽고 표현력이 풍부한 텍스트/스피치 음성 제작, 지역 억양 음성 합성 및 음성 복제를 전문으로 하고 있습니다.

보이스 빌딩 테크놀로지

CereProc는 유닛 선택 합성 및 파라메트릭 모델링이라는 두 가지 다른 음성 생성 기술을 사용하여 음성을 생성합니다.

CereProc의 유닛 선택 음성은 녹음된 음성의 대규모 데이터베이스에서 구축됩니다.데이터베이스 작성 중 녹음된 각 발성은 개개의 전화기, 음절, 형태소, 단어, 문장의 일부 또는 모두로 분할됩니다.세그먼트 분할은 특별히 수정된 음성 인식기를 [1]사용하여 이루어집니다.다음으로 기본 주파수(피치), 지속시간, 음절 내 위치 및 인접 전화기 등의 세그먼트화 및 음향 파라미터에 기초하여 음성 데이터베이스 내의 유닛 인덱스가 작성된다.런타임에 원하는 타깃 발성은 데이터베이스로부터 후보 유닛의 최적 체인을 결정함으로써 작성된다(유닛 선택).유닛 선택은 녹음된 음성에 Digital Signal Processing(DSP; 디지털 신호 처리)을 연결 포인트에서만 적용하기 때문에 가장 자연스러움을 제공합니다.DSP는 녹음된 음성을 자연스럽게 하지 않는 경우가 많습니다.

CereProc의 파라메트릭 음성은 통계 모델링 방법론을 기반으로 음성 합성을 생성한다.이 시스템에서는, 발화의 주파수 스펙트럼(보컬로), 기본 주파수(보컬 소스) 및 지속 시간(프로소디)을 동시에 모델링 한다.음성 파형은 이러한 파라미터에서 보코더를 사용하여 생성됩니다.중요한 것은 이러한 음성은 유닛 선택 음성보다 녹음된 음성이 현저하게 적기 때문에 설치 시 설치 면적이 훨씬 작기 때문에 개인 음성 [2]복제에 사용됩니다.

음성 및 언어

CereProc는 58개의 일반적인 음성을 가지고 있으며, 16개의 언어를 구사하며 다양한 지역 억양을 구사합니다.

  • 미국 영어: 이사벨라, 캐서린, 한나, 메간, 아담, 네이선, 앤디(아들 목소리), 조던(아들 목소리), 캐롤린
  • 영국 영어: 사라, 윌리엄, 잭, 로렌, 자일즈, 에이미
  • 북부 영어: Jess
  • 스코틀랜드 영어:헤더, 커스티, 스튜어트, 앤드류(아성), 마이리(아성)
  • 글래스고 영어: 도도
  • 랭커셔 영어: Claire
  • 아일랜드 영어: 케이틀린
  • West Midlands 영어:고소하다
  • 특수 FX 음성:악마, 유령, 고블린, 픽시, 로봇
  • 메트로폴리탄 프랑스어: 수잔, 로랑
  • 캐나다 프랑스어: 플로렌스
  • 카탈로니아어: Rita
  • 카스티안 스페인어: Sara
  • 라틴 아메리카 스페인어: Ana
  • 이탈리아어 : 로라, 다리오, 프란체스코(아성), 니코레타(아성)
  • 아일랜드어: Peig
  • 네덜란드어: Ada
  • 독일어: Gudrun, Alex
  • 오스트리아 독일어:레오폴드
  • 포르투갈어:루시아
  • 브라질 포르투갈어: 가브리엘
  • 일본어:유키
  • 스코틀랜드 게일어:케이티드
  • 스웨덴어: Ylva
  • 폴란드어: Pola
  • 루마니아어: Daria
  • 프랑스어 악센트 영어: 니콜
  • 러시아어:에브라
  • 중국어: 메일린
  • 덴마크어: 마리
  • 노르웨이어(보크몰): Clara
  • 노르웨이어(Nynorsk):훌다

게다가, 그 회사는 일반 대중이 일반적으로 들을 수 없는 많은 유명인들의 목소리를 개발했다.여기에는 조지 W 부시, 버락 오바마, 아놀드 슈워제네거[3]포함된다.

음성 클로닝

2009년 영화평론가 로저 에버트는 세레프록의 목소리를 합성한 버전을 만들기 위해 고용했다.에버트는 갑상선암 치료 수술 후 언어 능력을 상실했다.CereProc는 Ebert의 목소리를 담은 테이프와 DVD 해설을 발굴하여 자신의 [4]목소리처럼 들리는 텍스트 투 스피치 음성을 만들어냈다.로저 에버트는 2010년 3월 2일 오프라 윈프리출연에서 이 목소리를 사용했다.

NFL의 스티브 글리슨MND 진단을 받은 후 세레프록에 의해 그의 목소리를 복제했다. 글리슨은 마이크로소프트의 슈퍼볼 XLVII 광고의 합성 목소리를 사용하여 기술의 힘을 칭찬했다.

세레프록 음성 복제 기술은 현재 영국에서 MND를 가진 사람들이 언어 능력을 잃기 전에 합성 음성을 만들기 위해 사용되고 있다.이 과정은 2011년 [5]8월에 방송된 BBC 라디오 4 다큐멘터리 "비평가의 목소리를 돌려줘"에 소개되었습니다.

시스템 호환성

CereProc 음성은 다른 운영 체제 및 다른 유형의 장치에 배치할 수 있습니다.CereProc 데스크톱 음성은 Microsoft Windows 및 Apple Mac OS X와 호환됩니다.시스템 음성으로 설치되며 다른 음성 지원 응용 프로그램에서 사용할 수 있습니다.주로 기업 IVR 시장을 겨냥한 CereProc의 클라이언트/서버 시스템 cServer는 Windows 및 Linux에서 실행할 수 있습니다.세레프록 모바일 음성은 안드로이드와 애플 iOS에 탑재할 수 있다.SDK는 Android, Linux, MacOS, iOS 및 Windows에서 사용할 수 있습니다.SDK에는 C/C++, C#, Java 및 Python의 바인딩이 있습니다.

「 」를 참조해 주세요.

레퍼런스

  1. ^ Alan W. Black, 모든 사람들에게 항상 완벽한 합성입니다. IEEE TTS 워크숍 2002.
  2. ^ "Cerevoice Me".
  3. ^ "CereProc Voices".
  4. ^ Roger Ebert: 에센셜 맨 "에스콰이어", 2010년 2월 16일접속일 : 2011년9월 21일
  5. ^ '평론가 목소리 돌려주기'BBC 라디오 스코틀랜드 프로그램.2011년 10월 26일 취득.

외부 링크