MBROLA
MBROLA원저작자 | 티에리 뒤토이 |
---|---|
개발자 | 빈센트 파겔 |
초기 릴리즈 | 전 |
안정된 릴리스 | 3.3 / 2019년 12월 , 전( |
저장소 | github |
기입처 | C |
운영 체제 | 리눅스 창문들 FreeBSD |
유형 | 음성 신시사이저 |
면허증. | GNU Affero General Public License |
웹 사이트 | github |
MBROLA는 세계적인 협업 프로젝트로서 음성 합성 소프트웨어입니다.MBROLA 프로젝트 웹 페이지는 많은 구어용 다이폰[1] 데이터베이스를 제공합니다.
MBROLA 소프트웨어는 이러한 모든 언어를 위한 완전한 음성 합성 시스템은 아닙니다. 텍스트는 먼저 MBROLA 형식의 음소와 운율 정보로 변환되어야 하며 별도의 소프트웨어(예: eSpeak)로 변환되어야 합니다.NG)가 필요합니다.
역사
MBROLA 프로젝트는 가능한 한 많은 언어에 대응하는 음성 합성기 세트를 얻기 위한 과학적 프로젝트로 1995년 프랑스 몽스(Belgium)의 TCTS 연구소에서 시작되었습니다.MBROLA 소프트웨어의 첫 번째 릴리스는 1996년이었고 비상업적, 비군사적 응용 프로그램용 프리웨어로 제공되었습니다.작성된 음성 데이터베이스의 라이선스는 다르지만 대부분 비상업용 및 비군사용입니다.
MBROLA는 비상업 애플리케이션에서만 무료로 사용되기 때문에 Linux 워크스테이션에서 사실상의 음성 합성 엔진인 eSpeakNG를 개인/가정 사용자를 위한 대안으로 사용되었지만, 대부분 상용 솔루션(스피킹 타임 클럭, 포트 및 단말기의 보드 알림 등)에는 사용되지 않았습니다.음성 데이터베이스 업데이트의 초기 개발 및 MBROLA 소프트웨어의 지원이 중단되고 클로즈드 소스 바이너리가 점차 최신 하드웨어 및 운영 [2]체제의 개발에서 뒤쳐졌습니다.이 MBROLA 개발팀은 MBROLA를 오픈소스 소프트웨어로 출시하기로 결정하였으며, 2018년 10월 24일 GNU Affero General Public License와 함께 GitHub에서 소스 코드를 공개하였습니다.2019년 1월 23일, 동일한 라이선스로 WAV 파일에서 MBROLATOR이라는 데이터베이스를 생성할 수 있는 툴이 출시되었습니다.
중고 테크놀로지
MBROLA 소프트웨어는 음성 생성에 MBROLA(Multi-Band Resynthitation OverLap Add)[3] 알고리즘을 사용합니다.MBROLA 합성의 품질은 다이폰 기반이지만 일정한 피치를 갖는 다이폰과 연결성을 향상시키고 세그먼트 품질만 약간 저하시키는 고조파 위상을 전처리하기 때문에 대부분의 다이폰 합성기보다 높은 것으로 간주된다.
MBROLA는 PSOLA와 유사한 시간 영역 알고리즘으로, 합성 시 계산 부하가 매우 낮음을 의미합니다.그러나 PSOLA와 달리 MBROLA는 피치 기간의 사전 표시를 요구하지 않습니다.이 기능을 통해 MBROLA 알고리즘을 중심으로 MBROLA 프로젝트를 개발할 수 있게 되었습니다.이 알고리즘을 통해 전 세계의 많은 음성 연구실, 기업 또는 개인은 다양한 언어와 음성을 위한 다이폰 데이터베이스를 제공하고 있습니다.
레퍼런스
- ^ MBROLA의 목소리 목록
- ^ Mbrola-64가 SEGFAULT와 함께 즉시 크래시한다.
- ^ Dutoit, T; Leich, H (Dec 1993). "MBR-PSOLA: Text-To-Speech synthesis based on an MBE re-synthesis of the segments database". Speech Communication. 13 (3–4): 435–440. doi:10.1016/0167-6393(93)90042-J.