커널 고유 음성

Kernel eigenvoice

스피커 어댑테이션은 스피커 간 차이로 인한 불일치 시 기능 또는 음성 모델을 미세 조정하기 위한 중요한 기술입니다.지난 10년간 고유음성(EV) 스피커 어댑테이션이 개발되었습니다.또한 스피커 훈련에 대한 사전 지식을 활용하여 빠른 적응 알고리즘을 제공합니다(즉, 적은 양의 적응 데이터만 필요합니다).얼굴 인식의 커널 고유 얼굴 아이디어에서 영감을 얻어 커널 고유 음성(KEV)을 제안한다.[1]KEV는 EV에 대한 비선형 일반화입니다.이는 주성분 분석의 비선형 버전인 커널 주성분 분석을 통합하여 스피커 공간을 더욱 탐색하고 인식 성능을 향상시키기 위해 고차 상관 관계를 포착합니다.

「 」를 참조해 주세요.

레퍼런스

  1. ^ "Kernel Eigenvoice Thesis" (PDF). Archived from the original (PDF) on 2011-06-10. Retrieved 2009-07-17.

외부 링크