커널 고유 음성
Kernel eigenvoice스피커 어댑테이션은 스피커 간 차이로 인한 불일치 시 기능 또는 음성 모델을 미세 조정하기 위한 중요한 기술입니다.지난 10년간 고유음성(EV) 스피커 어댑테이션이 개발되었습니다.또한 스피커 훈련에 대한 사전 지식을 활용하여 빠른 적응 알고리즘을 제공합니다(즉, 적은 양의 적응 데이터만 필요합니다).얼굴 인식의 커널 고유 얼굴 아이디어에서 영감을 얻어 커널 고유 음성(KEV)을 제안한다.[1]KEV는 EV에 대한 비선형 일반화입니다.이는 주성분 분석의 비선형 버전인 커널 주성분 분석을 통합하여 스피커 공간을 더욱 탐색하고 인식 성능을 향상시키기 위해 고차 상관 관계를 포착합니다.
「 」를 참조해 주세요.
레퍼런스
- ^ "Kernel Eigenvoice Thesis" (PDF). Archived from the original (PDF) on 2011-06-10. Retrieved 2009-07-17.
외부 링크
- 커널 고유 음성 스피커 적응, Scientific Commons
- Mak, B.; Ho, S. (2005). "Various Reference Speakers Determination Methods for Embedded Kernel Eigenvoice Speaker Adaptation". IEEE International Conference on Acoustics, Speech, and Signal Processing, 2005. Proceedings. ICASSP '05. Vol. 1. pp. 981–984. doi:10.1109/ICASSP.2005.1415280.
- Mak, B.; Kwok, J. T.; Ho, S. (September 2005). "Kernel Eigenvoice Speaker Adaptation". IEEE Transactions on Speech and Audio Processing. 13 (5): 984–992. doi:10.1109/TSA.2005.851971. ISSN 1063-6676. S2CID 7361772. Retrieved 2017-11-15.
- 임베디드 커널 PCA, ICSLP 2004에 의한 커널 고유 음성 스피커 어댑테이션의 고속화.
- 컴포지트 커널 PCA, NIPS 2003에 의한 스피커 적응.
- Mak, Brian Kan-Wing; Hsiao, Roger Wend-Huu; Ho, Simon Ka-Lung; Kwok, J. T. (July 2006). "Embedded kernel eigenvoice speaker adaptation and its implication to reference speaker weighting". IEEE Transactions on Audio, Speech, and Language Processing. 14 (4): 1267–1280. CiteSeerX 10.1.1.206.4596. doi:10.1109/TSA.2005.860836. S2CID 7527119.