칼디(소프트웨어)
Kaldi (software)개발자 | 다니엘 포비 등 |
---|---|
안정적 해제 | 개정 3122 / 2013년 10월; 전 |
리포지토리 | https://github.com/kaldi-asr/kaldi |
기록 위치 | C++ |
운영 체제 | Unix 시스템(Linux, BSD, OSX 10.1{8,9} 등), Windows(Cygwin을 통해) |
유형 | 음성인식 |
면허증 | Apache License v.2.0[1] |
웹사이트 | kaldi-asr |
칼디는 음성 인식과 신호 처리를 위해 C++로 작성된 오픈 소스 음성 인식 툴킷으로 아파치 라이선스 v2.0에 따라 자유롭게 사용할 수 있다.null
칼디는 유연하고 확장 가능한 소프트웨어를 제공하는 것을 목표로 하며,[2] 자동 음성 인식(ASR) 연구자들이 인식 시스템을 구축하기 위해 사용하는 것을 목적으로 한다.null
선형 변환, MMI, 증강된 MMI 및 MCE 차별 훈련, 형상 공간 차별 훈련, 심층 신경망을 지원한다.[3]null
Kaldi는 mfcc, fbank, fMLR 등과 같은 기능을 생성할 수 있다.따라서 최근의 심층 신경 네트워크 연구에서는 원시 파형을 단대단 신경 모델을 위해 음향 기능으로 사전 처리하는 것이 Kaldi의 일반적인 사용이다.null
Kaldi는 CHIME 음성 분리 및 인식 챌린지의 일부로서 연속적인 몇 가지 사건에 대해 통합되었다.[4][5][6]이 소프트웨어는 처음에 존스 홉킨스 대학의 2009년 워크숍의 일부로 개발되었다.[7]null
칼디는 커피 식물을 발견했다고 전해진 전설적인 에티오피아 염소 헤르더 칼디의 이름을 따서 이름 지어졌다.[8]null
참고 항목
참조
- ^ "Kaldi: Legal stuff". kaldi-asr.org.
- ^ "Kaldi: About the Kaldi project". kaldi-asr.org.
- ^ "Kaldi: Deep Neural Networks in Kaldi". kaldi-asr.org.
- ^ "The 4th CHiME Speech Separation and Recognition Challenge". Retrieved 15 February 2017.
- ^ "The 3rd CHiME Speech Separation and Recognition Challenge". Retrieved 15 February 2017.
- ^ 에마뉘엘 빈센트, 존 바커, 와타나베 신지, 조나단 르 루, 프란체스코 네스타 등.두 번째 'CHIME' 음성 분리 및 인식 과제:데이터셋, 작업 및 기준선ICASSP - 제38회 음향, 음성 및 신호 처리에 관한 국제 회의 - 2013년 5월, 2013년 5월, 캐나다 밴쿠버. 페이지 126-130, 2013.
- ^ "History of the Kaldi project". Retrieved 26 July 2017.
- ^ "Kaldi: About the Kaldi project".
외부 링크
- 공식 웹사이트
- Kaldi – 공식 GitHub 프로젝트
- Kaldi와 음성 인식으로 시작하는 방법 - 시스템의 여러 부분에 대한 가이드
- 칼디 종이 - 칼디 음성 인식 툴킷
- VOSK – Kaldi 기반 알파 세페이의 오픈 소스 및 상용 모델