선택 가능한 모드 보코더

Selectable Mode Vocoder

Selectable Mode Vocoder(SMV)는 CDMA2000 [1]네트워크에서 사용되는 가변 비트레이트 음성 부호화 표준입니다.SMV는, 입력 음성 특성에 근거해 선택되는 복수의 동작 모드를 제공합니다.

와이드밴드 CDMA의 SMV는 풀레이트(8.5kbit/s), 하프레이트(4kbit/s), 쿼터레이트(2kbit/s), 8레이트(800bit/s)[1]의 4개의 코덱을 기반으로 합니다.풀 레이트와 하프 레이트는 복합 Closed-Loop-Open-Loop Analysis(COLL; 폐쇄 루프 오픈 루프 분석)에 근거한 CELP 알고리즘[1] 근거하고 있습니다.SMV에서는 신호 프레임은 처음에 다음과 같이 분류됩니다.

  • 무음/배경 노이즈
  • 비고정 음성
  • 고정 음성 없음
  • 개시
  • 비정상 음성
  • 정지음

이 알고리즘에는 Voice Activity Detection(VAD; 음성 액티비티 검출)과 그 후의 상세한 프레임 분류 방식이 포함됩니다.무음/백그라운드 노이즈 및 정지 상태의 무음 프레임은 스펙트럼 변조 노이즈로 나타나며 1/4 또는 1/8 비율로 부호화됩니다.SMV는 풀 레이트에 4개의 서브프레임을 사용하고 하프 레이트에 2/3개의 서브프레임을 사용합니다.확률적(고정적) 코드북 구조도 정교하고 각각 특정 유형의 음성을 위해 튜닝된 하위 코드북을 사용한다.서브코드북은 펄스 희소도가 다릅니다(여진 등의 노이즈에서는 더 희박합니다).SMV는 클린 스피치로 풀 레이트로 3.6MOS[2] 높은 점수를 획득합니다.

이 코더는 160개의 음성 샘플(20 ms)의 프레임으로 동작하며 노이즈 억제 옵션B 를 사용하는 경우는 80개의 샘플(10 ms)보다 앞서 봐야 합니다.노이즈 억제 옵션A 를 사용하는 경우는, 24 개의 앞을 내다보는 샘플이 필요합니다.따라서 코더의 알고리즘 지연은 노이즈 억제 옵션B 의 경우 30 ms, 노이즈 억제 옵션A 의 경우 33 ms 입니다.

CDMA 음성 코덱의 다음 진화는 VMR-WB입니다.VMR-WB는 같은 네트워크에 적합하면서도 광대역으로 훨씬 높은 음성 품질을 제공합니다.

SMV는 3GPP2 컨테이너 파일 형식인 3G2에서도 사용할 수 있습니다.

레퍼런스

  1. ^ a b c "3GPP2 C.S0030-0 Selectable Mode Vocoder (SMV) Service Option for Wideband Spread Spectrum Communication Systems" (PDF). 3rd Generation Partnership Project 2. 2004. Archived from the original (PDF) on 2011-07-23. Retrieved 2009-05-26.
  2. ^ J. Makinen; P. Ojala; H. Toukomaa. "Performance Comparison of Source Controlled GSM AMR and SMV Vocoders" (PDF). Nokia Research Center, Multimedia Technologies Laboratory. Retrieved 2009-05-26.[영구 데드링크]

외부 링크

  • RFC 3558 - Enhanced Variable Rate Codec(EVRC; 확장 가변 레이트코덱) 및 Selectable Mode Vocoder(SMV; 선택 가능 모드보코더)의 RTP 페이로드 형식