지각 음성 품질 측정

Perceptual Speech Quality Measure

지각 음성 품질 측정(PSQM)은 음성 대역(300~3400Hz) 음성 코덱의 음성 품질을 객관적으로 평가하고 정량화하는 권고 ITU-T P.861에 정의된 연산 및 모델링 알고리즘이다. 코덱은 음성 입력 수준, 토크 사용자, 비트 전송률 및 트랜스코딩이 다른 음성 코덱의 성능을 평가하기 위해 사용될 수 있다. P.861은 철회되었고 향상된 음성 평가 알고리즘을 포함하는 권고 ITU-T P.862(PESQ)로 대체되었다.

사용하는 이유

PSQM 표준을 사용하면 자동화된 시뮬레이션 기반 시험 방법론이 음성 명확성과 전송 음성 품질을 객관적으로 평가할 수 있다. 이 테스트를 용이하게 하기 위해 다양한 소프트웨어 및/또는 하드웨어 제품이 개발되었다. 이것은 많은 수의 사람들을 이용하여 주관적으로 음성 신호를 평가하고 음질을 평가하는 전통적인 관행에 비해 비용과 시간이 상당히 절약되는 결과를 낳는다. 더욱이 신뢰할 수 있고 재현 가능한 객관적인 결과를 산출한다. 이것은 높은 서비스 품질 표준을 유지하도록 의무화된 전화 통신 제공자들에게 매우 중요하다.

알고리즘.

PSQM은 정신 음향 수학 모델링(지각 및 인지 모두) 알고리즘을 사용하여 전송 전/후 음성 신호를 분석하여 신호 품질 저하를 측정하는 PSQM 값을 제공하고 0(저하 없음) ~ 6.5(최상하 저하) 범위의 PSQM 값을 제공한다. 또한, 이 결과는 평균 의견 점수(MOS)로 번역될 수 있는데, 이는 1에서 5까지의 숫자 척도로 수신 매체의 인식 품질을 측정하는 것으로 받아들여진다. 값이 1이면 받아들일 수 없고 품질이 낮은 음성을 나타내며, 값이 5이면 감지할 수 있는 문제가 없는 높은 음성을 나타낸다.

PSQM 알고리즘은 시간 주파수 매핑, 주파수 뒤틀림 및 강도 뒤틀림과 같은 일련의 비선형 프로세스를 통해 물리적 영역 신호를 지각적으로 의미 있는 정신음향 영역으로 변환한다.

코드화된 언어의 질은 내부 표현의 차이를 기준으로 판단된다. 이 차이는 소음 교란을 시간과 주파수의 함수로 계산하는 데 사용된다. PSQM 알고리즘은 지각 모델링 외에도 주관적 측정과 객관적 측정 사이의 높은 상관관계를 얻기 위해 음량 스케일링과 비대칭 마스킹과 같은 인지적 모델링을 사용한다.

제한 사항

PSQM은 원래 구상된 바와 같이 IP 애플리케이션, 패킷 손실, 지연 분산(지터) 또는 비순차 패킷과 같은 항목에서 공통적으로 발생하는 네트워크 QoS 동요를 설명하기 위해 개발되지 않았다. 이러한 조건들은 대개 과도한 네트워크 부하 시뮬레이션에서 부적절한 결과를 제공하며, 음성 품질의 매우 실제적인 손실을 설명하지 못한다. 상당한 패킷 손실을 도입하여 네트워크 결함 조건을 복제하려고 하면 PSQM 값이 잘못 부풀려진 MOS 값에 해당하게 된다.

이러한 한계를 극복하기 위해 PSQM+는 원래 알고리즘을 수정하여 개발하였다. PSQM+는 현실적인 네트워크 부하 조건에서 음성 코덱의 불리한 성능을 더 정확하게 반영하는 것처럼 보이는 결과를 생성한다.

기타 고려사항

다른 문제들은 다양한 음성 코덱을 평가하는 데 사용되는 시험 신호의 표준화 부족을 포함한다. PSQM은 객관적이고 주관적인 품질 평가(ITU-T P.800/P.830/P.861)를 위해 ITU 권장 방법에 따라 사용할 경우 보다 신뢰할 수 있고 일관된 MOS 값을 제공한다. 이러한 ITU-T 권장사항에는 평균 -20dB[clarification needed] 수준의 남성과 여성 성(性) 음성 기준 신호를 모두 사용하는 것이 포함된다. 음성 또는 신호의 유형, 성별, 지속시간, 이득은 모두 PSQM 값 또는 MOS 점수에 약간의 영향을 미칠 수 있으며, 임계값 레벨, 통화 수 및 환경의 기타 구성 설정에도 영향을 미칠 수 있다. 음성 품질 측정을 비교할 때 신호, 환경 및 구성을 모두 고려해야 한다.

많은 음성 코덱이 존재하며 매우 다양한 어플리케이션에서 사용된다. 시스템 요구 사항에 맞도록 적절한 음성 코덱을 신중하게 선택해야 한다. 다양한 네트워크 부하 조건에서 얻은 공통 음성 코덱 및 관련 PSQM/PSQM+ 파생 MOS 값 목록을 사용할 수 있다.

참조

참고 항목