μ-법칙 알고리즘

μ-law algorithm


μ-law 알고리즘과 A-law 알고리즘의 합성

μ-law 알고리즘(mu-law로 표기되기도 하고, 종종 u-law로 근사하기도 함)은 주로 북미일본8비트 PCM 디지털 통신 시스템에서 사용되는 컴판딩 알고리즘입니다.ITU-T의 G.711 규격의 2가지 버전 중 하나이며, 다른 버전은 유사한 A-law입니다.A-law는 유럽 등 E-1 회로에서 디지털 통신 신호가 전달되는 지역에서 사용됩니다.

압축 알고리즘은 오디오 신호의 동적 범위를 줄입니다.아날로그 시스템에서는, 이것에 의해서 송신중에 달성되는 신호잡음비(SNR)가 증가해, 디지털 도메인에서는 양자화 에러를 저감 할 수 있습니다(그 결과 신호 대 양자화 대 잡음비가 증가합니다).이러한 SNR의 증가는 동등한 SNR의 대역폭 감소와 교환할 수 있습니다.

알고리즘 타입

μ-law 알고리즘은 아날로그 형식과 양자화된 디지털 형식으로 설명할 수 있습니다.

계속되는

μ-법칙 함수
역μ-법칙 함수

특정 입력 x에 대해 μ-law 부호화의 방정식은 다음과 같습니다.[1]

여기서 μ = 255(북미 및 일본 표준), sgn(x)부호 함수이다.이 함수의 범위는 -1 ~ 1입니다.


μ-법칙 확장은 역방정식으로 [1]주어진다.

디스크리트

개별 형식은 ITU-T 권고 G.711[2]정의되어 있습니다.

G.711은 범위의 한계(예를 들어 +31 코드가 0xEF인지 0xF0인지)[citation needed]에서 값을 코드화하는 방법에 대해 불명확하다.다만, G.191은, μ-law [3]인코더용의 C언어의 샘플 코드를 제공하고 있습니다.예를 들어 +30 ~ +1에 해당하는 음의 범위는 -31 ~ -2입니다.이는 부호화 중에 음의 값을 양의 값으로 변환하기 위해 2의 보가 아닌 1의 보(단순 비트 반전)를 사용함으로써 설명됩니다.

양자화 μ-법칙 알고리즘
14비트 바이너리 선형 입력 8비트 압축 코드
+8158 ~ +4063 (256 의 16 인터벌) 0x80 + 인터벌 번호
+4062 ~ +2015 (16회/128회) 0x90 + 인터벌 번호
+2014~+991(64개 간격 중 16개 간격) 0xA0 + 인터벌 번호
+990 ~ +479 (16 인터벌/32) 0xB0 + 인터벌 번호
+478 ~ +223 (16 인터벌/16 인터벌) 0xC0 + 인터벌 번호
+222 ~ +95 (16 인터벌/8) 0xD0 + 인터벌 번호
+94 ~ +31 (16 인터벌/4) 0xE0 + 인터벌 번호
+30 ~ +1 (15 간격/2 ) 0xF0 + 인터벌 번호
0 0xFF
−1 0x7F
-31 ~ -2 (15 간격/2 ) 0x70 + 인터벌 번호
-95 ~ -32 (16 인터벌/4) 0x60 + 인터벌 번호
-223 ~ -96 (16 인터벌/8) 0x50 + 인터벌 번호
-479 ~ -224 (16 인터벌/16 인터벌) 0x40 + 인터벌 번호
-991 ~ -126 (16 인터벌/32) 0x30 + 인터벌 번호
-2015~-992(64개 간격 중 16개 간격) 0x20 + 인터벌 번호
-4063 ~ -2016 (16 인터벌/128) 0x10 + 인터벌 번호
-8159 ~ -4064 (256 의 16 인터벌) 0x00 + 인터벌 번호

실행

μ-law 알고리즘은 여러 가지 방법으로 구현할 수 있습니다.

아날로그
비선형 이득이 있는 증폭기를 사용하여 아날로그 도메인 전체를 압축할 수 있습니다.
비선형 ADC
μ-law 알고리즘과 일치하도록 간격이 일정하지 않은 양자화 수준을 가진 아날로그-디지털 변환기를 사용합니다.
디지털.
μ-law 알고리즘의 양자화된 디지털 버전을 사용하여 디지털 도메인에 있는 데이터를 변환합니다.
소프트웨어/DSP
μ-law 알고리즘의 연속 버전을 사용하여 컴파일된 값을 계산합니다.

사용상의 정당성

음성에는 다이나믹 범위가 넓기 때문에 μ-law 부호화가 사용됩니다.아날로그 신호 전송에서는 백그라운드 노이즈가 비교적 일정할 경우 미세한 디테일이 손실됩니다.세부 정밀도가 어차피 손상되고 신호가 사람에 의해 오디오로 인식된다고 가정할 때, 인식된 음향 강도 수준 또는 음량이 로그라는 사실을 로그 응답 연산 증폭기(Weber-Fechner 법칙)를 사용하여 신호를 압축함으로써 이용할 수 있다.통신회로에서는 대부분의 노이즈가 회선에 주입되기 때문에 압축기 후에는 의도된 신호가 비압축 소스에 비해 정적보다 상당히 큰 것으로 인식됩니다.이것은 일반적인 솔루션이 되었고, 따라서 일반적인 디지털 사용에 앞서 상호 운용 가능한 표준을 정의하기 위해 μ-law 규격이 개발되었습니다.

디지털 시스템에서 이 기존 알고리즘은 인식 가능한 인간의 음성을 인코딩하는 데 필요한 비트 수를 크게 줄이는 효과가 있었습니다.μ-law를 사용하여 샘플은 8비트 단위로 효과적으로 인코딩할 수 있습니다. 샘플 크기는 대부분의 표준 컴퓨터의 기호 크기와 편리하게 일치합니다.

μ-law 부호화는 신호의 다이내믹 레인지를 효과적으로 감소시켜 부호화 효율을 높이고 신호 대 왜곡 비율을 특정 비트 수의 선형 부호화에 의해 얻어진 것보다 크게 하는 방식으로 신호를 바이싱합니다.

인터넷에서 일반적으로 사용 가능한 Sun Microsystems C 언어 루틴 g711.c에서 생성된 μ-law 디코딩.

μ-law 알고리즘은 적어도 Sun Microsystems에 의해 SPARCstation 1로 거슬러 올라가는 .au 형식으로도 사용됩니다.이는 Unix 시스템에서 사운드의 사실상의 표준으로 널리 사용되는 /dev/audio 인터페이스에서 사용되는 네이티브 방식입니다.au 형식은 태양 아래 클래스 등 다양한 일반적인 오디오 API에서도 사용됩니다.Java 1.1 및 일부 C# 메서드의 오디오 Java 패키지.

이 그림은 μ-법칙이 더 작은(더 작은) 값에 표본을 집중시키는 방법을 보여 줍니다.수평축은 0-255 바이트 값을 나타내며 수직축은 μ-law 인코딩의 16비트 선형 디코딩 값입니다.

A-law와의 비교

μ-law 알고리즘은 A-law보다 약간 더 큰 동적 범위를 제공하지만 작은 신호의 경우 더 심한 비례 왜곡을 초래합니다.관례상 A-law는 적어도 한 국가가 사용하는 경우 국제 연결에 사용됩니다.

「 」를 참조해 주세요.

레퍼런스

  1. ^ a b "Waveform Coding Techniques - Cisco". 2006-02-02. Retrieved 2020-12-07.
  2. ^ "ITU-T Recommendation G.711".
  3. ^ G.191: 음성 및 오디오 코딩 표준화를 위한 소프트웨어 도구

Public Domain이 문서에는 General Services Administration 문서퍼블릭도메인 자료가 포함되어 있습니다.

외부 링크