조인트 인코딩

Joint encoding

오디오 엔지니어링에서, 공동 인코딩은 더 높은 품질, 더 작은 파일 크기 또는 둘 모두를 얻기 위해 인코딩하는 동안 유사한 정보를 가진 여러 채널의 결합을 말한다.

조인트 스테레오

인터넷이 비교적 낮은 비트 전송률, 적당한 인터넷 접속 속도로 허용 가능한 음질의 오디오의 전송을 허용함에 따라 공동 스테레오라는 용어가 두드러지게 되었다.조인트 스테레오는 이 목적을 위해 사용되는 수많은 인코딩 기법을 말한다.여기에는 두 가지 형태가 설명되는데, 두 형태 모두 MP3, AAC, Ogg Vorbis와 같이 서로 다른 코덱으로 다양하게 구현된다.

인텐시티 스테레오 부호화

이 형태의 조인트 스테레오는 음향 국산화 원리에 따라 기능하는 조인트 주파수 인코딩이라는 기술을 사용한다.인간의 청력은 주로 특정 오디오 주파수의 방향을 인지하는데 덜 예민하다.이 특성을 이용하여 강도 스테레오 코딩은 명백한 품질의 변화가 거의 없거나 전혀 인식되지 않는 오디오 스트림의 데이터 속도를 감소시킬 수 있다.

구체적으로는 인간에 의한 음의 국산화(sound localization)에 대한 경락간 시간차(ITD)의 우위는 낮은 주파수에 대해서만 존재한다.이는 높은 주파수에 대한 지배적 위치 표시기로서 경락간 진폭 차이(IAD)를 남긴다.강도 스테레오 코딩의 아이디어는 낮은 주파수를 하나의 채널로 병합하는 것이다(즉, 채널 간 전반적인 차이를 줄임) IAD 단위를 복구하기 위해 특정 주파수 영역을 이동시키는 방법에 대한 약간의 측면 정보를 전송하는 것이다.

이러한 유형의 코딩은 스테레오 이미지를 단순화하고 감지할 수 있는 압축 아티팩트를 생산할 수 있는 정보의 손실 때문에 원래의 오디오를 완벽하게 재구성하지 못한다.그러나, 매우 낮은 비트 전송률의 경우, 이러한 유형의 코딩은 일반적으로 오디오의 인식된 품질에서 이득을 얻는다.많은 오디오 압축 형식(MP3, AAC, VorbisOpus 포함)으로 지원되지만 모든 인코더가 항상 지원하는 것은 아니다.

M/S 스테레오 부호화

M/S 스테레오 코딩은 좌우 채널을 중간 채널과 사이드 채널로 변환한다. 채널은 좌우 채널의 합계 또는 M= L+ } 입니다사이드 채널은 좌우 채널의 차이, 즉 = - R M/S 코딩은 인텐시티 스테레오 코딩과 달리 변환 코딩의 특수한 경우로, 아티팩트를 도입하지 않고 오디오를 완벽하게 보존한다.FLACMonkey's Audio와 같은 무손실 코덱은 이러한 특성 때문에 M/S 스테레오 코딩을 사용한다.

원래 신호를 재구성하기 위해 채널이 = + L 또는 된 R= - 를 추가한다.

이러한 형태의 코딩은 매트릭스 스테레오로도 알려져 있으며, 다양한 형태의 오디오 처리 및 녹음 장비에 사용된다.디지털 시스템에 국한되지 않고 수동형 오디오 변압기나 아날로그 증폭기로도 만들 수 있다.M/ 스테레오 사용의 한 예는 FM 스테레오 방송으로, 여기서 + R 반송파변조하고 - R 은(는) 서브캐리어를 변조한다.이것은 중간 채널만 필요로 하는 모노 장비와의 역호환성을 가능하게 한다.M/S 스테레오의 또 다른 예는 입체 마이크로그로브 음반이다.스타일러스의 측면 운동은 두 채널의 합을 나타내고 수직 운동은 채널 간의 차이를 나타낸다.

조인트 주파수 인코딩

공동 주파수 인코딩은 데이터 속도를 줄이기 위해 오디오 데이터 압축에 사용되는 인코딩 기법이다.

아이디어는 여러 사운드 채널의 주어진 주파수 범위를 병합하여 결과 인코딩이 개별 채널의 묶음이 아닌 하나의 동종 데이터 스트림으로서 해당 범위의 소리 정보를 보존하도록 하는 것이다.이렇게 하면 정보가 정확하게 재구성될 수 없기 때문에 원래의 채널 분리가 영구히 파괴되지만, 필요한 저장 공간의 양은 크게 줄어들 것이다.오직 일부 형태의 조인트 스테레오만이 강도 스테레오 부호화와 같은 조인트 주파수 부호화 기법을 사용한다.

구현

MP3 압축 프로세스 내에서 사용할 경우, 조인트 스테레오는 일반적으로 여러 가지 기법을 사용하며, 각 MPEG 프레임에 대해 이들 기법을 전환할 수 있다.일반적으로 현대 인코더의 공동 스테레오 모드는 일부 프레임에는 M/S 스테레오, 다른 프레임에는 L/R 스테레오, 어떤 방법이든 최상의 결과를 산출할 수 있는 방법을 사용한다.인코더는 전환 시기와 각 채널에 할당할 공간의 양을 결정하기 위해 서로 다른 알고리즘을 사용한다. 전환이 너무 잦거나 사이드 채널이 충분한 비트를 얻지 못할 경우 품질이 저하될 수 있다.일부 인코딩 소프트웨어만 있으면 Xing과 같은 초기 인코더의 공동 스테레오 모드를 모방하여 모든 프레임에 M/S 스테레오 사용을 강제할 수 있다.RAME 인코더 내에서는 이것을 강제 조인트 스테레오라고 한다.[1]

MP3와 마찬가지로 Oggg Vorbis 스테레오 파일은 L/R 스테레오나 조인트 스테레오 중 하나를 사용할 수 있다.조인트 스테레오 사용 시 M/S 스테레오 방식과 인텐시티 스테레오 방식을 모두 사용할 수 있다.정량화 전 M/S 스테레오(사용시)를 적용하는 MP3와는 달리, Ogg Vorbis 인코더는 정량화 후 주파수 영역의 샘플에 M/S 스테레오를 적용하여 M/S 스테레오 적용을 무손실 단계로 한다.이 단계 이후, 어떠한 주파수 영역도 M/S 신호의 사이드 채널의 해당 부분을 제거함으로써 인텐시티 스테레오로 변환할 수 있다.오그 보르비스의 바닥 기능이 필요한 좌우 패닝을 처리한다.

참조

  1. ^ "Detailed command line switches". LAME documentation. Retrieved 2013-12-13. JOINT STEREO [...] means the encoder can use (on a frame by frame basis) either L/R stereo or mid/side stereo. In mid/side stereo, [...] more bits are allocated to the mid channel than the side channel. When there isn't too much stereo separation, this effectively increases the bandwidth, so having higher quality with the same amount of bits. Using mid/side stereo inappropriately can result in audible compression artifacts. Too much switching between mid/side and regular stereo can also sound bad. To determine when to switch to mid/side stereo, LAME uses a much more sophisticated algorithm than the one described in the ISO documentation. FORCED MID/SIDE STEREO forces all frames to be encoded with mid/side stereo. It should only be used if you are sure every frame of the input file has very little stereo separation.

외부 링크