손실 압축

Lossy compression
저압축(고품질) JPEG
고압축(저품질) JPEG

정보기술에서 손실 압축 또는 비가역 압축은 내용을 나타내기 위해 부정확한 근사치와 부분 데이터 폐기를 사용하는 데이터 압축 방식의 클래스입니다.이러한 기술은 콘텐츠 저장, 처리 및 전송을 위한 데이터 크기를 줄이기 위해 사용됩니다.이 페이지의 다양한 버전의 고양이 사진을 보면 더 많은 세부 정보가 삭제될수록 더 거친 이미지를 만드는 방법을 알 수 있습니다.이는 데이터를 열화시키지 않는 무손실 데이터 압축(역방향 데이터 압축)과는 반대됩니다.손실 압축을 사용하여 가능한 데이터 감소량은 손실 없는 기술을 사용하는 것보다 훨씬 높습니다.

적절하게 설계된 손실 압축 기술은 최종 사용자가 성능 저하를 알아차리기 전에 파일 크기를 크게 줄이는 경우가 많습니다.유저가 알아차린 경우에서도, 데이터의 추가 삭감이 바람직할 수 있습니다(예를 들면, 실시간 통신이나 전송 시간이나 스토리지 요구를 삭감할 수 있습니다).가장 널리 사용되는 손실 압축 알고리즘은 Nasir Ahmed, T. Natarajan 및 K. Rao1974년에 처음 발표한 이산 코사인 변환(DCT)입니다.2019년에는 손실 [1]압축을 위해 DCT와 유사한 특성과 성능을 가진 새로운 사인파-고엽 변환 함수 패밀리가 제안되었다.

손실 압축은 멀티미디어 데이터(오디오, 비디오이미지)의 압축에 가장 일반적으로 사용되며, 특히 스트리밍 미디어나 인터넷텔레포니 등의 애플리케이션에서 사용됩니다.반면 은행 기록이나 텍스트 문서와 같은 텍스트 및 데이터 파일에는 일반적으로 무손실 압축이 필요합니다.마스터 무손실 파일을 만들면 더 많은 복사본을 생성할 수 있습니다.이를 통해 손실된 소스 파일을 기반으로 한 새로운 압축 복사를 피할 수 있으며, 이로 인해 추가적인 아티팩트와 불필요한 정보 손실이 발생할 수 있습니다.

종류들

원본 파일에 포함된 전체 정보가 손실되지 않고 저장에 필요한 컴퓨터 파일 크기 또는 전송에 필요한 대역폭을 줄이는 방식으로 많은 유형의 디지털 데이터를 압축할 수 있습니다.예를 들면, 화상을 닷의 배열이라고 간주해, 각 닷의 색과 휘도를 특정하는 것으로 디지털 파일로 변환한다.화상에 같은 색의 영역이 포함되어 있는 경우는, 「빨간 점, 붉은 점…(197회 더)…」이 아니고 「200개의 붉은 점」이라고 하는 것으로, 손실 없이 압축할 수 있다.

원본 데이터에는 일정량의 정보가 포함되어 있으며 모든 정보를 전달할 수 있는 파일 크기에는 하한값이 있습니다.기본 정보 이론은 이 데이터의 크기를 줄이는 데 절대적인 한계가 있다고 말한다.데이터가 압축되면 엔트로피가 증가하므로 무한히 증가할 수 없습니다.예를 들어 압축된 ZIP 파일은 원래 파일보다 작지만 동일한 파일을 반복적으로 압축해도 크기가 0으로 줄어들지 않습니다.대부분의 압축 알고리즘은 추가 압축이 무의미하고 실제로 데이터 크기를 증가시키는 시기를 인식할 수 있습니다.

대부분의 경우 파일 또는 데이터 스트림에는 필요 이상의 정보가 포함되어 있습니다.예를 들어, 사진은 가장 큰 크기로 재생되었을 때 눈으로 식별할 수 있는 것보다 더 세밀할 수 있습니다. 마찬가지로 오디오 파일은 매우 큰 음절에서 많은 세밀한 정보가 필요하지 않습니다.손실 압축 기법을 가능한 한 인간의 인식에 가깝게 개발하는 것은 복잡한 작업이다.경우에 따라서는 디지털 정보가 가능한 한 제거된 원본과 정확히 동일한 인식을 제공하는 파일이 이상적일 수 있습니다. 다른 경우, 눈에 띄는 품질 상실은 유효한 트레이드오프라고 간주됩니다.

의료 이미지 압축과 같은 일부 애플리케이션에서는 "손실"의 부정적인 의미를 피하기 위해 "손실"과 "손실 없는"보다 "복원 불가"와 "복원 불가"라는 용어가 각각 선호됩니다.손실의 종류와 양은 이미지의 유용성에 영향을 미칠 수 있습니다.압축의 아티팩트나 바람직하지 않은 효과는 명확하게 식별될 수 있지만 결과는 의도한 목적에 여전히 유용합니다.또는 손실 압축 영상은 '시각적으로 무손실'이거나 의료 영상의 경우 이른바 DAIC([2]Diagnostically Acceptable Returnable Compression)가 적용되었을 수 있습니다.

변환 부호화

손실 압축의 일부 형식은 디지털 이미지, 디지털 오디오 신호 및 디지털 비디오에 사용되는 데이터 압축의 일종인 변환 부호화의 적용으로 생각할 수 있습니다.변환은 일반적으로 더 나은(더 표적화된) 정량화를 가능하게 하기 위해 사용됩니다.응용 프로그램에 대한 지식은 폐기할 정보를 선택하기 위해 사용되며, 그 결과 대역폭이 줄어듭니다.그런 다음, 나머지 정보는 다양한 방법을 통해 압축할 수 있습니다.출력이 디코딩되면 결과는 원래 입력과 동일하지 않을 수 있지만 응용 프로그램의 목적에 충분히 근접할 것으로 예상됩니다.

손실 압축의 가장 일반적인 형태는 변환 부호화 방법인 이산 코사인 변환(DCT)[3]으로,[4] Nasir Ahmed, T. Natarajan 및 K. Rao의해 1974년에 처음 발표되었다.DCT는 일반적인 이미지 압축 형식(JPEG ),[5] 비디오 코딩 표준(MPEG 및 H.264/AVC ) 및 오디오 압축 형식(MP3 AAC 등)에 가장 널리 사용되는 손실 압축 형식입니다.

오디오 데이터의 경우, 일반적인 변환 부호화의 형태는 지각 부호화입니다. 지각 부호화는 원시 데이터를 보다 정확하게 정보 내용을 반영하는 도메인으로 변환합니다.예를 들어 사운드파일을 시간의 경과에 따른 진폭레벨로 표현하는 것이 아니라 시간의 경과에 따른 주파수 스펙트럼으로 표현하는 것이 인간의 오디오 인식에 보다 정확하게 대응합니다.변환 부호화의 데이터 축소(압축하거나 손실이 없는 비가역)이 주요한 목표, 그것은 또한:한가지 더 정확하게 space[6]–의 예를 들어는 원래 금액을 원칙적으로, 어떤 사람이 아날로그 또는 고해상도의 디지털 마스터와 함께 시작하면 주어진 크기의 MP3파일 더 나은 repres을 제공해야 하는 데이터를 나타낸다 다른 목표를 허용한다.en같은 사이즈의 WAV 또는 AIFF 파일에 있는 압축 해제되지 않은 원시 오디오보다 높은 톤입니다.이는 비압축 오디오는 비트레이트 또는 깊이를 낮춰 파일사이즈를 줄일 수 있을 뿐이지만 오디오를 압축하면 비트레이트 및 깊이를 유지하면서 사이즈를 줄일 수 있기 때문입니다.이 압축은 전체 데이터를 손실하는 것이 아니라 중요도가 가장 낮은 데이터를 선택적으로 손실합니다.또한 변환 부호화는 데이터를 조작하거나 다른 방법으로 편집하기 위한 더 나은 영역을 제공할 수 있습니다. 예를 들어 오디오 균등화는 원시 시간 영역이 아닌 주파수 영역(예를 들어 저음 증폭)에서 가장 자연스럽게 표현됩니다.

이러한 관점에서 지각 부호화는 본질적으로 데이터를 폐기하는 것이 아니라 데이터를 더 잘 표현하는 것에 관한 것입니다.또 다른 용도는 하위 호환성 그레이스열화입니다.컬러 TV에서 휘도-색도 변환 도메인(YUV 등)을 통해 색상을 인코딩하는 것은 흑백 세트가 색상 정보를 무시한 채 휘도를 표시하는 것을 의미합니다.또 다른 예로는 채도 서브샘플링이 있습니다.NTSC에서 사용되는 YIQ 의 색 공간을 사용하면 컴포넌트의 해상도를 인간의 인식에 맞게 낮출 수 있습니다.인간의 해상도는 흑백(루마), 해상도는 노란색이나 녹색 등의 중간 스펙트럼 색상에 대해서는 가장 높고, 빨간색이나 블루에 대해서는 가장 낮습니다.즉, NTSC 디스플레이에 대해서는 가장 낮습니다.스캔 라인당 약 350픽셀의 Luma, 150픽셀의 황색 대 녹색, 50픽셀의 청색 대 적색 등 각 컴포넌트에 대한 인간의 감도에 비례합니다.

정보 손실

손실 압축 포맷에서는 생성 손실이 발생합니다.파일의 압축과 압축 해제를 반복하면, 파일의 품질이 서서히 저하됩니다.이는 무손실 데이터 압축과는 대조적으로, 이러한 절차를 사용해도 데이터가 손실되지 않습니다.손실 데이터 압축에 관한 정보 이론의 기초는 속도 왜곡 이론에 의해 제공된다.최적 부호화 이론에서 확률을 사용하는 것과 마찬가지로, 속도 왜곡 이론은 지각 왜곡과 심지어 심미적 판단을 모델링하기 위해 베이지안 추정과 결정 이론에 크게 의존합니다.

기본적인 손실 압축 방식에는 다음 2가지가 있습니다.

  • 손실 변환 코덱에서는, 화상이나 음성의 샘플을 취득해, 작은 세그먼트(segment)로 잘라, 새로운 베이스 스페이스로 변환해, 양자화한다.결과 양자화된 값은 엔트로피 부호화됩니다.
  • 손실예측코덱에서는 현재 음성샘플 또는 화상프레임을 예측하기 위해 이전 및/또는 후속 복호화 데이터가 사용된다.예측 데이터와 실제 데이터 사이의 오차는 예측을 재현하는 데 필요한 추가 정보와 함께 양자화되고 코드화됩니다.

일부 시스템에서는 두 가지 기술이 결합되어 예측 단계에 의해 생성된 오류 신호를 압축하기 위해 변환 코덱이 사용됩니다.

비교

lossy 메서드의 장점은 lossy 메서드가 어플리케이션의 요건을 충족시키면서 lossy 메서드보다 훨씬 작은 압축 파일을 생성할 수 있다는 것입니다.손실 방법은 사운드, 이미지 또는 비디오를 압축하는 데 가장 많이 사용됩니다.이는 이러한 유형의 데이터가 정신이 쉽게 "빈칸을 채우거나" 과거의 아주 작은 오류나 불일치를 볼 수 있는 인간의 해석을 위한 것이기 때문이다. 이상적으로는 손실 압축은 투명(감지할 수 없음)하며 ABX 테스트를 통해 검증할 수 있다.손실 압축을 사용하는 데이터 파일은 크기가 작기 때문에 저장 및 인터넷 전송 비용이 절감됩니다. 이는 넷플릭스와 같은 스트리밍 비디오 서비스와 스포티파이 같은 스트리밍 오디오 서비스의 중요한 고려 사항입니다.

정서적 효과

Audio Engineering Library가 실시한 연구에 따르면 MP3와 같은 낮은 비트레이트(112kbps) 손실 압축 형식은 추골 및 감정적 특성에 뚜렷한 영향을 미쳐 부정적인 감정적 특성을 강화하고 긍정적인 [7]감정을 약화시키는 경향이 있다고 합니다.이 연구는 또한 트럼펫이 압축의 영향을 가장 많이 받는 악기인 반면, 경적음은 가장 적다는 점에 주목했다.

투명도

사용자가 손실 압축 파일(예를 들어 다운로드 시간을 단축하기 위해)을 취득하면 검색된 파일은 비트 수준에서 원본과 상당히 다를 수 있으며, 대부분의 실용적인 목적으로는 사람의 귀나 눈으로 구분할 수 없습니다.예를 들어 인간의 눈은 특정 파장의 빛만 볼 수 있다는 점을 고려하면서 많은 압축 방법은 인간 생리의 특이성에 초점을 맞춘다.심리음향 모델은 어떻게 소리가 인지된 품질을 저하시키지 않고 고도로 압축될 수 있는지를 기술합니다.사람의 눈이나 귀에 눈에 띄는 손실성 압박으로 인한 결함을 압축 아티팩트라고 합니다.

압축비

손실 비디오 코덱의 압축비(즉, 압축되지 않은 파일에 비해 압축된 파일의 크기)는 거의 항상 오디오 및 정지화면에 상당하는 것보다 훨씬 우수합니다.

  • 비디오는 가시적인 품질 저하 없이 매우 압축할 수 있습니다(예: 100:1).
  • 대부분의 경우 오디오는 10:1로 압축되며 거의 감지할 수 없는 품질 손실
  • 정지화면은 오디오와 마찬가지로 10:1로 압축이 잘 안 되는 경우가 많지만 특히 정밀 검사를 통해 품질 저하가 더욱 두드러집니다.

트랜스코딩 및 편집

손실 압축(공식적으로 트랜스코딩)에 관한 중요한 경고는 손실 압축 파일을 편집하면 재인코딩에 의한 디지털 생성 손실이 발생한다는 것입니다.이것은, (손실이 없는) 원고의 손실 파일만 생성해, JPEG 대신원시 이미지 형식의 이미지 등, 원고의 파일을 편집(복사)하는 것으로 회피할 수 있습니다.손실 압축된 데이터를 손실 압축 없이 복호화 및 압축하면 손실 압축 이전의 데이터 크기와 비교할 수 있지만 이미 손실된 데이터는 복구할 수 없다.원본을 보관하지 않고 손실 변환을 사용할 경우 소프트웨어 또는 디바이스와의 호환성을 확보하거나(포맷 시프트), 압축 파일 복호화 또는 배포에 대한 특허 로열티를 지불하지 않기 위해 앞으로 포맷 변환이 필요할 수 있습니다.

손실 파일 편집

복호화 및 재인코딩 없이 압축 데이터를 직접 수정함으로써 품질 저하 없이 손실 압축 파일을 편집할 수 있다.파일 크기를 더 크게 압축한 것처럼 편집하는 것도 가능하지만 이보다 더 큰 손실은 없습니다.

JPEG

JPEG의 무손실 편집을 위한 주요 프로그램은 다음과 같습니다.jpegtran, 및 파생된exiftran(Exif 정보도 보존) 및 Jpegcrop(Windows 인터페이스 제공)을 참조하십시오.

이를 통해 이미지를 잘라내거나, 회전하거나, 뒤집거나, 플랩하거나, 색도 채널을 떨어뜨려 그레이스케일로 변환할 수 있습니다.불필요한 정보는 파기되지만 나머지 부분의 품질은 변경되지 않습니다.

동일한 인코딩으로 이미지를 결합하거나(그리드와 같이 나란히 합성), 로고와 같은 이미지를 기존 이미지에 붙여넣거나(둘 다 JPEGjoin을 통해), [8]배율을 조정하는 것과 같은 다른 변환도 어느 정도 가능합니다.

재인코딩하지 않고 압축에 일부 변경을 가할 수 있습니다.

  • 압축 최적화(디코딩된 이미지를 변경하지 않고 크기를 줄이기 위해)
  • 프로그레시브 부호화와 비프로그레시브 부호화 간의 변환.

프리웨어의 Windows 전용 IrfanView에는, 몇개의 무손실 JPEG 조작이 있습니다.JPG_TRANSFORM 플러그 인.

메타데이터

ID3 태그, Vorbis 코멘트, Exif 정보 등의 메타데이터는 일반적으로 기본 데이터를 변경하지 않고 수정 또는 삭제할 수 있습니다.

다운샘플링/압축된 표현 확장성

비트레이트 필링과 같이 표현된 소스 신호의 분해능과 압축 표현에 사용되는 데이터의 양을 다운샘플링 또는 다른 방법으로 감소시키고 싶을 수 있지만, 이 기능은 모든 설계에서 지원되지 않습니다.이는 모든 코덱이 단순히 dr.d.를 가능하게 하는 형태로 데이터를 인코딩하는 것은 아니기 때문입니다.이 기능을 갖춘 유명한 디자인으로는 정지화면용 JPEG 2000과 비디오용 H.264/MPEG-4 AVC 기반의 스케일러블 비디오 코딩이 있습니다.이러한 방식은 또한 JPEG 이미지, MPEG-2 MPEG-4 Part 2 비디오와 같은 오래된 설계에도 표준화되어 있지만, 이러한 이전 방식들은 실제 일반적인 용도로 채택되는 데는 한계가 있었다.이 용량(실제로 흔히 있는 경우)이 없으면 주어진 것보다 낮은 해상도 또는 낮은 충실도로 표현을 작성하려면 원래 소스 신호에서 시작하여 인코딩하거나 압축된 표현으로 시작하여 압축 해제 후 다시 인코딩(트랜스코딩)해야 합니다.단, 후자는 디지털 생성을 일으키는 경향이 있습니다.이온 손실

또 다른 접근방식은 원래의 신호를 몇 가지 다른 비트레이트로 부호화한 후 어떤 것을 사용할지(RealNetworks의 "SureStream"과 같이 인터넷을 통해 스트리밍하거나 Apple의 iTunes Store와 같이 다양한 다운로드를 제공할 때), 또는 여러 번 브로드캐스트할지를 선택하는 것입니다(다양한 구현에서 가장 잘 수신된 것을 사용하는 경우).계층적 변조의 양상입니다.비슷한 기법이 맵, 피라미드 표현, 그리고 정교한 축척 공간 방법에도 사용된다.일부 오디오 형식은 손실 형식과 손실 없는 보정을 조합하여 원래 신호를 재생합니다.보정을 삭제하여 더 작고 압축된 파일을 남길 수 있습니다.이러한 형식에는 MPEG-4 SLS(Scalable to Lossless), Wav Pack, Optim 등이 있습니다.PROG DualStream 및 DTS-HD Master Audio in Lossless(XLL) 모드

방법들

그래픽스

이미지

3D 컴퓨터 그래픽스

비디오

오디오

일반

연설

기타 데이터

연구자들은 짧은 단어를 긴 단어로 대체하기 위해 시소러스 또는 생성 텍스트 [16]기술을 사용하여 텍스트에 손실 압축을 수행했지만, 이러한 기술은 때때로 손실 데이터 변환의 관련 범주에 속합니다.

해상도 저하

손실 압축의 일반적인 종류는 이미지 스케일링, 특히 소멸과 같이 이미지의 해상도를 낮추는 것입니다.또한조각과 같이 이미지의 "낮은 정보" 부분을 덜 제거할 수도 있습니다.가우스 블러와 같은 많은 미디어 변환은 손실 압축과 마찬가지로 되돌릴 수 없습니다. 변환된 신호에서 원래 신호를 재구성할 수 없습니다.그러나 일반적으로 이러한 크기는 원본과 동일하며 압축 형식이 아닙니다.NASA의 뉴호라이즌스 우주선이 고해상도 이미지를 보내기 전에 명왕성-차론과의 조우 장면을 미리 보내왔기 때문에 해상도를 낮추는 것은 실용적이다.느린 접속을 위한 또 다른 솔루션은 이미지를 점진적으로 정의하는 이미지 인터레이스를 사용하는 것입니다.따라서 부분 전송으로 스케일링된 [citation needed]풀버전을 작성하지 않고 저해상도 버전으로 최종 이미지를 미리 볼 수 있습니다.

「 」를 참조해 주세요.

메모들

  1. ^ Abedi, M.; Sun, B.; Zheng, Z. (July 2019). "A Sinusoidal-Hyperbolic Family of Transforms With Potential Applications in Compressive Sensing". IEEE Transactions on Image Processing. 28 (7): 3571–3583. Bibcode:2019ITIP...28.3571A. doi:10.1109/TIP.2019.2912355. PMID 31071031. S2CID 174820107.
  2. ^ European Society of Radiology (2011). "Usability of irreversible image compression in radiological imaging. A position paper by the European Society of Radiology (ESR)". Insights Imaging. 2 (2): 103–115. doi:10.1007/s13244-011-0071-x. PMC 3259360. PMID 22347940.
  3. ^ "Data compression". Encyclopedia Britannica. Retrieved 13 August 2019.
  4. ^ Ahmed, Nasir; Natarajan, T.; Rao, K. R. (January 1974), "Discrete Cosine Transform", IEEE Transactions on Computers, C-23 (1): 90–93, doi:10.1109/T-C.1974.223784, S2CID 149806273
  5. ^ "T.81 – DIGITAL COMPRESSION AND CODING OF CONTINUOUS-TONE STILL IMAGES – REQUIREMENTS AND GUIDELINES" (PDF). CCITT. September 1992. Retrieved 12 July 2019.
  6. ^ 「디지털 오디오 지각 코더의 주된 목표는 데이터 삭감이지만, 이것이 필수는 아닙니다.이제 알 수 있듯이 지각 코딩을 사용하여 고급 비트 할당을 통해 디지털 오디오의 표현을 개선할 수 있습니다."마스킹지각 코딩, Victor Lombardi, noisebetweenstations.com
  7. ^ Svetlik, Joe (December 5, 2016). "MP3s make you less happy, study says". What Hi Fi?. What Hi Fi?. Retrieved December 17, 2018.
  8. ^ "New jpegtran features". sylvana.net. Retrieved 2019-09-20.
  9. ^ a b c d e f Stanković, Radomir S.; Astola, Jaakko T. (2012). "Reminiscences of the Early Work in DCT: Interview with K.R. Rao" (PDF). Reprints from the Early Days of Information Sciences. 60. Retrieved 13 October 2019.
  10. ^ a b K. R. Rao와 J. Hwang, 이미지, 비디오, 오디오 부호화에 관한 기술과 표준, 프렌티스 홀, 1996; JPEG: 8장; H.261: 9장; MPEG-1: 10장; MPEG-2: 11장
  11. ^ Guckert, John (Spring 2012). "The Use of FFT and MDCT in MP3 Audio Compression" (PDF). University of Utah. Retrieved 14 July 2019.
  12. ^ Brandenburg, Karlheinz (1999). "MP3 and AAC Explained" (PDF). Archived (PDF) from the original on 2017-02-13.
  13. ^ Darko, John H. (2017-03-29). "The inconvenient truth about Bluetooth audio". DAR__KO. Archived from the original on 2018-01-14. Retrieved 2018-01-13.
  14. ^ Ford, Jez (2015-08-24). "What is Sony LDAC, and how does it do it?". AVHub. Retrieved 2018-01-13.
  15. ^ Ford, Jez (2016-11-22). "aptX HD - lossless or lossy?". AVHub. Retrieved 2018-01-13.
  16. ^ I. H. WITTEN; et al. "Semantic and Generative Models for Lossy Text Compression" (PDF). The Computer Journal. Retrieved 2007-10-13.

외부 링크

(웨이백 머신 복사)