오디오 코딩 형식

Audio coding format
일반적인 오디오 형식 간 부호화 효율 비교

오디오 코딩[1] 형식(또는 오디오 압축 형식)은 디지털 오디오(디지털 텔레비전, 디지털 라디오, 오디오 및 비디오 파일 등)의 저장 또는 전송을 위한 콘텐츠 표현 형식입니다.오디오 코딩 형식의 예로는 MP3, AAC, Vorbis, FLACOpus있습니다.특정 오디오 코딩 포맷과의 오디오 압축 및 압축 해제가 가능한 특정 소프트웨어 또는 하드웨어 실장은 오디오코덱이라고 불립니다.오디오 코덱의 예로는 LAM이 있습니다.LAM은 소프트웨어에 MP3 오디오 코딩 포맷으로 오디오를 부호화 및 디코딩하는 몇 가지 다른 코덱 중 하나입니다.

일부 오디오 코딩 형식은 오디오 코딩 사양으로 알려진 상세한 기술 사양 문서에 의해 문서화되어 있습니다.이러한 사양 중 일부는 표준화 기관에 의해 기술 표준으로 작성 및 승인되었으며, 따라서 오디오 코딩 표준으로 알려져 있습니다."표준"이라는 용어는 공식 표준뿐만 아니라 사실상표준에도 사용되기도 한다.

특정 오디오 코딩 형식으로 인코딩된 오디오 콘텐츠는 보통 컨테이너 형식으로 캡슐화됩니다.따라서 사용자는 보통 미가공 AAC 파일이 아니라 .m4a 오디오파일을 가지고 있습니다.이것은 AAC 인코딩 오디오를 포함한 MPEG-4 Part 14 컨테이너입니다.컨테이너에는 제목 및 기타 태그와 같은 메타데이터와 빠른 [2]검색을 위한 인덱스도 포함되어 있습니다.주목할 만한 예외는 MP3 파일입니다.MP3 파일은 컨테이너 형식이 없는 원시 오디오 코딩입니다.제목이나 아티스트 등의 메타데이터 태그를 MP3에 추가하는 사실상의 표준은 MP3에 태그를 부가하고 MP3 플레이어에 의존하여 청크를 부정한 형식의 오디오 코딩으로 인식하여 건너뜁니다.오디오를 포함한 비디오파일에서는 인코딩된 오디오콘텐츠는 멀티미디어 컨테이너 포맷 내의 비디오(비디오 코딩 포맷)와 번들 됩니다.

오디오 코딩 형식이 형식을 구현하는 코덱에서 사용되는 모든 알고리즘을 지시하는 것은 아닙니다.정신음향학적 모델에 따르면 손실된 오디오 압축이 작동하는 방법의 중요한 부분은 인간이 들을 수 없는 방식으로 데이터를 제거하는 것입니다. 인코더 구현자는 (정신음향학적 모델에 따라) 제거할 데이터를 자유롭게 선택할 수 있습니다.

무손실, 무손실 및 비압축 오디오 코딩 형식

무손실 오디오 코딩 포맷은 사운드를 표현하기 위해 필요한 총 데이터를 줄이지만 원래의 압축되지 않은 형식으로 디코딩할 수 있습니다.손실 오디오 부호화 포맷은 압축에 가세해 음성의 비트 분해능을 감소시켜 회복 불가능한 정보의 손실을 초래하는 데이터의 양을 크게 감소시킨다.

컨슈머 오디오는 크기가 작을수록 배포가 훨씬 편리하기 때문에 대부분의 경우 손실 오디오코덱을 사용하여 압축됩니다.가장 널리 사용되는 오디오 코딩 형식은 MP3 Advanced Audio Coding(AAC; 어드밴스 오디오 코딩)으로, 모두 Modified Discrete Cosine Transform(MDCT; 수정 이산 코사인 변환) 및 지각 부호화 알고리즘에 근거한 손실 형식입니다.

FLACApple Lossless 와 같은 무손실 오디오 코딩 포맷을 이용할 수 있는 경우가 있습니다.다만, 대용량의 파일을 사용할 수 있습니다.

Pulse-Code Modulation(PCM; 펄스 코드 변조)나 .wav 등의 비압축 오디오 형식도 사용되는 경우가 있습니다.PCM은 CDA(Compact Disc Digital Audio)의 표준 형식이었지만 MP3가 등장한 이후 손실 압축이 표준이 되었습니다.

역사

Solidyne 922:세계 최초의 PC용 상용 오디오 비트 압축 사운드 카드, 1990년

1950년 벨 연구소는 DPCM([3]Differential Pulse-Code Modulation) 특허를 출원했고, P는 적응형 DPCM(Adaptive DPCM)을 도입했다.Cummiskey, Nikil S. Jayant, 그리고 James L. 1973년 [4][5]연구소의 플래너건입니다

지각 부호화는 선형 예측 부호화(LPC)[6]를 사용한 음성 부호화 압축에 처음 사용되었다.LPC의 초기 개념은 1966년 [7]이타쿠라 후미타다(나고야 대학)와 사이토 슈조(일본전신전화)의 작품으로 거슬러 올라간다.1970년대에 비슈누 S. 아탈과 맨프레드 R. Bell LabsSchroeder는 인간의 귀의 마스킹 특성을 이용한 지각 코딩 알고리즘인 적응 예측 코딩(APC)이라고 불리는 LPC의 형태를 개발했으며,[6] 1980년대 초에 상당한 압축률을 달성한 코드 들뜸 선형 예측(CELP) 알고리즘이 뒤를 이었다.지각 코딩은 MP3[6]AAC와 같은 최신 오디오 압축 형식에서 사용됩니다.

Nasir Ahmed, T. Natarajan 및 K. R. Rao의해 [8]1974년에 개발된 이산 코사인 변환(DCT)은 MP3[9] 및 AAC 등의 최신 오디오 압축 형식에 사용되는 수정 이산 코사인 변환(MDCT)의 기초를 제공했습니다.MDCT는 J.[11] P. Princen, A. W. Johnson 및 A. B. Bradley에 의해 1986년 Princen과 Bradley의 이전 연구에 이어 [10]1987년에 제안되었습니다.MDCT는 Dolby Digital,[12][13] MP3,[9] Advanced Audio Coding(AAC;[14] 어드밴스드오디오 코딩) 등의 최신 오디오 압축 형식에서 사용됩니다.

손실 형식 목록

장군

기본 압축 알고리즘 오디오 코딩 표준 줄임말 서론 시장점유율(2019년)[15] Ref
수정 이산 코사인 변환(MDCT) 돌비 디지털 (AC-3) AC3 1991 58% [12][16]
적응형 변환 음향 부호화 ATRAC 1992 불명 [12]
MPEG 레이어 III MP3 1993 49% [9][17]
어드밴스드 오디오 코딩(MPEG-2/MPEG-4) AAC 1997 88% [14][12]
Windows Media 오디오 WMA 1999 불명 [12]
오그 보비스 오그 2000 7% [18][12]
제약된 에너지 래핑 변환 셀트 2011 [19]
오퍼스 오퍼스 2012 8% [20]
LDAC LDAC 2015 불명 [21][22]
어댑티브 차분 펄스 코드 변조(ADPCM) aptX/aptX-HD aptX 1989 불명 [23]
디지털 극장 시스템 DTS 1990 14% [24][25]
마스터 품질 인증 완료 MQA 2014 불명
서브밴드 코딩(SBC) MPEG-1 오디오레이어 II MP2 1993 불명
뮤즈팩 MPC 1997

연설

무손실 형식 목록

「 」를 참조해 주세요.

레퍼런스

  1. ^ "오디오 코딩"이라는 용어는 를 들어 어드밴스드 오디오 코딩이라는 이름으로 볼 수 있으며 비디오 코딩이라는 용어와 유사합니다.
  2. ^ "Video - Where is synchronization information stored in container formats?".
  3. ^ 미국 특허 2605361, C.Chapin Cutler, "통신 신호의 차분 양자화", 1952-07-29 발행
  4. ^ Cummiskey, P.; Jayant, N. S.; Flanagan, J. L. (1973). "Adaptive Quantization in Differential PCM Coding of Speech". Bell System Technical Journal. 52 (7): 1105–1118. doi:10.1002/j.1538-7305.1973.tb02007.x.
  5. ^ Cummiskey, P.; Jayant, Nikil S.; Flanagan, J. L. (1973). "Adaptive quantization in differential PCM coding of speech". The Bell System Technical Journal. 52 (7): 1105–1118. doi:10.1002/j.1538-7305.1973.tb02007.x. ISSN 0005-8580.
  6. ^ a b c Schroeder, Manfred R. (2014). "Bell Laboratories". Acoustics, Information, and Communication: Memorial Volume in Honor of Manfred R. Schroeder. Springer. p. 388. ISBN 9783319056609.
  7. ^ Gray, Robert M. (2010). "A History of Realtime Digital Speech on Packet Networks: Part II of Linear Predictive Coding and the Internet Protocol" (PDF). Found. Trends Signal Process. 3 (4): 203–303. doi:10.1561/2000000036. ISSN 1932-8346.
  8. ^ Nasir Ahmed; T. Natarajan; Kamisetty Ramamohan Rao (January 1974). "Discrete Cosine Transform" (PDF). IEEE Transactions on Computers. C-23 (1): 90–93. doi:10.1109/T-C.1974.223784.
  9. ^ a b c Guckert, John (Spring 2012). "The Use of FFT and MDCT in MP3 Audio Compression" (PDF). University of Utah. Retrieved 14 July 2019.
  10. ^ Princen, J.; Johnson, A.; Bradley, A. (1987). "Subband/Transform coding using filter bank designs based on time domain aliasing cancellation". ICASSP '87. IEEE International Conference on Acoustics, Speech, and Signal Processing. Vol. 12. pp. 2161–2164. doi:10.1109/ICASSP.1987.1169405. S2CID 58446992.
  11. ^ Princen, J.; Bradley, A. (1986). "Analysis/Synthesis filter bank design based on time domain aliasing cancellation". IEEE Transactions on Acoustics, Speech, and Signal Processing. 34 (5): 1153–1161. doi:10.1109/TASSP.1986.1164954.
  12. ^ a b c d e f Luo, Fa-Long (2008). Mobile Multimedia Broadcasting Standards: Technology and Practice. Springer Science & Business Media. p. 590. ISBN 9780387782638.
  13. ^ Britanak, V. (2011). "On Properties, Relations, and Simplified Implementation of Filter Banks in the Dolby Digital (Plus) AC-3 Audio Coding Standards". IEEE Transactions on Audio, Speech, and Language Processing. 19 (5): 1231–1241. doi:10.1109/TASL.2010.2087755. S2CID 897622.
  14. ^ a b Brandenburg, Karlheinz (1999). "MP3 and AAC Explained" (PDF). Archived (PDF) from the original on 2017-02-13.
  15. ^ "Video Developer Report 2019" (PDF). Bitmovin. 2019. Retrieved 5 November 2019.
  16. ^ Britanak, V. (2011). "On Properties, Relations, and Simplified Implementation of Filter Banks in the Dolby Digital (Plus) AC-3 Audio Coding Standards". IEEE Transactions on Audio, Speech, and Language Processing. 19 (5): 1231–1241. doi:10.1109/TASL.2010.2087755. S2CID 897622.
  17. ^ Stanković, Radomir S.; Astola, Jaakko T. (2012). "Reminiscences of the Early Work in DCT: Interview with K.R. Rao" (PDF). Reprints from the Early Days of Information Sciences. 60. Retrieved 13 October 2019.
  18. ^ Xiph.Org Foundation (2009-06-02). "Vorbis I specification - 1.1.2 Classification". Xiph.Org Foundation. Retrieved 2009-09-22.
  19. ^ Terriberry, Timothy B. Presentation of the CELT codec. Presentation (PDF).
  20. ^ Valin, Jean-Marc; Maxwell, Gregory; Terriberry, Timothy B.; Vos, Koen (October 2013). High-Quality, Low-Delay Music Coding in the Opus Codec. 135th AES Convention. Audio Engineering Society. arXiv:1602.04845.
  21. ^ Darko, John H. (2017-03-29). "The inconvenient truth about Bluetooth audio". DAR__KO. Archived from the original on 2018-01-14. Retrieved 2018-01-13.
  22. ^ Ford, Jez (2015-08-24). "What is Sony LDAC, and how does it do it?". AVHub. Retrieved 2018-01-13.
  23. ^ Ford, Jez (2016-11-22). "aptX HD - lossless or lossy?". AVHub. Retrieved 2018-01-13.
  24. ^ "Digital Theater Systems Audio Formats". Library of Congress. 27 December 2011. Retrieved 10 November 2019.
  25. ^ Spanias, Andreas; Painter, Ted; Atti, Venkatraman (2006). Audio Signal Processing and Coding. John Wiley & Sons. p. 338. ISBN 9780470041963.