코덱 듣기 테스트

Codec listening test

코덱 청취 테스트는 일반적으로 인식된 충실도 또는 압축 효율성과 관련하여 둘 이상의 손실 오디오 코덱을 비교하기 위해 고안된 과학 연구다.

대부분의 시험은 이중 블라인드 비교의 형태를 취한다. 일반적으로 사용되는 방법은 "ABX" 또는 "ABC/HR" 또는 "MUSHRA"로 알려져 있다. 최소한의 지원으로 이러한 유형의 시험을 개인이 수행할 수 있는 다양한 소프트웨어 패키지가 있다.

시험방법

ABX 시험

ABX 시험에서, 수신기는 알 수 없는 샘플 X를 A 또는 B로 식별해야 하며, A(보통 원본)와 B(대개 인코딩된 버전)를 참조할 수 있어야 한다. 시험 결과는 통계적으로 유의해야 한다. 이 설정을 통해 청취자가 자신의 기대에 편향되지 않고, 그 결과가 우연의 결과일 가능성이 없다는 것을 보장한다. 만약 미리 정해진 시험 횟수에서 낮은 p-값으로 표본 X를 신뢰성 있게 결정할 수 없다면, 귀무 가설을 기각할 수 없으며 표본 A와 B 사이에 감지할 수 있는 차이가 있음을 증명할 수 없다. 이것은 보통 암호화된 버전이 실제로 수신자에게 투명하다는 것을 나타낸다.

ABC/HR 시험

ABC/HR 테스트에서 C는 항상 참조가 가능한 원본이다. A와 B는 임의의 순서로 된 원본과 인코딩된 버전이다. 청취자는 품질에 대한 주관적인 판단으로 점수를 할당하기 전에 먼저 인코딩된 버전을 원본(ABC/HR의 "HR"이 나타내는 Hidden Reference)과 구별해야 한다. 이 점수를 사용하여 서로 다른 인코딩 버전을 비교할 수 있다.

무슈라

MUSHRA(Hidden Reference and Anchor)에서, 청취자는 기준(따라서 라벨로 표시됨), 특정 수의 시험 샘플, 기준의 숨겨진 버전 및 하나 이상의 앵커와 함께 제시된다. 닻의 목적은 저울을 "절대 저울"에 가깝게 하여 경미한 유물이 매우 나쁜 품질로 평가되지 않도록 하는 것이다.

결과.

많은 이중 블라인드 음악 듣기 시험이 시행되었다. 다음 표에는 온라인에서 발표된 여러 듣기 시험의 결과가 나열되어 있다. 의미 있는 결과를 얻기 위해, 듣기 시험은 유사하거나 동일한 비트 전송률에서 코덱의 성능을 비교해야 한다. 왜냐하면 어떤 손실 인코더에 의해 생산되는 오디오 품질은 비트 전송률을 증가시킴으로써 사소한 수준으로 향상될 것이기 때문이다. 수신자가 압축되지 않은 원본 오디오와 손실 인코더의 출력을 일관되게 구별할 수 없는 경우, 코덱이 투명성을 달성했다고 결론 내릴 수 있다.

이러한 테스트에서 비교한 인기 형식에는 MP3, AAC(및 확장), Vorbis, MusepackWMA가 포함된다. RealAudio Gecko, ATRAC3, QDesignmp3PRO 형식은 2007년 현재 훨씬 낮은 채택에도 불구하고 일부 테스트에서 나타난다. MP3와 같은 일부 형식에는 많은 인코더 및 디코더 구현(전용 소스 및 오픈 소스)이 존재하며, 이는 오늘날에도 널리 사용되고 있는 가장 오래되고 가장 잘 알려진 형식이다.

출처 날짜 형식 비트레이트(kbit/s) 코덱 음악 장르 샘플 리스너 최상의 결과 평.
ff123 2001 다중의 ~128
  • MP3: 레임 3.89베타 --abr 134 -h --nsphyune—athtype 2 --lowpass 16—ns-bass -8
  • MP3: 오디오 촉매 2.1 128 kbit/s 내 Xing, 고주파 모드 비활성화, 단순 스테레오 비활성화
  • AAC: 리퀴드 프로 5.0.0 베타 2, 빌드 24 스트리밍 128, 이퀄라이제이션 비활성화, 동적 비활성화, 듀얼 모노 인코딩 비활성화, 프로그램에 의해 오버라이드된 오디오 대역폭, 17995Hz로 설정됨
  • MPC: mppenc.exe 버전 1.7.9c -라디오 -ltq_gain 10 -tmn 12 -nmt 4.8
  • WMAv8: Windows Media Player 7.1(버전 7.01.00.3055); Wmadmoe.dll 버전 8.0.0371 128kbit/s
  • Ogg Vorborbis: Windows 32 128 kbit/s용 Oggdrop RC2
1 16 뮤즈팩AAC
ff123 2001년 10월 - 2002년 1월 다중의 ~128
  • MP3: 레임 3.89베타 --abr 134 -h --nsphyune—athtype 2 --ns-bass -8
  • MP3: 오디오 촉매 2.1 128 kbit/s 내 Xing, 고주파 모드 비활성화, 단순 스테레오 비활성화
  • AAC: 리퀴드 프로 5.0.0 베타 2, 빌드 24 스트리밍 128, 이퀄라이제이션 비활성화, 동적 비활성화, 듀얼 모노 인코딩 비활성화, 프로그램에 의해 오버라이드된 오디오 대역폭, 17995Hz로 설정됨
  • MPC: mppenc.exe 버전 1.7.9c -라디오 -ltq_gain 10 -tmn 12 -nmt 4.8
  • WMAv8: Windows Media Player 7.1(버전 7.01.00.3055); Wmadmoe.dll 버전 8.0.0371 128kbit/s
  • Vorbis: Windows 32용 **Oggdrop Pre-RC3; CVS(10/26/01) 128kbit/s
다양한 3 25-28 뮤즈팩
또는 보비스
ff123 2002년 7월 다중의 ~64
  • Ogg Vorbis 1.0 -b 64 - managed
  • Ogg Vorbis 1.0 -q 0
  • MMJB 7.2 mp3PRO 64
  • 64 kbit/s의 WMA8(인코딩에 WMP 7.1 사용)
  • QuickTime 6.0 MPEG-4 AAC 64 kbit/s의 낮은 복잡도
다양한 12 24-41 mp3PRO Vorbis의 두 변종 모두 근소한 2위였다.
로베르토 아모림 2003년 6월 AAC CBR 128
  • 싸이텔 AAC-enc 2.15 -br 128
  • 전방/Nero 5.5.10.35 128 kbit/s CBR, 고품질
  • 소렌손 스퀴즈 3.5(FhG Pro) 128 kbit/s
  • Apple QuickTime 6.3(Apple/Dolby) 128kbit/s 고품질
  • FAAC 1.17b -a 64(64 kbit/s/채널, ABR)
다양한 10 11-18 퀵타임
로베르토 아모림 2003년 7월 다중의 ~128
  • Apple QuickTime 6.3 MP4 인코더 128 kbit/s 고품질
  • RAME MP3 인코더 3.90.3 --alt-preset 128
  • 뮤즈팩 1.14 --품질 4 --x레벨
  • Ogg Vorbis post-1.0 CVS -q 4.25
  • Windows Media 오디오 v9 PRO 비트레이트 관리 2패스 VBR 128kbit/s
다양한 12 14-24 뮤즈팩 AAC, WMA, 보르비스는 공동 2위를 차지했다.
로베르토 아모림 2003년 9월 다중의 ~64
  • 전방/Nero 6.0.0.15 HE AAC VBR 프로필 스트리밍:: 중간, 고품질
  • Ogg Vorbis post-1.0 CVS -q 0
  • mp3PRO (Adobe Odion 1.0에서) VBR 퀄리티 40, Current Codec, M/S 및 IS 허용, 축소 허용, CRC 없음
  • Real Audio Gecko (Real Producer 9.0.1에서) 64 kbit/s
  • Windows Media 오디오 V9 VBR 품질 50
  • QuickTime 6.3 AAC LC 64 kbit/s, 최상의 품질
다양한 12 30-43 네로
헤아크
이 테스트에서 청취자는 99% 이상의 신뢰도로 64 kbit/s의 모든 테스트 코덱보다 LIME에 의해 인코딩된 128 kbit/s MP3 오디오를 선호했다.

"MP3와 동일한 품질의 마케팅 플롯 [sic]을 비트 전송률의 절반으로 제공하는 코덱은 없다."

로베르토 아모림 2004년 1월 MP3 ~128
  • RAME 인코더 3.95 --Preset 128
  • Adobe Odion 1.0 VBR 품질 40, "Current - Best" 코덱의 FHG MP3 인코더.
  • Apple iTunes 4.2 MP3 112 kbit/s VBR, 최고 품질, 조인트 스테레오, 스마트 인코딩
  • GOGO-no-코다 3.12 -b 128 -a -q 0
  • 오디오 액티브 인코더 2.04 128 kbit/s 고품질
  • Xing MP3 인코더 1.5 VBR 품질 정상
다양한 12 11-22 변변찮은 저자는 그 결과가 ITunes에 대해 Xing 인코더의 구식 버전 사용과 최적화되지 않은 설정의 영향을 받았을 수 있다고 언급했다.
로베르토 아모림 2004년 2월 AAC ~128
  • 전방/Nero AAC-enc v 2.6.2.0 - 인터넷 프로파일, 고품질, LC
  • Apple iTunes 4.2(Apple/QuickTime) 128kbit/s
  • 콤팩트! 1.2베타3(zPlane/H)HI) VBR 5, 고품질, LC
  • FAAC 1.23.5 -q 115
  • Real Producer 10 베타(CodingTechnology) 128 kbit/s
다양한 12 19-29 아이튠즈 오픈 소스 FAAC 코덱은 이전 테스트 이후 크게 향상됨
로베르토 아모림 2004년 5월 다중의 ~128
  • RAME 인코더 3.96 -V5—athaa-감도 1
  • Apple iTunes 4.2 128 kbit/s AAC
  • Ogg Vorbis aoTuV 튜닝 b2 -q 4.35
  • 뮤즈팩 1.14b --품질 4.15—x레벨
  • Sony Atrac3 132 kbit/s
  • Microsoft WMA9 표준 비트레이트 VBR 128 kbit/s
다양한 18 12-27 aoTuV(Vorbis) 및 뮤즈팩
로베르토 아모림 2004년 6월 다중의 CBR 32
  • RAME 인코더 3.96 -b 32
  • 네로 어드밴스 HE AAC+PS 32 kbit/s CBR 고품질
  • Ogg Vorbis post 1.0.1CVS --managed -b 32 SSRC로 다시 샘플링
  • Helix Producer 10리얼 오디오 32 kbit/s 스테레오 음악 코덱
  • QDesign 음악 코덱 2 Pro 32 kbit/s(32 kHz, 품질 모드)
  • Microsoft WMA9 표준 32kbit/s(32kHz)
  • mp3PRO 32kbit/s(32kHz), Adobe Odion 1.5에서
다양한 18 47-77 네로
헤아크
수소오디오 사용자 "구루불레즈" 2004년 7월 다중의 ~175
  • MPC: 뮤즈팩 -표준
  • MP3: 라임 3.97 알파 -V 3; -V 2
  • Ogg Vorbis: 메가믹스 -q 6,00; -q 6,99; -q 5,50
고전적인 18 1 뮤즈팩
수소오디오 사용자 "구루불레즈" 2005년 8월 다중의 ~180
  • AAC: Faac 1.24.1. 출시일: 2004년 말 (?). 설정: -q175
  • AAC: Nero Digital aacenc32 v.3.2.0.15. 발매일: 2005년 6월. 설정: -streaming(하이/기본 인코더)
  • MP3: RAME 3.97 알파 11. 릴리스 날짜: 2005년 7월. 설정: -V2—vbr-new
  • MPC: mppenc 1.15v. 출시일: 2005년 3월. 설정: --품질 5
  • Ogg Vorbis: 1.1.1 기반 aoTuV 베타 4. 출시 날짜: 2005년 7월. 설정: -q6,00
고전적인 18 1 aoTuV(보비스) 저자는 이전 테스트(위) 이후 Vorbis 인코딩의 상당한 개선을 반영한다.

"Vorbis는 이제 아오유미[aoTuV의 크리에이터] 덕분에 180kbit/s 인코딩(그리고 클래식 음악)을 위한 훌륭한 오디오 포맷이 되었다."

구루보올레ZZ (프랑스어로) 2005년 8월 다중의 ~96
  • AAC-LC: iTunes 4.9 / QuickTime 7.02 CBR 96
  • MP3: RAME 3.97 알파 11 --abr 99
  • MPC: mppenc 1.14 --x레벨—품질 3(또는—썸)
  • Ogg Vorbis: SVN 1.1.1 -q2,00 기반 AoTuV / LANCER 베타 4
  • WMA 표준: WMA 9.1 CBR 96
클래식, 다양함 클래식 150종, 다양한 35종 1 aoTuVAAC가 동점(클래식), aoTuV(다양한) 저자는 초기 '다위니아 국면'에서 복수의 인코더를 서로 맞대어 각 참여 인코더를 선정했다. 예를 들어, LAME은 전체 샘플 말뭉치의 하위 집합에서 4개의 다른 MP3 인코더를 확실히 능가했기 때문에 대표적인 MP3 인코더로 선택되었다.
세바스티안 마레스 2005년 12월 다중의 ~140 (1998년 128년)
  • Nero AAC 3.1.0.2 VBR/스테레오 - 스트리밍, 100-120 kbit/s [LC AAC]
  • iTunes AAC 6.0.1.3 128 kbit/s, VBR
  • LAME 3.97 베타 2 - V5 - vbr-new
  • Ogg Vorbis AoTuV 4.51 베타 -q 4.25
  • WMA Professional 9.1 품질 기반 VBR, Q50
  • 샤인 0.1.4(낮은 앵커) -b 128
다양한 18 18-30 4웨이 타이(샤인 제외) "현재 인코더로 128kbit/s의 품질이 매우 좋다는 것을 이번 테스트가 보여준다고 생각하는데... 96?또는그보다 더 낮은 64kbit/s로 비트레이트를할 시점이다 이동해야."
Mp3-tech.org 2006년 3월 AAC 48
  • 3gpp 6.3.0 48kbit/s CBR
  • 코딩 기술 - Winamp 5.2 베타 393 48kbit/s CBR HE-AAC
  • 코딩 기술 - Winamp 5.2 베타 393 48kbit/s CBR HEV2-AAC
  • 네로 디지털 4.9.9.95 48kbit/s ABR HE-AAC
  • 네로 디지털 4.9.9.96 48kbit/s ABR HEV2-AAC
  • iTunes 6.0.2 (Low 앵커) 48kbit/s CBR
  • LAME 3.97b2(하이 앵커) -V5
다양한 18 10-20 동점5길
(앵커를 제외한 모든)
"… 전반적으로, 이 비트레이트에서는 HE-AAC v2보다 일반 HE-AAC가 더 나을 것 같지만, 이에 관한 명확한 결론을 도출하기 위해서는 훨씬 더 많은 샘플이 필요할 것이다.
세바스티안 마레스 2006년 11월 다중의 ~48
  • Ogg Vorbis AoTuV 5 베타 -q -1
  • WMA Professional 10 1-통과 CBR, 48 kbit/s
  • Nero HE-AAC 2006년 5월 26일 -q 0.2
  • WMA Standard 9.2 품질 기반 VBR, Q10
  • iTunes AAC 7.0.2.16 48 kbit/s, CBR
다양한 20 22-34 네로
헤아크
WMA 프로페셔널과 aoTuV 공동 2위
세바스티안 마레스 2007년 7월 다중의 ~64
  • Ogg Vorbis AoTuV 5 베타 -q 0
  • WMA Professional 10 1-통과 CBR, 64 kbit/s
  • 네로 HE-AAC 2007년 7월 20일 -q 0.24
다양한 18 21-33 네로 디지털과 WMA 프로페셔널
세바스티안 마레스 2008년 10월 MP3 ~128
  • LAME 3.98.2 -V5.7
  • RAME 3.97 - V5—vbr-new
  • iTunes 8.0.1.11 112 kbit/s, VBR, 최고 품질, 조인트 스테레오, 스마트 인코딩, 10 Hz 미만의 필터
  • 프라운호퍼 IIS mp3surround CL 인코더 v1.5 -br 0 -m 4 -q 1 -vbri -ofl
  • Helix v5.1 2005.08.09 -X2 -U2 -V60
  • l3enc 0.99a(Low Anchor) -br 128000 - mod 1
다양한 14 26-39 동점5길
(L3enc를 제외한 모든)
"128kbps의 품질은 매우 좋고 MP3 인코더는 지난 시험 이후 많이 향상되었다." 또한 프라운호퍼와 헬릭스 코덱은 인식된 오디오 품질 면에서 사실상 동일하지만 LAME보다 인코딩 속도가 몇 배 더 빠르다는 점에 주목한다.
수소오디오 사용자 IgorC(2011년 3월/4월) 2011년 3월 다중의 ~64
  • Ogg Vorbis AoTuV 6.02 베타 -q 0.1
  • Apple HE-AAC는 VBR, 고품질, 64 kbit/s를 제한함
  • CELT 복잡성 10, VBR 67.5 kbit/s
  • 네로 HE-AAC -q 0.245
다양한 30 25-13 CELT / Opus 결과에서, CELT는 나중에 표준화되었을 때 그것의 이름인 Opus로 언급된다.
수소오디오 사용자 IgorC(2011년 7월 - 8월) 2011년 7월/8월 LC-AAC ~96
  • 네로 1.5.4.0 -q 0.345
  • Apple QuickTime 7.6.9 True VBR, 고품질, 96 kbit/s
  • Apple QuickTime 7.6.9 제한 VBR, 고품질, 96 kbit/s
  • 프라운호퍼 IIS(Winamp 5.62) VBR 3
  • 코딩 기술(Winamp 5.61을 통해) CBR 100kbps
다양한 20 25 애플 퀵타임
수소오디오 사용자 "Kamedo2" 2013년 5월 MP3 ~224
  • 레임3100i -V2+
  • 라임 3.99.5 -V1
  • LAME 3.98.4 -q 0 -b 224
  • Helix v5.1 -X2 -U2 -V146
  • BladeEnc(Low 앵커) -quit -nocfg -224
다양한 25 1 동점4길
(BladeEnc를 제외한 모든 항목)
낮은 닻)
대부분의 손상 등급은 4(감지할 수 있지만 성가시지는 않음)와 5(감지할 수 없음) 사이의 등급이다. 두 스피치 모두 낮은 닻을 제외하고 투명한 샘플(p<0.02)을 샘플링한다.
수소오디오 사용자 카메도2(2014년 7월/9월) 2014년 7월 - 9월 다중의 ~96
  • AAC Apple QuickTime iTunes 11.2.2 (qaac 2.4.1) 제한 VBR, 고품질, 96 kbit/s
  • Opus 1.1 VBR, 96 kbit/s
  • Ogg Vorbis aoTuV 베타 6.03 -q 2.2(~96kbps)
  • MP3 REMP 3.99.5 VBR, -V 5 (잘 알려진 비교지만 비트 전송률이 더 높은 약 130 kbps)
  • AAC FAAC v1.28 (중저 앵커) -b 96
  • AAC FAAC v1.28(Low 앵커) -q 30(약 52kbps)
다양한 40 33 오푸스 오퍼스가 확실한 승자, 애플AAC가 2위, 오그 보비스, 고비트레이트 라임 MP3가 통계적으로 공동 3위에 올랐다. 사전에 열등한 것으로 알려진 FAAC는 나쁜 결과를 버리고 품질 척도 앵커로 활용됐다.


커닝햄과 맥그리거 2019년 2월 다중의 192 - 1411
  • 압축되지 않은 WAV
  • MP3 CBR 192kbps
  • AAC 192kbps CBR
  • ACER 저품질 ~1023kbps VBR
  • ACER 중간 품질 ~1130kbps VBR
  • ACER 고품질 ~1233kbps VBR
10 100 5웨이 타이(WAV, MP3, AAC, ACER HQ, ACER MQ) 참가자들은 압축되지 않은, MP3, AAC, ACER 고품질, ACER 고품질, ACER 중급 압축 오디오 사이에 소음과 왜곡 면에서 인식된 차이는 없지만 ACER 저품질 포맷은 낮은 품질로 인식된다고 보고했다. 그러나 스테레오 분야에 대한 참가자의 인식 측면에서, 시험 중인 모든 형식은 통계적으로 유의미한 차이가 없이 서로 잘 수행되었다.[1]


출처 날짜 형식 비트레이트(kbit/s) 코덱 음악 장르 샘플 리스너 최상의 결과 평.


참고 항목

참조

  1. ^ 커닝엄, 스튜어트, 맥그리거는 이언(2019년)."주관적 평가 음악의 ACER란 코덱 생성과 AAC, MP3, 그리고Uncompressed PCM에 압축". 국제 저널 디지털 멀티 미디어 방송.2019년:1–16. doi:10.1155/2019/8265301.재료는 창조적 공용 귀인 4.0국제 라이센스 하에 가능하다 이 원본에서 복사되었다.

외부 링크

  • 수소음향 - 커뮤니티 오디오 애호가 사이트, 대부분의 비상업적 ABX 테스트 호스트
  • 사운드 전문가. 인터넷을 통한 코덱의 지속적인 블라인드 리스닝 테스트