청각 마스킹

Auditory masking

청각 마스킹은 한 소리의 지각에 다른 소리의 존재에 의해 영향을 받을 때 발생한다.[1]

주파수 영역에서 청각 마스킹은 동시 마스킹, 주파수 마스킹 또는 스펙트럼 마스킹으로 알려져 있다. 시간 영역에서 청각 마스킹은 시간 마스킹 또는 비동시 마스킹으로 알려져 있다.

마스크된 임계값

마스크되지 않은 임계값은 마스킹 신호가 존재하지 않아도 감지할 수 있는 신호의 가장 조용한 수준이다. 마스크된 임계값은 특정 마스킹 노이즈와 결합할 때 감지되는 신호의 가장 조용한 수준이다. 마스킹 양은 마스크된 임계값과 마스크되지 않은 임계값 사이의 차이입니다.

그림 A – Gelfand(2004)[1]에서 개작

Gelfand는 기본적인 예를 제공한다.[1] 주어진 개인의 경우, 그렇지 않으면 조용한 환경에서 고양이가 기둥을 긁는 소리가 먼저 10dB SPL 수준에서 들린다고 하자. 그러나 동일한 개인이 고양이 긁는 소리를 감지할 수 없는 마스킹 소음(예: 동시 작동하는 진공청소기)이 있는 경우 긁는 소리 수준이 최소 26dB SPL이 아니면 고양이 긁는 소리를 감지할 수 없다. 대상 사운드에 대한 해당 개인의 마스크되지 않은 임계값(즉, 고양이 긁힘)은 10dB SPL이고, 마스크된 임계값은 26dB SPL이라고 할 수 있다. 마스킹의 양은 단순히 16dB라는 두 임계값 사이의 차이일 뿐이다.

마스킹의 양은 대상 신호와 마스커의 특성에 따라 달라지며, 개별 청취자에게도 특정된다. 위의 예에 나오는 사람이 26dB SPL에서 고양이가 긁는 것을 감지할 수 있었지만, 다른 사람은 진공 상태가 켜져 있는 동안 고양이 긁는 소리를 들을 수 없을 수도 있다. 고양이 긁는 소리 수준이 30dB SPL로 증가할 때까지(따라서 두 번째 청취자의 가위질 양을 20dB로 만든다).

동시 마스킹

동시 마스킹은 소리가 원래 소리와 동일한 지속시간 동안 발생하는 소음이나 원치 않는 소리에 의해 들리지 않게 될 때 발생한다.[2] 예를 들어, 1kHz의 강력한 스파이크는 1.1kHz의 낮은 톤을 가리는 경향이 있다. 또한 440 Hz와 450 Hz에서 두 개의 사인 톤을 분리할 때 명확하게 감지할 수 있다. 동시에 제시하면 명확하게 인식할 수 없다.

임계 대역폭

서로 다른 두 주파수의 두 소리를 동시에 재생하면 결합음보다는 두 개의 개별적인 소리를 들을 수 있는 경우가 많다. 주파수를 별도로 들을 수 있는 능력을 주파수 분해능 또는 주파수 선택성이라고 한다. 신호가 조합 톤으로 인식되면 동일한 임계 대역폭에 존재한다고 한다. 이 효과는 내이의 청각 기관인 콜레아 내에서의 여과로 인해 발생하는 것으로 생각된다. 복잡한 소리는 다른 주파수 성분으로 나뉘며, 이들 성분은 쿨레아 내 기저세포막 내부의 섬유의 특정 위치에서 진동 패턴에 피크를 일으킨다. 그리고 나서 이러한 요소들은 청각신경에 독립적으로 코딩되어 뇌로 소리 정보를 전달한다. 이 개별 코딩은 주파수 성분이 주파수가 충분히 다를 경우에만 발생하며, 그렇지 않으면 동일한 임계 대역에 속하고 같은 장소에서 코딩되며 두 개 대신 하나의 소리로 인식된다.[3]

한 소리를 다른 소리와 구별하는 필터를 청각 필터, 청취 채널 또는 임계 대역폭이라고 한다. 주파수 분해능은 수신기가 신호 주파수인 들을 것으로 예상되는 주파수보다 중심에 있는 필터를 선택하기 때문에 기준 막에서 발생한다. 날카롭게 튜닝된 필터는 중심 주파수가 다른 주파수를 통과하지 못하기 때문에 주파수 분해능이 좋다(Pickles 1982). 콜레아 내 골절과 외모세포의 손상은 소리를 구분하는 능력을 손상시킬 수 있다(Moore 1986). 이것은 왜 콩레아 손상으로 인해 청력을 잃은 사람이 언어에서 다른 자음을 구별하는데 있어서 일반 청각 장애인보다 더 많은 어려움을 겪게 되는지를 설명해준다.[4]

마스킹은 주파수 선택성의 한계를 보여준다. 신호가 신호와 주파수가 다른 마스커에 의해 가려지는 경우, 청각 시스템은 두 주파수를 구별할 수 없었다. 하나의 소리가 이전에 들었던 신호를 가릴 수 있는 조건을 실험함으로써 청각 시스템의 주파수 선택성을 시험할 수 있다.[5]

유사 주파수

그림 B – Ehmer에서 개조

마스커가 신호 임계값을 얼마나 효과적으로 올리느냐에 따라 신호의 주파수와 마스커의 주파수에 따라 달라진다. 그림 B의 그래프는 마스킹 오디오그램이라고도 알려진 마스킹 패턴의 시리즈다. 각 그래프는 상단 모서리에 표시된 각 마스커 주파수 250, 500, 1000 및 2000Hz에서 생성된 마스킹 양을 보여준다. 예를 들어 첫 번째 그래프에서 마스커는 신호와 동시에 250Hz의 주파수로 표시된다. 마스커가 신호 임계값을 증가시키는 양을 표시하고 X축에 표시된 다른 신호 주파수에 대해 이 값을 반복한다. 마스커의 주파수는 일정하게 유지된다. 마스킹 효과는 다양한 마스커 소리 수준에서 각 그래프에 나타난다.

그림 C – Gelfand 2004에서[1] 각색
그림 D – Gelfand 2004에서[1] 채택

그림 B는 Y축을 따라 마스킹의 양을 보여준다. 가장 큰 마스킹은 마스커와 신호가 동일한 주파수로 신호 주파수가 마스커 주파수에서 멀리 이동함에 따라 감소하는 것이다.[1] 이러한 현상을 온 주파수 마스킹이라고 하며 마스커와 신호가 동일한 청각 필터 내에 있기 때문에 발생한다(그림 C). 이것은 듣는 사람이 그것들을 구별할 수 없다는 것을 의미하며, 그것들은 더 큰 소리에 의해 더 조용한 소리로 인식된다(그림 D).

그림 E – 1998년[5] Moore에서 개조한 제품

마스커가 신호의 임계값을 높이는 양은 오프 주파수 마스킹에서 훨씬 적지만, 마스커의 일부가 신호의 청각 필터에 겹치기 때문에 마스킹 효과가 있다(그림 [5]E).

그림 F – Moore 1998에서[5] 각색한 것

오프 주파수 마스킹은 마스킹 효과를 가지기 위해 마스커의 레벨이 더 커야 한다. 이는 그림 F에 나타나 있다. 신호의 청각 필터에 일정량의 마스커만 겹치고 신호를 커버하려면 마스커가 더 필요하기 때문이다.[5]

저주파수

마스킹 패턴은 마스커의 빈도와 강도(그림 B)에 따라 변한다. 20-40dB 범위와 같은 1000Hz 그래프의 낮은 수준의 경우 곡선은 비교적 평행하다. 특히 마스커보다 높은 주파수의 신호에 대해서는 마스커 강도가 증가함에 따라 곡선이 분리된다. 이는 마스킹 효과가 마스커의 강도가 높아짐에 따라 주파수가 상향으로 확산된다는 것을 보여준다. 곡선은 저주파보다 고주파에서 훨씬 더 얕다. 이러한 평탄화는 마스킹의 상향 확산이라고 불리며, 이것이 간섭 음향이 저주파 신호보다 고주파 신호를 훨씬 더 잘 가리는 이유다.[1]

또한 그림 B는 마스커 주파수가 증가함에 따라 마스킹 패턴이 점점 압축된다는 것을 보여준다. 이는 고주파 마스크가 마스커 주파수에 가까운 좁은 범위의 주파수에서만 효과적이라는 것을 보여준다. 반면에 저주파 마스크는 넓은 주파수 범위에 걸쳐 효과적이다.[1]

그림 G – Gelfand가[1] 작성한 도표에서 수정

하비 플레처는 소음의 띠가 톤을 가리는 데 얼마나 큰 기여를 하는지를 알아내기 위해 실험을 수행했다. 실험에서, 고정된 톤 신호는 그것을 중심으로 한 다양한 노이즈 대역폭을 가지고 있었다. 각 대역폭에 대해 마스크된 임계값이 기록되었다. 그의 연구는 최대 마스킹 효과를 유발하는 노이즈의 중요한 대역폭이 있고 그 밴드 외부의 에너지가 마스킹에 영향을 미치지 않는다는 것을 보여주었다. 이것은 청각 시스템이 음의 주파수보다 중심에 있는 청각 필터를 가지고 있는 것으로 설명될 수 있다. 이 청각 필터 안에 있는 마스커의 대역폭은 효과적으로 톤을 가릴 수 있지만 필터 외부의 마스커는 아무런 효과도 없다(그림 G).

이것은 오디오 파일의 크기를 줄이기 위해 MP3 파일에 사용된다. 임계 대역폭을 벗어나는 신호의 일부는 감소된 정밀도로 표현된다. 청취자가 인식하는 신호의 부분은 보다 높은 충실도로 재현된다.[6]

강도의 영향

그림 H – Moore 1998의[5] 각색

강도 수준의 변화는 마스킹에도 영향을 미칠 수 있다. 필터의 하단 끝은 데시벨 레벨이 증가함에 따라 평평해지는 반면, 높은 끝은 약간 더 가파르게 된다. 강도가 높은 필터의 고주파 측 기울기 변화는 저주파수보다 일관성이 떨어진다. 중간 주파수(1~4kHz)에서는 강도가 증가함에 따라 기울기가 증가하지만, 낮은 주파수에서는 수평을 가진 명확한 기울기가 없고 높은 중심 주파수의 필터는 레벨이 증가함에 따라 기울기가 약간 감소하는 것을 보여준다. 필터의 선명도는 필터에 대한 출력 레벨이 아니라 입력 레벨에 따라 달라진다. 청각 필터의 하단도 레벨이 높아질수록 넓어진다.[5] 이러한 관측치는 그림 H에 예시되어 있다.

시간 마스킹

일시적인 마스킹 또는 비동시 마스킹은 갑작스러운 자극음이 자극 바로 앞이나 뒤에 존재하는 다른 소리를 들을 수 없을 때 발생한다. 마스커 직전 소리를 가리는 마스킹을 후진 마스킹 또는 프리 마스킹, 마스킹이라고 하며, 마스커 직후 소리를 가리는 마스킹을 포워드 마스킹 또는 포스트 마스킹이라고 한다.[5] 임시 마스킹의 효과는 마스커의 시작 및 오프셋으로부터 기하급수적으로 감소하며, 시작 감쇠는 약 20ms, 오프셋 감쇠는 약 100ms 지속된다.

동시 마스킹과 유사하게, 시간 마스킹은 청각 시스템이 수행하는 주파수 분석을 드러낸다. 복잡한 고조파 톤에 대한 전방 마스킹 임계값(예: 기본 주파수가 500Hz인 톱니 모양의 프로브)은 첫 번째 몇 개의 고조파를 중심으로 한 주파수 대역에 대한 임계값 피크(즉, 높은 마스킹 레벨)를 나타낸다. 실제로 전방 마스킹 임계값에서 측정한 청각 대역폭은 동시 마스킹을 사용하여 측정한 대역폭보다 좁고 정확하다.

시간적마스킹은귀의 음향 반사작용, 즉 큰 소리로부터 귀의 섬세한 구조를 보호하기 위해 활성화되는 중간의 무의식적인 반응과 혼동해서는 안 된다.

기타 마스킹 조건

그림 I – 입방체 동시 마스킹

복면("동일한 측면") 복면만이 복면이 일어나는 유일한 조건은 아니다. 마스킹이 발생하는 또 다른 상황을 대측("다른 쪽") 동시 마스킹이라고 한다. 이 경우 한쪽 귀에서 신호가 들릴 수 있지만 다른 귀에는 마스커를 적용하여 의도적으로 신호를 빼앗기는 경우.

마지막으로 마스킹이 발생하는 상황을 중앙 마스킹이라고 한다. 마스커가 임계값 상승을 일으키는 경우를 말한다. 이것은 또 다른 영향이 없을 수도 있고, 또한 마스커와 신호에서 얻은 별도의 신경 입력 사이의 중추신경계 내 상호작용에 기인한다.[1]

다양한 자극 유형의 효과

좁은 밴드 노이즈의 형태나 사인파 톤의 마스커(masker)를 사용할 때 다른 마스킹 효과를 보기 위한 실험이 진행되어 왔다.

정현상 신호와 정현상 마스커(톤)가 동시에 제시되면 결합된 자극의 봉투가 박동이라고 묘사된 규칙적인 패턴으로 변동한다. 변동은 두 소리의 주파수 차이로 정의된 속도로 발생한다. 주파수 차이가 작을 경우 소리는 하나의 톤의 시끄러운 소리에서 주기적인 변화로 인식된다. 만약 박자가 빠르다면 이것은 거친 느낌으로 묘사될 수 있다. 큰 주파수 분리가 있을 때 두 구성 요소는 거칠거나 박자가 없는 분리된 음으로 들린다. 비트는 신호 자체가 들리지 않을 때에도 신호의 존재에 대한 신호일 수 있다. 신호나 마스커 중 하나에 사인파 음이 아닌 협대역 소음을 사용하면 박자의 영향을 줄일 수 있다.[3]

마스킹의 메커니즘

마스킹에는 많은 다른 메커니즘이 있는데 하나는 억압이다. 이는 다른 신호의 존재로 인해 신호에 대한 응답이 감소하는 경우다. 이것은 첫 번째 신호에 의해 야기된 원래의 신경 활동이 다른 소리의 신경 활동에 의해 감소되기 때문에 일어난다.[7]

조합 톤은 신호와 마스커의 산물이다. 이것은 두 소리가 상호 작용하여 새로운 소리를 낼 때 발생하는데, 이것은 원래 신호보다 더 잘 들릴 수 있다. 이것은 귀에서 일어나는 비선형 왜곡에 의해 발생한다. 예를 들어, 두 개의 마스커의 조합 톤은 두 개의 원래 마스커보다 더 잘 마스커일 수 있다.[5]

소리는 두 소리 사이의 빈도 차이에 따라 여러 가지 방식으로 상호작용을 한다. 가장 중요한 두 가지는 입방체 차이 톤과[definition needed] 2차 차이 톤이다[definition needed].[5]

입방체 차이 톤은 합계로 계산한다.[clarification needed]

2F1 – F2[8]

(F1은 첫 번째 주파수, F2는 두 번째 주파수) 이것들은 대부분 들을 수 있고 특히 원래 음조의 수준이 낮을 때 들을 수 있다. 따라서 그들은 2차 차이 톤보다 정신 음향 튜닝 곡선에 더 큰 영향을 미친다.

2차 차이 톤은 의 결과물이다[clarification needed].

F2 – F1

이것은 상대적으로 높은 수준에서 발생하므로 정신 음향 튜닝 곡선에 미치는 영향이 적다.[5]

조합 톤은 기본 톤과 상호 작용하여 원래 기본 톤과 같기 때문에 2차 조합 톤을 발생시킬 수 있다. 이것의 예는.

3F1 – 2F2

2차 조합 톤은 다시 1차 톤의 조합 톤과 유사하다.[5]

Off 주파수 수신

오프 주파수 청취는 청취자가 청각 성능을 향상시키기 위해 신호 주파수보다 조금 낮은 필터를 선택하는 것이다. 이 "오프 주파수" 필터는 필터의 출력 수준에서 신호보다 마스커의 레벨을 더 많이 감소시키며, 이는 그들이 신호를 더 명확하게 들을 수 있다는 것을 의미하며, 따라서 청각 성능의 향상을 야기한다.[2]

적용들

청각 마스킹은 종종 청력 손실에 관련된 성가신 울림, 쉿, 윙윙거리는 소리 또는 이명을 억제하기 위해 이명 마스크에 사용된다. 청음기 청음기 등 다양한 종류의 청음기법, 각 귀를 일방적으로 시험하는 표준청음검사, 부분 마스킹 소음 발생 시 음성인식을 시험하는 표준청음시험에도 사용된다.

청각 마스킹은 음향 신호(MP3)에 대한 데이터 압축을 수행하는 데 이용된다.

참고 항목

참조

  1. ^ a b c d e f g h i j Gelfand, S.A. (2004) 청각 심리학적생리학적 음향에 대한 소개 4차 Ed. 뉴욕, 마르셀 드커
  2. ^ a b 무어, B.C.J. (2004) 청각 심리학 입문, 5차 에드. 런던, 엘스비에 아카데미 프레스
  3. ^ a b 무어, B.C.J. (1986) 런던, 학술지 청각의 주파수 선택성
  4. ^ 무어, B.C.J. (1995) 옥스퍼드, 옥스퍼드 대학 출판부의 달팽이관 손상의 지각적 결과
  5. ^ a b c d e f g h i j k l 무어, B.C.J. (1998) 런던, Whurr 출판사
  6. ^ Sellars, P. (2000), Perceptual Coding: How MP3 Compression Works, Cambridge: Sound on Sound, archived from the original on 2015-07-31, retrieved 12 December 2020
  7. ^ 옥센함, A.J. 플랙, C.J. 억제와 마스킹의 상승 확산, 미국음향학회지, 104 페이지 (6) 페이지 3500–10
  8. ^ 이, 교구, 김민종. 3차 적응형 볼테라 필터를 이용한 입방체 차음 진폭 추정, 제8차 디지털 오디오 효과 국제회의(DAFx'05) 개최, 스페인 마드리드, 2005년 9월 20일-22일, 페이지 297
  • 피클스, J.O. (1982) 런던, 학술지 청각 생리학 소개

외부 링크