바이노럴 언마스킹

Binaural unmasking

바이노럴 언마스킹Ira Hirsh에 의해 발견되는 청각적 지각의 현상이다.[1] 바이너럴 언마스킹에서 뇌는 두 귀의 정보를 결합하여 소음에서의 신호 감지 및 식별을 개선한다. 이 현상은 신호의 경락간 위상과 소음의 경락간 위상에 차이가 있을 때 가장 흔히 나타난다. 그러한 차이가 존재하는 경우, 경락간 단계가 동일한 기준 상황이나 자극이 단수적으로 제시된 경우에 비해 마스킹 문턱값이 개선된다. 그 두 사건은 보통 매우 유사한 문턱을 제시한다. 개선의 크기는 "바이노럴 마스킹 수준 차이"(BMLD) 또는 간단히 "마스킹 수준 차이"로 알려져 있다.

바이너럴 언마스킹은 저주파수에서 가장 효과적이다. 광대역 소음의 순수 톤에 대한 BMLD는 250Hz에서 최대 15데시벨(dB)에 도달하고 1500Hz에서는 2-3dB로 점차 감소한다. 그런 다음 BMLD는 모든 높은 주파수에서 최소 4 kHz까지 2-3 dB로 안정화된다.[2] 협대역 마스킹 소음에도 바이너럴 언마스킹을 관찰할 수 있지만 효과는 다르게 작용한다. 즉, 더 큰 BMLD를 관찰할 수 있고 빈도가 증가함에 따라 감소의 증거가 거의 없다.[3]

J.C.R.는 소음에서 언어의 식별 개선을 처음 보고했다. 릭라이더.[4] 릭라이더는 마스킹 해제 시 사용되던 경락간 위상의 차이는 음원의 방향에 따라 달라지며 건전한 국소화에 관여하는 경락간 시차와 유사하다고 언급했다. 연설은 마스킹이 해제될 수 있고, 기초적인 단서는 건전한 방향에 따라 다르다는 사실은 바이노럴적인 마스킹이 칵테일 파티 효과에 역할을 할 가능성을 높였다.

라벨 표시 시스템

Jeffress가 처음 사용한 다른 자극 구성에 대한 체계적인 라벨 표시 시스템은 이 지역의 대부분의 작가들에 의해 채택되었다.[5] 조건 이름은 NxSy로 기록되며, 여기서 x는 노이즈의 경내 구성이고 y는 신호의 경내 구성이다. x와 y의 일부 공통 값에는 다음이 포함된다.

  • 0은 신호나 노이즈가 두 귀에서 동일함을 의미한다.
  • π은 신호나 노이즈가 경락간 위상차이 rad 라디안(Radians)
  • τ은 신호나 노이즈가 경락간 시간차를 갖는 것을 의미하며, 여기서 시차의 정확한 값인 τ은 다른 곳에 명시되어 있다.
  • ρ은 소음의 경락 간 상관관계가 1 미만이며, 정확한 상관관계가 다른 곳에 명시되어 있음을 의미한다.
  • m은 신호나 소음이 모노럴이라는 것을 의미한다.

이론들

바이노럴 언마스킹에는 두 가지 주요 설명 프레임워크가 있다. 이것들은 경락간 교차상관 및 경락간 뺄셈에 기초한다.[7]

교차상관 계정은 로이드 A가 제안한 것과 유사한 중뇌의 우연 감지 네트워크의 존재에 의존한다. 소리 지역화에서 경락 간 시간 차이에 대한 민감성을 설명하기 위해 제프레스[8]. 각 우연의 일치 검출기는 차등 전송 지연을 유발하는 차축 네트워크를 통해 두 귀로부터 일련의 동작 전위를 수신한다. 신호의 검출은 신호의 존재에 의해 가장 활동적인 우연 검출기의 응답률이 감소할 때 발생하는 것으로 생각된다. 두 귀의 신호의 교차 상관은 종종 일련의 우연 감지 뉴런을 모델링하기 위한 수학적 대용물로 사용된다; 감소된 응답률은 교차 상관계 최대 감소로 해석된다.

감산계정은 "균등화-취소" 또는 "EC" 이론으로 알려져 있다. 이 계정에서 두 귀(또는 내부 표현)의 파형은 다른 귀에서 하나를 빼기 전에 뇌에 의해 일시적으로 정렬(동등화)된다. 실제로, 우연의 일치 검출기는 한쪽 귀의 작용 전위에 의해 흥분되지만 다른 쪽 귀의 작용 전위에 의해 억제되는 뉴런으로 대체된다. 그러나 EC 이론은 그러한 노골적인 신경학적 용어로 일반적으로 틀에 박혀 있지 않으며, 뇌에서 적절한 신경 기질이 확인되지 않았다. 그럼에도 불구하고, EC 이론은 매우 인기 있는 모델링 프레임워크를 증명했고, 정신 음향 실험에서 교차 상관 모델과의 직접적인 비교에서 좋은 성과를 거두었다.

지각 단서

귀는 들어오는 소리를 다른 주파수로 필터링한다. 즉, 콩레아에서 주어진 장소와 청각 신경섬유는 제한된 주파수 범위에만 반응한다. 결과적으로, 연구원들은 신호 주위의 좁은 주파수 대역 내에서 두 귀의 음성과 잡음의 혼합에 의해 발생하는 단서들을 연구했다. 신호와 협대역 노이즈가 추가되면 결과적으로 발생하는 진폭과 위상이 노이즈나 신호의 그것과 다른 벡터 합산이 발생한다. 바이너럴 언마스킹 자극의 경우 신호와 노이즈의 경락간 파라미터의 차이는 각 귀에 다른 벡터 합산이 있음을 의미한다.[5] 따라서 자극 구성과 관계없이 청취자의 귀에서 자극의 수준과 단계 차이에 모두 변동이 있는 경향이 있다.

실험은 이들 중 청각 시스템이 가장 잘 감지할 수 있는 단서들을 조사했다. 이러한 결과는 낮은 주파수(특히 500Hz)에서 청각 시스템이 경청 시간 차이에 가장 민감하다는 것을 보여주었다.[10] 그러나 고주파수에서는 경락간 수준차이로의 전환이 있는 것 같다.[11]

실제적 함의

일상 생활에서, 언어와 잡음이 다른 방향에서 올 때, 말소리는 소음에서 더 쉽게 이해되는데, 이것은 "마스킹으로부터의 공간 방출"이라고 알려진 현상이다. 이러한 상황에서, 언어와 소음은 경락간 시간적 차이와 경락간 수준의 차이를 가지고 있다. 시간 차이는 두 귀의 음경 경로 길이 차이에 의해 생성되며, 수준 차이는 머리의 음향 그림자 효과에 의해 발생한다. 두 단서는 음향 국소화에 큰 역할을 하며, 두 단서는 모두 마스킹으로부터 공간 방출에 독립적인 영향을 미치는 것으로 나타났다.[12] 경락 간 수준의 차이는 한쪽 귀 또는 다른 한쪽 귀로 하여금 신호잡음 비를 더 잘 갖게 할 수 있으며, 이는 청자가 그 귀만 들어도 이해성이 향상될 수 있게 한다. 그러나 경락간 시간 차이는 두 귀의 파형을 비교해야만 이용할 수 있다. 마스킹으로부터의 공간 방출의 성공적인 모델은 균등화-취소 이론을 사용하여 경내 시간 차이의 영향을 발생시키는 경향이 있다.[13]

참조

  1. ^ Hirsh IJ (1948). "The influence of interaural phase on interaural summation and inhibition". J. Acoust. Soc. Am. 20 (4): 536–544. Bibcode:1948ASAJ...20..536H. doi:10.1121/1.1906407.
  2. ^ Hirsh IJ, Burgeat M (1958). "Binaural Effects in Remote Masking". J. Acoust. Soc. Am. 30 (9): 827–832. Bibcode:1958ASAJ...30..827H. doi:10.1121/1.1909781.
  3. ^ McFadden D, Pasanen EG (1978). "Binaural detection at high frequencies with time-delayed waveforms". J. Acoust. Soc. Am. 34 (4): 1120–1131. Bibcode:1978ASAJ...63.1120M. doi:10.1121/1.381820. PMID 649871.
  4. ^ Licklider JC (1948). "The influence of interaural phase relations upon the masking of speech by white noise". J. Acoust. Soc. Am. 20 (2): 150–159. Bibcode:1948ASAJ...20..150L. doi:10.1121/1.1906358.
  5. ^ a b Jeffress LA, Blodgett HC, Sandel TT, Wood CL (1956). "Masking of Tonal Signals". J. Acoust. Soc. Am. 28 (3): 416–426. Bibcode:1956ASAJ...28..416J. doi:10.1121/1.1908346.
  6. ^ Colburn HS (1977). "Theory of binaural interaction based on auditory-nerve data. II. Detection of tones in noise". J. Acoust. Soc. Am. 61 (2): 525–533. Bibcode:1977ASAJ...61..525C. doi:10.1121/1.381294. PMID 845314.
  7. ^ Durlach NI (1963). "Equalization and cancellation theory of binaural masking-level differences". J. Acoust. Soc. Am. 35 (8): 416–426. doi:10.1121/1.1918675.
  8. ^ Jeffress, L.A. (1948). "A Place Theory of Sound Localization". Journal of Comparative and Physiological Psychology. 41 (1): 35–9. doi:10.1037/h0061495. PMID 18904764.
  9. ^ Culling JF (2007). "Evidence specifically favoring the equalization-cancellation theory of binaural unmasking". J Acoust Soc Am. 122 (5): 2803–2813. Bibcode:2007ASAJ..122.2803C. doi:10.1121/1.2785035. PMID 18189570. S2CID 24476950.
  10. ^ Van Der Heijden M, Joris PX (2010). "Interaural correlation fails to account for detection in a classic binaural task: Dynamic ITDs dominate N0Sπ detection". J Assoc Res Otolaryngol. 11 (1): 113–131. doi:10.1007/s10162-009-0185-8. PMC 2820206. PMID 19760461.
  11. ^ Culling JF (2011). "Subcomponent cues in binaural unmasking" (PDF). J Acoust Soc Am. 129 (6): 3846–3855. Bibcode:2011ASAJ..129.3846C. doi:10.1121/1.3560944. PMID 21682408.
  12. ^ Bronkhorst AW, Plomp, R (1988). "The effect of head-induced interaural time and level differences on speech intelligibility in noise". J Acoust Soc Am. 83: 1508–1516. doi:10.1121/1.395906. PMID 3372866.
  13. ^ Beutelmann R, Brand T (2006). "Prediction of speech intelligibility in spatial noise and reverberation for normal-hearing and hearing-impaired listeners". J Acoust Soc Am. 120 (1): 331–342. Bibcode:2006ASAJ..120..331B. doi:10.1121/1.2202888. PMID 16875230.