임계 밴드

Critical band

청각학이나 정신음향학에서는 1933년[1] 하비 플레처가 도입하고 1940년에 정제된 비판 대역의 개념은 내이 내부의 청각 기관인 콜레아가 만든 "청각 필터"의 주파수 대역폭을 설명한다.[2]대략적으로 임계 대역은 두 번째 톤이 청각 마스킹에 의해 첫 번째 톤의 인식을 방해하는 오디오 주파수의 대역이다.

Psychophysiologically을 물리치와 청각적 거칠기 감각은 청각 frequency-analysis 메커니즘의 무능의 빈도 차이 가장 중요한 대역 폭보다 작다 입력을 해소하고 기계적인 시스템(기저막)의 i.에 대응하여 반향을 일으키결과 불규칙한" 간간하다"[3]에 연결할 수 있습니다nputs. 임계 대역은 청각 마스킹 현상과도 밀접하게 관련되어 있다 – 동일한 임계 대역 내에서 더 높은 강도의 두 번째 신호가 있을 때 소리 신호의 청각성을 감소시킨다.마스킹 현상은 소리(기준의 지각 프레임)와 강도(기준의 물리적 프레임)의 복잡한 관계에서 음압 알고리즘에 이르는 광범위한 함축적 의미를 갖는다.

청각 필터

필터는 주변 청각 시스템을 포함하여 청각학 및 정신 음향학의 많은 측면에서 사용된다.필터는 특정 주파수를 증가시키고 다른 주파수를 감쇠시키는 장치다.특히 대역 통과 필터는 차단 주파수 외부의 주파수를 정지시키면서 대역폭 내의 다양한 주파수를 통과시킬 수 있다.[4]

중심 주파수(Fc), 하한(F1) 및 상한(F2)이 주파수 및 대역폭을 차단하는 대역 통과 필터.상한 및 하한 컷오프 주파수는 진폭이 피크 진폭보다 3dB 아래로 떨어지는 지점으로 정의된다.대역폭은 상한과 하한 컷오프 주파수 사이의 거리로, 필터를 통과한 주파수 범위다.

기저막의 형태와 구성은 서로 다른 주파수가 특히 막을 따라 다른 지점에서 강하게 공명한다는 것을 의미한다.이것은 막의 주파수 범위에 대한 감도의 톤토픽 조직으로 이어지며, 이것은 "청각 필터"[5]라고 알려진 겹치는 대역 통과 필터의 배열로 모델링될 수 있다.청각 필터는 기저막의 점들과 연관되어 있으며, 달팽이의 주파수 선택성을 결정하므로, 청취자의 다른 소리들 간의 차별성이 결정된다.[4][6]이들은 비선형적이고 레벨에 의존하며, 기저막의 튜닝이 고주파에서 저주파로 변화함에 따라 대역폭이 저주파에서 콜레아의 정점으로 감소한다.[4][6][7]청각 필터의 대역폭은 Fletcher(1940)가 처음 제안한 것처럼 임계 대역폭이라고 불린다.신호와 마스커가 동시에 나타나는 경우, 임계 대역폭에 속하는 마스커 주파수만 신호를 마스킹하는 데 기여한다.임계 대역폭이 클수록 신호 대 잡음 비(SNR)가 낮아지고 신호가 더 많이 마스킹된다.

중심 주파수와 관련된 ERB도표는 글라스버그와 무어의 공식에 따른 ERB 대 중심 주파수를 보여준다.[6]

청각 필터와 관련된 또 다른 개념은 등가 직사각형 대역폭(ERB)이다.ERB는 청각 필터, 주파수 및 임계 대역폭 사이의 관계를 보여준다.ERB는 청각 필터와 동일한 양의 에너지를 전달하고 입력 주파수에 따라 어떻게 변화하는지 보여준다.[4][6]낮은 소음 수준에서 ERB는 글라스버그와 무어에 따라 다음과 같은 방정식으로 근사치를 구한다.[6]

ERB(f) = 24.7 * (4.37 f / 1000 + 1)

여기서 ERB는 Hz, f는 Hz 단위의 중심 주파수다.

각 ERB는 기저막의 약 0.9mm에 해당하는 것으로 생각된다.[6][7]ERB는 주파수와 관련된 척도로 변환할 수 있으며 기준 막대를 따라 청각 필터의 위치를 보여준다.예를 들어 ERB 번호 3.36은 기저막의 비정형 끝에서 주파수에 해당하는 반면 ERB 번호 38.9는 기저에 해당하고 값 19.5는 둘 사이의 반쪽이다.[6]

청각 필터를 모델링하는 데 사용되는 필터 유형 중 하나는 감마톤 필터다.이 필터는 간단한 선형 필터를 제공하며, 따라서 구현은 쉽지만 청각 시스템의 비선형적인 측면을 설명할 수는 없다. 그럼에도 불구하고 청각 시스템의 다양한 모델에서 사용된다.청각 필터링의 감마코네 모델의 변형과 개선에는 감마키르프 필터, 전극 및 원제로 감마코네 필터, 양면 감마코네 필터, 필터 캐스케이드 모델 등이 있으며, 이러한 모델의 다양한 레벨 의존적이고 동적으로 비선형적인 버전이 포함된다.[8]

정신음향 튜닝 곡선

청각 필터의 모양은 정신 음향 튜닝의 분석에 의해 발견되는데, 이는 대상자의 음색 검출 임계값을 마스커 파라미터의 함수로 보여주는 그래프다.[9]

정신 음향 튜닝 곡선은 노치 노이즈 방식으로 측정할 수 있다.이러한 형태의 측정은 상당한 시간이 걸릴 수 있으며 각각의 마스크된 임계값을 찾는 데 약 30분이 걸릴 수 있다.[10]노치 노이즈 방법에서 피사체는 마스커로서 노치 노이즈, 사인파(순수음)가 신호로 제시된다.노치 노이즈는 사인파 마스커를 사용할 경우 발생하는 대상 청력 박동을 방지하기 위해 마스커로 사용된다.[7]노치 노이즈는 피험자가 탐지하려는 신호 주파수를 중심으로 한 눈금이 있는 노이즈로 특정 대역폭 내의 노이즈를 포함하고 있다.노이즈 변경의 대역폭과 정현악에 대한 마스크된 임계값을 측정한다.마스킹 임계값은 신호가 마스커와 동시에 피사체에 재생될 때 동시 마스킹을 통해 계산되며 이후는 계산되지 않는다.

한 과목에서 청각 필터의 진정한 표현을 얻으려면, 많은 정신 음향 튜닝 곡선을 다른 주파수에서 신호로 계산할 필요가 있다.측정되는 각 정신 음향 튜닝 곡선의 경우 최소 5개 이상 13~15개 임계값 사이에 노치 폭이 다른 값을 계산해야 한다.[10]또한 청각 필터는 비대칭이기 때문에 많은 임계값을 계산할 필요가 있으므로 신호 주파수에 대한 노치 비대칭으로 임계값을 측정해야 한다.[9]많은 측정이 필요하기 때문에 사람의 청각 필터의 형태를 찾는 데 필요한 시간은 매우 길다.필요한 시간을 줄이기 위해 마스크된 임계값을 찾을 때 오름차순 방법을 사용할 수 있다.임계값을 계산하는 데 오름차순 방법을 사용하면 임계값을 계산하는 데 약 2분이 소요되기 때문에 필터 모양 계산에 필요한 시간이 크게 줄어든다.[10]일정 비율의 특정 자극 수준에 반응하는 대신 대상자가 먼저 음색을 들을 때 문턱이 기록되기 때문이다.

기저막의 해부학 및 생리학

인간의 는 외이, 중이, 내이의 세 부분으로 이루어져 있다.내이 안에는 달팽이가 앉아 있다.달팽이 모양의 편성은 달팽이 모양의 형상으로, 전도성 통로가 아닌 센서리노럴 경로를 통해 음향을 전달할 수 있다.[11]콜레아는 복잡한 구조로 세 겹의 유체로 이루어져 있다.스칼라 전시불리와 스칼라 매체는 레이스너 막에 의해 분리되는 반면 스칼라 매체와 스칼라 틴파니는 기준 막에 의해 분리된다.[11]아래 다이어그램은 컴파트먼트와 컴파트먼트의 복잡한 레이아웃을 보여준다.[4]

여러 구획을 보여주는 칼레아 단면도(위에서 설명한 바와 같이)

기저막은 염기에서 정점으로 진행되면서 넓어진다.따라서 밑부분(가장 얇은 부분)은 꼭지점보다 뻣뻣함이 크다.[4]이는 현무암막을 통해 이동하는 음파의 진폭은 콜레아를 통해 이동함에 따라 변화한다는 것을 의미한다.[11]진동이 콜레아를 통해 전달되면 3칸 내의 액체가 기저막으로 하여금 파동처럼 반응하게 한다.이 파동을 '여행파'라고 하는데, 이 용어는 기저막은 단순히 기저부에서 정점을 향해 하나의 단위로서 진동하지 않는다는 것을 의미한다.

사람의 귀에 소리가 전달될 때, 파동이 콜레아를 통해 이동하는 데 걸리는 시간은 5밀리초밖에 되지 않는다.[11]

저주파 이동파가 콜레아를 통과할 때 파동은 점차 진폭으로 증가하다가 거의 즉시 소멸한다.칼레아에 진동의 위치는 제시된 자극의 빈도에 따라 달라진다.예를 들어, 높은 주파수에 비해 낮은 주파수는 대부분 정점을 자극하며, 이는 콜레아의 기저부를 자극한다.기준 막의 생리학적 속성은 장소-빈도 지도의 형태로 설명할 수 있다.[12]

기저막의 단순화된 개략도로, 기저부에서 꼭지점까지의 특성 빈도 변화를 보여준다.

염기성 막은 스칼라 매질 내에 위치한 코르티의 기관을 지지한다.[4]코르티의 기관은 외부와 내부 머리카락 세포로 구성된다.한쪽 귀에는 대략 15,000개에서 16,000개의 머리카락 세포가 있다.[11]외부 머리카락 세포는 코르티 기관 위에 위치한 지각막을 향해 입체적으로 돌출되어 있다.스테레오실리아는 소리가 골막을 통해 진동을 일으킬 때 지각막의 움직임에 반응한다.이렇게 되면 입체감이 분리되고 화학적 과정이 일어날 수 있는 채널이 형성된다.결국 신호는 여덟 번째 신경에 도달하고, 그 다음 뇌에서의 처리가 이어진다.[11]

마스킹과 관계

청각 필터는 측정 방법 및 청각 시스템에서 작동하는 방식에서 마스킹과 밀접한 관련이 있다.앞에서 설명한 것처럼 필터의 임계 대역폭은 주파수가 증가할수록 크기가 증가하며, 이와 함께 필터는 레벨이 증가할수록 비대칭이 된다.

청각 필터의 비대칭.도표는 입력 수준이 증가함에 따라 청각 필터의 비대칭성이 증가하는 것을 보여준다.강조 표시된 필터는 90dB 입력 레벨(핑크)과 20dB 입력 레벨(녹색)의 형상을 보여준다.둥근(roex) 필터 형태를 보인 [13]무어와 글라스버그가 각색한 다이어그램.

청각 필터의 이 두 가지 특성은 저주파 마스크가 높은 주파수를 역주파보다 더 잘 가리는 마스킹의 상향 확산에 기여하는 것으로 생각된다.레벨을 높이면 저주파 기울기가 얕아지므로, 진폭을 증가시킴으로써 저주파는 낮은 입력 레벨에서보다 더 높은 주파수를 마스킹한다.

청각 필터는 오프 주파수 청취를 사용하여 배경 소음에서 신호를 들을 때 마스커의 영향을 줄일 수 있다.이는 마스커의 중심 주파수가 신호의 중심 주파수와 다를 때 가능하다.대부분의 상황에서 청취자는 신호에 초점을 맞춘 청각 필터를 '통과'로 청취하기로 선택하지만, 마스커가 존재하는 경우 이는 적절하지 않을 수 있다.신호에 집중된 청각 필터는 필터의 SNR이 낮도록 하고 신호 감지 능력을 감소시키는 다량의 마스커를 포함할 수도 있다.그러나, 청취자가 여전히 상당한 양의 신호를 포함하고 있지만 마스커가 적은 약간 다른 필터를 통해 청취했다면, SNR이 증가하여 청취자가 신호를 감지할 수 있게 된다.[4]

오프-주파수 청취.다이어그램 A는 신호를 중심으로 한 청각 필터와 그 필터 안에 마스커 일부가 어떻게 들어가 낮은 SNR이 발생하는지를 보여준다. 다이어그램 B는 신호의 중심이 아니라 상당한 양의 해당 신호를 포함하고 마스커가 적은 기준 막대를 따라 더 멀리 필터를 보여준다.이 시프트는 Gelfand(2004)에서 채택된 SNR. 도표를 증가시킴으로써 마스커의 효과를 감소시킨다.[4]

위의 첫 번째 다이어그램은 신호를 중심으로 한 청각 필터와 마스커의 일부가 어떻게 그 필터 안에 들어가는지를 보여준다.이것은 낮은 SNR을 초래한다.두 번째 다이어그램은 기준 막대를 따라 다음 필터를 나타내며, 신호 중심은 아니지만 상당한 양의 신호와 마스커가 포함되어 있다.이것은 SNR을 증가시킴으로써 마스커의 효과를 감소시킨다.

위 내용은 마스킹의 파워스펙트럼 모델에 적용된다.일반적으로 이 모델은 청각 필터의 배열을 포함하는 청각 시스템에 의존하며, 신호를 중심에 두거나 최상의 SNR로 필터를 선택한다.청각 필터에 빠지는 마스커만이 마스킹에 기여하고 신호 청력을 위한 사람의 문턱은 마스커에 의해 결정된다.[6]

정상 및 손상된 청각 필터

'정상' 귀에서 청각 필터는 아래 그림과 유사한 형태를 가진다.이 그래프는 주파수 선택성과 기저막의 튜닝을 반영한다.

"정상" 콜레아의 청각 필터

기저막의 튜닝은 그 기계적 구조 때문이다.기저막 밑부분은 좁고 뻣뻣하며 높은 주파수에 가장 잘 반응한다.그러나, 정점에 있는 막은 넓고 유연하며 낮은 주파수에 가장 잘 반응한다.따라서 소리의 주파수에 따라 기저동맥막의 다른 부분이 진동하며, 그 특정 주파수에서 최대 반응을 일으킨다.

그러나 손상된 귀에서는 청각 필터의 모양이 '정상' 귀와 다르다.[14]

손상된 콜레아의 청각 필터

손상된 귀의 청각 필터는 일반 귀와 비교하여 평평하고 넓다.외부 모세포가 손상되면서 주파수 선택성과 기저막의 튜닝이 줄어들기 때문이다.외발세포만 손상되면 저주파 쪽에서 필터가 더 넓어진다.외피와 내모세포가 모두 손상되었을 때 필터는 양쪽으로 넓어진다.이것은 덜 흔하다.청각 필터의 확대는 주로 필터의 저주파 쪽에 있다.이것은 낮은 주파수 마스킹, 즉 위에서 설명한 마스킹의 상향 확산에 대한 민감도를 증가시킨다.[6]

참고 항목

참조

  1. ^ https://archive.org/details/bstj12-4-377 Bell System Technical Journal, 1933년 10월, "Loudness, 그것의 정의, 측정 및 계산"
  2. ^ Fletcher, Harvey (1940). "Auditory Patterns". Reviews of Modern Physics. 12 (1): 47–65. Bibcode:1940RvMP...12...47F. doi:10.1103/RevModPhys.12.47.
  3. ^ Campbell, M.; Greated, C. (1987). The Musician's Guide to Acoustics. New York: Schirmer Books. ISBN 978-0-02-870161-5.
  4. ^ a b c d e f g h i Gelfand, S. A. (2004). Hearing: an introduction to psychological and physiological acoustics (4th ed.). New York: Marcel Dekker. ISBN 978-0-585-26606-0.
  5. ^ Munkong, R.; Biing-Hwang Juang (May 2008). "Auditory perception and cognition". IEEE Signal Processing Magazine. 25 (3): 98–117. Bibcode:2008ISPM...25...98M. doi:10.1109/MSP.2008.918418.
  6. ^ a b c d e f g h i Moore, B. C. J. (1998). Cochlear hearing loss. London: Whurr Publishers Ltd. ISBN 978-0-585-12256-4.
  7. ^ a b c Moore, B. C. J. (1986). "Parallels between frequency selectivity measured psychophysically and in cochlear mechanics". Scand. Audio Suppl. (25): 129–52.
  8. ^ R. F. Lyon; A. G. Katsiamis; E. M. Drakakis (2010). "History and Future of Auditory Filter Models" (PDF). Proc. ISCAS. IEEE.
  9. ^ a b Glasberg, B. R.; Moore, B. C. J. (1990). "Derivation of auditory filter shapes from notched-noise data". Hear. Res. 47 (1–2): 103–138. doi:10.1016/0378-5955(90)90170-T.
  10. ^ a b c Nakaichi, Takeshi; Watanuki, Keisuke; Sakamoto, Shinichi (2003). "A simplified measurement method of auditory filters for hearing-impaired listeners". Acoustical Science and Technology. 24 (6): 365–375. doi:10.1250/ast.24.365.
  11. ^ a b c d e f Plewes, K. (2006). Anatomy and physiology of the ear.
  12. ^ "Promenade 'round the Cochlea". 2003.
  13. ^ Moore, B. C. J.; Glasberg, B. R. (1987). "Formulae describing frequency selectivity as a function of frequency and level, and their use in calculating excitation patterns". Hearing Research. 28 (2–3): 209–225. doi:10.1016/0378-5955(87)90050-5. ISSN 0378-5955. PMID 3654390.
  14. ^ Moore, B. C. J. (2003). An introduction to the psychology of hearing (5th ed.). San Diego, CA: Academic Press. ISBN 978-0-12-505627-4.

외부 링크

  • P.N. 바실라키스, K. (2007) 피츠.SRA: 소리 신호의 스펙트럼 및 거칠기 분석을 위한 웹 기반 연구 도구.Northwest Academic Computing Consortium이 J. Middleton, Eastern Washington University에 보조금을 지급함