심리 음향학

Psychoacoustics

정신음향학인간이 다양한 소리를 어떻게 인지하는지에 대한 과학적 연구와 청각학을 수반하는 정신물리학 분야이다.좀 더 구체적으로, 그것은 소리와 관련심리적 반응을 연구하는 과학의 한 분야이다.심리 음향학은 심리학, 음향학, 전자 공학, 물리학, 생물학, 생리학, 컴퓨터 과학을 [1]포함한 많은 분야의 학문 간 분야이다.

배경

청각은 순수하게 기계적인 파동 전파 현상이 아니라 감각적이고 지각적인 사건이다. 다시 말해, 사람이 무언가를 들었을 때, 무언가가 공기를 통해 이동하는 기계적인 음파로 에 도달하지만, 귀 안에서 그것은 신경 활동 전위로 변환된다.포유류의 달팽이관 외모세포(OHC)는 달팽이관 분할의 기계적 반응에 대한 높은 감도와[clarification needed] 더 나은 주파수 분해능을 일으킨다.이 신경 맥박들은 그들이 지각되는 뇌로 이동한다.따라서 오디오 프로세싱과 같은 음향학의 많은 문제에서는 환경의 역학뿐만 아니라 사람의 청각 [clarification needed][citation needed]체험에 귀와 뇌가 모두 관여한다는 사실도 고려하는 것이 유리하다.

를 들어 내이(,)는 음성 파형을 신경 자극으로 변환하는 데 상당한 신호 처리를 수행하므로 파형 간의 특정 차이를 감지할 [2]수 없습니다.MP3와 같은 데이터 압축 기술은 이 [3]사실을 활용합니다.또한 귀는 다른 강도 수준의 소리에 대해 비선형 반응을 보입니다. 이러한 비선형 반응을 라우드니스라고 합니다.전화망이나 오디오 노이즈 저감 시스템은, 송신전에 데이터 샘플을 비선형 압축해 [4]재생용으로 확대하는 것으로, 이 사실을 이용한다.귀의 비선형 응답의 또 다른 효과는 주파수에 가까운 소리가 팬텀 비트 노트 또는 상호 변조 왜곡 제품을 [5]발생시킨다는 것입니다.

"심리 음향학"이라는 용어는 인지 심리학과 개인적인 기대, 편견, 그리고 성향이 음향 미학과 예민함에 대한 청취자들의 상대적인 평가와 비교, 그리고 다양한 악기의 상대적인 품질에 대한 청취자들의 다양한 결정에 미칠 수 있는 영향에 대한 논의에서도 발생한다.nd 퍼포먼스"듣고 싶은(또는 기대하는) 말을 듣는다"는 표현은 [citation needed]그러한 논의에 포함될 수 있다.

인식의 한계

동일한 밝기 등고선입니다.음성 주파수 대역의 중간에서 피크 감도는 2 ~4 kHz입니다.

인간의 귀는 일반적으로 20Hz(0.02kHz) ~ 20,000Hz(20kHz) 범위소리를 들을 수 있습니다.상한은 나이가 들수록 감소하는 경향이 있으며, 대부분의 성인은 16kHz 이상을 들을 수 없습니다.음악 [6]톤으로 식별된 최저 주파수는 이상적인 실험실 조건에서 12Hz입니다.4~16Hz의 톤은 인체의 촉각으로 지각할 수 있습니다.

귀의 주파수 분해능은 1000-2000Hz 옥타브 내에서 약 3.6Hz이다.즉, 3.6Hz보다 큰 피치의 변화는 임상 [6]환경에서 인지할 수 있다.그러나 더 작은 피치 차이는 다른 방법을 통해 인지할 수 있다.예를 들어, 두 개의 피치의 간섭은 종종 톤 음량의 반복적인 변화로 들릴 수 있습니다.이 진폭 변조는 두 톤의 주파수 차이와 동일한 주파수로 발생하며 이를 비팅이라고 합니다.

서양 음악 표기법에 사용되는 반음계는 선형 주파수 음계가 아니라 로그 음계이다. 스케일과 바크 스케일과 같은 다른 스케일은 인간의 청각에 대한 실험에서 직접 도출되었으며(이 스케일은 지각 연구에 사용되지만 일반적으로 음악 작곡에는 사용되지 않음), 고주파 끝에서는 주파수가 대략 로그이지만 저주파 끝에서는 거의 선형이다.

가청음의 강도 범위는 매우 넓다.사람의 고막은 음압의 변화에 민감하며 몇 마이크로파스칼(μPa)에서 100kPa 이상까지의 압력 변화를 감지할 수 있습니다.이러한 이유로 음압 수준도 로그로 측정되며, 모든 압력은 20μPa(또는 1.97385−10×10atm)를 기준으로 합니다.따라서 가청 하한은 0dB 정의되지만 상한은 명확하게 정의되지 않습니다.상한은 귀가 물리적으로 손상되거나 소음으로 인한 청력 손실을 일으킬 수 있는 한계에 대한 질문이다.

가청 하한을 보다 엄격하게 조사하면 소리를 들을 수 있는 최소 임계값이 주파수에 따라 결정됩니다.다양한 주파수의 테스트 톤에 대해 이 최소 강도를 측정함으로써 주파수의존성 절대청각(ATH) 곡선을 도출할 수 있다.일반적으로 귀는 1 - 5 kHz 사이의 민감도 피크(즉, 가장 낮은 ATH)를 나타내지만, 노년층의 귀는 [7]2 kHz 이상의 민감도 감소를 보인다.

ATH는 등가명도 등고선 중 가장 낮다.등요도 등고선은 음압 수준(dB SPL)이 동일한 음량으로 인식되는 가청 주파수 범위를 나타냅니다.연구소에서 1933년 Fletcher와 Munson이 헤드폰을 통해 재생한 순수한 음색을 사용하여 등시음 등고선을 처음 측정했으며, 이들이 수집한 데이터를 Fletcher-Munson 곡선이라고 한다.주관적인 음량 측정이 어려웠기 때문에 플레처-먼슨 곡선은 많은 피험자에 대해 평균화되었다.

Robinson과 Dadson은 1956년에 이 과정을 개선하여 무반향실에서 측정된 전면 음원에 대한 등음도 곡선의 새로운 세트를 얻었습니다.로빈슨-대드슨 곡선은 1986년에 ISO 226으로 표준화되었다.2003년에 ISO 226은 12개의 국제 연구에서 수집된 데이터를 사용하여 등가명도 등고선으로 개정되었다.

사운드 현지화

음원의 위치 파악은 음원의 위치를 결정하는 과정입니다.뇌는 음원을 특정할 수 있도록 두 귀 사이의 크기, 톤, [8]타이밍의 미묘한 차이를 이용합니다.국부화는 방위각 또는 수평각, 천정각 또는 수직각, 거리(정지음의 경우) 또는 속도(이동음의 [9]경우)의 3차원 위치로 설명할 수 있습니다.대부분의 네 발 달린 동물인 인간은 수평 방향의 탐지에는 능숙하지만, 귀가 대칭으로 놓여 있기 때문에 수직 방향의 탐지에는 능숙하지 않다.올빼미의 어떤 종은 귀를 비대칭으로 배치하고 세 개의 평면 모두에서 소리를 감지할 수 있는데,[10] 이는 어둠 속에서 작은 포유동물을 사냥하기 위한 적응이다.

마스킹 효과

오디오 마스킹 그래프

청자가 무음 상태에서 주어진 음향 신호를 들을 수 있다고 가정합니다.다른 소리가 재생되고 있는 동안 신호가 재생되고 있는 경우(메스커), 청취자가 들을 수 있도록 신호가 더 강해야 합니다.마스킹이 발생하기 위해 마스커가 원래 신호의 주파수 성분을 가질 필요는 없습니다.마스크된 신호는 마스커보다 약해도 들을 수 있습니다.마스킹은 신호와 마스커가 함께 재생될 때(예를 들어, 한 사람이 소리를 지르는 동안 속삭이는 경우) 발생하며, 청취자는 더 큰 마스커에 의해 가려지기 때문에 더 약한 신호를 듣지 못합니다.마스킹은 마스커가 시작되기 전 또는 마스커가 멈춘 후 신호에도 발생할 수 있습니다.예를 들어, 갑자기 큰 박수 소리가 한 번 울리면 바로 앞이나 바로 뒤에 오는 소리가 들리지 않을 수 있습니다.후방 마스킹의 효과는 전방 마스킹보다 약합니다.마스킹 효과는 심리음향학 연구에서 널리 연구되어 왔다.마스커의 레벨을 변경하고 임계값을 측정한 후 유사한 특징을 드러내는 정신물리학적 튜닝 곡선의 다이어그램을 작성할 수 있습니다.마스킹 효과는 MP3 등의 손실 오디오 부호화에도 사용됩니다.

기본이 누락됨

2f, 3f, 4f, 5f 등(여기서 f는 특정 주파수)의 관계에 있는 고조파 일련의 주파수를 제시하면 인간은 피치가 f라는 것을 인식하는 경향이 있다.청각적 예는 유튜브에서 찾을 수 [11]있다.

소프트웨어

지각 오디오 코딩은 정신 음향학 기반 알고리즘을 사용합니다.

심리음향 모델은 주어진 디지털 오디오 신호의 어떤 부분을 안전하게 제거할 수 있는지, 즉 (의식적으로) 인식된 소리의 품질에 큰 손실을 주지 않고 설명함으로써 고품질 손실 신호 압축을 제공합니다.

조용한 도서관에서 박수 소리가 고통스러울 정도로 크게 들릴지 몰라도 번화한 도심 거리에서 차가 역효과를 낸 후에는 거의 눈에 띄지 않는다.따라서 전체 압축률에 큰 이점이 있으며, 심리음향 분석을 통해 압축된 음악 파일이 고품질 마스터의 1/10~1/12 크기로 나타나지만 비례적인 품질 손실은 눈에 띄게 줄어듭니다.이러한 압축은 현대의 거의 모든 손실 오디오 압축 포맷의 기능입니다.이러한 포맷에는 Dolby Digital(AC-3), MP3, Opus, Ogg Vorbis, AAC, WMA, MPEG-1 Layer II(여러 국가에서 디지털 오디오 방송용으로 사용) 및 ATRAC(MiniDisc일부 워크맨 모델에서 사용되는 압축) 등이 있습니다.

정신 음향학은 인체 해부학, 특히 앞서 설명한 것처럼 소리를 감지하는 귀의 한계에 크게 기초하고 있다.요약하면 다음과 같은 제한이 있습니다.

압축 알고리즘은 인간의 청각 범위 밖의 소리에 낮은 우선순위를 할당할 수 있습니다.중요하지 않은 컴포넌트에서 중요한 컴포넌트로 조심스럽게 비트를 이동시킴으로써 이 알고리즘은 청취자가 가장 인식할 가능성이 높은 소리를 가장 정확하게 표현하도록 합니다.

음악

정신 음향학은 음악 심리학과 음악 치료와 관련된 주제와 연구를 포함합니다.벤자민 보레츠와 같은 이론가들은 정신 음향학의 결과 중 일부는 음악적인 [12]맥락에서만 의미가 있다고 생각한다.

Irv Teibel's Environments 시리즈 LP(1969–79)는 심리적 [13]능력을 향상시키기 위해 특별히 출시된 상업적인 사운드의 초기 사례이다.

응용정신음향학

심리 음향 모형

심리음향학은 오랫동안 컴퓨터 과학과 공생 관계를 유지해왔다.인터넷의 선구자인 J. C. R. Ricklider와 Bob Taylor는 모두 정신 음향학 대학원 수준의 연구를 마쳤으며, BBN Technologies는 최초의 패킷 교환 네트워크를 구축하기 전에 음향 문제에 대한 컨설팅을 전문으로 했습니다.

릭라이더는 "음높이 지각의 이중 이론"[14]이라는 제목의 논문을 썼다.

심리 음향학은 소프트웨어 개발의 많은 분야에 적용되며, 개발자들은 디지털 신호 처리에서 입증되고 실험적인 수학적 패턴을 매핑합니다.MP3Opus 등의 많은 오디오 압축 코덱은 압축비를 높이기 위해 심리 음향 모델을 사용합니다.극장이나 가정에서 음악을 재생하기 위한 전통적인 오디오 시스템의 성공은 정신 음향학과[15] 정신 음향학적 고려가 정신 음향학적 음장 [16]합성 같은 새로운 오디오 시스템을 만들어냈기 때문이다.게다가, 과학자들은 손상, 손상 또는 [17]살상할 수 있는 주파수를 방출하는 새로운 음향 무기를 만드는 데 제한적인 성공을 거두고 실험했다.심리음향학도 음파탐지에 활용되어 여러 개의 독립된 데이터 차원을 쉽게 해석할 [18]수 있습니다.이를 통해 공간 오디오와 음파 탐지 컴퓨터[19] 게임 및 기타 애플리케이션(드론 비행 및 영상 유도 [20]수술 )에서 청각 안내를 수행할 수 있습니다.음악가와 예술가들이 원치 않는 악기의 주파수를 가리고 다른 주파수를 향상시킴으로써 새로운 청각 경험을 계속 창조하는 오늘날 음악에도 적용된다.그러나 또 다른 애플리케이션은 소형 또는 저음질 확성기의 설계로, 기초가 누락되는 현상을 이용하여 확성기가 물리적으로 생산할 수 있는 주파수보다 낮은 주파수에서 저음의 효과를 줄 수 있다(참고 자료 참조).

자동차 제조업체들은 엔진과 심지어 문까지 특정한 [21]소리를 내기 위해 엔지니어링합니다.

「 」를 참조해 주세요.

관련 필드

심리 음향학 토픽

레퍼런스

메모들

  1. ^ Ballou, G (2008). Handbook for Sound Engineers (Fourth ed.). Burlington: Focal Press. p. 43.
  2. ^ Christopher J. Plack (2005). The Sense of Hearing. Routledge. ISBN 978-0-8058-4884-7.
  3. ^ Lars Ahlzen; Clarence Song (2003). The Sound Blaster Live! Book. No Starch Press. ISBN 978-1-886411-73-9.
  4. ^ Rudolf F. Graf (1999). Modern dictionary of electronics. Newnes. ISBN 978-0-7506-9866-5.
  5. ^ Jack Katz; Robert F. Burkard & Larry Medwetsky (2002). Handbook of Clinical Audiology. Lippincott Williams & Wilkins. ISBN 978-0-683-30765-8.
  6. ^ a b Olson, Harry F. (1967). Music, Physics and Engineering. Dover Publications. pp. 248–251. ISBN 978-0-486-21769-7.
  7. ^ Fastl, Hugo; Zwicker, Eberhard (2006). Psychoacoustics: Facts and Models. Springer. pp. 21–22. ISBN 978-3-540-23159-2.
  8. ^ 톰슨, 다니엘 M.오디오에 대해서:프로젝트 또는 Professional Recording Studio를 최대한 활용합니다.보스턴, 매사추세츠주: 버클리, 2005.인쇄.
  9. ^ 도로, 커티스컴퓨터 음악 튜토리얼.케임브리지, 매사추세츠: MIT, 2007.인쇄.
  10. ^ Lewis, D.P. (2007) :올빼미 귀와 청각.올빼미 페이지 [온라인]제공 : http://www.owlpages.com/articles.php?section=Owl+Physiology&title=Hearing [2011년 4월 5일]
  11. ^ Acoustic, Musical. "Missing Fundamental". YouTube. Archived from the original on 2021-12-20. Retrieved 19 August 2019.
  12. ^ Sterne, Jonathan (2003). The Audible Past: Cultural Origins of Sound Reproduction. Durham: Duke University Press. ISBN 9780822330134.
  13. ^ Cummings, Jim. "Irv Teibel died this week: Creator of 1970s "Environments" LPs". Earth Ear. Retrieved 18 November 2015.
  14. ^ Licklider, J. C. R. (January 1951). "A Duplex Theory of Pitch Perception" (PDF). The Journal of the Acoustical Society of America. 23 (1): 147. Bibcode:1951ASAJ...23..147L. doi:10.1121/1.1917296. Archived (PDF) from the original on 2016-09-02.
  15. ^ Ziemer, Tim (2020). "Conventional Stereophonic Sound". Psychoacoustic Music Sound Field Synthesis. Current Research in Systematic Musicology. Vol. 7. Cham: Springer. pp. 171–202. doi:10.1007/978-3-030-23033-3_7. ISBN 978-3-030-23033-3. S2CID 201142606.
  16. ^ Ziemer, Tim (2020). Psychoacoustic Music Sound Field Synthesis. Current Research in Systematic Musicology. Vol. 7. Cham: Springer. doi:10.1007/978-3-030-23033-3. ISBN 978-3-030-23032-6. ISSN 2196-6974. S2CID 201136171.
  17. ^ "Archived copy". Archived from the original on 2010-07-19. Retrieved 2010-02-06.{{cite web}}: CS1 maint: 제목으로 아카이브된 복사(링크)
  18. ^ Ziemer, Tim; Schultheis, Holger; Black, David; Kikinis, Ron (2018). "Psychoacoustical Interactive Sonification for Short Range Navigation". Acta Acustica United with Acustica. 104 (6): 1075–1093. doi:10.3813/AAA.919273. S2CID 125466508.
  19. ^ CURAT. "Games and Training for Minimally Invasive Surgery". CURAT. University of Bremen. Retrieved 15 July 2020.
  20. ^ Ziemer, Tim; Nuchprayoon, Nuttawut; Schultheis, Holger (2019). "Psychoacoustic Sonification as User Interface for Human-Machine Interaction" (PDF). International Journal of Informatics Society. 12 (1). arXiv:1912.08609. doi:10.13140/RG.2.2.14342.11848. Retrieved 15 July 2020.
  21. ^ Tarmy, James (5 August 2014). "Mercedes Doors Have a Signature Sound: Here's How". Bloomberg Business. Retrieved 10 August 2020.

원천

외부 링크