음성 지각 운동 이론
Motor theory of speech perception시리즈의 일부 | ||||||
음성학 | ||||||
---|---|---|---|---|---|---|
언어학 시리즈의 일부 | ||||||
하위 분야 | ||||||
조음 | ||||||
| ||||||
음향학 | ||||||
| ||||||
인식 | ||||||
| ||||||
언어 포털 | ||||||
음성 인식의 운동 이론은 사람들이 음성에서 [1][2][3][4][5]발생하는 소리 패턴을 확인하는 것이 아니라 발음되는 성관 제스처를 확인함으로써 음성 단어를 인식한다는 가설이다.원래 음성 인식은 선천적이고 인간 고유의 특수 모듈을 통해 수행된다고 주장했다.모듈의 개념은 이론의 [5]최신 버전에서 검증되었지만, 음성 모터 시스템의 역할은 음성 조음을 생성하는 것뿐만 아니라 그것들을 감지하는 것이라는 생각은 여전히 남아 있다.
그 가설은 내부보다는 언어 인식 분야 밖에서 더 많은 관심을 얻었다.이것은 특히 성관에 [5]의해 만들어진 것을 포함하여 운동 운동의 생산과 인식을 연결하는 거울 뉴런의 발견 이후 증가했습니다.이 이론은 1950년대 앨빈 리버먼과 프랭클린 S에 의해 Haskins 연구소에서 처음 제안되었다. 쿠퍼, 그리고 도널드 생크바일러, 마이클 스터더트 케네디, 이그나티우스 매팅리, 캐롤 파울러, 더글러스 휠런에 의해 개발되었습니다.
기원과 개발
이 가설은 시각장애인을 위해 소리 대신 철자를 [6]읽는 읽기 기계를 만들기 위해 패턴 재생을 사용한 연구에서 비롯되었다.이것은 일련의 청각적 소리의 연속로서 어떻게 구음이 음향 스펙트로그램에 대응하는지에 대한 면밀한 조사로 이어졌다.이것은 연속된 자음과 모음이 서로 시간적으로 겹친다는 것을 발견했다.[7][8][9]이는 음성이 어쿠스틱한 알파벳이나 암호처럼 들리는 것이 아니라 겹치는 음성 제스처의 암호로 들린다는 것을 시사했다.
어소시에이션의 어프로치
처음에, 그 이론은 연상론이었다: 유아들은 그들이 듣는 말을 모방하고 이것은 명료함과 감각적 결과 사이의 행동적 연관성을 이끈다.나중에, 이 명백한 모방은 단락이 되어 음성 [8]지각이 될 것이다.하지만, 이 이론의 이러한 측면은 언어학 이전의 유아들이 이미 다른 언어 [1]소리를 분리하는데 사용되는 대부분의 발음 대조를 감지할 수 있다는 발견과 함께 사라졌다.
인식주의적 접근법
행동주의적 접근법은 음성 [1]모듈이 있는 인식주의적 접근법으로 대체되었다.모듈이 입력의 근위 또는 즉시 레벨이 아닌 숨겨진 원위부 객체의 관점에서 음성을 감지했습니다.이에 대한 증거는 음성 처리가 이중 [10]인식과 같이 특수하다는 연구 결과였다.
원위부 객체 변경
처음에, 음성 인식은 두 가지 모두에 해당하는 음성 객체와 연결된다고 가정했다.
이것은 나중에 운동 [1]명령보다는 음성 제스처, 그리고 실제 움직임이 아닌 언어적인 수준에서 [12]화자가 의도한 제스처를 포함하도록 수정되었다.
근대 개정판
음성 인식은 비스피치 소리(예를 들어 이중 [13]인식의 문을 닫는 등)에 대해 발생할 수 있다는 것이 밝혀졌기 때문에 "스피치는 특별하다"는 주장은 [5]철회되었다.
거울 뉴런
거울 뉴런의 발견은 언어 지각의 운동 이론에 대한 새로운 관심을 불러 일으켰고,[14] 비록 비평가들도 있지만, 그 이론은 여전히 [5]지지자들을 가지고 있다.
지지하다
비감사 제스처 정보
음성이 물리적으로 만들어지는 방식에 따라 식별되는 경우, 비청취 정보는 여전히 주관적으로 "소리"로 들리더라도 음성 인식에 통합되어야 한다.사실, 이것은 사실이다.
- 맥거크 효과는 청각 신호와 다른 음성 음절의 생성이 그것과 동기화되는 것을 보는 것이 청각 신호 지각에 영향을 미친다는 것을 보여준다.즉, 누군가 "바"를 들었지만 "가"를 발음하는 비디오를 본다면, 그들이 듣는 것은 다르다. 어떤 사람들은 그들이 "다"를 듣는다고 믿는다.
- 사람들은 [15]말하는 사람을 볼 수 있다면 소음 속에서 말하는 것을 더 쉽게 들을 수 있다.
- 사람들은 그들의 생산이 촉각적으로 [16]느껴질 때 음절을 더 잘 들을 수 있다.
범주적 인식
음성합성기를 사용하면 /b//에서 /d//에서 /dɑ/로 이어지는 연속체를 따라 또는 /d//에서 /t//로 이어지는 연속체의 음성 개시 시간에 음성음을 변경할 수 있다(예를 들어).청취자가 두 개의 다른 소리를 구별하도록 요구받았을 때, 그들은 소리가 지속적으로 변화하더라도 소리를 별개의 범주에 속하는 것으로 인식한다.즉, 10개의 소리(한쪽 극단에서는 /d//, 다른 한쪽 극단에서는 /t//, 중간에서는 음계가 다른 소리)는 모두 음향적으로 다를 수 있지만, 듣는 사람은 모두 /d// 또는 /t//로 듣게 됩니다.마찬가지로 영어 자음 /d/는 다른 발음 컨텍스트(예를 들어 /du/의 /d/는 기술적으로 /di/의 것과 같지 않음)에 걸쳐 음향 세부 사항이 다를 수 있지만, 청취자가 인식하는 모든 /d/는 하나의 범주(음성 치경 파열음)에 속하며, 이는 "언어적 표현은 추상적, cano"이기 때문이다.니컬, 음성 세그먼트 또는 이러한 [17]세그먼트의 기초가 되는 제스처.이것은 인간이 범주적 지각으로 말을 식별한다는 것을 암시하며, 따라서 언어 지각의 운동 이론에 의해 제안된 것과 같은 전문화된 모듈이 올바른 [18]궤도에 오를 수 있다는 것을 암시한다.
음성 모조
만약 사람들이 음성으로 제스처를 들을 수 있다면, 음성 [19]섀도우에서처럼 헤드폰에서 들리는 단어들이 반복될 때처럼, 말의 모방은 매우 빨라야 한다.사람들은 들은 음절을 보통 [20]음절보다 더 빨리 반복할 수 있다.
음성 제작
- 청각 발화는 성관 [21]근육과 운동[22] 피질, 전운동 [23]피질을 활성화시킨다.음성 인식에서 청각과 시각 입력의 통합은 또한 그러한 [24]영역과 관련이 있다.
- 운동전피질을 교란시키면 언어단위의 지각이 교란된다.[25]
- 운동 영역의 활성화는 음성 [26]제스처를 만드는 음성 트랙 아티큘레이터와 연결되는 음소적 특징의 관점에서 발생합니다.
- 음성의 지각은 [27]발음을 담당하는 관절자의 운동 표현을 선제적으로 자극함으로써 도움을 받는다.
- 청각 및 운동 피질 결합은 특정 신경 발화 빈도 [28]범위로 제한됩니다.
지각-액션 메쉬
지각과 생산이 일반적으로 모터 시스템에서 결합되어 있다는 증거가 존재합니다.이것은 동작을 보고([29]또는 소리를 듣고) 그 동작을 수행함으로써 활성화되는 거울 뉴런의 존재에 의해 뒷받침된다.또 다른 근거의 원천은 지각과 [30]작용에 사용되는 표현 사이의 공통 코딩 이론이다.
비판
음성 지각의 운동 이론은 이론 언어학 같은 다른 분야에서는 더 인기가 있지만, 음성 지각 분야에서는 널리 받아들여지지 않는다.세 명의 지지자가 지적했듯이, "언어 인식 분야에는 지지자가 거의 없으며, 많은 저자들은 주로 비판적 논평을 제공하기 위해 그것을 인용한다."[5]p. 361그것에 대한 몇 가지 비판들이 존재한다.[31][32]
여러 소스
음성 인식은 문맥과 같은 비생산적인 정보의 원천에 의해 영향을 받는다.개별 단어는 고립되어서는 이해하기 어렵지만 문장 맥락에서 들으면 쉽다.따라서 음성 인식은 최적의 방법으로 [31]함께 통합된 여러 소스를 사용하는 것으로 보인다.
생산.
언어지각운동이론은 유아의 언어운동능력이 언어지각능력을 예측한다고 예측하지만 실제로는 [33]그 반대다.또한 음성 생성의 결함이 음성 인식을 손상시킬 것이라고 예상하지만,[34] 그렇지 않다.하지만, 이것은 유아들이 어린 시절에 모방으로 모든 생산-인식 패턴을 배워야 했던 이론의 첫 번째 그리고 이미 대체된 행동주의 버전에만 영향을 미친다.이것은 더 이상 모터스피치 이론가들의 주류가 아니다.
음성 모듈
전문 음성 모듈에 대한 몇 가지 근거 출처가 뒷받침되지 못하고 있다.
- 이중 인식은 도어 [13]슬램으로 확인할 수 있습니다.
- 맥거크 효과는 또한 누군가에게 농구공이 튀는 비디오를 보여주지만 탁구공이 [citation needed]튀는 소리를 내는 것과 같은 비언어적 자극으로 달성될 수 있다.
- 범주적 인식의 경우, 청취자는 단일 음성 범주 내의 음향 차이에 민감할 수 있다.
그 결과, 이 이론의 이 부분은 일부 [5]연구자들에 의해 폐기되었다.
하위 태스크
음성 인식의 운동 이론에 대한 증거는 완전한 구어 또는 구어 문장이 아닌 음성 단위를 사용하는 음절 식별과 같은 과제로 제한된다.그 결과, "음성 지각은 때때로 하위 수준에서의 음성 인식을 가리키는 것으로 해석됩니다.그러나 이러한 연구의 궁극적인 목표는 아마도 생태학적으로 유효한 조건, 즉 성공적인 음성 음성 처리가 궁극적으로 정신 사전 및 청각 [35]이해와 접촉하는 상황을 지원하는 신경 과정을 이해하는 것이다."그러나 이는 "암묵적인 조사 대상인 음성 인식에 대한 약한 연결"[35] 문제를 야기한다.
새들
새들은 또한 서로의 새소리를 [36]성대모사 측면에서 듣는다고 제안되어 왔다.
「 」를 참조해 주세요.
레퍼런스
- ^ a b c d Liberman, A. M.; Cooper, F. S.; Shankweiler, D. P.; Studdert-Kennedy, M. (1967). "Perception of the speech code". Psychological Review. 74 (6): 431–461. doi:10.1037/h0020279. PMID 4170865.
- ^ Liberman, A. M.; Mattingly, I. G. (1985). "The motor theory of speech perception revised". Cognition. 21 (1): 1–36. CiteSeerX 10.1.1.330.220. doi:10.1016/0010-0277(85)90021-6. PMID 4075760. S2CID 112932.
- ^ Liberman, A. M.; Mattingly, I. G. (1989). "A specialization for speech perception". Science. 243 (4890): 489–494. doi:10.1126/science.2643163. PMID 2643163.
- ^ Liberman, A. M.; Whalen, D. H. (2000). "On the relation of speech to language". Trends in Cognitive Sciences. 4 (5): 187–196. doi:10.1016/S1364-6613(00)01471-6. PMID 10782105. S2CID 12252728.
- ^ a b c d e f g Galantucci, B.; Fowler, C. A.; Turvey, M. T. (2006). "The motor theory of speech perception reviewed". Psychonomic Bulletin & Review. 13 (3): 361–377. doi:10.3758/bf03193857. PMC 2746041. PMID 17048719.
- ^ 리버먼, A. M. (1996년)스피치: 특별한 코드.케임브리지, 매사추세츠: MIT 프레스.ISBN 978-0-262-12192-7
- ^ Liberman, A. M.; Delattre, P.; Cooper, F. S. (1952). "The role of selected stimulus-variables in the perception of the unvoiced stop consonants". The American Journal of Psychology. 65 (4): 497–516. doi:10.2307/1418032. JSTOR 1418032. PMID 12996688.
- ^ a b c Liberman, A. M.; Delattre, P. C.; Cooper, F. S.; Gerstman, L. J. (1954). "The role of consonant-vowel transitions in the perception of the stop and nasal consonants". Psychological Monographs: General and Applied. 68 (8): 1–13. doi:10.1037/h0093673. PDF
- ^ Fowler, C. A.; Saltzman, E. (1993). "Coordination and coarticulation in speech production". Language and Speech. 36 ( Pt 2-3) (2–3): 171–195. doi:10.1177/002383099303600304. PMID 8277807. S2CID 7199908. PDF
- ^ Liberman, A. M.; Isenberg, D.; Rakerd, B. (1981). "Duplex perception of cues for stop consonants: Evidence for a phonetic mode". Perception & Psychophysics. 30 (2): 133–143. doi:10.3758/bf03204471. PMID 7301513.
- ^ Liberman, A. M. (1970). "The grammars of speech and language" (PDF). Cognitive Psychology. 1 (4): 301–323. doi:10.1016/0010-0285(70)90018-6.
- ^ Liberman, A. M.; Mattingly, I. G. (1985). "The motor theory of speech perception revised" (PDF). Cognition. 21 (1): 1–36. CiteSeerX 10.1.1.330.220. doi:10.1016/0010-0277(85)90021-6. PMID 4075760. S2CID 112932.
- ^ a b Fowler, C. A.; Rosenblum, L. D. (1990). "Duplex perception: A comparison of monosyllables and slamming doors". Journal of Experimental Psychology. Human Perception and Performance. 16 (4): 742–754. doi:10.1037/0096-1523.16.4.742. PMID 2148589.
- ^ Massaro, D. W.; Chen, T. H. (2008). "The motor theory of speech perception revisited". Psychonomic Bulletin & Review. 15 (2): 453–457, discussion 457–62. doi:10.3758/pbr.15.2.453. PMID 18488668. S2CID 9266946.
- ^ MacLeod, A.; Summerfield, Q. (1987). "Quantifying the contribution of vision to speech perception in noise". British Journal of Audiology. 21 (2): 131–141. doi:10.3109/03005368709077786. PMID 3594015.
- ^ Fowler, C. A.; Dekle, D. J. (1991). "Listening with eye and hand: Cross-modal contributions to speech perception". Journal of Experimental Psychology. Human Perception and Performance. 17 (3): 816–828. doi:10.1037/0096-1523.17.3.816. PMID 1834793.
- ^ Nygaard LC, Pisoni DB (1995). "Speech Perception: New Directions in Research and Theory". In J.L. Miller, P.D. Eimas (eds.). Handbook of Perception and Cognition: Speech, Language, and Communication. San Diego: Academic Press. ISBN 978-0-12-497770-9.
- ^ Liberman, A. M.; Harris, K. S.; Hoffman, H. S.; Griffith, B. C. (1957). "The discrimination of speech sounds within and across phoneme boundaries". Journal of Experimental Psychology. 54 (5): 358–368. doi:10.1037/h0044417. PMID 13481283.
- ^ Marslen-Wilson, W. (1973). "Linguistic structure and speech shadowing at very short latencies". Nature. 244 (5417): 522–523. doi:10.1038/244522a0. PMID 4621131. S2CID 4220775.
- ^ Porter Jr, R. J.; Lubker, J. F. (1980). "Rapid reproduction of vowel-vowel sequences: Evidence for a fast and direct acoustic-motoric linkage in speech". Journal of Speech and Hearing Research. 23 (3): 593–602. doi:10.1044/jshr.2303.593. PMID 7421161.
- ^ Fadiga, L.; Craighero, L.; Buccino, G.; Rizzolatti, G. (2002). "Speech listening specifically modulates the excitability of tongue muscles: A TMS study". The European Journal of Neuroscience. 15 (2): 399–402. CiteSeerX 10.1.1.169.4261. doi:10.1046/j.0953-816x.2001.01874.x. PMID 11849307. S2CID 16504172.
- ^ Watkins, K. E.; Strafella, A. P.; Paus, T. (2003). "Seeing and hearing speech excites the motor system involved in speech production". Neuropsychologia. 41 (8): 989–994. doi:10.1016/s0028-3932(02)00316-0. PMID 12667534. S2CID 518384.
- ^ Wilson, S. M.; Saygin, A. E. P.; Sereno, M. I.; Iacoboni, M. (2004). "Listening to speech activates motor areas involved in speech production". Nature Neuroscience. 7 (7): 701–702. doi:10.1038/nn1263. PMID 15184903. S2CID 8080063.
- ^ Skipper, J. I.; Van Wassenhove, V.; Nusbaum, H. C.; Small, S. L. (2006). "Hearing Lips and Seeing Voices: How Cortical Areas Supporting Speech Production Mediate Audiovisual Speech Perception". Cerebral Cortex. 17 (10): 2387–2399. doi:10.1093/cercor/bhl147. PMC 2896890. PMID 17218482.
- ^ Meister, I. G.; Wilson, S. M.; Deblieck, C.; Wu, A. D.; Iacoboni, M. (2007). "The Essential Role of Premotor Cortex in Speech Perception". Current Biology. 17 (19): 1692–1696. doi:10.1016/j.cub.2007.08.064. PMC 5536895. PMID 17900904.
- ^ Pulvermuller, F.; Huss, M.; Kherif, F.; Moscoso del Prado Martin F; Hauk, O.; Shtyrov, Y. (2006). "Motor cortex maps articulatory features of speech sounds". Proceedings of the National Academy of Sciences. 103 (20): 7865–7870. doi:10.1073/pnas.0509989103. PMC 1472536. PMID 16682637.
- ^ d'Ausilio, A.; Pulvermüller, F.; Salmas, P.; Bufalari, I.; Begliomini, C.; Fadiga, L. (2009). "The Motor Somatotopy of Speech Perception". Current Biology. 19 (5): 381–385. doi:10.1016/j.cub.2009.01.017. PMID 19217297.
- ^ Assaneo, M. Florencia; Poeppel, David (2018). "The coupling between auditory and motor cortices is rate-restricted: Evidence for an intrinsic speech-motor rhythm". Science Advances. 4 (2): eaao3842. doi:10.1126/sciadv.aao3842. PMC 5810610. PMID 29441362.
- ^ Rizzolatti, G.; Craighero, L. (2004). "The Mirror-Neuron System". Annual Review of Neuroscience. 27: 169–192. doi:10.1146/annurev.neuro.27.070203.144230. PMID 15217330. S2CID 1729870. PDF
- ^ Hommel, B.; Müsseler, J.; Aschersleben, G.; Prinz, W. (2001). "The Theory of Event Coding (TEC): A framework for perception and action planning". The Behavioral and Brain Sciences. 24 (5): 849–878, discussion 878–937. doi:10.1017/s0140525x01000103. PMID 12239891.
- ^ a b Massaro, D. W. (1997). Perceiving talking faces: From speech perception to a behavioral principle. Cambridge, MA: MIT Press. ISBN 978-0-262-13337-1.
- ^ Lane, H (1965). "The Motor Theory of Speech Perception: A Critical Review". Psychological Review. 72 (4): 275–309. doi:10.1037/h0021986. PMID 14348425.
- ^ Tsao, F. M.; Liu, H. M.; Kuhl, P. K. (2004). "Speech perception in infancy predicts language development in the second year of life: A longitudinal study". Child Development. 75 (4): 1067–84. doi:10.1111/j.1467-8624.2004.00726.x. PMID 15260865.
- ^ MacNeilage, P. F.; Rootes, T. P.; Chase, R. A. (1967). "Speech production and perception in a patient with severe impairment of somesthetic perception and motor control". Journal of Speech and Hearing Research. 10 (3): 449–67. doi:10.1044/jshr.1003.449. PMID 6081929.
- ^ a b Hickok, G.; Poeppel, D. (2007). "The cortical organization of speech processing". Nature Reviews Neuroscience. 8 (5): 393–402. doi:10.1038/nrn2113. PMID 17431404. S2CID 6199399. 394페이지 참조
- ^ Williams, H.; Nottebohm, F. (1985). "Auditory responses in avian vocal motor neurons: A motor theory for song perception in birds". Science. 229 (4710): 279–282. doi:10.1126/science.4012321. PMID 4012321.