인텔리전스(통신)

Intelligibility (communication)

음성 의사소통에서, 지능성은 주어진 조건에서 얼마나 말이 이해할 수 있는지를 나타내는 척도다. 지능성은 음성 신호의 수준(크지만 너무 크지는 않음), 품질, 배경 소음의 유형과 수준, 반향(일부 반사가 있지만 너무 많지는 않음), 통신 장치를 통한 음성의 경우 통신 시스템의 특성에 영향을 받는다. 언어의 지능화에 대한 일반적인 표준 측정은 STI이다. 음성 지능의 개념은 음성학, 인적 요인, 음향 공학, 음향학을 포함한 여러 분야와 관련이 있다.

중요한 영향

언어는 인간 사이의 주요 의사소통 방법으로 여겨진다. 인간은 나이, 성별, 모국어, 그리고 말하는 사람과 듣는 사람 사이의 사회적 관계와 같은 많은 요인에 따라 말하고 듣는 방식을 바꾼다. 언어의 지능은 또한 언어와 청각 장애와 같은 병리학에 의해 영향을 받을 수 있다.[1][2]

마지막으로, 음성 정보성은 통신 채널의 환경이나 한계에 의해 영향을 받는다. 방에서 말하는 메시지가 얼마나 잘 이해될 수 있는가는 그 사람의 영향을 받는다.

소음 수준 및 잔향

지능은 배경 소음과 너무 많은 반향에 의해 부정적인 영향을 받는다. 소리 수준과 소음 수준 사이의 관계는 일반적으로 신호 대 잡음 비 측면에서 설명된다. 배경 소음 레벨이 35~100dB인 경우, 100% 정보화를 위한 임계값은 일반적으로 12dB의 신호 대 잡음 비율이다.[3] 12dB는 신호가 배경 소음보다 약 4배 더 커야 함을 의미한다. 음성 신호의 범위는 약 200–8000 Hz이며, 인간의 청력은 약 20–20,000 Hz이므로 마스킹의 효과는 마스킹 소음의 주파수 범위에 따라 달라진다. 또한 다른 음성 사운드는 음성 주파수 스펙트럼의 다른 부분을 사용하므로 흰색 또는 분홍색 소음과 같은 연속적인 배경 소음은 경쟁 음성, 다중 대화기 또는 "칵테일 파티" 잡음 또는 산업 기계와 같은 가변적이거나 변조된 배경 소음과 달리 지능에 다른 영향을 미칠 것이다.

반향은 또한 시간이 지남에 따라 음성 소리를 흐리게 함으로써 음성 신호에 영향을 미친다. 이는 마스킹이 정지, 글라이드, 모음 전환, 음치, 지속시간 등의 프로소딕 단서 등을 통해 모음을 안정적으로 강화시키는 효과가 있다.[4]

배경 잡음이 지능을 떨어뜨린다는 사실은 듣기 작업을 더 어렵게 하여 천장 효과를 보상하는 방법으로 구어 및 일부 언어 인식 실험을 포함하는 청력계 테스트에 이용된다.

인텔리전스 표준

측정할 수량 측정 단위 좋은 가치관
STI 인텔리전스(내부적으로 알려진) > 0.6
CIS 인텔리전스(내부적으로 알려진) > 0.78
%Alcons 관절 손실(미국에서 인기) < 10%
C50 명료도 지수(독일 내에서도 널리 분포) > 3dB
RASTI(오브솔레트) 인텔리전스(내부적으로 알려진) > 0.6

파동의 1~2%만이 왜곡에 영향을 받지 않더라도 단어 표현은 높은 수준을 유지한다.[5]

다양한 유형의 음성으로 지능화

롬바르드 연설

인간의 뇌롬바르드 효과라고 불리는 과정을 통해 자동으로 소음으로 만들어진 말을 바꾼다. 이런 연설은 정상적인 연설에 비해 지능이 높아졌다. 시끄러울 뿐만 아니라 음역 원근의 주파수가 높아지고 모음의 지속시간이 길어진다. 사람들은 또한 더 눈에 띄는 얼굴 움직임을 보이는 경향이 있다.[6][7]

비명을 지르다.

고함치는 음성이 증가하면 음성 정보가 감소하기 때문에 롬바르드 말보다 더 잘 이해할 수 없다.[8] 하지만, "외치는 연설의 무한정 최고봉 클리핑은 그것을 거의 정상 연설처럼 이해할 수 있게 만든다."[9]

명료한 말씨

청력 장애가 있는 사람과 대화할 때 명확한 말을 사용한다. 더 느린 말하기 속도, 점점 더 긴 일시 정지, 높은 음성 강도, 증가된 단어 지속 시간, "대상" 모음 포마제, 인접 모음에 비해 높은 자음 강도, 그리고 다수의 음운론적 변화(모음 감소 및 더 많은 릴리스 정지 버스트 포함)가 특징이다.[10][11]

유아 지도 언어

유아 주도 언어(또는 아기 대화)는 성인을[12] 대상으로 하는 언어보다 간결한 구문과 작고 이해하기 쉬운 어휘를 사용한다.성인을 대상으로 하는 언어에 비해 기본 빈도가 높고 피치 범위가 과장되고 속도가 느리다.[13]

인용발언

인용발언은 사람들이 구어 연구에 자의적으로 관여할 때 발생한다. 그것은 일반적인 언어보다 느린 템포와 적은 연결 음성 과정(예: 핵 모음의 단축, 단어의 최종 자음 생략)을 가지고 있다.[14]

하이퍼스페이스 스피치

하이퍼스페이스 효과로도 알려진 하이퍼스페이스 스피치(hyperspace speech)는 사람들이 환경 잡음의 존재에 대해 오도될 때 발생한다. 그것은 음향 신호로부터 정보를 복구하는 과정에서 청취자 측에서 인지된 어려움을 완화하기 위해 음성 모음 표적의 F1과 F2를 수정하는 것을 포함한다.[14]

메모들

  1. ^ 폰탄, L, 펠레그리니, T, 올코즈, J, & 아바드, A. (2015, 9월) 발음도덕도 점수에서 오더된 언어의 이해도를 예측하는 것. 인터스피치 2015(pp. pp-1)의 인터스피치 2015(SLPAT 2015) 위성 워크숍에서 지원 기술을 위한 음성 및 언어 처리에 관한 워크숍.
  2. ^ 폰탄, L, 페라네, I, 파리나스, J, 핀퀴어, J, 타디외, J, 마그넨, C, ... & 퓰그라베, C. (2017년) 자동 음성 인식은 연령과 관련된 청력 손실을 시뮬레이션한 청취자의 음성 이해성과 이해를 예측한다. 음성, 언어, 청각 연구 저널, 60(9), 2394-2405.
  3. ^ 로빈슨, G. S. 카살리, J. G. (2003) 음성 통신 및 노이즈에서의 신호 감지 E. H. Berger, L. H. Royster, J. D. 로이스터, D. P. 드리스콜, M. Layne (Eds.), 소음 매뉴얼 (5번째) (pp. 567-600). 페어팩스, VA: 미국산업위생협회.
  4. ^ Garcia Lecumberri, M. L.; Cooke, M.; Cutler, A. (2010). "Non-native speech perception in adverse conditions: A review". Speech Communication. 52 (11–12): 864–886. doi:10.1016/j.specom.2010.08.014. hdl:11858/00-001M-0000-0012-BE5A-C.
  5. ^ C.J. 무어(1997) 청각 심리학 소개. 학술 출판사. 제4판 학술 출판사. 런던 ISBN 978-0-12-505628-1
  6. ^ Junqua, J. C. (1993). "The Lombard reflex and its role on human listeners and automatic speech recognizers". The Journal of the Acoustical Society of America. 93 (1): 510–524. Bibcode:1993ASAJ...93..510J. doi:10.1121/1.405631. PMID 8423266.
  7. ^ 서머스, W.V;Pisoni, D.B.;Bernacki, R.H.;Pedlow, R. 나;스토크스, M.A.(1988년).소음의 연설 생산에 미치는 영향:.음향 및 지각 analyses".저널지에 음향 협회. 84(3):917–928.Bibcode:1988ASAJ...84..917S. doi:10.1121/1.396660.PMC3507387.PMID 3183209.PDF는 승객을 머신에 2016-03-04 Archived.
  8. ^ Pickett, J. M. (1956). "Effects of Vocal Force on the Intelligibility of Speech Sounds". The Journal of the Acoustical Society of America. 28 (5): 902–905. Bibcode:1956ASAJ...28..902P. doi:10.1121/1.1908510.
  9. ^ 맥클린, 도널드 J. & A. 마이클 홀, "고함소리의 지능화", 무선통신과 비행안전의 항공의료 측면에 관한 심포지엄의 진행, AGARD/NATO 자문 보고서 19, 페이지 10-1에서 10-13 (1969년 12월 런던 12월)
  10. ^ Picheny, M. A.; Durlach, N. I.; Braida, L. D. (1985). "Speaking clearly for the hard of hearing I: Intelligibility differences between clear and conversational speech". Journal of Speech and Hearing Research. 28 (1): 96–103. doi:10.1044/jshr.2801.96. PMID 3982003.
  11. ^ Picheny, M. A.; Durlach, N. I.; Braida, L. D. (1986). "Speaking clearly for the hard of hearing. II: Acoustic characteristics of clear and conversational speech". Journal of Speech and Hearing Research. 29 (4): 434–446. doi:10.1044/jshr.2904.434. PMID 3795886.
  12. ^ 스노우 CE. 퍼거슨 CA. (1977년). 어린이와 대화: 케임브리지 대학 출판부의 언어 입력 및 획득. ISBN 978-0-521-29513-0
  13. ^ Kuhl, P. K.; Andruski, J. E.; Chistovich, I. A.; Chistovich, L. A.; Kozhevnikova, E. V.; Ryskina, V. L.; Stolyarova, E. I.; Sundberg, U.; Lacerda, F. (1997). "Cross-language analysis of phonetic units in language addressed to infants". Science. 277 (5326): 684–686. doi:10.1126/science.277.5326.684. PMID 9235890.
  14. ^ a b Johnson K, Flemming E, Wright R (1993). "The hyperspace effect: Phonetic targets are hyperarticulated". Language. 69 (3): 505–28. doi:10.2307/416697. JSTOR 416697.

외부 링크