포맨트

Formant
F1 F2 나타내는 미국 영어 모음 [i, u, ɑ]스펙트로그램

언어 과학음운학에서, 공식은 인간 발성의 음향 공진에서 오는 넓은 스펙트럼의 최대치다.[1][2] 음향학에서 공식은 일반적으로 스펙트럼에서 넓은 피크 또는 국소 최대값으로 정의된다.[3][4] 고조파 소리의 경우, 이 정의와 함께 공식 주파수를 공명에 의해 가장 많이 증강되는 고조파 주파수로 받아들이기도 한다. 이 두 정의의 차이는 "공식자"가 소리의 생산 메커니즘을 특징짓는 것인지 또는 생산된 소리 그 자체를 특징짓는 것인지에 있다. 실제로 스펙트럼 피크의 주파수는 운에 의해 고조파가 공명 주파수와 정렬되는 경우를 제외하고 관련 공명 주파수와 약간 다르다.

방은 공진, 즉 소리가 벽과 물체에서 반사되는 방식 때문에 특정한 방의 특성을 갖는다고 말할 수 있다. 예를 들어 앨빈 루시에가 그의 작품 '방에 앉아 있다'에서 착취한 것처럼, 이러한 성격의 룸 공식자들은 특정한 주파수를 강조하고 다른 사람들을 흡수함으로써 자신을 강화시킨다.

연설과 방 모두에서, 공식은 공간의 공명의 특징이다. 이들은 음성과 같은 음향원에 흥분해 소스의 소리를 형상화(필터화)한다고 하지만, 소스 자체가 아니다.

역사

어쿠스틱한 관점에서 볼 때, 음운학은 발성의 유효 길이가 모음을 바꾼다는 생각에 심각한 문제를 가지고 있었다.[citation needed] 실제로 발성부의 길이가 바뀌면 구강 공동에 의해 형성된 모든 음향 공명기가 스케일링되고, 그 공명 주파수도 스케일링된다. 따라서, 베이스소프라노 가수와 같이 음역 길이가 다른 토커가 동일한 음성 범주에 속하는 것으로 인식되는 소리를 낼 수 있을 때 모음이 주파수에 어떻게 의존할 수 있는지는 불분명했다. 모음의 정체성을 뒷받침하는 스펙트럼 정보를 정상화시킬 방법이 있어야 했다. 헤르만은 1894년 이 문제에 대한 해결책을 제시하면서 "공식적인"이라는 용어를 사용하였다. 그에 따르면 모음은 특별한 부분적, 혹은 "공식적" 또는 "성격적"의 간헐적인 생산에 따라 특별한 음향 현상이다. "포맨트"의 빈도는 모음의 성격을 바꾸지 않고 약간 다를 수 있다. 를 들어, a의 경우, "포맨트"는 동일인에서도 350~440Hz까지 다양할 수 있다.[5]

음성학

남성 음성의[6] 평균 모음 포마감제
모음
(IPA)
포맨트1 F
(Hz)
포맨트2 F
(Hz)
차이점
F1F2
(Hz)
i 240 2400 2160
y 235 2100 1865
e 390 2300 1910
ø 370 1900 1530
ɛ 610 1900 1290
œ 585 1710 1125
a 850 1610 760
ɶ 820 1530 710
ɑ 750 940 190
ɒ 700 760 60
ʌ 600 1170 570
ɔ 500 700 200
ɤ 460 1310 850
o 360 640 280
ɯ 300 1390 1090
u 250 595 345
다이어그램의 평균 모음 공식

포머넌트는 음성, 악기[7] 또는 노래에 의해 발생하는 음향 신호의 독특한 주파수 성분이다. 인간이 음성 소리를 구별하기 위해 요구하는 정보는 주파수 스펙트럼의 피크를 명시함으로써 순수하게 정량적으로 나타낼 수 있다. 이 공식들의 대부분은 관과 실내 공진에 의해 만들어지지만, 몇 개의 휘파람 소리는 벤투리 효과 저압 구역의[citation needed] 주기적인 붕괴에서 비롯된다.

주파수가 가장 낮은 공식을 F1, 두 번째 F2, 세 번째 F라고3 한다(음성의 기본 주파수F라고0 부르기도 하지만 공식이 아니다). 대부분의 경우 두 개의 첫 번째 공식인 F1 F2 모음을 식별하기에 충분하다. 인지모음 품질과 처음 두 공식 주파수의 관계는 한 쌍의 밴드패스 필터(성악 공명 시뮬레이션)를 통해 클릭 열차를 통과하여 발생하는 '인공모음'을 들어보면 알 수 있다.

비음에는 보통 2500Hz 정도의 추가 공식이 있다. 액상[l]은 보통 1500Hz에서 추가 공식을 가지지만, 영어 "r" 소리([[])는 매우 낮은 세 번째 공식을 통해 구별된다. (2000Hz보다 훨씬 작음)

플로시브(및, 어느 정도 프라이틱스)는 주변 모음에서 포뮬러 원료의 배치를 수정한다. Bilabial sounds (such as /b/ and /p/ in "ball" or "sap") cause a lowering of the formants; on spectrograms, velar sounds (/k/ and /ɡ/ in English) almost always show F2 and F3 coming together in a 'velar pinch' before the velar and separating from the same 'pinch' as the velar is released; alveolar sounds (English /t/ and /d/) cause fewer systematic 정확히 어떤 모음이 존재하느냐에 따라 부분적으로 이웃 모음 공식의 변화 이러한 모음 형태변환 빈도의 시간변화를 '형식전환'이라고 한다.

정상 음성 음성에서, 기저 진동의 기본 주파수는 조화 오버톤이 풍부한 톱니 파동을 닮았다. 기본 주파수 또는 (더 자주) 오버톤 중 하나가 시스템의 공명 주파수보다 높으면 공명은 약하게 흥분할 뿐이고 보통 그 공명에 의해 전달되는 공식은 대부분 상실된다. 이는 소프라노 오페라 가수들이 모음을 구별하기 어려울 정도로 높은 음량을 부르는 경우에 가장 잘 드러난다.

공명 조절은 오버톤 가창으로 알려진 성악 기법의 필수 요소로 연주자가 낮은 기본 음조를 노래하고, 날카로운 공명음을 만들어 상위 고조파를 선택해 한번에 여러 음색이 노래되는 느낌을 준다.

분광기는 공식의 시각화를 위해 사용될 수 있다. 스펙트로그래프에서는 노래를 부를 때 포뮬러와 자연적으로 발생하는 하모닉을 구별하기가 어려울 수 있다. 그러나 성악 튀김과 같은 무통 기법을 통해 모음 형태로 자연적인 포메이션을 들을 수 있다.

거식추정

포뮬란트가 음역의 음향 공진으로 보이든, 대역 통과 필터와 같은 음성 스펙트럼에서 국소 맥시마로 보이든 간에 주파수와 스펙트럼 폭(대역폭)에 의해 정의된다.

이 정보를 얻기 위한 다른 방법들이 존재한다. 공식 주파수는 음향 정의에서 스펙트럼 분석기(그림) 또는 스펙트럼 분석기를 사용하여 소리의 주파수 스펙트럼에서 추정할 수 있다. 단, 음성 녹음으로부터 발성의 음향 공명(즉, 포뮬러 원제의 음성 정의)을 추정하기 위해서는 선형 예측 코딩을 사용할 수 있다. 중간 접근방식은 기본 주파수를 중화시켜 스펙트럼 엔벨롭을 추출하고 [8]그 다음에야 스펙트럼 엔벨롭에서 국소 최대치를 찾는다.

공식 그림

처음 두 가지 공식은 모음의 품질을 결정하는 데 중요하며, 종종 개방/폐쇄(또는 낮은/높은) 및 앞/뒤 치수(전통적으로 완전히 정확하지는 않지만, 의 모양과 위치와 관련이 있다)에 해당한다고 한다. 따라서 첫 번째 공식 F1 개방 또는 저모음(예: [a])의 주파수가 높고(예: [i] 또는 [u])의 주파수가 낮으며, 두 번째 공식 F2 앞모음(예: [i])의 주파수가 높고, 뒷모음([9][10]예: [u])의 주파수가 낮다. 그림 1에서 볼 수 있는 바와 같이

그림 1 공식 플롯의 개략도

모음은 거의 항상 4개 이상의 구별 가능한 공식들을 가지고 있을 것이다; 때때로 6개 이상의 공식들이 있다. 그러나 모음 품질을 결정하는데 있어 처음 두 가지 공식은 가장 중요하며, 반올림과 같은 모음 품질의 일부 측면을 포착하기에 충분하지는 않지만,[11] 두 번째 공식에 대한 첫 번째 공식의 플롯의 관점에서 표시되는 경우가 많다.[12] 언어 또는 방언의 모음이 전통적인 청각 모음 차트 및 공식 플롯에 어떻게 표시될 수 있는지 예를 노르웨이의 경우 볼 수 있다.

대니얼 존스의 모음 발음을 포착하려는 시도는 국제음반협회가 사다리꼴로 모음을 플로팅하는 결과를 낳았지만, 실제 조형 공간은 더 삼각형일 수 있다. 이 그림은 IPA의 기본모음을 발음하는 존과 존 웰스의 공식적 표현들을 이상화한 것이다.[13]

많은 작가들은 형식 그림에서 모음의 위치를 전통적인 모음 사각형 그림에서 모음의 위치와 최적의 정렬을 찾는 문제를 다루었다. 라데포게드의[14] 선구적인 연구는 멜 스케일을 사용했는데, 이 스케일이 그림 1에서처럼 헤르츠에 표현된 기본 주파수의 음향 측정보다 음조의 청각 스케일과 더 밀접하게 일치한다고 주장되었기 때문이다. 멜 척도의 두 가지 대안으로는 바크 척도와 ERB 비율 척도가 있다. 이 세 척도의 비교는 헤이워드, 페이지 141에 나타나 있으며, 헤르츠 척도와 바크 척도에 기초한 공식 플롯은 페이지 153에 비교된다.[15] 널리 채택되고 있는 공식 플롯을 개선하기 위한 또 다른 전략은 F2 값이 아니라 주어진 모음의 F1과 F2의 차이를 수평축에 표시하는 것이다.

싱어의 포뮬러

훈련된 스피커와 클래식 가수의 주파수 스펙트럼에 대한 연구는 특히 남자 가수의 경우 3000Hz(2800Hz~3400Hz) 전후의 명확한 공식성분을 나타내며, 음성이나 훈련되지 않은 스피커나 가수의 스펙트럼에는 존재하지 않는다. 그것은 하나 이상의 성악부의 높은 공명 중 하나 이상과 연관되어 있다고 생각된다.[16][17] 오케스트라를 통해 가수를 듣고 이해할 수 있게 하는 것은 3000Hz의 에너지 증가다. 이 공식은 성악 훈련을 통해 활발히 개발되는데, 예를 들어 소위 '보스디 스트레가'나 '마녀의 목소리'[18] 운동을 통해 발생하며, 성악의 일부가 공명기로 작용하여 발생한다.[19][20] 고전음악과 성악 교육학에서는 이러한 현상을 스퀼로라고도 한다.

참고 항목

참조

  1. ^ 티츠, I.R. (1994년) 프렌티스 홀의 음성 제작 원리, ISBN978-0-13-717893-3.
  2. ^ Titze, I.R., Baken, R.J. Bozeman, K.W., Granqvist, S. Henrich, N., Herbst, C.T., Howard, D.M., Hunter, E.J., Kaelin, D., Kent, R.D., Löfqvist, A., McCoy, S., Miller, D.G., Noé, H., Scherer, R.C., Smith, J.R., Story, B.H., Švec, J.G., Ternström, S. and Wolfe, J. (2015) "Toward a consensus on symbolic notation of harmonics, resonances, and formants i발성" J. 음향. Soc. America. 137, 3005–3007.
  3. ^ 1968년 도버가 재인쇄한 J.H.(1938) 사이언스 앤 뮤직 청바지.
  4. ^ 미국 음향 협회 표준 사무국 (1994년) ANSI S1.1-1994 (R2004) 미국 국립 표준 음향 용어, (12.41) 뉴욕 멜빌 미국 음향 협회
  5. ^ 맥켄드릭, J. G. (1903) 실험용 음성학. 1902년 6월 30일(pp. 241–259)에 끝나는 연도 스미스소니언 기관의 등록 위원회 연례 보고서. 스미스소니언 협회.
  6. ^ Catford, J.C. (1988) 옥스퍼드 대학 출판부의 실용적 음성학 소개, 페이지 161. ISBN 978-0198242178
  7. ^ Reuter, Christoph(2009): 악기를 블렌딩하고 부분 마스킹하는 데 있어서 형식적인 자세와 마이크로 변조의 역할. 인: 미국음향학회지(JASA, Journal of America) 126,4,4,2237
  8. ^ Kawahara, Hideki; Masuda-Katsuse, Ikuyo; de Cheveigné, Alain (April 1999). "Restructuring speech representations using a pitch-adaptive time–frequency smoothing and an instantaneous-frequency-based F0 extraction: Possible role of a repetitive structure in sounds". Speech Communication. 27 (3–4): 187–207. doi:10.1016/S0167-6393(98)00085-5.
  9. ^ 라데포게드, 피터(2006) 음성학 과정 보스턴, MA: 톰슨 워즈워스, 페이지 188. ISBN 1-4130-2079-8
  10. ^ 라데포게드, 피터(2001) 모음과 자음: 언어의 소리 소개, MA: 블랙웰, 페이지 40. ISBN 0-631-21412-7
  11. ^ 단념, David(1997) '표준 남부 영국식 영어 발음 모노퐁 모음의 공식' 국제 음성학회지 27쪽 47–55.
  12. ^ 헤이워드, 카트리나(2000) 실험용 음성학, 영국 할로우: 피어슨, 페이지 149. ISBN 0-582-29137-2
  13. ^ 제프 린지, 2013년 모음 공간. [1]
  14. ^ Ladefoged, P. (1967). Three Areas of Experimental Phonetics. Oxford. p. 87.
  15. ^ Hayward, K. (2000). Experimental Phonetics. Longman. ISBN 0-582-29137-2.
  16. ^ 선드버그, J. (1974년). 미국 음향학회지 55, 838–844 "노래하는 포맨트에 대한 기술적 해석"
  17. ^ Bele, Irene velsvik (December 2006). "The Speaker's Formant". J. Voice. 20 (4): 555–578. doi:10.1016/j.jvoice.2005.07.001.
  18. ^ Frisell, Anthony (2007). Baritone Voice. Boston: Branden Books. p. 84. ISBN 978-0-8283-2181-5.
  19. ^ "Vocal Ring, or The Singer's Formant". The National Center for Voice and Speech. Retrieved 2008-04-07.
  20. ^ Sundberg, Johan (1987). The science of the singing voice. DeKalb, Ill: Northern Illinois University Press. ISBN 0-87580-542-6.

외부 링크