음소성 맞춤법

Phonemic orthography

음소성 맞춤법이란 문자(글자 기호)가 언어의 음소(중대한 구어 소리)에 대응하는 맞춤법(언어를 쓰는 시스템)을 말한다. 자연 언어는 음소거성 정자를 완벽하게 가지고 있는 경우는 드물다. 알파벳 문자 체계를 기반으로 한 정문에서 높은 수준의 그래핀-포네메 서신을 기대할 수 있지만, 이 서신이 얼마나 완전한지에 대해서는 차이가 있다. 예를 들어, 영어 맞춤법은 알파벳이지만 매우 비독점적이다; 한때는 현대 철자가 유래된 중세 영어 단계 동안 대부분 음소독적이었지만, 맞춤법이 훨씬 더 안정적이면서 구어 영어는 빠르게 변화하여 현대 비독점적 상황을 초래했다. 그러나 영어에 비해 상대적으로 최근에 현대화되었기 때문에 루마니아어, 이탈리아어, 터키어, 스페인어, 핀란드어, 체코어, 라트비아어, 에스페란토어, 한국어, 스와힐리어 맞춤법 체계가 일관된 음소 표현에 훨씬 가까워졌다.

덜 형식적인 용어로, 음소성 맞춤법이 높은 언어는 규칙적인 철자를 가진 것으로 묘사될 수 있다. 또 다른 용어는 깊고 얕은 맞춤법의 용어로, 맞춤법의 깊이는 맞춤법이 음소거에서 벗어나는 정도를 의미한다. 이 개념은 또한 음절과 같은 알파벳이 아닌 문자 시스템에도 적용될 수 있다.

이상적인 음소성 맞춤법

이상적인 음소성 맞춤법에서는, 그 언어의 음소(글자)와 음소 사이에는 완전한 일대일 대응(편향)이 있을 것이고, 각각의 음소체는 변함없이 그 상응하는 그래프로 표현될 것이다. 그래서 단어의 철자는 분명하지 않고 투명하게 그 발음을 나타낼 것이고, 반대로 단어의 발음을 아는 화자는 의심의 여지없이 그 철자를 유추할 수 있을 것이다. 그 이상적인 상황은 드물지만 몇 개 국어로 존재한다.

이상적으로 음소거적인 맞춤법의 논란이 되는 예는 세르보-크로아티아어[contradictory]. 그것의 알파벳(라틴어는 물론 세르비아 키릴 문자)에는 30개의 그래프가 있는데, 각각 음소 중 하나에 고유하게 대응된다. 이 완벽해 보이지만 단순한 음소 표기법은 세르비아 언어학자 부크 카라지치에 의해 1814년에 처음으로 키릴 문자, 그리고 크로아티아 언어학자 류데빗 가즈에 의해 1830년에 라틴 문자인 19세기에 달성되었다. 그러나 가즈의 라틴어 알파벳과 세르비아어 키릴어 둘 다 짧은 모음과 긴 모음, 그리고 세르보 크로아티안이 가지고 있는 비토닉(짧은 모음은 쓰여 있다), 상승음, 하강음 등을 구분하지 않는다. 세르보크로아티아어에서는 음색과 모음 길이를 선택적으로 (라틴어로) ⟨e,, ⟨ē,, ⟨é,, ⟨ȅ, ⟨ȇ, ⟨⟩로 표기하였고, 특히 사전에서는 ⟨⟩로 표기하였다.

또 다른 이상적인 음소 표기법은 당시 발표된 언어 창조자 L. L. Zamenhof의 원리 "한 글자, 한 소리"[1]를 채용하면서 에스페란토 고유의 것이다.

이 음운론적 이상과는 뚜렷한 두 가지 유형의 편차가 있다. 첫 번째 경우, 정확한 일대일 서신은 분실될 수 있지만(예를 들어, 어떤 음소는 한 글자 대신 디그그래프로 표현될 수도 있다), "정규성"은 유지된다: 발음으로부터 철자를 예측하는 알고리즘(그러나 더 복잡한 알고리즘)이 있고, 그 반대의 경우도 있다. 두 번째 경우, 특정 단어들은 다른 단어들과 다른 규칙에 따라 철자되고 발음되기 때문에 진정한 불규칙성이 도입되며, 발음이나 그 반대의 경우로부터 철자를 예측하는 것은 더 이상 불가능하다. 이상과의 두 유형의 편차에 대한 일반적인 사례는 다음 절에서 설명한다.

음소성 맞춤법으로부터의 편차

맞춤법이 일대일 그래핀-포네임 대응의 이상에서 벗어날 수 있는 몇 가지 방법이 아래에 열거되어 있다. 첫 번째 목록은 예측 가능성에 영향을 주지 않고 철자와 발음 사이의 관계를 더 복잡하게 만드는 경향이 있는 편차를 포함한다(위 단락 참조).

사례 1: 일반

발음과 철자는 여전히 예측 가능한 방식으로 일치한다.

  • 음운은 하나의 문자(프랑스어로 digraph che, 독일어로 trigraph sch의 경우처럼)가 아니라 여러 글자로 된 일련의 문자로 나타낼 수 있다. 그것은 다중 글씨를 더 작은 단위로 분해할 수 없는 경우에만 예측가능성을 유지한다. 어떤 언어는 digraph와 일련의 개별 문자를 구별하기 위해 diacritic을 사용하며, 어떤 언어는 그것을 구별하기 위해 그 언어에 대한 지식을 필요로 한다; 영어로 gatherd거품을 비교한다.

예:

로만치에서의 schs-ch

ng 대 n + g(웨일스어)

manx Gaelic의 ch 대 ch: 이것은 두 개의 다른 단일 음소에 동일한 digraph가 사용되는 약간 다른 경우다.

프랑스어의 ai 대

이는 원래 다른 언어에 사용되었던 알파벳(이러한 예에서 라틴 알파벳)을 사용했기 때문에 현재 언어에서 사용되는 모든 음운에 사용할 수 있는 문자가 단 한 개도 없기 때문이다(일부 정자법에서는 사용 가능한 문자의 수를 늘리기 위해 분음법과 같은 장치를 사용한다).

  • 때로는 반대로 하나의 문자가 둘 이상의 음소의 순서를 나타낼 수도 있다(x는 영어와 다른 언어로 /ks/ 시퀀스를 나타낼 수 있기 때문이다).
  • 때때로, 통신의 규칙은 더 복잡하고 인접한 글자에 의존하는데, 종종 역사적 소리 변화의 결과로 나타난다(이탈리아어caci의 발음에 대한 규칙과 영어로는 침묵 e).

사례 2: 불규칙함

발음과 철자가 항상 예측 가능한 방식으로 일치하는 것은 아니다.

  • 때로는 서로 다른 글자가 같은 음소에 대응하기도 한다(를 들어 폴란드어에서는 u와 o가 모두 음소 /u/로 발음된다). 그것은 종종 역사적 이유 때문이다(폴란드 글자들은 원래 다른 음소를 의미했고, 후에 음운학적으로 병합되었다. 그것은 발음으로 인한 철자의 예측가능성에 영향을 미치지만 꼭 그 반대의 경우도 아니다. 또 다른 예는 현대 그리스어에서 발견되는데, 그 음운 /i/는 six, η, η, ε, υ, υ의 6가지 다른 방법으로 쓸 수 있다.
  • 반대로, 문자나 문자 그룹은 다른 맥락에서 다른 음소에 대응될 수 있다. 예를 들어, 영어에서 th는 /th/ (이것과 같이) 또는 /through/ (에서)로 발음할 수 있고, /th/ (고atherd와 같이)로 발음할 수 있다.
  • 철자는 그렇지 않으면 역사적인 발음을 나타낼 수 있다; 철자법이 구어의 건전한 변화를 반드시 따라잡는 것은 아니다. 예를 들어 영국 기사kdigraph gh는 모두 한 번 발음되었지만(후자는 여전히 일부 스코틀랜드의 품종에서 발음된다) 소리가 없어진 후에는 더 이상 단어의 음소 구조나 발음을 나타내지 않는다.
  • 철자법은 고려되고 있는 것과 다른 방언의 발음을 나타낼 수 있다.
  • 외래어의 철자는 종종 소스 언어의 맞춤법에 따라 붙거나 영향을 받는다(영어 단어 발레와 파히타, 각각 프랑스어와 스페인어). 그러나 일부 외래어로는 규칙성이 어느 쪽인가에 의해 유지된다.
    • 스펠링에 맞추어 발음을 자연화(러시아어 р withр과 같이, 프랑스어 운전기사의 pronouncedорр과 같이, 그러나 러시아어 모음 감소의 일반적인 규칙에 따라 [ʂɐˈforor]를 발음함; 또한 철자 발음 참조) 또는 에 의해 발음함
    • 철자를 고유하게 한다(를 들어, 축구는 스페인어로 futbol, 포르투갈어futebol이다).
  • 철자법은 민간 어원(영어 단어에서처럼 딸꾹질, 에서처럼 기침을 하고 에서처럼 상상된 단어와의 연관성 때문에 스펠링하는 것)이나 먼 어원(영어 단어 부채에서 라틴어의 영향으로 침묵 b가 추가된 것)을 반영할 수 있다.
  • 철자법은 역사적 발음의 반영이기도 하지만 순수 음소체적(다음 절 참조)보다는 형태소독적 구조를 반영할 수도 있다.

대부분의 맞춤법에는 인접어(글자 산스크리트어 및 기타 인도어)에서 발음이 인접한 소리에 의해 영향을 받는 산디(sandhi)라고 알려진 발음의 변화를 반영하지 않는다. 언어는 또한 일본어의 히라가나가타카나 음절과 같은 어휘 항목의 구별되는 집합(그리고 라틴어와 그리스어에서 파생된 단어의 영어 맞춤법에서의 다른 처리)에 다른 기호 집합이나 다른 규칙을 사용할 수 있다.

형태소독성 특징

알파벳 맞춤법에는 순수한 음소체보다는 형태소체적인 특징이 있는 경우가 많다. 이는 철자가 발음뿐만 아니라 단어의 근본적인 형태학적 구조를 어느 정도 반영하고 있다는 것을 의미한다. 따라서 다른 형태의 형태(최소 의미 있는 언어 단위)는 발음의 차이에도 불구하고 종종 동일하거나 유사하게 철자된다. 그것은 종종 역사적인 이유 때문에 발생한다; 형태소독성 철자는 주어진 형태소의 발음의 변화를 야기시킨 역사적 소리가 변화하기 전의 이전 발음을 반영한다. 그러한 철자는 읽을 때 단어를 인식하는 데 도움이 될 수 있다.

맞춤법에서 형태소성 형상의 몇 가지 예는 아래에 설명되어 있다.

  • 영어 복수형 형태소는 고양이와 도그즈아닌 고양이와 개와 같이 /s/ 또는 /z/로 발음되는지 여부에 관계없이 -s로 표기된다. 왜냐하면 [s][z] 소리는 그 환경에 따라 자동으로 다르게 발음되는 동일한 기본 형태소음의 형태이기 때문이다. (단, 이 형태소가 /ɪz/의 형태를 취하면, 모음의 첨가는 교회, 대중이라는 철자에 반영된다.)
  • 마찬가지로 영어 과거형 형태소는 /d/, /t/ 또는 / /d/로 발음되는지에 관계없이 -ed로 쓰여진다.
  • 많은 영어 단어들은 현재의 발음보다 어원과 형태학을 반영하는 철자를 가지고 있다. 예를 들어, 기호서명은 같은 뜻이지만 두 단어에서 다르게 발음되는 철자 ⟨sign⟩을 포함한다. 다른 예로는 과학 /sasa/ vs 양심 /prival/ vs. prrival/ vs. prequel /prival/, 국가 /neɪ/ vs 민족주의 /nn/, 특수 /spɛ/ vs. /spiː/가 있다.
  • 음운론적 동화는 스페인어와 같은 다른 음운론적 맞춤법에도 반영되지 않는 경우가 많은데, 이 경우 오베너는 bp로 '포텐'과 옵티니스타 '최적주의자'가 쓰이지만, 음성과 관련하여 일반적으로 중성화되며 발음이 모두 중성화되며 발음이 모두 [3] 또는 발음이 모두 발음이 모두 [p]와 같이 다양한 방식으로 발음된다.n.[2] 반면 세르보 크로아티아어(세르비안, 크로아티아어, 보스니아어, 몬테네그린) 철자는 동화를 반영하기 때문에 сра/스르비자 "세르비아"를 쓰지만 срп/srpski "세르비안"을 쓴다.
  • 많은 언어(독일어, 폴란드어, 러시아어 등)에서 발생하는 최종적인 절제는 일반적으로 철자에 반영되지 않는다. 예를 들어 독일어에서는 bad "bath"가 /t/로 발음되더라도 최종 ⟨d⟩로 스펠링되므로, d /d/로 발음되는 동사 baden(bathe)과 같은 다른 형태학적으로 관련된 형태에 해당된다. (Compare Rat, "advises", "advise"). 그러나 터키어 맞춤법은 보다 엄격히 음소이다. 예를 들어, 독일어 철자를 사용했을 때처럼 *ed가 아닌 (그리고 "meat"의 단어와 동일) 에더 "does"의 명령어는 et로 발음되는 것처럼(그리고 독일어 철자를 사용했을 때와 마찬가지로) 에더 "does"의 어구가 발음된다.

한국의 한글은 수세기에 걸쳐 음소독성이 강한 철자법에서 형태론적인 철자법으로 변화해 왔다.[citation needed] 일본 카나는 거의 완전히 음소독성이지만, 특히 ぢ di와 du du(표준 도쿄 방언에서 じjiずzu가 아닌 발음)의 사용에서 ぢdi와 づdu(표준 도쿄 방언에서 pronunciationji와 ずzu가 아닌)의 음소독성 측면이 몇 가지 있다. 그것은 정식으로 다른 모라에 대한 요츠가나의 합병과 결합된 렌다쿠 사운드 변화에서 나온 것이다. 러시아어 맞춤법도 대부분 형태포폰이 있는데, 이는 모음 감소, 자음 동화, 최종 불분명한 일탈을 반영하지 않기 때문이다. 또한 어떤 자음 조합은 무성 자음을 가지고 있다.

결함 있는 맞춤법

결함 있는 맞춤법은 언어에서 모든 음소 또는 음소 구분을 나타낼 수 없는 것이다. 영어 맞춤법이 이처럼 부족한 예로는 음성과 음성을 구분할 수 없는 "th" 음소(각각//음소/ 및 /음소/)의 구분이 부족하며, 각각 이런 / writtenðɪs/(음소)와 얇은 /ˈɪnn/(음소음)과 같은 단어로 발생하며, 둘 다 ⟨th로 표기되어 있다.

언어간 비교

높은 그래핀 대 포네임 및 음운 대 그라페임 대응(대출 단어 및 동화에 따른 예외 제외)을 가진 언어는 다음과 같다.

다른 많은 음소성 맞춤법들은 약간 결함이 있다: 말레이어 (incl) 말레이시아어인도네시아어), 이탈리아어, 말티어, 웨일스어, 카자흐어 등은 모음을 완전히 구분하지 않으며, 리투아니아어, 라트비아어, 세르보크로아티아어음색과 모음 길이를 구분하지 않으며(또한 리투아니아어와 라트비아어의 추가 모음), 소말리아어는 모음 음음을 구분하지 않으며, 그래프 bv는 모든 품종에서 동일한 음음을 나타낸다. 아메리카 대륙의 스페인어에서는 /s/문자 s, c, z로 나타낼 수 있다. 힌디, 푼자비, 구자라티, 마이틸리 등과 같은 현대 인도-아리아어들은 schwa 삭제를 특징으로 하며, 여기서 암묵적 기본 모음은 명시적으로 표시하지 않고 억제된다. 마라티와 같은 다른 것들은 모음 길이에 대한 그래핀 대 포네임 대응력이 높지 않다.

프랑스어는, 묵음문자코모음엘리듬을 많이 사용하는 것으로 보아 철자와 발음의 일치성이 크게 부족한 것 같지만, 발음에 관한 규칙은 비록 복잡하기는 하지만, 상당한 정확도로 일관되고 예측 가능하다. 그러나 실제 문자 대 음성 대응은 종종 낮으며 일련의 소리들은 철자되는 여러 가지 방법을 가지고 있을 수 있다.

독일어, 헝가리어(주로 ly를 제외한 음소, j는 같은 소리를 나타내지만 자음과 모음 길이는 항상 정확한 것은 아니며 다양한 철자법이 발음이 아닌 어원을 반영하고 있다), 포르투갈어, 현대 그리스어(그리스 알파벳으로 표기됨) 등의 표기법과 한국어 한글이 고려되기도 한다. 중간 깊이를 가져야 한다(예를 들어, 위에서 설명한 것처럼 많은 형태소독성 특징을 포함한다).

프랑스어와 비슷하게, 독일어의 발음을 철자에서 유추하는 것은 그 반대의 경우보다 훨씬 쉽다. 예를 들어 /eː/와 /ɛː/를 병합하는 화자의 경우, 음소 /eː/는 e, ee, eh, é 또는 éh로 표기할 수 있다.

영어 철자법은 매우 비독점적이다. 영어 철자의 불규칙성은 부분적으로는 맞춤법이 확립된 후에 대모음 변화가 일어났기 때문이기도 하고, 부분적으로는 영어가 다른 시기에 많은 외래어를 습득하여 원래의 철자를 다양한 수준으로 유지하고 있기 때문이기도 하며, 부분적으로는 철자의 정규화(시대에서 벗어나기) 때문이다.많은 다른 철자법이 동일한 단어에 대해 허용될 수 있는 경우) 중앙 계획 없이 기간 동안 임의적으로 발생하였다. 그러나 영어조차도 철자로부터 발음을 예측하는 일반적인 규칙들을 가지고 있고, 이러한 규칙들 중 몇몇은 대부분 성공적이다; 발음으로 철자를 예측하는 규칙들은 더 높은 실패율을 가지고 있다.

에스페란토로이반과 같은 대부분의 구성 언어들은 대부분 음소성 맞춤법을 가지고 있다.

일본어(히라가나, 가타카나)의 음절체계는 거의 완벽하게 얕은 맞춤법의 예로서, and과 づ(위에서 논함)의 사용과 は, sounds, へ, へ의 음을 わ, お, え을 역사적 가나 사용의 유물로 나타내는 경우는 예외로 한다. 또한 음조의 억양에 대한 표시도 없어, 말씨가 구별되는 箸이나 橋(히라가나어로 はは)과 같은 단어의 동음이의어가 된다.

자비에 마르주는[3] 인공 신경망을 이용해 정형외과적 깊이에 따라 17개의 정자법을 순위를 매긴다. Among the tested orthographies, Chinese and French orthographies, followed by English and Russian, are the most opaque regarding writing (i.e. phonemes to graphemes direction) and English, followed by Dutch, is the most opaque regarding reading (i.e. graphemes to phonemes direction); Esperanto, Arabic, Finnish, Korean, Serbo-Croatian and Turkish a읽기와 쓰기에 매우 얕다; 이탈리아어는 읽기에 얕고 쓰기에 매우 얕다, 브레톤, 독일어, 포르투갈어, 스페인어는 읽고 쓰기에 얕다.

맞춤법 재조정

시간이 흐르면서 영어와 프랑스어처럼 발음이 바뀌고 철자가 시대에 뒤떨어진다. 음소성 맞춤법을 유지하기 위해서는 다양한 언어 규제자에 의해 시도되고 다른 철자 개량자들에 의해 제안된 것처럼 그러한 시스템은 주기적인 업데이트가 필요할 것이다.

때때로 단어의 발음이 철자와 일치하도록 바뀐다; 이것을 철자 발음이라고 한다. 이것은 외래어에 가장 흔하지만, 때때로 확립된 고유어의 경우에도 발생한다.

일부 영어의 개인명과 지명에서는 이름의 철자와 발음의 관계가 너무 멀어 음소와 제자 사이의 연관성을 쉽게 파악할 수 없다. 더욱이 많은 다른 말로 하면, 그 발음은 그 뒤이어 고정된 철자에서 진화했기 때문에 음소체는 그 반대보다는 그 자모를 나타낸다고 말할 수밖에 없다. 그리고 많은 기술적인 전문용어에서는 의사소통의 주요 매체는 구어보다 문자 언어여서 음운은 자모를 나타내며, 그 단어가 어떻게 발음되는가는 중요하지 않다. 게다가, 읽고 쓸 줄 아는 사람들이 단어로 듣는 것을 인식하는 소리는 단어의 실제 철자에 의해 상당한 영향을 받는다.[4]

때때로, 나라들은 작문을 현대 언어와 다시 맞추기 위해 철자 개혁을 겪게 한다. 이러한 것들은 터키가 아랍 문자에서 라틴어 기원의 터키어 문자로 전환했을 때와 같이 단순한 철자 변경과 단어 형태에서부터 전체 문자 체계 자체를 바꾸는 것에 이르기까지 다양하다.

음성 표기법

국제음반문자(IPA)와 같은 음성 표기법은 발음을 표준적인 형태로 기술하는 것을 목적으로 한다. 그것들은 종종 문어 철자의 모호함을 해결하기 위해 사용된다. 그들은 또한 이전에 쓰여진 양식이 없는 언어를 쓰는 데 사용될 수도 있다. IPA와 같은 시스템은 음소표현이나 보다 상세한 음성정보를 표시하는 데 사용될 수 있다(좁음 넓은 전사 참조).

음소성 맞춤법은 음성 표기법과 다르다. 음소성 맞춤법에서 알로폰은 보통 동일한 그래프로 표현되는 반면, 순수한 음소성 문자에서는 음성적으로 구별되는 알로폰이 구별되도록 요구할 것이다. 미국 영어의 예를 들어보자: "테이블"과 "캣"이라는 단어의 /t/ 소리는 음소 철자법에서 같은 문자로 쓰여질 것이다. 그러나, 엄밀하게 발음된 대본은 "테이블"에서 흡인된 "t"와 "버터"에서 플랩, "stop"에서 흡인되지 않은 "t"와 "alt"(cat)를 구별할 수 있다.이 알로폰들은 모든 영어 방언에 존재한다. 즉, 대부분의 영어권 사용자들이 /t/라고 생각하는 소리는 정말로 소리의 집단으로, 모두 한 단어로 어디에서 발생하느냐에 따라 약간 다르게 발음된다. 완벽한 음소성 맞춤법에는 소리 그룹(phoneme)당 한 글자가 있는데, 소리가 단어를 구별하는 곳에만 다른 글자가 있다(그래서 "침대"는 "베트"와 철자가 다르다).

좁은 음성 전사는 전화기를 나타내며, 인간이 만들 수 있는 소리들, 많은 소리들은 언어마다 그룹화가 다르지만, 어떤 주어진 자연 언어에서든 하나의 음성으로 함께 묶일 수 있다. 예를 들어, 영어는 흡인된 자음과 흡인되지 않은 자음을 구별하지 않지만 한국어, 벵갈어, 힌디어와 같은 다른 언어들은 구별한다. 반면에, 한국어는 다른 언어들과 달리 음성과 무성 자음을 구분하지 않는다.

세계 모든 언어의 언어 소리는 다소 작은 보편적 음성 문자로 쓰여질 수 있다. 이것의 표준은 국제 음성 알파벳이다.

참고 항목

참조

  1. ^ "Bazaj elparolaj reguloj PMEG". bertilow.com.
  2. ^ Hualde, José Ignacio (2005). The Sounds of Spanish. Cambridge University Press. p. 103, 146. ISBN 0-521-54538-2.
  3. ^ Marjou, Xavier (June 2021). "OTEANN: Estimating the Transparency of Orthographies with an Artificial Neural Network". Proceedings of the Third Workshop on Computational Typology and Multilingual NLP. arXiv:1912.13321. doi:10.18653/v1/2021.sigtyp-1.1.
  4. ^ David Stark. "Standardised Spelling - Pronunciation 1". The English Spelling Society. Archived from the original on 7 March 2014.