삼단화

Syllabification

하이픈화라고도 하는 음절화(/sɪlæbɪffkeʃnn/) 또는 음절화(/sɪlæbɪkeɪ/n/)는 구어든 쓰든[1] 서명이든 단어를 음절로 구분하는 것이다.[2]

개요

영어 맞춤법(예: 실라블)을 사용할 때, 그리고 국제 음성 알파벳(IPA)에서 실제 구어체 음절을 필사할 때(예: [ˈsbl.].bᵊ])로 구분된 문장은 하이픈으로 표기된다. 프리젠테이션을 위해 타이포그래퍼인터피드(유니코드 문자 U+00B7, 예: 실·라·블), 특수 목적의 "하이페네이션 포인트"(U+2027, 예: 실·라·블) 또는 공간(예: 실 라블)을 사용할 수 있다.

행의 끝에서 한 단어가 그 행에 맞지 않고 다음 행으로 옮기면 첫 번째 행이 다른 행보다 훨씬 짧을 경우, 일반적으로 "기호"라고 불리는 부분들로 글로 구분된다. 이것은 매우 긴 단어와 신문의 좁은 기둥이 있는 특별한 문제가 될 수 있다. 워드 프로세싱명분화 과정을 자동화하여 짧은 단어의 음절표시가 필요 없는 경우가 많다.

어떤 언어에서는 구어 음절도 글쓰기의 음절의 기본이 되기도 한다. 그러나 현대 영어의 철자법에 있어서 소리와 글자의 일치성이 약하기 때문일 수 있는데, 영어의 문자 음절은 주로 발음 원리 대신 어원론적 또는 형태학적 원리에 기초하고 있다. 예를 들어 「학습」을 생활언어의 정확한 음절에 따라 리어닝으로 삼을 수는 없다. 줄의 끝에서 리어만 보면 디그라프 ea많은 다른 값을 가질 수 있기 때문에 독자로 하여금 단어를 잘못 발음하게 할 수 있다. 영어 맞춤법의 역사는 그러한 현상을 설명한다.

그러므로 영어의 문자적 음절은 음운론적 단위(모폴로지와는 반대로)의 언어적 개념에 부합하지 않는 "음운적"의 개념을 다룬다.

그 결과, 대부분의 원어민들조차 사전과 상담하거나 워드 프로세서를 사용하지 않고서는 정해진 규칙에 따라 단어를 음절할 수 없게 된다. 학교들은 보통 사전을 참조하는 것보다 이 주제에 대해 훨씬 더 많은 조언을 제공하지 않는다. 게다가, 영국과 미국의 음절과 심지어 같은 영어 다양성의 사전들 사이에서도 차이가 있다.

핀란드어, 이탈리아어, 포르투갈어 및 기타 거의 음성 철자가 된 언어에서, 작가들은 원칙적으로 일반 규칙만을 사용하여 현존하거나 새로 창조된 단어를 정확하게 음절할 수 있다. 핀란드에서, 아이들은 정확한 음절을 믿을 수 있게 만들어질 때까지 모든 단어를 하이픈으로 바꾸는 법을 먼저 배우고, 그 후에는 하이픈을 생략할 수 있다.

알고리즘.

컴퓨터 과학의 미해결 문제:

영어에 완벽한 음절 알고리즘이 있을까?

하이픈화 알고리즘은 특히 컴퓨터 프로그램에서 구현을 위해 코드화된 규칙 집합으로, 하이픈으로 두 줄에 걸쳐 단어가 깨질 수 있는 지점을 결정한다. 예를 들어, 하이픈화 알고리즘은 탄핵 또는 탄핵으로 탄핵 또는 탄핵으로 기각될 수 있지만 탄핵은 성립되지 않는다고 결정할 수 있다.

단어 깨기 규칙이 복잡해지는 이유 중 하나는 영어의[citation needed] "대화체"가 하이픈에 따라 다른 경향이 있기 때문이다. 미국영어는 음에 작용하는 경향이 있지만 영국영어는 단어의 기원에 주목한 다음 소리를 내는 경향이 있다. 예외도 많아 문제가 더욱 복잡해진다.

어떤 엄지손가락의 법칙은 키리 소령의 "하이픈테이션에 대하여 - 페단트리의 무정부상태"[3]에서 찾을 수 있다. 하이픈에 대한 알고리즘 접근법 중 TeX형식설정 시스템에서 구현된 접근법이 널리 사용된다. 그것은 컴퓨터 및 유형 설정의 첫 두 권과 프랭클린 마크 량의 논문에 완전히 기록되어 있다.[4] 량 교수의 연구의 목적은 알고리즘을 실질적으로 가능한 한 정확하게 하고 어떤 예외 사전이라도 작게 유지하는 것이었다.

미국 영어에 대한 TeX의 원래 하이픈화 패턴에서 예외 목록에는 14개의 단어만 포함되어 있다.[5]

인텍스

TeX 하이픈 알고리즘의 포트는 Haskell, JavaScript, Perl, PostScript, Python, Ruby, C# 및 TeX를 포함한 여러 프로그래밍 언어의 라이브러리로 사용할 수 있다. \showhyphens.

LaTeX에서는 사용자가 다음을 사용하여 하이픈 보정을 추가할 수 있다.

\henhenation{words}

\hyphenation 명령어는 단어가 단어 목록이고 공백으로 구분되고 각 하이픈 포인트가 a로 표시되는 허용 하이픈 점을 선언한다. - 캐릭터 예를 들면.

\cHenation{fortran er-go-no-mic}

현재 작업에서 "포트란"은 하이픈을 사용하지 않아야 하며 "전기"가 하이픈을 사용해야 하는 경우 표시된 지점 중 하나에 있을 것임을 선언한다.[6]

그러나 몇 가지 한계가 있다. 예를 들어 주식은 \hyphenation 명령은 기본적으로 ASCII 문자만 허용하므로 ASC가 아닌 단어의 하이픈을 수정하는 데 사용할 수 없음영어를 제외한 거의 모든 언어에서 매우 흔한 II 문자(예, é, ç 등). 그러나 간단한 해결책이 존재한다.[7][8]

참고 항목

메모들

  1. ^ 이 용어는 또한 자음이 음절(음절)이 되는 과정에도 사용된다. 예를 들어, 북중미 영어에서 "can"은 음절 /n/로 [kknn] 또는 [kn̩]로 발음할 수 있다.
  2. ^ 바우스 C, 구티에레즈 E, 카레라스 M. 수화 생성에서 음절의 역할. 프런트 사이콜. 2014;5:1254. 2014년 11월 13일 발행. 도이:10.3389/fpsyg.2014.01254
  3. ^ Major Keary. "On Hyphenation - Anarchy of Pedantry". PC Update. Australia: Melbourne PC User Group. Archived from the original on March 10, 2005. Retrieved Oct 6, 2005.
  4. ^ Liang, Franklin Mark (Aug 1983), "Word Hy-phen-a-tion by Com-pu-ter", PhD dissertation, Stanford University Department of Computer Science, STAN-CS-83-977
  5. ^ "The Plain TeX hyphenation tables". Retrieved June 23, 2009.
  6. ^ "\hyphenation". Hypertext Help with LaTeX. Yale.
  7. ^ "Accented words aren't hyphenated". TeX FAQ.
  8. ^ "How does hyphenation work in TeX?". Tex FAQ.

외부 링크