결합 캐릭터
Combining character디지털 타이포그래피에서 결합 문자는 다른 문자를 수정하기 위한 문자다.라틴어 스크립트에서 가장 일반적인 결합 문자는 결합 분음 부호(결합 악센트 포함)이다.
유니코드는 또한 많은 사전 컴파일된 문자를 포함하고 있어, 많은 경우에 사용자나 애플리케이션의 선택에 따라 결합한 분음법과 사전 컴파일된 문자를 모두 사용할 수 있다.이로 인해 두 유니코드 문자열을 비교하기 전에 유니코드 정규화를 수행하고 데이터 손실을 방지하기 위해 유니코드에서 문자를 나타내는 모든 유효한 방법을 레거시 인코딩에 올바르게 매핑하도록 인코딩 변환기를 신중하게 설계해야 한다.[1]
유니코드에서는 유럽 언어와 국제 음성 알파벳에 대한 분음 부호를 결합하는 주요 블록은 U+0300이다.–U+036F.2음절 부호를 결합하는 것은 유니코드 문자의 다른 많은 블록에도 존재한다.유니코드에서는 항상 (ANSEL과 같은 일부 오래된 결합 문자 집합과는 대조적으로) 주인공 뒤에 분음 부호가 추가되며, 일부 시스템에서는 이러한 분음 부호가 잘 나타나지 않을 수 있지만 위아래에 쌓인 분음 부호를 포함하여 동일한 문자에 여러 분음 부호를 추가할 수 있다.
유니코드 범위
다음 블록은 문자 결합 전용이다.
- 버전 1.0 이후 분음 부호(0300–036F), 후속 버전 4.1로 수정
- 분음 부호 확장(1AB0–1AFF), 버전 7.0 결합
- 분음 부호(1DC0–1DFF), 4.1 - 5.2 버전 결합
- 기호용 분음 부호 결합(20D0–20)FF), 버전 1.0 이후 후속 버전 5.1로 수정
- Half Marks(FE20–FE2F), 버전 1.0, 후속 버전 8.0으로 수정
결합 문자는 이러한 블록에만 국한되지 않는다. 예를 들어 결합 다쿠텐(U+3099)과 결합한 한다쿠텐(U+309A)이 히라가나 블록에 있고, 데바나가리 블록에는 해당 스크립트와 함께 사용하기 위한 모음 기호 및 기타 마크 등이 포함되어 있다.결합 문자는 유니코드 주요 범주 "M"("Mark")에 할당된다.
분음 부호 결합[1] 공식 유니코드 컨소시엄 코드 차트(PDF) | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
U+030x | ◌̀ | ◌́ | ◌̂ | ◌̃ | ◌̄ | ◌̅ | ◌̆ | ◌̇ | ◌̈ | ◌̉ | ◌̊ | ◌̋ | ◌̌ | ◌̍ | ◌̎ | ◌̏ |
U+031x | ◌̐ | ◌̑ | ◌̒ | ◌̓ | ◌̔ | ◌̕ | ◌̖ | ◌̗ | ◌̘ | ◌̙ | ◌̚ | ◌̛ | ◌̜ | ◌̝ | ◌̞ | ◌̟ |
U+032x | ◌̠ | ◌̡ | ◌̢ | ◌̣ | ◌̤ | ◌̥ | ◌̦ | ◌̧ | ◌̨ | ◌̩ | ◌̪ | ◌̫ | ◌̬ | ◌̭ | ◌̮ | ◌̯ |
U+033x | ◌̰ | ◌̱ | ◌̲ | ◌̳ | ◌̴ | ◌̵ | ◌̶ | ◌̷ | ◌̸ | ◌̹ | ◌̺ | ◌̻ | ◌̼ | ◌̽ | ◌̾ | ◌̿ |
U+034x | ◌̀ | ◌́ | ◌͂ | ◌̓ | ◌̈́ | ◌ͅ | ◌͆ | ◌͇ | ◌͈ | ◌͉ | ◌͊ | ◌͋ | ◌͌ | ◌͍ | ◌͎ | CGJ |
U+035x | ◌͐ | ◌͑ | ◌͒ | ◌͓ | ◌͔ | ◌͕ | ◌͖ | ◌͗ | ◌͘ | ◌͙ | ◌͚ | ◌͛ | ◌͜◌ | ◌͝◌ | ◌͞◌ | ◌͟◌ |
U+036x | ◌͠◌ | ◌͡◌ | ◌͢◌ | ◌ͣ | ◌ͤ | ◌ͥ | ◌ͦ | ◌ͧ | ◌ͨ | ◌ͩ | ◌ͪ | ◌ͫ | ◌ͬ | ◌ͭ | ◌ͮ | ◌ͯ |
메모들
|
코드포인트 U+032A 및 U+0346–034A는 IPA 기호:
코드포인트 U+034B–034E는 무질서한 언어에 대한 IPA 분음부:
- U+034B ◌͋: 비강탈출
- U+034C ◌͌: velopharyngeal 마찰
- U+034D ◌͍: labial 확산
- U+034E ◌͎: 휘파람 회전식
U+034F는 "CGJ(Combining Grapheme Joiner)"로 눈에 보이는 글리프가 없다.
코드 포인트 U+035C–0362는 이중 분음 부호, 두 글자에 걸쳐 배치된 분음 부호다.
코데프포인트 U+0363–036F는 중세의 위첨자 문자로 중세 게르만어 필사본에 등장하는 다른 문자 바로 위에 쓰여진 글자들이지만, 어떤 경우에는 19세기까지 사용되고 있다.예를 들어 U+0364는 (Early) New High Jerman umlaut 표기법(예: 현대 독일어 ü)에 사용되는 앞의 글자 위에 쓰여진 e이다.
확장된 분음 부호 결합[1][2] 공식 유니코드 컨소시엄 코드 차트(PDF) | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
U+1ABX | ◌᪰ | ◌᪱ | ◌᪲ | ◌᪳ | ◌᪴ | ◌᪵ | ◌᪶ | ◌᪷ | ◌᪸ | ◌᪹ | ◌᪺ | ◌᪻ | ◌᪼ | ◌᪽ | ◌᪾ | ◌ᪿ |
U+1ACX | ◌ᫀ | ◌᫁ | ◌᫂ | ◌᫃ | ◌᫄ | ◌᫅ | ◌᫆ | ◌᫇ | ◌᫈ | ◌᫉ | ◌᫊ | ◌᫋ | ◌ᫌ | ◌ᫍ | ◌ᫎ | |
U+1ADX | ||||||||||||||||
U+1AEX | ||||||||||||||||
U+1AFX | ||||||||||||||||
메모들 |
분음 부호 결합[1] 공식 유니코드 컨소시엄 코드 차트(PDF) | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
U+1DCx | ◌᷀ | ◌᷁ | ◌᷂ | ◌᷃ | ◌᷄ | ◌᷅ | ◌᷆ | ◌᷇ | ◌᷈ | ◌᷉ | ◌᷊ | ◌᷋ | ◌᷌ | ◌᷍ | ◌᷎ | ◌᷏ |
U+1DDX | ◌᷐ | ◌᷑ | ◌᷒ | ◌ᷓ | ◌ᷔ | ◌ᷕ | ◌ᷖ | ◌ᷗ | ◌ᷘ | ◌ᷙ | ◌ᷚ | ◌ᷛ | ◌ᷜ | ◌ᷝ | ◌ᷞ | ◌ᷟ |
U+1DEX | ◌ᷠ | ◌ᷡ | ◌ᷢ | ◌ᷣ | ◌ᷤ | ◌ᷥ | ◌ᷦ | ◌ᷧ | ◌ᷨ | ◌ᷩ | ◌ᷪ | ◌ᷫ | ◌ᷬ | ◌ᷭ | ◌ᷮ | ◌ᷯ |
U+1DFX | ◌ᷰ | ◌ᷱ | ◌ᷲ | ◌ᷳ | ◌ᷴ | ◌᷵ | ◌᷶ | ◌᷷ | ◌᷸ | ◌᷹ | ◌᷺ | ◌᷻ | ◌᷼ | ◌᷽ | ◌᷾ | ◌᷿ |
메모들 |
기호에 대한 분음 부호 조합[1][2] 공식 유니코드 컨소시엄 코드 차트(PDF) | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
U+20Dx | ◌⃐ | ◌⃑ | ◌⃒ | ◌⃓ | ◌⃔ | ◌⃕ | ◌⃖ | ◌⃗ | ◌⃘ | ◌⃙ | ◌⃚ | ◌⃛ | ◌⃜ | ◌⃝ | ◌⃞ | ◌⃟ |
U+20Ex | ◌⃠ | ◌⃡ | ◌⃢ | ◌⃣ | ◌⃤ | ◌⃥ | ◌⃦ | ◌⃧ | ◌⃨ | ◌⃩ | ◌⃪ | ◌⃫ | ◌⃬ | ◌⃭ | ◌⃮ | ◌⃯ |
U+20Fx | ◌⃰ | |||||||||||||||
메모들 |
결합 하프 마크[1] 공식 유니코드 컨소시엄 코드 차트(PDF) | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
U+FE2x | ◌︠ | ◌︡ | ◌︢ | ◌︣ | ◌︤ | ◌︥ | ◌︦ | ◌︧ | ◌︨ | ◌︩ | ◌︪ | ◌︫ | ◌︬ | ◌︭ | ◌︮ | ◌︯ |
메모들 |
오픈타입
OpenType은 ccmp "특징 태그"를 사용하여 문자 결합과 관련된 구성 또는 분해, 기본 글리프에 문자를 결합하는 위치를 정의하기 위한 마크 태그, 그리고 문자를 서로 결합하는 위치를 정의하기 위한 mkmk를 가지고 있다.
잘고 문자
결합 문자는 잘고 텍스트를 만드는 데 사용되었는데, 이것은 과도한 디아크리틱스 사용으로 인해 "손상" 또는 "크리피"로 나타나는 텍스트다.이로 인해 텍스트가 수직으로 확장되어 다른 텍스트와 겹치게 된다.[2]
참고 항목
메모들
- ^ 예를 들어, 윈도우-1258과 VISCII 사이에서 변환할 때 전자는 분음부 결합을 사용하는 반면 후자는 사전 컴파일된 문자의 수가 많기 때문에 코드 값과 유니코드 코드 포인트 사이의 간단한 매핑을 사용하는 변환기는 변환할 때 텍스트가 손상된다.
- ^ Korpela, Jukka K. "How does Zalgo text work?". Stack Overflow. Retrieved 11 April 2019.
외부 링크
- 분음부 차트 결합(Adobe PDF 형식)
- 아이아크리틱스 보충 차트 결합(Adobe PDF 형식)
- 결합된 마크 테스트 페이지와 결합된 사전 컴파일된 문자 마주보기
- 앨런 우드의 유니코드 자원
- DecodeUnicode.org에서 분음 부호 참조를 결합함