티베트어(유니코드 블록)

Tibetan (Unicode block)
티베트어
범위U+0F00..U+0FFFF
(256 코드 포인트)
평면BMP
스크립트티베트어(207자)
공통(4자)
주요 문자티베트어
쩡카
맡겨진211개의 코드 포인트
사용되지 않음45개의 예약된 코드 포인트
2 더 이상 사용되지 않음
유니코드 버전 기록
2.0 (1996)168 (+168)
3.0 (1999)193 (+25)
4.1 (2005)195 (+2)
5.1 (2008)201 (+6)
5.2 (2009)205 (+4)
6.0 (2010)211 (+6)
참고:
ISO 10646과 통일할 때 원래의 티베트 블록은 유니코드 1.0.1에서 제거되었다.[3] 현재 블록(새로운 인코딩 모델과 다른 범위 포함)은 버전 2.0에서 도입되었다.

티베트어는 티베트어, 덩카어, 중국, 부탄어, 네팔어, 몽골어, 인도 북부, 파키스탄 동부, 러시아의 다른 언어의 문자를 포함하는 유니코드 블록이다.

블록

티베트어[1][2][3]
공식 유니코드 컨소시엄 코드 차트(PDF)
0 1 2 3 4 5 6 7 8 9 A B C D E F
U+0F0x
NB
U+0F1x
U+0F2x
U+0F3x ༿
U+0F4x
U+0F5x
U+0F6x
U+0F7x ཿ
U+0F8x
U+0F9x
U+0FAX
U+0FBx ྿
U+0FCX
U+0FDx
U+0FEX
U+0FFx
메모들
1.^ 유니코드 버전 14.0 기준
2.^ 회색 영역은 할당되지 않은 코드 포인트를 나타냄
3.^ 유니코드 코드 포인트 U+0F77 및 U+0F79는 유니코드 5.2 이상에서 더 이상 사용되지 않음

구 티베트 블록

티베트어(유니코드 1.0.0)
범위U+1000..U+104F
(80 코드 포인트)
평면BMP
스크립트티베트어
주요 문자티베트어
쩡카
상태유니코드 2.0 출시 전 삭제
현재 사용 중인 사용자미얀마
유니코드 버전 기록
1.0.0 (1991)71 (+71)
1.0.1 (1992)0 (-71)
참고: ISO 10646과 통합할 때 원래 티베트 블록은 유니코드 1.0.1에서 삭제되었다.[3] 티베트는 후에 유니코드 2.0의 새로운 인코딩 모델로 재도입되었다.

티벳 유니코드 블록은 1.0.0 버전에서 눈에 보이는 srog 메드결막음을 정확하게 구별할 수 없는 virama 기반 인코딩으로 할당되었다는 점에서 독특하다.[note 1] 이 인코딩은 버전 1.1의 ISO 10646과 통합하는 과정에서 버전 1.0.1의 유니코드 표준에서 제거되었다가 버전 2.0에서 블록 크기가 더 큰 명시적 루트/하위 부호화 인코딩으로 다시 도입되었다.[3] 유니코드 2.0 이후 모든 버전에 대해 유니코드 안정성 정책에 의해 기존 문자를 이동하거나 제거하는 것이 금지되어 유니코드 2.0으로 인코딩된 티베트 문자와 이후 모든 버전은 불변한다.

구 유니코드 1.0.0 티베트 블록의 범위는 유니코드 3.0 이후 미얀마 블록이 차지하고 있다. Microsoft Windows에서는 오래된 티베트 블록을 참조하는 데이터 정렬이 Windows XP만큼 늦게 유지되었고 Windows 2003에서 제거되었다.[4]

티베트어(유니코드 1.0.0)[1][2]
공식 유니코드 컨소시엄 코드 차트(PDF)
0 1 2 3 4 5 6 7 8 9 A B C D E F
U+100x
U+101x
U+102x ཿ
U+103x
U+104x
메모들
1.^ 유니코드 버전 1.0.0 기준. 문자는 유니코드 2.0 및 모든 후속 버전의 해당 코드 포인트를 통해 표시된다.
2.^ 회색 영역은 할당되지 않은 코드 포인트를 나타냄

역사

다음의 유니코드 관련 문서는 티베트 블록에서 특정 문자를 정의하기 위한 목적과 과정을 기록한다.

각주

  1. ^ 대부분의 유니코드 인디케이터 인코딩에서는 0폭 비조인어(ZWNJ)를 사용하여 시스템이 보이는 할란타를 표시하도록 강제하거나 0폭 조인어(ZWJ)를 사용하여 비결합 결합형식을 사용하도록 강제할 수 있지만, 티베트어를 쓸 때 중요한 결막음 렌더링을 강제할 수 있는 방법은 없다. 예를 들어, 신할라는 결막을 강제하기 위해 ZWJ를 사용한다.

참조

  1. ^ "Unicode character database". The Unicode Standard. Retrieved 2016-07-09.
  2. ^ "Enumerated Versions of The Unicode Standard". The Unicode Standard. Retrieved 2016-07-09.
  3. ^ a b c "Unicode 1.0.1 Addendum" (PDF). The Unicode Standard. 1992-11-03. Retrieved 2016-07-09.
  4. ^ Kaplan, Michael (2007-08-28). "Every character has a story #29: U+1000^H^H^H^H0f40, (TIBETAN or MYANMAR LETTER KA, depending on when you ask)". Sorting it all out.