CNS 11643

CNS 11643
CNS 11643
에일리어스CSIC(중국 표준 교환 코드)
언어번체 중국어
표준.CNS 11643
분류ISO 2022, DBCS, CJK 인코딩
인코딩 형식
기타 관련 부호화Big5, CCCII

CNS 11643 문자 집합(Chinese National Standard 11643)은 공식적으로 중국 표준 교환 코드(CSIC[1])라고도 불리며 대만(중화인민공화국)의 표준 문자 집합입니다.실제로 관련된 Big5 문자 집합의 변형은 사실상의 표준입니다.

CNS 11643은 ISO 2022에 준거하도록 설계되어 있습니다.16개의 평면을 포함하므로 인코딩 가능한 최대 문자 수는 16×94×94 = 141376입니다.평면 1~7은 표준에 의해 정의되며, 2007년부터 평면 10~15도 [2]: 115–122 표준에 의해 정의되었다.이전에는 사용자 정의 문자를 [citation needed]위해 플레인 12~15(35344 코드 포인트)가 특별히 지정되었습니다.CCCII와는 달리 CNS 11643에서의 바리안트문자의 부호화는 관련이 없습니다.

EUC-TW 는, CNS 11643 ASCII 를 Extended Unix Code(EUC; 확장 UNIX 코드) 형식으로 부호화한 표현입니다.특정 CSIC 평면을 나타낼 수 있는 다른 부호화에는 ISO-2022-CN(플레인1 및 2) 및 ISO-2022-CN-EXT(플레인1 ~ 7)가 있습니다.

역사

표준의 초판은 1986년에 발행되었으며, Big5의 레벨 1과 레벨 2에서 파생된 평면 1과 평면 2를 포함했으며, 보정된 뇌졸중 수, 두 개의 중복 문자 누락, 213개의 고전 부수 추가 등으로 인해 일부 순서가 재조정되었다.이후 1988년(6319자, 점유면 14)과 1990년(7169자, 점유면 15)[2]: 115–122 에 표준 확장이 발표되었다.

Unicode 1.0.0에는 아직 한자가 포함되어 있지 않지만 CNS 11643과의 호환성을 위한 문자가 포함되어 있습니다.CJK Compatibility Forms 블록의 제목은 Unicode 1.0.[3]0입니다.유니코드 1.0.1을 위해 유니코드 CJK 통합 한자 세트가 편집될 때, 국가 기관들은 CJK 공동 연구 그룹에 포함을 위해 문자 집합을 제출하였다.제출된 CNS 11643 버전에는 플레인 14 확장자에 추가로 원하는 문자가 포함되어 있습니다(68-21 이후,[2]: 179–180 확장자의 표준 버전에서 마지막으로 사용된 코드 포인트).

1992년에 발행된 표준 제2판에서는 7개의 평면에 걸쳐 훨씬 더 많은 한자의 컬렉션이 정의되었다.6148 코드 포인트 01-01 ~ 66-38을 포함한 1988년 플레인 14 확장의 서브셋은 플레인 3이 되었다(나머지 171 문자 코드 포인트 66-39 ~ 68-21은 플레인 4에 대신 분배된다).비행기 15의 확장자는 포함되지 않았지만, 그것의 338개의 문자가 비행기 4부터 [2]: 115–122 7까지에 포함되었다.

2007년에 발표된 이 표준의 제3판은 평면 1에 기존의 보포모포로마자 알파벳 지원에 유로 기호, 문자 0, 가나확장자를 추가했다.추가 한자를 포함한 평면 10~14를 도입하고 기존 평면 15 확장을 표준 자체에 포함시켰다(평면 4~7에 이미 문자가 존재했던 위치에 공백이 남아 있음).또한 코드 포인트 68-40부터 [2]: 115–122 시작하여 플레인 3에 128개의 한자를 추가했습니다.

2017년 현재 대응하는 Unicode 문자가 없는 수천 개의 CNS 11643 문자가 있으며, 대부분은 Plane 10 ~14 입니다.이것들은 Unicode Supplementary Private Use [4]Area에 매핑되어 있습니다.

Big 5와의 관계

Big5 부호화 레벨1과 2는 대부분 CNS 11643 플레인1과 2에 대응하고 있습니다.단, 순서가 다른 경우가 있습니다.또한 Big5에는 2개의 중복된 한자가 존재하지만 CNS 11643에는 없습니다.범위 [5][6]목록을 사용하여 매핑할 수 있습니다.단, CNS 11643 플레인1의 213 클래식래디컬은 Big5에서 사용할 수 있는 문자에 추가되어 2007년에 [2]: 115–122 CNS 11643 플레인1에 추가 문자가 추가되었습니다.Big5-2003 배리언트 Big5는 CNS 11643의 부분 부호화로 정의되어 있습니다.

Big5 한지 레퍼토리에서 지금까지 Unicode에 매핑된 문자는 CNS 11643 플레인에서 U+5F5D(),)로 대응하는 문자와 다른1 문자뿐이며, 그 CNS 플레인1은 U+5F5E([7])에서 관련된 바리안트에 매핑됩니다.그러나 IBM에 의해 정의된 것과 같은 Big5의 일부 변형 매핑에는 U+5F5D가 [8]아닌 U+5F5E가 포함됩니다.

레퍼런스

  1. ^ ECMA (1993-01-21). Chinese Standard Interchange Code (CSIC) - Set 1 (PDF). ITSCJ/IPSJ. ISO-IR-171.
  2. ^ a b c d e f Lunde, Ken (2008). "3. Character Set Standards". CJKV Information Processing (2nd ed.). O'Reilly Media. ISBN 9780596514471.
  3. ^ "3.8: Block-by-Block Charts" (PDF). The Unicode Standard. version 1.0. Unicode Consortium.
  4. ^ "CNS 11643 in Unicode's Supplementary Private Use Area". [chinese mac]. Council on East Asian Studies at Yale University.
  5. ^ Lunde, Ken (1995-12-18). "4.3: CJK Character Set Compatibility Issues - Chinese (Taiwan)". CJK.INF Version 1.9.
  6. ^ Zhu, HF.; Hu, DY.; Wang, ZG.; Kao, TC.; Chang, WCH.; Crispin, M. (1996). "RFC 1922: Chinese Character Encoding for Internet Messages". Requests for Comments. IETF.
  7. ^ Lunde, Ken (2018-02-15). "Exploring IICore—Part 4". CJK Type Blog. Adobe Inc.
  8. ^ "ibm-950_P110-1999 (lead byte 0xC2)". International Components for Unicode Converter Explorer. Unicode Consortium.

외부 링크