GB 12345

GB 12345

GB 12345,[1] entitled Code of Chinese ideogram set for information interchange supplementary set (Chinese: 信息交換用漢字編碼字符集 輔助集), is a Traditional Chinese character set standard established by China, and can be thought as the traditional counterpart of GB 2312.이것은 Big5만큼 일반적으로 사용되지 않지만 번체 한자의 인코딩으로 사용됩니다.6,866자로 Big5CNS 11643과의 관계나 호환성은 없습니다.

성격.

GB12345의 문자는 94×94 그리드(ISO/IEC 2022와 같이)로 배치되고, 각 문자의 2바이트 코드 포인트는 행(qu))과 행(cell, wei位) 내의 문자의 위치를 특정하는 qu-wei 형식으로 표현된다.

행(1 ~ 94)에는 다음과 [2][3]같은 문자가 포함됩니다.

  • 01 ~ 09: 06 행 57 ~ 85 를 제외하고, GB 2312 와 같게, 29 개의 세로 구두점 형식을 추가해, 08 행 27 ~ 32 에 GB 5007.1 ~ 85 의 6 핀인 문자를 추가했습니다.
  • 16-87: GB 2312에서 간체된 문자 형식을 대체한 전통적인 문자 형식을 배열했습니다.
  • 88~89: 103자의 한자 간체로 인해 병합된 한자.

10 ~ 15 행과 90 ~94 행은 할당 해제되어 있습니다.

인코딩

ISO-2022-CN-EXT 부호화의 사양에서는, 이 시퀀스가 다음과 같이 기술되어 있습니다.ESC $ )그 뒤에 아직 결정되지 않은 바이트가 이어집니다(플레이스 홀더에 의해 표시됨).<X12345>)를 사용하면 시퀀스와 마찬가지로 GB12345 문자를 표시할 수 있습니다.ESC $ ) A(또한ESC $ )prefix)는 GB 2312를 나타내지만, ISO-IR 레지스트리에 시퀀스의 마지막 [4]바이트를 지정하는 등록을 수신한 후에만 사용됩니다.2023년 현재 그러한 등록은 존재하지 [5]않는다.단, 같은 코멘트 요구에서는 부호화 라벨도 정의됩니다.CN-GB-12345EUC-CN과 [4]같은 방법으로 ASCII와 함께 사용되는 GB 12345의 경우.

비표준 번체 한자 포함

GB/T 12345에는 표준 표준 한자 의 간체 한자와 번체 한자의 대응 표와는 다른 몇 개의 번체 문자가 포함되어 있습니다.

  • §(57~76) : §의 전통적인 대응어는 §(2013:3620, 페이지76), §도 바리안트 형식이 아닙니다.
  • § (33–05) : §의 전통적인 대응어는 § (2013:1305, 페이지 60)이지만 §는 변형형이다.
  • 𨻶(47~22): has는 규격에 전통적인 대응관계가 없다.

GB 12345 및 Unicode

GB 12345의 문자는 초기 ISO 10646/Unicode 표준에서 CJK 문자의 통합 집합을 이끈 한 통일의 소스 중 하나로 채택되었습니다.6,866개의 한자가 모두 통합되었다.

「 」를 참조해 주세요.

레퍼런스

  1. ^ "GB/T 12345-1990: Code of Chinese ideogram set for information interchange--Supplementary set". Standardization Administration of the People's Republic of China. Retrieved 2022-10-01.
  2. ^ Lunde, Ken (2009). CJKV Information Processing: Chinese, Japanese, Korean & Vietnamese Computing (2nd ed.). Sebastopol, CA: O'Reilly. pp. 150–151. ISBN 978-0-596-51447-1.
  3. ^ Chung, Jaemin (2014-12-20). "GB 12052-89 to Unicode table".
  4. ^ a b Zhu, HF.; Hu, DY.; Wang, ZG.; Kao, TC.; Chang, WCH.; Crispin, M. (1996). "RFC 1922: Chinese Character Encoding for Internet Messages". Requests for Comments. IETF. doi:10.17487/rfc1922. Note: Currently, there are some GB sets that have not been registered in ISO. Here <X7589>, <X7590>, <X12345>, <X13131> and <X13132> represent the final character that will be assigned by ISO for those sets. These GB sets shall only be used once these final characters are assigned.
  5. ^ ISO-IR: ISO/IEC International Register of Coded Character Sets To Be Used With Escape Sequences (PDF) (Registry Index). ITSCJ/IPSJ.

외부 링크