GB 12345
GB 12345![]() | 이 글은 그 주제에 익숙하지 않은 사람들에게는 불충분한 맥락을 제공한다.(2023년 1월 (이 를 에 대해 설명합니다) |
GB 12345,[1] entitled Code of Chinese ideogram set for information interchange supplementary set (Chinese: 信息交換用漢字編碼字符集 輔助集), is a Traditional Chinese character set standard established by China, and can be thought as the traditional counterpart of GB 2312.이것은 Big5만큼 일반적으로 사용되지 않지만 번체 한자의 인코딩으로 사용됩니다.6,866자로 Big5 및 CNS 11643과의 관계나 호환성은 없습니다.
성격.
GB12345의 문자는 94×94 그리드(ISO/IEC 2022와 같이)로 배치되고, 각 문자의 2바이트 코드 포인트는 행(qu))과 행(cell, wei位) 내의 문자의 위치를 특정하는 qu-wei 형식으로 표현된다.
행(1 ~ 94)에는 다음과 [2][3]같은 문자가 포함됩니다.
- 01 ~ 09: 06 행 57 ~ 85 를 제외하고, GB 2312 와 같게, 29 개의 세로 구두점 형식을 추가해, 08 행 27 ~ 32 에 GB 5007.1 ~ 85 의 6 핀인 문자를 추가했습니다.
- 16-87: GB 2312에서 간체된 문자 형식을 대체한 전통적인 문자 형식을 배열했습니다.
- 88~89: 103자의 한자 간체로 인해 병합된 한자.
10 ~ 15 행과 90 ~94 행은 할당 해제되어 있습니다.
인코딩
ISO-2022-CN-EXT 부호화의 사양에서는, 이 시퀀스가 다음과 같이 기술되어 있습니다.ESC $ )
그 뒤에 아직 결정되지 않은 바이트가 이어집니다(플레이스 홀더에 의해 표시됨).<X12345>
)를 사용하면 시퀀스와 마찬가지로 GB12345 문자를 표시할 수 있습니다.ESC $ ) A
(또한ESC $ )
prefix)는 GB 2312를 나타내지만, ISO-IR 레지스트리에 시퀀스의 마지막 [4]바이트를 지정하는 등록을 수신한 후에만 사용됩니다.2023년 현재[update] 그러한 등록은 존재하지 [5]않는다.단, 같은 코멘트 요구에서는 부호화 라벨도 정의됩니다.CN-GB-12345
EUC-CN과 [4]같은 방법으로 ASCII와 함께 사용되는 GB 12345의 경우.
비표준 번체 한자 포함
GB/T 12345에는 표준 표준 한자 표의 간체 한자와 번체 한자의 대응 표와는 다른 몇 개의 번체 문자가 포함되어 있습니다.
- §(57~76) : §의 전통적인 대응어는 §(2013:3620, 페이지76), §도 바리안트 형식이 아닙니다.
- § (33–05) : §의 전통적인 대응어는 § (2013:1305, 페이지 60)이지만 §는 변형형이다.
- 𨻶(47~22): has는 규격에 전통적인 대응관계가 없다.
GB 12345 및 Unicode
GB 12345의 문자는 초기 ISO 10646/Unicode 표준에서 CJK 문자의 통합 집합을 이끈 한 통일의 소스 중 하나로 채택되었습니다.6,866개의 한자가 모두 통합되었다.
「 」를 참조해 주세요.
레퍼런스
- ^ "GB/T 12345-1990: Code of Chinese ideogram set for information interchange--Supplementary set". Standardization Administration of the People's Republic of China. Retrieved 2022-10-01.
- ^ Lunde, Ken (2009). CJKV Information Processing: Chinese, Japanese, Korean & Vietnamese Computing (2nd ed.). Sebastopol, CA: O'Reilly. pp. 150–151. ISBN 978-0-596-51447-1.
- ^ Chung, Jaemin (2014-12-20). "GB 12052-89 to Unicode table".
- ^ a b Zhu, HF.; Hu, DY.; Wang, ZG.; Kao, TC.; Chang, WCH.; Crispin, M. (1996). "RFC 1922: Chinese Character Encoding for Internet Messages". Requests for Comments. IETF. doi:10.17487/rfc1922.
Note: Currently, there are some GB sets that have not been registered in ISO. Here <X7589>, <X7590>, <X12345>, <X13131> and <X13132> represent the final character that will be assigned by ISO for those sets. These GB sets shall only be used once these final characters are assigned.
- ^ ISO-IR: ISO/IEC International Register of Coded Character Sets To Be Used With Escape Sequences (PDF) (Registry Index). ITSCJ/IPSJ.