정보교환 한자코드

Chinese Character Code for Information Interchange
CCCII / EACC
CCCII-illust.svg
CCCII의 4단 문자 ((, 엔, 위안)입니다.
언어중국어, 일본어, 한국어
표준.MARC-8, ANSI/NISO Z39.64(양쪽 EACC 버전)
현황주로 라이브러리 시스템에서 사용
분류MARC의 JACKPHY 성분인 ISO 2022 구조에 기반한 CJK용 TBCS

정보교환용 한자코드(CCII)는 대만의 한자분석그룹이 개발한 문자 세트입니다.그것은 1980년에 처음 출판되었고 1982년과 [1]1987년에 크게 확장되었다.

주로 라이브러리 [2][3]시스템에서 사용됩니다.1984년 Big5와 [2]1986년 CNS 11643설립되기 이전부터 중국어 번체용으로 확립된 가장 오래된 부호화 중 하나입니다.간체 버전 및 주요 한자 [1]집합의 다른 변형을 인코딩하는 고유한 시스템으로 구분됩니다.

CCCII의 이전 버전은 MARC-8의 일부로 동아시아 문자 코드(EACC, ANSI/NISO Z39.64)[4]라는 이름으로 의회도서관에 의해 사용되며, MARC 21의 JACKPHY 지원의 일부로 구성되어 있습니다.단, EACC에는 최신 버전의 [5][1]CCII보다 적은 문자가 포함되어 있습니다.

설계.

CCCII 또는 EACC 구현의 9글자로, 「」(양날의 검)의 변형으로서 부호화됩니다.그 중 아홉 번째인 ,은 보통 [6]의 변형입니다.

바이트 범위

CCII는 ISO/IEC [1]2022에서 정의된 94세트로n 설계되어 있습니다.각 한자는 3바이트 코드로 표시되며, 각 바이트는 0x21에서 0x7E 사이의 7비트입니다.따라서 CCII에서 나타낼 수 있는 최대 한자 수는 94×94×94=830584이다.실제로는 CCII에서 부호화할 수 있는 문자의 수는 이 수보다 적습니다.왜냐하면 변종문자는 CCII의 관련 ISO 2022 플레인으로 부호화되기 때문에 대부분의 코드 포인트는 변종용으로 예약되어 있어야 하기 때문입니다.

다만, 실제로는, 이러한 범위를 넘는 바이트가 사용되는 경우가 있습니다.코드 0x212320은 일부 구현에서 [7]표의 공간으로 사용됩니다.홍콩의 라이브러리에서 사용되는 CCII 사양에서는 구두점 및 [8]기호에는 0x2120으로 시작하는 코드를 사용합니다.첫번째 바이트 0x7F 일부 변이에 의해 어떤 방법으로 사용할 수 없는 통일 래퍼토리와 발주 또는 한중일 통합 한자 확장 Ahanzi(예를 들어 0x7F3449 U+3449 또는 0x7F796E U+796E을 위해서[8]통보 어떻게 지속이 바이트 UCS-2BE 코드와 일치하는)에 대한 정보를 인코딩하기에, 이 바이트 0x21–0x7E거나 심지어 0x20–0x7F의 외부 포함할 것 사용된다. range (예: U+551C의 경우 0x7F551C,[9] 0x7F5의 경우)U+5용 AA4AA4[9] 또는 0x7F8U+[8]8EDA용 EDA

ISO 2022와의 상호작용

CCCII/EACC는 이스케이프 [10]시퀀스와 함께 사용되는 코드화된 문자 집합의 국제 레지스트리에 등록되어 있지 않기 때문에 ISO 2022와 함께 사용하기 위한 표준 지정 이스케이프가 없습니다.MARC-8은 EACC에 프라이빗 용도를 할당합니다.F- 바이트 0x31 (1ANSI X3.41 (ISO 2022)[11]의 실장.

레이어 및 바리안트 문자

94개의 ISO 2022 평면은 각각 6개의 평면으로 이루어진 16개의 층으로 그룹화된다(4개의 [1]평면을 포함하는 16개 층은 제외).레이어 1에는 비한자와 한자가 모두 포함되어 있으며 비한자와 가장 자주 사용되는 한자는 플레인1에 배치되어 나머지 5개의 플레인은 보다 일반적인 한자로 [1]구성됩니다.레이어 2에는 간체 한자가 포함되어 있으며 행과 셀 번호는 레이어 1의 중국어 번체 번호와 동일합니다.레이어 3~12는 처음 2개의 [12]레이어와 상동하는 행과 셀 번호에 추가 변형 형태를 포함한다.

마지막 4개의 레이어는 다른 용도로 사용됩니다.특히 13층은 일본어 지원용 추가 문자(가나 및 일본어 고쿠지)를 포함하고 14층은 한국어 지원용 추가 문자(한글)[12]를 포함하고 있다.레이어 15는 미사용(예약)이며, 레이어 16은 다른 [1]문자에 사용됩니다.

이 독특한 디자인은 하나조노 대학 국제선불교연구소의 크리스찬 위튼에 의해 비판되어 왔다.그는 문자 변형의 관계는 매우 복잡하며 고정적이고 1차원적이며 유선화된 코드화로는 표현될 [3]수 없다고 주장한다.Ken Lunde는 "대만에서 가장 잘 고안된 문자 집합 표준 중 하나"라고 설명하면서 그 구조를 "진정으로 존경받는 것"이라고 설명하지만 OpenType의 변형 형태 대체는 동일한 수준의 [1]기능을 제공할 수 있다는 결론을 내렸습니다.

CCII는 1987년판 기준으로 약 53940개의 코드 포인트를 정의하고 있지만 1989년의 최신 초안에서는 이를 75684개의 코드 포인트(44167개의 고유 문자와 31517개의 변형으로 구성)로 확장했습니다.의회도서관에서 사용되는 변종인 EACC는 15686자로 구성된 [1]더 작은 세트만 포함합니다.

도입

1995년 현재 CCCII 또는 EACC는 주로 미국, 홍콩 대만의 도서관에서 사용되었습니다.CCII는 범CJK 커버리지를 약속했지만, 그 지원은 전문 하드웨어에 한정되어 있었습니다.루트 문자 대 변종 문자를 사용해야 하는 시기를 확인하기 어려웠고, 확실하게 확립된 참조 문자의 부족으로 인해 문자 채택이 더욱 제한되었으며, 그 결과 Big5가 다른 지역에서 중국인에게 더 많이 사용되었습니다.(당시 [3]유니코드는 아직 널리 채택되지 않았기 때문에) 도서관 사용.

2009년 현재, EACC는 여전히 전문 서지 [1]목적으로 광범위하게 사용되고 있다.그것은 [1]유니코드의 중요한 선구자이기도 했다.Unicode 한지 문자는 Unihan 데이터베이스의 대응하는 CCII 및 EACC 코드를 참조합니다.kCCCII그리고.kEACCEACC와 유니코드 사이의 한자, 한글, 가나 및 구두점 지도표는 [13]의회도서관에서 구할 수 있다.[4]

구두점, 기호, 가나 및 자모 차트

다음은 문장 부호, 기호, 가나 및 한글 자모에 대한 차트로, 문자를 보여주고 가능한 유니코드 매핑을 제공합니다.가능한 경우 게시된 매핑 데이터에 대해 참조됩니다.

한글 음절에 대한 유니코드 매핑은 간결하게 하기 위해 아래에 생략되어 있지만 [14]의회도서관에 의해 문서화되어 있습니다.CCCII 한지 번호는 수만 개로[1][3] 아래에 표시되어 있지 않습니다(단, 소수점 또는 숫자로도 비한지 범위에 포함되어 있는 경우는 제외).Unihan[4] 데이터베이스 및 [9][8]다른 곳에서 Unicode로의 매핑을 사용할 수 있습니다.

문자 집합 0x2120(플레인 1, 행 0: 홍콩 구두점)

CCCII는 보통n [1]94세트이므로 보통 0x2120으로 [9]시작하는 코드를 사용하지 않지만 다음 레이아웃은 [8]홍콩의 라이브러리에서 사용되는 배리언트에 의해 사용됩니다.

CCCII([8]홍콩)(프리픽스 0x2120)
0 1 2 3 4 5 6 7 8 9 A B C D E F
2배 ´ ¨
3배
4배 ± × ÷
5배 ° ¢ £ §
6배
7배

문자 집합 0x2121(플레인 1, 행 1: 컨트롤용으로 예약됨)

제어 [1]코드용으로 예약된 평면 1 행 1에는 문자가 할당되지 않습니다.

문자 집합 0x2122(평면 1, 2행: 수학적 연산자)

이 행에는 수학적 연산자가 포함되어 있습니다.EACC는 이 행을 [13]비워 둡니다.다음 표는 [2][9]대만에서 온 소식통에 대한 것입니다.

CCCII(대만)[9][15] (0x2122로 프리픽스)
0 1 2 3 4 5 6 7 8 9 A B C D E F
2배 ± × ÷
3배 Δ
4배
5배 π
6배
7배

다음 표는 홍콩 도서관 그룹인 홍콩 혁신 사용자 그룹이 제공하고 [16][8]홍콩 대학이 주최하는 CCCII 데이터에 대한 것이다.이 행에는 전혀 다른 레이아웃이 사용됩니다.

CCCII(홍콩)([8]프리픽스 0x2122)
0 1 2 3 4 5 6 7 8 9 A B C D E F
2배 ¬
3배
4배
5배
6배
7배

문자 집합 0x2123(플레인 1, 3행: 로마자 및 구두점)

이 행에는 구두점, 아랍어 서부 숫자 및 [9]로마자가 포함됩니다.Wansung 코드3행과 GB 2312의 3행비교합니다.

다양한 베리에이션에 의해, 0x212320(MARC 사양에서는 인식),[7][8] 0x21231(ANSI 규격에 기재되어 있어 [7][8]MARC에서도 인식) 또는 0x21635F로,[9] 다양한 IDE 공간(U+3000)을 부호화합니다.EACC는 [7]이 세트에 하이픈 마이너스, 괄호 및 표의 공간만 포함합니다.

CCCII/EACC[13][9][15](0x2123으로 프리픽스)
0 1 2 3 4 5 6 7 8 9 A B C D E F
2배 IDSP[a] !/IDSP[b] " # $ % & ' (/마이너스) )/표시 * + , -/ . /
3배 0 1 2 3 4 5 6 7 8 9 : ; < > = > ?
4배 @ A B C D E F G H I J K L M N O
5배 P Q R S T U V W X Y Z [ \ ] _
6배 '/' a b c d e f g h i j k l m n o
7배 p q r s t u v w x y z { } ~
EACC에 포함되어 있습니다.

문자 집합 0x212A(플레인 1, 10행: 내부 IME 문자 및 geta 마크)

EACC에서 이 행에는 내부적으로 RLIN 입력 [17]방식으로 문자 구성요소를 나타내기 위해 사용되는 여러 개인 사용 영역 매핑 문자가 포함됩니다. RLIN 입력 방식은 의회도서관이 비로마 카탈로그 [18]작성에 사용합니다.이러한 컴포넌트 문자는 IME 내부에서만 사용해야 하며, 다른 곳에서 발견된 경우 geta 마크(U+3013)[17]로 대체할 수 있습니다.이 행에는 0x212A46에도 이 문자가 포함됩니다.이 행은 [1]CCII에서는 할당 해제되어 있습니다만, CCII의 [9]매핑 중에는 그 위치에 geta 마크가 표시되어 있는 것도 있습니다.

EACC[13](0x212A로 프리픽스)
0 1 2 3 4 5 6 7 8 9 A B C D E F
2배
3배
4배
5배
6배
7배

문자 집합 0x212B(평면 1, 11행: 구두점)

이 행에는 다른 기호 외에 [1][7]중국어로 사용되는 다양한 구두점이 포함되어 있습니다.CCCII는 이 [1]행에 35개의 구두점 세트를 포함합니다.EACC는 이 행에 13자만 포함합니다(아래 상자에 표시).[7]

CCCII/EACC[13][9][15](0x212B로 프리픽스)
0 1 2 3 4 5 6 7 8 9 A B C D E F
2배 _
3배 [/filename](/[/filters)] ]/표시 ·/
4배
5배 Cifrão symbol.svg ¢ £ ¥ d. s. ®
6배 © §
7배 α
EACC에 포함되어 있습니다.

문자 집합 0x212C~0x212E(플레인 1, 12~14행: 라디칼 및 서수)

이 행들은 중국 [1]소수점, [9]로마 숫자, 천상의 줄기와 [15]지상의 가지포함합니다.

CCCII[15](0x212C로 프리픽스)
0 1 2 3 4 5 6 7 8 9 A B C D E F
2배
3배
4배
5배
6배 ⼿
7배
CCCII[8][15](0x212D로 프리픽스)
0 1 2 3 4 5 6 7 8 9 A B C D E F
2배
3배
4배 ⽿
5배 / 訁訁
6배
7배 / 釒釒
CCCII[9][8][15](0x212E로 프리픽스)
0 1 2 3 4 5 6 7 8 9 A B C D E F
2배 / 飠飠 ⾿
3배
4배
5배
6배
7배

문자 집합 0x212F(플레인 1, 15행: 중국어 숫자 및 보포모포)

이 행에는 중국 숫자와 [1]보포모포가 포함되어 있습니다.EACC 에는, 표의 영(0)[7] 만이 포함됩니다.

CCCII/EACC[13][15][9](0x212F로 프리픽스)
0 1 2 3 4 5 6 7 8 9 A B C D E F
2배
3배
4배
5배 ˊ ˇ ˋ ˙ / ﹒﹒[c]
6배
7배 ü
EACC에 포함되어 있습니다.

문자 집합 0x272B(평면 7, 열 11: 참조 마크)

행에는 참조 마크(고메지루시)[9]가 포함되어 있습니다.

CCCII[9](0x272B로 프리픽스)
0 1 2 3 4 5 6 7 8 9 A B C D E F
6배

문자 집합 0x272E–0x272F(플레인 7, 14~15행: 대체 보포모포)

홍콩의 도서관에서 사용되는 변형은 평면 1행 15에 보포모포 문자를 포함하지 않고 평면 [8]7에 다른 레이아웃으로 포함합니다.

CCCII([8]홍콩)(프리픽스 0x272E)
0 1 2 3 4 5 6 7 8 9 A B C D E F
7배
CCCII(홍콩)(프리픽스 0x272F)
0 1 2 3 4 5 6 7 8 9 A B C D E F
2배
3배

문자 집합 0x6921(플레인 73, 1행: 일본어 구두점)

이 행은 레이어 13의 첫 번째 평면인 평면 73에 있으며, 여기에는 일본어 [12]지원 문자가 포함되어 있습니다.구두점이 [7]포함되어 있습니다.JIS X 0208의 1행과 비교합니다.이 행은 포함되는 문자의 레이아웃에 따르는 경향이 있습니다.

CCCII/EACC[13][9][8](0x6921로 프리픽스)
0 1 2 3 4 5 6 7 8 9 A B C D E F
2배
3배
4배
5배
6배
7배

문자 집합 0x6924(플레인 73, 4행: 히라가나)

이 행에는 히라가나가 포함되어 있습니다.JIS X 0208의 4열을 비교합니다.

CCCII/EACC[13][9][8](0x6924로 프리픽스)
0 1 2 3 4 5 6 7 8 9 A B C D E F
2배
3배
4배
5배
6배
7배

문자 집합 0x6925(플레인 73, 5행: 가타카나)

이 행에는 가타카나가 포함되어 있습니다. 행에 대응하는 JIS X 0208의 5행과 별도의 다쿠텐과 handakuten을 더한 을 비교합니다.

CCCII[13][9]/EACC(0x6925로 프리픽스)
0 1 2 3 4 5 6 7 8 9 A B C D E F
2배
3배
4배
5배
6배
7배 ゙/ / ゛゛ ゚/ / ゜゜

문자 집합 0x6F24–0x6F25(플레인 79, 4~5행: jamo)

이 행에는 한국의 자모가 들어 있습니다.

EACC[13](0x6F24 프리픽스)
0 1 2 3 4 5 6 7 8 9 A B C D E F
5배
6배
7배
EACC[13](0x6F25 프리픽스)
0 1 2 3 4 5 6 7 8 9 A B C D E F
2배

문자 집합 0x6F76(플레인 79, 행 86: 고대 한글)

이 행에는 더 이상 일반적으로 사용되지 않는 여러 개의 역사적인 한글 문자가 포함되어 있습니다.이들 중 일부는 개인 사용 [17]영역에 매핑됩니다.

EACC[13](0x6F76 프리픽스)
0 1 2 3 4 5 6 7 8 9 A B C D E F
2배
3배
4배
5배
6배
7배

문자 집합 0x7B25(플레인 91, 5행: 보충 가타카나)

이 행에는 외국 음소를 [9]쓰는 데 사용되는 추가 가타카나가 포함되어 있습니다.

CCCII[9](0x7B25로 프리픽스)
0 1 2 3 4 5 6 7 8 9 A B C D E F
7배

각주

  1. ^ ISO 2022n 94 세트의 트레일 바이트 범위를 벗어났지만 일부 [7]구현에서 사용되고 있는 것으로 기록되었습니다.
  2. ^ EACC의 [7]ANSI 규격에 지정되어 있는 표의 공간의 부호화.이것은 [15]0x212B3D의 느낌표와 더불어 CCII에서 [9]느낌표로 사용됩니다.여기에서는 [8]홍콩 HKIUG의 CCII 배리언트는 EACC에 따릅니다.
  3. ^ 부호화:: HanExtra 매핑에서는 이 [9]문자에 U+FE52가 사용됩니다.단, 여기에서는 다른 3개의 톤이 bopomofo로 마크되어 있는 ,, ,, ,[15] 뒤에 표시됩니다.매핑 U+02D9는 Big5 [19]등의 부호화 보포모포 범위에서 이 톤 마크에 더 많이 사용됩니다.

레퍼런스

  1. ^ a b c d e f g h i j k l m n o p q r s Lunde, Ken (2009). CJKV Information Processing: Chinese, Japanese, Korean & Vietnamese Computing (2nd ed.). Sebastopol, CA: O'Reilly. pp. 122–124. ISBN 978-0-596-51447-1.
  2. ^ a b c Tang, Audrey (2007-11-10). "Encode::HanExtra - Extra sets of Chinese encodings". CCCII: The earliest (and most sophisticated) Traditional Chinese encoding... used mostly in library systems.... Map for "CCCII" is supplied by the Koha Taiwan project.
  3. ^ a b c d Wittern, Christian (1995-05-01). "Chinese character codes: an update". International Research Institute for Zen Buddhism / Hanazono University. Archived from the original on 2004-10-12.
  4. ^ a b c Jenkins, John H.; Cook, Richard; Lunde, Ken (2020-03-05). "Unicode Han Database (Unihan)". Unicode Standard Annex #38.
  5. ^ "Archived copy". Archived from the original on 2016-06-15. Retrieved 2016-06-15.{{cite web}}: CS1 maint: 제목으로 아카이브된 복사(링크)
  6. ^ Kangxi Dictionary, p. 1296, char. 1
  7. ^ a b c d e f g h i j Library of Congress (2007-12-05). "Code Table East Asian Punctuation Marks". MARC 21 Specifications for Record Structure, Character Sets, and Exchange Media.
  8. ^ a b c d e f g h i j k l m n o p q Hong Kong Innovative Users Group Unicode Task Force. "HKIUG Code Table for CJK Characters: Mapping to Unicode". University of Hong Kong Libraries.
  9. ^ a b c d e f g h i j k l m n o p q r s t u v w Tang, Audrey; Koha Taiwan. "Map for CCCII". Encode::HanExtra. CPAN.
  10. ^ "2.4: Multiple byte graphic character sets". International Register of Coded Character Sets to be Used With Escape Sequences (ISO-IR) (PDF). ITSCJ/IPSJ. p. 14.
  11. ^ Library of Congress (2007-12-05). "Technique 2: Using standard alternate graphic character sets". MARC 21 Specifications for Record Structure, Character Sets, and Exchange Media.
  12. ^ a b c Lunde, Ken (1995-12-18). "2.5.2: CCCII". CJK.INF Version 1.9.
  13. ^ a b c d e f g h i j k l Library of Congress (2007-12-05). "East Asian Code Tables". MARC 21 Specifications for Record Structure, Character Sets, and Exchange Media.
  14. ^ Library of Congress (2007-12-05). "Code Table Korean Hangul". MARC 21 Specifications for Record Structure, Character Sets, and Exchange Media.
  15. ^ a b c d e f g h i j 표시된 문자는 교토 대학의 야스오카 고이치(Yasuoka Koichi)가 배포한 CCCII의 대표 BDF 글꼴과 부분적으로 상호 참조된다.
  16. ^ Hong Kong Innovative Users Group (2013-01-07). "Introduction to Hong Kong Innovative Users Group". University of Hong Kong Libraries.
  17. ^ a b c Library of Congress (2004-09-02). "Summary List of MARC 21 Characters Assigned to the Private Use Area (PUA)". MARC 21 Specifications for Record Structure, Character Sets, and Exchange Media.
  18. ^ Morris, Susan (2007). "Finding JACKPHY: Online Cataloging to Include Arabic, Hebrew, Other Scripts". Library of Congress Information Bulletin. Vol. 66, no. 12.
  19. ^ van Kesteren, Anne. "big5". Encoding Standard. WHATWG.
  • 이 페이지의 일부 정보는 CNS 공식 웹 사이트의 정보를 기반으로 합니다.

외부 링크