빅5
Big5![]() |
MIME / IANA | 빅5 |
---|---|
에일리어스 | Big-5, 大五碼 |
언어 | 중국어 번체, 영어 부분 지원: 중국어 간체, 그리스어, 일본어, 러시아어, 불가리아어,[1] 일부 IPA 문자(음성 사용용) |
작성자 | 정보 산업 연구소 |
분류 | 확장 [a][b]ASCII, 가변폭 부호화, DBCS, CJK 부호화 |
확장 | ASCII[b] |
내선번호 | Windows-950, Big5-HKSCS, 기타 다수 |
기타 관련 부호화 | CNS 11643 |
Big-5 또는 Big5는 대만, 홍콩, 마카오에서 번체 한자로 사용되는 한자 인코딩 방식입니다.
간체자를 사용하는 중화인민공화국(PRC)은 GB 18030 문자 집합을 대신 사용합니다.
Big5는 그것을 [2]개발한 대만의 5개 회사의 컨소시엄에서 이름을 따왔다.
조직
원래 Big5 문자 집합은 먼저 사용 빈도, 다음으로 스트로크 수를 기준으로 정렬되고 마지막으로 Kangxi 기수를 기준으로 정렬됩니다.
원래 Big5 문자 집합에는 일반적으로 사용되는 문자가 많이 없었습니다.이 문제를 해결하기 위해 각 벤더는 자체 확장을 개발했습니다.ETen 확장은 인기를 통해 현재의 Big5 규격의 일부가 되었다.
Big5의 구조는 ISO 2022 표준에 준거하지 않지만 Shift JIS 인코딩과 어느 정도 유사합니다.Double-Byte Character Set(DBCS; 더블바이트 문자 집합)은 다음과 같습니다.
첫 번째 바이트("리드 바이트") | 0x81 ~ 0xfe (또는 사용자 정의 이외의 문자의 경우 0xa1 ~0µ9) |
두 번째 바이트 | 0x40~0x7e, 0xa1~0xfe |
(16진수를 나타내는 프레픽스0x).
표준 할당(벤더 또는 사용자 정의 확장 제외)에서는 0x7F ~ 0xA0 또는 0xFF 바이트를 리드(첫 번째) 또는 트레일(두 번째) 바이트로 사용하지 않습니다.바이트 0xA1 ~ 0xFE는 더블바이트(Big5) 코드의 리드 바이트와 트레일 바이트 모두에 사용됩니다.바이트 0x40 ~0x7E는 리드 바이트 뒤에 트레일 바이트로 사용되거나, 그렇지 않으면 싱글 바이트 코드로 사용됩니다.두 번째 바이트가 어느 범위에도 속하지 않으면 동작이 지정되지 않습니다(즉, 시스템에 따라 다름).또한 Big5 문자 세트의 일부 변형(예를 들어 HKSCS)에서는 0x81 ~0xA0 범위의 값을 포함한 리드 바이트의 확장 범위를 사용하는 반면 다른 변형에서는 0xFD ~0xFF를 단일 바이트 코드로 사용하여 리드 바이트 범위를 제한합니다.0xA1~0xFC)[3]에 접속합니다.
개개의 Big5 코드의 수치에는, 자주 4 자리수의 16 진수치가 지정됩니다.이 숫자는 Big5 코드를 구성하는2 바이트를 마치2 바이트가 16 비트 숫자의 빅 엔디안인 것처럼 나타냅니다.예를 들어, 전폭 공간의 Big5 코드(바이트 0xa1 0x40)는 보통 0xa140 또는 A140으로 기술됩니다.
엄밀히 말하면 Big5 인코딩에는 DBCS 문자만 포함됩니다.단, 실제로는 Big5 코드가 항상 지정되지 않은 시스템 의존형 싱글바이트 문자 세트(ASCII 또는 코드 페이지 437 등의 8비트 문자 세트)와 함께 사용되므로 Big5 인코딩 텍스트에 DBCS 문자와 싱글바이트 문자가 혼재되어 있습니다.0x00 ~ 0x7f 범위의 바이트 중 더블바이트 문자의 일부가 아닌 바이트는 싱글바이트 문자로 간주됩니다(이 문제에 대한 자세한 설명은 아래의 "일치하는 SBCS"에 대한 설명을 참조하십시오).
ASCII 이외의 싱글바이트가 2바이트 문자의 일부가 아닌 허용치를 벗어나는 의미는 시스템에 따라 다릅니다.오래된 MSDOS 기반 시스템에서는 8비트 문자로 표시될 가능성이 높으며, 최신 시스템에서는 예기치 않은 결과가 나타나거나 오류가 발생할 수 있습니다.
조직을 보다 상세하게 조사하다
원래의 Big5에서는, 부호화는 다른 존으로 구분되어 있습니다.
0x8140 ~0xA0FE | 사용자 정의 문자용으로 예약됨 |
0xA140 ~0xA3BF | 그래픽 문자 |
0xA3C0 ~0xA3FE | 예약됨, 사용자 정의 문자용 아님 |
0xA440 ~0xC67e | 자주 사용하는 문자 ★★★ |
0xC6A1 ~0xC8FE | 사용자 정의 문자용으로 예약됨 |
0xC940 ~0xF9D5 | 빈도가 낮은 문자 " " " |
0xF9D6 ~0xFEFE | 사용자 정의 문자용으로 예약됨 |
"그래픽 문자"는 실제로 구두점, 부분 구두점(예를 들어 대시 반, 생략 반, 아래 참조), 딩박트, 외국어 문자 및 기타 특수 문자(예: "전폭" 표시 형식, 쑤저우 숫자의 숫자, 주음부호 등)로 구성됩니다.
대부분의 벤더 내선번호에서는 확장문자는 사용자 정의 문자용으로 예약된 다양한 존에 배치되어 있습니다.이 존들은 보통 각각 이전 존과 관련되어 있는 것으로 간주됩니다.예를 들어, 추가 "그래픽 문자"(예: 구두점)는 0xa3c0-0xa3fe 범위에 배치될 것으로 예상되며, 추가 로그 그래프는 0xc6a1-0xc8fe 또는 0xf9d6-0xfe 범위에 배치될 것으로 예상된다.예를 들어, 키릴 문자나 일본어 가나가 "자주 사용하는 문자"와 관련된 영역에 배치되는 등 확장 문자를 많이 추가할 수 없는 경우가 있습니다.
Big5 코드가 실제로 암호화하는 것
개별 Big5 코드가 항상 완전한 의미 단위를 나타내는 것은 아닙니다.Logogram의 Big5 코드는 항상 Logogram이지만 "그래픽 문자" 섹션의 코드가 항상 완전한 "그래픽 문자"인 것은 아닙니다.Big5 인코딩은 문자 또는 문자의 일부에 대한 특정 그래픽 표현으로, 마침 두 개의 공백이 있는 ASCII 문자로 구성되어 있습니다.이는 CJK(중국어, 일본어, 한국어) 컴퓨팅에서 일반적으로 사용되는 더블바이트 문자 집합의 특성으로 Big5만의 문제는 아닙니다.
(이러한 것은 이론적으로는 틀렸기 때문에 역사적 관점에서 설명할 필요가 있습니다.텍스트 모드 퍼스널 컴퓨팅이 여전히 표준이었던 옛날에는 문자가 보통 단일 바이트로 표시되고 각 문자가 화면에서 한 자리를 차지했습니다.따라서 더블바이트 문자가 화면에서 두 가지 위치를 차지해야 한다고 주장하는 실질적인 이유가 있었습니다. 즉, 기성 미국제 소프트웨어는 DBCS 기반 시스템에서 수정 없이 사용할 수 있습니다.문자가 임의의 수의 화면 위치를 취할 수 있는 경우, 1바이트의 텍스트가 1개의 화면 위치를 차지한다고 가정하는 소프트웨어는 잘못된 출력을 생성합니다.물론 컴퓨터가 텍스트 화면을 다루지 않아도 된다면 제조업체는 이러한 인위적인 제한을 강요하지 않을 것입니다. Apple Macintosh가 그 예입니다.단, 텍스트스크린 기반 시스템에서 올바르게 동작하도록 인코딩 자체를 설계해야 합니다.)
이 점을 설명하기 위해 Big5 코드 0xa14b(…)를 검토합니다.영어 사용자에게는 줄임표처럼 보이고 Unicode 표준에서는 그렇게 인식됩니다.그러나 중국어에서는 줄임표는 두 개의 한자(…)의 공간에 들어가는 6개의 점으로 구성되어 있기 때문에 사실 중국어 줄임표에는 Big5 코드가 없고 Big5 코드 0xa14b는 중국 줄임표의 절반만을 나타냅니다.전체 줄임표는 두 개의 한자 공간을 차지해야 하며, 많은 DBCS 시스템에서는 한 개의 DBCS가 한 개의 한자 공간을 정확히 차지해야 하므로 줄임표의 절반만 나타냅니다.
Big5로 인코딩된 문자는 보통 텍스트 파일에서 쉽게 사용할 수 있는 것을 항상 나타내는 것은 아닙니다.예를 들어, 「따옴표」(0xa1ca, ),)는, 문예 작품의 타이틀로 조판할 필요가 있습니다.또 다른 예로 쑤저우 숫자를 들 수 있는데, 이것은 숫자를 적어도 두 줄로 구성된 2-D 형태로 배치해야 하는 과학적 표기법이다.
일치하는 SBCS
실제로 Big5는 일치하는 Single Byte Character Set(SBCS; 싱글바이트 문자 집합)이 없으면 사용할 수 없습니다.이는 대부분 호환성이 있기 때문입니다.단, 다른 CJK DBCS 문자 집합과 마찬가지로 사용할 SBCS가 지정되어 있지 않습니다.Big5는 항상 DBCS로 정의되어 있지만, Big5를 사용할 때는 적절한 미지정 SBCS와 페어링하여 MBCS라고 부르는 사람도 있습니다.단, Big5 자체는 정의대로 엄밀하게 DBCS입니다.
미지정 SBCS를 사용하는 것은 이론적으로 사용되는 SBCS가 시스템에 따라 다를 수 있음을 의미합니다.현재는 ASCII만이 SBCS를 사용할 수 있습니다.그러나 오래된 DOS 기반 시스템에서는 위치 127을 포함한 제어 코드 영역에 특별한 기호가 있는 코드 페이지 437이 훨씬 더 흔했습니다.단, 중국어 키트를 탑재한 Macintosh 시스템 또는 cxterm 터미널 에뮬레이터를 실행하는 Unix 시스템에서는 Big5와 페어링된 SBCS는 Code Page 437이 아닙니다.
Big5의 유효 범위를 벗어나면 오래된 DOS 기반 시스템은 해당 시스템의 Big5와 쌍을 이루는 SBCS에 따라 일상적으로 해석합니다.예를 들어 127~160 문자는 무효인 Big5가 생성되기 때문에 회피되는 것이 아니라 Code Page 437에서 유효한 문자가 되기 때문에 사용됩니다.
따라서 Big5가 Big5의 DBCS와 ASCII의 SBCS로 구성된 MBCS라는 현대적 특성은 역사적으로 부정확하고 잠재적으로 결함이 있을 수 있습니다. 일치하는 SBCS를 선택하는 것은 이론적으로도 Big5와 전혀 무관하기 때문입니다.
역사
ASCII가 중국어, 일본어, 한국어로 사용되는 큰 문자 집합을 지원하지 못함에 따라 정부와 업계는 언어를 컴퓨터로 렌더링할 수 있는 창의적인 해결책을 찾아야 했습니다.다양한 애드혹 및 통상 독자 사양의 입력 방식이 표준 시스템 개발로 이어졌습니다.그 결과 1984년 대만정보산업연구소에 의해 Big5 인코딩이 정의되었다."Big5"라는 이름은 이 표준이 대만의 5개 대형 IT 기업의 협업에서 나왔다는 것을 인정하기 위한 것입니다.Acer(일본), MiTAC(일본), ZiaJia(일본), ZERO ONE 테크놀로지(일본), First International Computer(국제 최초 컴퓨터)(일본).
Big5는 여러 상용 소프트웨어 패키지, 특히 E-TEN Chinese DOS 입력 시스템(ETEN Chinese System)에 채택된 번체 한자 집합을 사용한 중국인들 사이에서 급속히 보급되었습니다.중화민국 정부는 1980년대 중반에 Big5가 컴퓨터에 번체 중국어를 사용하는 사실상의 표준이 되었기 때문에 Big5를 그들의 표준으로 선언했습니다.
내선번호
원래 Big-5는 일반 국민문자 표준형식표 (4808자)와 덜 일반적인 국민문자 (6343자)의 CJK 로그그램만 포함되며 사람들의 이름, 지명, 사투리, 화학, 생물학, 일본어 가나 문자는 포함되지 않는다.그 결과 많은 Big-5 지원 소프트웨어에는 이 문제를 해결하기 위한 확장이 포함되어 있습니다.
UTF-8 또는 UTF-16은 다양한 변형으로 인해 현대적 사용에 보다 일관된 코드 페이지가 됩니다.
벤더 확장
ETEN 확장
ETEN(중국어) 운영 체제에서는 IBM 5550의 코드 페이지에 있지만 일반 Big5에는 없는 일부 문자에 대한 지원을 추가하기 위해 다음과 같은 코드 포인트가 추가되었습니다.
- A3C0 ~ A3E0 : 33개의 컨트롤 문자
- C6A1~C875: 원 1~10, 괄호 1~10, 로마 숫자 1~9(i~ix), CJK 급진 문자, 일본어 히라가나, 일본어 가타카나, 키릴 문자
- F9D6–F9FE: ''', ''', ''', ''', ''', ''', ''' 등의 문자 뒤에 34개의 반문자 기호가 추가된다.
일부 Eten 버전에는 추가 그래픽 기호와 간체 한자가 있습니다.
Microsoft 코드 페이지
Microsoft ( 軟 )는, F9D6-F9 를 서포트하는 Microsoft Windows 로 사용하기 위해서, 코드 페이지 950 로서 독자적인 버전의 Big5 확장을 작성했습니다.ETEN의 내선번호에서 FE 코드 포인트.Windows 의 일부 버전에서는, 유로 통화 기호는 Big-5 코드 포인트 A3E1 에 매핑 됩니다.
중국어 번체판 Windows(또는 Windows 2000 이후 버전)에 Microsoft의 HKSCS 패치를 설치하면 코드 페이지 950을 사용하는 응용 프로그램은 자동으로 숨김 코드 페이지 951 테이블을 사용합니다.이 표는 [4]표준으로 지정된 호환성 코드 포인트를 제외하고 HKSCS-2001의 모든 코드 포인트를 지원합니다.
IBM 코드 페이지
마이크로소프트의 코드 페이지 950과 달리 IBM의 CCSID 950은 단일 바이트 코드 페이지 1114(CCSID 1114) 및 이중 바이트 코드 페이지 947(CCSID 947)[5][6][7]로 구성됩니다.리드바이트 0xA3,[8] 0xC6,[9][10] 0xC7[11] 및 0xC8의 [9][12]ETEN 확장자가 포함되어 있지만 리드바이트 0xF9(Microsoft 포함)를 가진 확장자는 생략하고 사용자 정의 [9][13]문자로 개인 사용 영역에 매핑합니다.또한 Trail 바이트가 0x81~A0인 2개의 비 ETEN 확장 영역도 포함되어 있습니다.즉, 통상적인 Big5 트레일 바이트 범위 밖이지만 Big5+ 트레일 바이트 범위와 유사합니다.영역 5에는 리드 바이트가 0xF2~F9가 있으며, 영역 9에는 리드 바이트가 0x81~8C로 사용자 [14]정의되어 있습니다.
IBM은 Big-5 배리언트의 유로 부호 업데이트를 싱글 바이트(0x80)와 더블 바이트(0xA3E1)의 유로 [15]부호가 모두 포함된 CCSID 1370이라고 합니다.싱글 바이트 코드 페이지 1114(CCSID 5210)와 더블 바이트 코드 페이지 947(CCSID 21427)[15][16][17]로 구성됩니다.IBM DB2의 Microsoft 버전과 더 나은 호환성을 위해 IBM은 또한 순수 더블바이트 코드 페이지[18] 1372와 마이크로소프트 코드 페이지 [19]950에 해당하는 관련 가변 폭 CCSID 1373을 정의합니다.
IBM은 HKSCS-2001 Big5 코드 페이지로(CPGID 1374년 CCSID 5470을 이중 바이트 구성 요소로서)[20][21]은 HKSCS-2008 코드 페이지(CPGID 1374년 CCSID과 13662을 이중 바이트 구성 요소)[23]고 CC에 CCSID 5471 CCSID 9567은 HKSCS-2004 코드 페이지(CPGID 1374년 CCSID 9566을 이중 바이트 구성 요소로서)[22]고 CCSID 13663 할당합니다.SID1375assi은현재 CCSID 13663에 [24]상당하는 성장 중인 HKSCS 코드 페이지로 이동합니다.
중국해 글꼴
중국해 글꼴(China Sea 글꼴)[25]은 중국해에서 만든 중국어 번체 글꼴입니다.글꼴은 별도로 판매되는 경우는 거의 없지만 Microsoft Office 97 중국어 버전 등 다른 제품과 함께 번들로 제공됩니다.글꼴은 일본어 가나, 고쿠지, 기타 Big-5에 없는 문자를 지원합니다.그 결과, 중국해 확장자는 정부가 지원하는 [as of?]확장자보다 더 인기가 많아졌다.일부 홍콩 BBS는 HKSCS가 도입되기 전에 중국해 글꼴로 인코딩을 사용했다.
'사쿠라' 글꼴
The 'Sakura' font (日和字集 Sakura Version) is developed in Hong Kong and is designed to be compatible with HKSCS.HKSCS에는 없는 고쿠지 및 독점 딩배트(도라에몽 포함)를 지원합니다.
Unicode-at-on
Unicode-at-on(이전 BIG5 확장자)은 코드 페이지테이블을 변경하여 BIG-5를 확장하지만 버전2 이후의 중국해 확장자를 사용합니다.그러나 중국해의 파산, 개발의 지연, 그리고 HKSCS와 유니코드의 인기(프로젝트는 HKSCS와 호환되지 않음)가 높아짐에 따라 이 확장의 성공은 기껏해야 제한적이다.
이러한 문제에도 불구하고 유니코드 개인 사용 영역에 매핑된 문자는 유니코드 형식으로 문자를 내보낼 때 표준화된 동등한 문자에 다시 매핑됩니다.
OPG
The web sites of the Oriental Daily News and Sun Daily, belonging to the Oriental Press Group Limited (東方報業集團有限公司) in Hong Kong, used a downloadable font with a different Big-5 extension coding than the HKSCS.
공식 내선번호
타이완 교육부 글꼴
대만 교육부는 자체 글꼴인 대만 교육부 글꼴(Taiwan Education Matistry 글꼴)을 내부적으로 사용할 수 있도록 제공했습니다.
타이완 농업 위원회 글꼴
대만의 농업위원회 글꼴인 행정원은 '물고기'의 84자, '새'의 7자를 포함한 133자의 사용자 지정 글꼴인 '대만 농업위원회 글꼴'을 도입했다.
빅5 이상
중국디지털화기술재단(中國디지털화기술재단)은 1997년에 Big5+를 도입했습니다.Big5+는 Unicode 1.1에 모든 CJK 로그그램을 포함하기 위해 20000개 이상의 코드 포인트를 사용했습니다.그러나 추가 코드 포인트는 원래 Big-5 정의를 초과하여(Big5+는 높은 바이트 값 81-FE 및 낮은 바이트 값 40-7E 및 80-FE를 사용), 새로운 코드 페이지 파일 없이 Microsoft Windows에 설치할 수 없습니다.
빅 5E
Windows 사용자가 커스텀 폰트를 사용할 수 있도록 하기 위해 Chinese Foundation for Digitalization Technology는 Big-5E를 도입하여 3954자(8E40-A0FE, 8140-86DF, 86E0-875C)를 추가하고 ETEN 확장자에서 일본어 가나를 삭제했습니다.Big 5+와 달리 Big 5E는 원래 정의 내에서 Big 5를 확장합니다.Mac OS X 10.3 이후에서는 LiHei Pro(儷 Pro.ttf) 및 LiSong Pro(儷 Pro.ttf) 글꼴로 Big-5E를 지원합니다.
Big5-2003
중국 디지털화 기술 재단은 Big5의 정의를 만들어 노트 형태로 CNS 11643에 넣었고, 이는 대만의 공식 표준의 일부가 되었습니다.
Big5-2003에는 1984년 ETEN 확장자(코드포인트 A3C0-A3E0, C6A1-C7F2, F9D6-F9)에 도입된 모든 Big-5 문자가 포함되어 있습니다.FE) 및 유로 기호.당국은 CNS 11643에 이러한 문자가 포함되어 있지 않다고 주장했기 때문에 키릴 문자는 포함되지 않았다.
CDP
1990년대 후반에 중국판 데이터 처리 글꼴(漢 data process ( ()을 만들었는데, 최신 버전 2.5에는 모지쿄 글꼴보다 적은 112,533자가 포함되어 있습니다.
HKSCS
홍콩은 또한 문자 인코딩에 빅5를 채택했다.그러나 광둥어에는 일반 Big5 문자 집합에서 사용할 수 없는 자체 문자가 있습니다.이 문제를 해결하기 위해 홍콩 정부는 1995년에 Big5 확장자 GCCS(Government Chanese Character Set)를, 1999년에 Hong Kong Supplement Character Set(홍콩 부가 문자 집합)을 만들었습니다.홍콩 내선번호는 일반적으로 패치로 배포되었습니다.Microsoft에 의해 패치로 배포되고 있지만, 완전한 Unicode 글꼴은 홍콩 정부의 웹사이트에서도 구할 수 있습니다.
HKSCS에는 2개의 부호화 방식이 있습니다.하나는 Big-5 부호화 규격용이고 다른 하나는 ISO 10646 규격용입니다.최초 출시 이후에는 HKSCS-2001과 HKSCS-2004도 있습니다.HKSCS-2004는 기술적으로 국제표준화기구(ISO)가 2004년 4월에 발표한 ISO/IEC 10646:2003 및 개정판 1에 준거하고 있습니다.
HKSCS에는 공통 ETEN 확장자의 모든 문자 외에 중국어 간체 문자, 지명, 사람 이름 및 광둥어 구(불경어 포함)가 포함되어 있습니다.
2020년 현재[update], HKSCS의 최신판은 HKSCS-2016이지만, Big5의 모든 문자를 인코딩한 마지막판은 HKSCS-2008이며, 최신판에 추가된 문자는 ISO 10646/Unicode에만 매핑되어 있습니다(CJK Unified Ideal 확장자로 사용됨).또한 홍콩의 상황과 마찬가지로 마카오에 필요한 문자도 있지만 빅5나 HKSCS에는 포함되지 않기 때문에 빅5나 HKSCS에는 없는 문자로 구성된 마카오 보충 문자 집합이 개발되었지만, 이 문자 집합도 빅5에는 인코딩되지 않았습니다.MSCS의 첫 번째 배지는 [27]2009년에 유니코드 매핑에 포함시키기 위해 제출되었으며,[26] MSCS의 첫 번째 최종 버전은 2020년에 확립되었습니다.
가나 및 키릴 문자
0xC6 범위의 러시아어 키릴 문자와 목록 마커의 두 가지 주요 Big5 확장 레이아웃이 있습니다.A1 ~ 0xC875 。이것들은 [28]서로 호환되지 않습니다.아래 표에 비교되어 있습니다.
가나 및 키릴 문자의 ETEN 레이아웃은 HKSCS[29](HTML5 [30]포함) 및 Unicode-At-On[31] 변종 및 IBM 버전의 코드 페이지 [32][33][34]950에서도 사용되며, Big5-2003 [35]변종에서도 Kyrill 문자의 ETEN 레이아웃(키릴 문자는 생략).Windows-950 용으로 공개되어 있는 매핑파일에는 어느 것도 포함되어 있지 않습니다.이 Big5 범위는 [36]Unicode용 International Components에서 Windows-950을 구현함으로써 Private Use Area에 매핑됩니다.Python의 빌트인cp950
Windows 이외의 시스템에서 사용되는 코덱 구현 또는 코드 페이지950이 액티브한 Windows 코드페이지가 아닌 경우, BIG5 를 사용하고 있습니다.TXT [37]레이아웃기존 Mac OS 버전에는 [3]레이아웃이 없습니다.
Big5 코드 0xC6A1 ~0xC875 | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
|
「 」를 참조해 주세요.
레퍼런스
- ^ "Big5 (Traditional Chinese) character code table".
- ^ "Character Sets". chinesemac.org. Retrieved 2021-08-31.
- ^ a b Apple, Inc (2005-04-04) [1996-06-31]. Map (external version) from Mac OS Chinese Traditional encoding to Unicode 3.0 and later. Unicode Consortium.
- ^ "狗爺語錄 » Blog Archive » What is Code Page 951 (CP951)?". Archived from the original on 2007-02-22. Retrieved 2006-09-27.
- ^ "CCSID 950 information document". Archived from the original on 2014-12-02.
- ^ "CCSID 1114 information document". Archived from the original on 2016-03-27.
- ^ "CCSID 947 information document". Archived from the original on 2014-12-01.
- ^ "Lead byte A3: ibm-950_P110-1999". ICU Demonstration - Converter Explorer. International Components for Unicode.
- ^ a b c Zhu, HF.; Hu, DY.; Wang, ZG.; Kao, TC.; Chang, WCH.; Crispin, M. (1996). "Chinese Character Encoding for Internet Messages". Requests for Comments. IETF. doi:10.17487/rfc1922. RFC 1922.
- ^ "Lead byte C6: ibm-950_P110-1999". ICU Demonstration - Converter Explorer. International Components for Unicode.
- ^ "Lead byte C7: ibm-950_P110-1999". ICU Demonstration - Converter Explorer. International Components for Unicode.
- ^ "Lead byte C8: ibm-950_P110-1999". ICU Demonstration - Converter Explorer. International Components for Unicode.
- ^ "Lead byte F9: ibm-950_P110-1999". ICU Demonstration - Converter Explorer. International Components for Unicode.
- ^ "IBM Traditional Chinese Graphic Character Set for IBM BIG-5 Code" (PDF). IBM. 1999. C-H 3-3220-131 1999-04.
- ^ a b "CCSID 1370 information document". Archived from the original on 2016-03-27.
- ^ "CCSID 5210 information document". Archived from the original on 2014-11-29.
- ^ "CCSID 21427 information document". Archived from the original on 2016-03-27.
- ^ "CPGID 01372: MS T-Chinese Big-5 (Special for DB2)". IBM Globalization - Code page identifiers. Archived from the original on 2016-03-17.
- ^ "ibm-1373_P100-2002". ICU Demonstration - Converter Explorer. International Components for Unicode.
- ^ "CCSID 5471: Mixed Big-5 ext for HKSCS-2001". IBM Globalization - Coded character set identifiers. IBM. Archived from the original on 2014-11-29.
- ^ International Components for Unicode (ICU), ibm-5471_P100-2006.ucm, 2007-05-09
- ^ "CCSID 9567: Mixed Big-5 ext for HKSCS-2004". IBM Globalization - Coded character set identifiers. IBM. Archived from the original on 2014-11-29.
- ^ "CCSID 13663: Mixed Big-5 ext for HKSCS-2008". IBM Globalization - Coded character set identifiers. IBM. Archived from the original on 2014-11-29.
- ^ "CCSID 1375: Mixed Big-5 ext for HKSCS". IBM Globalization - Coded character set identifiers. IBM. Archived from the original on 2014-11-29.
- ^ 黃國書. "Chinasea 1.0 中國海字集". ISU FTP. Archived from the original on 2005-03-19. Retrieved 2016-12-05.
- ^ a b Macao Special Administrative Region Government (2020-06-11). "Submission of Macao's Vertical Extension (UNC Characters), Horizontal Extension, and IVSes Registration for MSCS" (PDF). ISO/IEC JTC 1/SC 2/WG 2 IRGN 2430.
- ^ Computer Chinese Characters Encoding Workgroup (2009-06-12). "Submission of Characters from Macao Information Systems Character Set" (PDF). ISO/IEC JTC 1/SC 2/WG 2 IRGN 1580. Archived from the original (PDF) on 2015-01-04.
- ^ Lunde, Ken (1996-07-12). "2.3.1: BIG FIVE". CJK.INF Version 2.1.
- ^ "Big5HKSCS-2004". Mozilla Taiwan.
- ^ van Kesteren, Anne. "big5". Encoding Standard. WHATWG.
- ^ "UAO 2.41 b2u". Mozilla Taiwan.
- ^ "Lead byte C6: ibm-950_P110-1999". ICU Demonstration - Converter Explorer. International Components for Unicode.
- ^ "Lead byte C7: ibm-950_P110-1999". ICU Demonstration - Converter Explorer. International Components for Unicode.
- ^ "Lead byte C8: ibm-950_P110-1999". ICU Demonstration - Converter Explorer. International Components for Unicode.
- ^ "Big5-2003 b2u". Mozilla Taiwan.
- ^ IBM; Unicode Consortium (2002-12-03). "windows-950-2000". International Components for Unicode.
- ^ 리드 바이트 0xC6 및 0xC7의 cp950 코덱 출력을 나타내는 스크립트
- ^ Unicode Consortium (2015-12-02) [1994-02-11]. BIG5 to Unicode table (complete).
- ^ "Big5-ETen vs Unicode mapping table". Mozilla Taiwan. 2002-02-24.
- Lunde, Ken (1999). CJKV Information Processing (First ed.). O'Reilly and Associates, Inc. ISBN 978-1-56592-224-2.
외부 링크
- Mozilla 및 Big5 인코딩 패밀리: Big5 인코딩 개요와 각 확장 코드 차트 및 관련 Firefox 버그(번체 중국어)
- Big5 문자 코드표
- 중국어 코드: Christian Wittern 업데이트
- CNS 11643 공식 웹사이트에서는 "중국어 정보 코드" 섹션에 Big5e 문자 집합(Big5의 확장 버전)에 대한 정보가 있습니다.
- Big5 소개 확장자 간의 차이를 포함합니다.
- ICU Converter Explorer의 Big5 그래픽 뷰
- 대만 교육부 글꼴 다운로드 페이지
- CDP 글꼴 다운로드 페이지
- 홍콩 보충 문자 집합 정보 다운로드 가능한 HKSCS 문서 및 글꼴
- Dynalab(華abcs)의 HKSCS 글꼴 다운로드 페이지.
- Microsoft Windows Codepage 950 (번체 중국어 Big5)
- on.cc OPG 글꼴 다운로드 페이지
- China Sea 글꼴 다운로드 페이지 (v3.0)
- Big5 코드셋의 개요