JIS X 0212
JIS X 0212![]() |
언어 | JIS X 0208과 함께 일본 지원용으로 제작되었습니다.언어 자체로는 실질적으로 지원하지 않습니다. |
---|---|
표준. | JIS X 0212:1990 |
현황 | 유니한 소스코드화된 문자 집합 자체는 JIS X 0208만큼 폭넓게 지원되지 않지만 EUC-JP에서 [1]사용되는 경우가 있습니다. |
분류 | 보조 문자 집합, ISO 2022, DBCS, CJK 인코딩 |
확장 | JIS X 0208 함께 사용 시 |
인코딩 형식 | EUC-JP ISO-2022-JP-1 |
에 의해 성공자 | JIS X 0213 |
기타 관련 부호화 | KS X 1002 |
JIS X 0212는 일본어로 사용되는 부가 문자를 인코딩하기 위한 코드화된 문자 집합을 정의하는 일본 산업 표준입니다.이 표준은 JIS X 0208(코드 페이지 952)을 보완하기 위한 것입니다.IBM 코드 페이지로서 953 또는 5049 번호가 부여됩니다(아래 참조).
이것은 유니코드의 CJK 통합 한자 소스 표준 중 하나이다.
역사
1990년, 일본 표준 협회(JSA)는 정보 교환을 위한 보충 일본어 그래픽 문자 집합의 보조 문자 집합의 JIS X 0212-1990 코드를 발표했습니다.이 표준은 JIS X 0208 문자 집합에서 사용할 수 있는 문자 범위를 기반으로 구축되어 해당 문자 집합의 커버리지 단점에 대처하기 위한 것입니다.
특징들
규격은 6,067자로 다음과 같이 구성되어 있습니다.
- 분음 부호가 있는 21개의 그리스 문자
- 동유럽 문자 26자(대부분 키릴 문자)
- 198자의 영문자(분음 부호 포함)
- 5,801 한자
인코딩
파일 등에서 JIS X 0212 문자를 사용할 수 있도록 하기 위해 다음 인코딩 또는 캡슐화를 사용합니다.
- EUC-JP 문자는 3바이트로 표시됩니다.첫 번째 바이트는 0x8F, 다음 2바이트는 0xA1 ~0xFE입니다
- ISO-2022-JP-EXT, ISO-2022-JP-1, ISO-2022-JP-2 등의 ISO 2022 기반의 JIS 인코딩의 특정 실장에서는, 「ESC $(D)」시퀀스가 JIS X 0212 문자를 나타내기 위해서 사용됩니다.
일반적인 Shift JIS 인코딩에서는 JIS X 0212 문자를 캡슐화할 수 없습니다.Shift JIS에는 문자에 할당되지 않은 코드 공간이 충분하지 않기 때문입니다.
실장
JIS X 0212는 IBM에 의해 Code page 953이라고 불리며, 여기에는 벤더 [2][3][4]확장기능이 포함되어 있습니다.대체 CCSID 5049에서는 이러한 확장이 [5]제외됩니다.
JIS X 0212 문자는 전통적으로 일본의 정보처리를 지배해 온 부호화 시스템인 Shift JIS로 부호화할 수 없기 때문에 문자 집합의 실제적인 실장은 거의 이루어지지 않았다.위에서 설명한 바와 같이 UNIX/Linux 시스템에서 일반적으로 사용되는 EUC-JP로 인코딩할 수 있으며, 대부분의 구현이 여기서 이루어집니다.
- 1990년대 초에 Unix X Window 시스템에서 사용하기 위해 기본 "BDF" 글꼴이 컴파일되었습니다.
- IME 변환 파일이 WNN 시스템용으로 컴파일되었다.
- 이를 지원하기 위해 kterm 콘솔 창 응용 프로그램이 확장되었습니다.
- Emacs와 jstevie 편집자는 그것을 지원하기 위해 확장되었다.
Netscape/Mozilla/Firefox 패밀리, Opera 등의 WWW 브라우저와 Mozilla Thunderbird 등의 관련 애플리케이션은 JIS X 0212 문자를 EUC-JP 인코딩으로 표시할 수 있지만 Internet Explorer는 JIS X 0212 문자를 지원하지 않습니다.GNOME 터미널과 같은 최신 터미널 에뮬레이션 패키지도 JIS X 0212 문자를 지원합니다.
EUC 코딩에서 JIS X 0212를 지원하는 어플리케이션은 다음과 같습니다.
- Unix/Linux용 xjdic 사전 프로그램
- WWWJDIC 일본어 사전 서버(단, Internet Explorer는 EUC에서 JIS X 0212 확장을 지원하지 않으므로 이 서버는 EUC-JP 모드로 설정하면 이러한 문자에 대해 비트맵 그래픽을 전송합니다.)
JIS X 0212 및 유니코드
JIS X 0212의 한자는 초기 ISO 10646/유니코드 표준에서 CJK 문자 집합을 통합한 한 통일의 소스 중 하나로 채택되었습니다.5,801개의 한자가 모두 통합되었다.
미래
JIS X 0212 규격은 위의 용도와는 별개로 사실상 소멸되었으며, 그 중 2,743개의 한자가 JIS X 0213 규격에 포함되어 있습니다.장기적으로는 유니코드에 포함된 5,801개의 한자가 그 공헌을 할 것으로 보인다.
「 」를 참조해 주세요.
레퍼런스
- JIS X 0212-1990 情報交換用漢字符号―補助漢字, 日本規格協会, 東京 (1990年10月1日制定).(일본 표준 문서)
- 일본어 정보처리 이해, Ken Lunde, O'Reilly & Assoc. 1993
- CJKV Information Processing, Ken Lunde, O'Reilly & Assoc. 1999, 2008.
- ^ van Kesteren, Anne. "5. Indexes (§ Index jis0212)". Encoding Standard. WHATWG.
- ^ "Code page 953 information document". Archived from the original on 2016-03-17.
- ^ "CCSID 953 information document". Archived from the original on 2016-03-28.
- ^ Code Page CPGID 00953 (pdf) (PDF), IBM
- ^ "CCSID 5049 information document". Archived from the original on 2016-03-27.