JIS X 0212

JIS X 0212
JIS X 0212
언어JIS X 0208과 함께 일본 지원용으로 제작되었습니다.언어 자체로는 실질적으로 지원하지 않습니다.
표준.JIS X 0212:1990
현황유니한 소스코드화된 문자 집합 자체는 JIS X 0208만큼 폭넓게 지원되지 않지만 EUC-JP에서 [1]사용되는 경우가 있습니다.
분류보조 문자 집합, ISO 2022, DBCS, CJK 인코딩
확장JIS X 0208 함께 사용 시
인코딩 형식EUC-JP
ISO-2022-JP-1
에 의해 성공자JIS X 0213
기타 관련 부호화KS X 1002

JIS X 0212는 일본어로 사용되는 부가 문자를 인코딩하기 위한 코드화된 문자 집합을 정의하는 일본 산업 표준입니다.이 표준은 JIS X 0208(코드 페이지 952)을 보완하기 위한 것입니다.IBM 코드 페이지로서 953 또는 5049 번호가 부여됩니다(아래 참조).

이것은 유니코드의 CJK 통합 한자 소스 표준 중 하나이다.

역사

1990년, 일본 표준 협회(JSA)는 정보 교환을 위한 보충 일본어 그래픽 문자 집합의 보조 문자 집합의 JIS X 0212-1990 코드발표했습니다. 표준은 JIS X 0208 문자 집합에서 사용할 수 있는 문자 범위를 기반으로 구축되어 해당 문자 집합의 커버리지 단점에 대처하기 위한 것입니다.

특징들

JIS X 0208, JIS X 0212, JIS X 0213, Windows-31J, 마이크로소프트 표준 레퍼토리 및 유니코드 레퍼토리를 비교하는 오일러 다이어그램.

규격은 6,067자로 다음과 같이 구성되어 있습니다.

  • 분음 부호가 있는 21개의 그리스 문자
  • 동유럽 문자 26자(대부분 키릴 문자)
  • 198자의 영문자(분음 부호 포함)
  • 5,801 한자

인코딩

파일 등에서 JIS X 0212 문자를 사용할 수 있도록 하기 위해 다음 인코딩 또는 캡슐화를 사용합니다.

  • EUC-JP 문자는 3바이트로 표시됩니다.첫 번째 바이트는 0x8F, 다음 2바이트는 0xA1 ~0xFE입니다
  • ISO-2022-JP-EXT, ISO-2022-JP-1, ISO-2022-JP-2 등의 ISO 2022 기반의 JIS 인코딩의 특정 실장에서는, 「ESC $(D)」시퀀스가 JIS X 0212 문자를 나타내기 위해서 사용됩니다.

일반적인 Shift JIS 인코딩에서는 JIS X 0212 문자를 캡슐화할 수 없습니다.Shift JIS에는 문자에 할당되지 않은 코드 공간이 충분하지 않기 때문입니다.

실장

EUC-JP uses first byte 0x8F followed by two bytes in 0xA1–FE for JIS X 0212.
Windows code page 20932 uses a first byte in 0xA1–FE followed by a byte in 0x21–FE for JIS X 0212.
적합 EUC-JP(왼쪽) 및 Windows 코드페이지 20932(오른쪽)에서의 JIS X 0212 부호화.

JIS X 0212는 IBM에 의해 Code page 953이라고 불리며, 여기에는 벤더 [2][3][4]확장기능이 포함되어 있습니다.대체 CCSID 5049에서는 이러한 확장이 [5]제외됩니다.

JIS X 0212 문자는 전통적으로 일본의 정보처리를 지배해 온 부호화 시스템인 Shift JIS로 부호화할 수 없기 때문에 문자 집합의 실제적인 실장은 거의 이루어지지 않았다.위에서 설명한 바와 같이 UNIX/Linux 시스템에서 일반적으로 사용되는 EUC-JP로 인코딩할 수 있으며, 대부분의 구현이 여기서 이루어집니다.

  • 1990년대 초에 Unix X Window 시스템에서 사용하기 위해 기본 "BDF" 글꼴이 컴파일되었습니다.
  • IME 변환 파일이 WNN 시스템용으로 컴파일되었다.
  • 이를 지원하기 위해 kterm 콘솔 창 응용 프로그램이 확장되었습니다.
  • Emacsjstevie 편집자는 그것을 지원하기 위해 확장되었다.

Netscape/Mozilla/Firefox 패밀리, Opera 등의 WWW 브라우저와 Mozilla Thunderbird 등의 관련 애플리케이션은 JIS X 0212 문자를 EUC-JP 인코딩으로 표시할 수 있지만 Internet Explorer는 JIS X 0212 문자를 지원하지 않습니다.GNOME 터미널과 같은 최신 터미널 에뮬레이션 패키지도 JIS X 0212 문자를 지원합니다.

EUC 코딩에서 JIS X 0212를 지원하는 어플리케이션은 다음과 같습니다.

  • Unix/Linux용 xjdic 사전 프로그램
  • WWWJDIC 일본어 사전 서버(단, Internet Explorer는 EUC에서 JIS X 0212 확장을 지원하지 않으므로 이 서버는 EUC-JP 모드로 설정하면 이러한 문자에 대해 비트맵 그래픽을 전송합니다.)

JIS X 0212 및 유니코드

JIS X 0212의 한자는 초기 ISO 10646/유니코드 표준에서 CJK 문자 집합을 통합한 한 통일의 소스 중 하나로 채택되었습니다.5,801개의 한자가 모두 통합되었다.

미래

JIS X 0212 규격은 위의 용도와는 별개로 사실상 소멸되었으며, 그 중 2,743개의 한자가 JIS X 0213 규격에 포함되어 있습니다.장기적으로는 유니코드에 포함된 5,801개의 한자가 그 공헌을 할 것으로 보인다.

「 」를 참조해 주세요.

레퍼런스

  • JIS X 0212-1990 情報交換用漢字符号―補助漢字, 日本規格協会, 東京 (1990年10月1日制定).(일본 표준 문서)
  • 일본어 정보처리 이해, Ken Lunde, O'Reilly & Assoc. 1993
  • CJKV Information Processing, Ken Lunde, O'Reilly & Assoc. 1999, 2008.
  1. ^ van Kesteren, Anne. "5. Indexes (§ Index jis0212)". Encoding Standard. WHATWG.
  2. ^ "Code page 953 information document". Archived from the original on 2016-03-17.
  3. ^ "CCSID 953 information document". Archived from the original on 2016-03-28.
  4. ^ Code Page CPGID 00953 (pdf) (PDF), IBM
  5. ^ "CCSID 5049 information document". Archived from the original on 2016-03-27.

외부 링크