ISO 2033

ISO 2033

ISO 2033:1983 표준("기계 판독 가능한 문자 코드(MICROCR)")[1]은 광학 문자 인식 시스템 또는 자기 잉크 문자 인식 시스템에서 사용할 문자 세트를 정의합니다.일본 표준 JIS X 9010:1984('기계 판독 가능 문자 코드(OCRMICR)') JIS C 6229-1984)와 밀접한 [2]관련이 있습니다.

OCR-A의 문자 세트

ISO-IR-91 로서 ISO-IR 레지스트리에 등록된OCR-A 폰트의 부호화 버전은 일본어 버전(JIS X 9010/JIS C 6229)으로, ISO 2033 에서 정의되고 있는 부호화와는 다릅니다.다만, 5C [2]에서의 Yen 기호가 부가되어 있습니다.

ISO 2033 및 JIS C 6229 OCR-A 세트
0 1 2 3 4 5 6 7 8 9 A B C D E F
0x 없음 SOH STX ETX 전원 ENQ ACK BS HT LF VT FF CR 그렇게 SI
1배 DLE DC1 DC2 DC3 DC4 NAK 동기 ETB 할 수 있다 전자파 후보선수 ESC FS GS RS 미국
2배 SP " £
00A3
$ % & ' {
007B
}
007D
* + , - . /
3배 0 1 2 3 4 5 6 7 8 9 : ;
2440
=
2441
?
4배 A B C D E F G H I J K L M N O
5배 P Q R S T U V W X Y Z ¥
00A5

2442
6배
7배
JIS-Roman과 비교하여 재정의

OCR-B의 문자 세트

ISO-IR-92 로서 ISO-IR-92 로서 등록된 OCR-B 폰트의 G0 의 버전은 일본어 버전(JIS X 9010/JIS C 6229)으로, JIS-Roman 에 근거하고 있는 것만으로 ISO 2033 에 정의되고 있는 부호와는 다릅니다(달러 기호는 0x245).time, 0x24의 [3]범용 통화 기호(마이너스)입니다.이러한 코드 포인트 외에 백틱(')과 칠데(~)[3]를 생략한 점만 ASCII와 다릅니다.ISO-IR-93으로 등록된 부가 세트는 ISO-8859-1 코드포인트에 파운드 기호(£), 유니버설 통화 기호()), 섹션 기호())[4]를 할당하고, 엔 기호용 ISO-8859-1 코드포인트에 백슬래시를 할당한다.

JIS X 9008 문자 세트(JIS C 6257)

JIS X 9010(JIS C 6229)은 JIS X 9008:1981(구 JIS C 6257-1981)의 OCR [5]: fn1 폰트의 문자 세트도 정의합니다.이것들은 JISX0201 로마 세트(ISO-IR-94고 backtick을 생략하는 것(등록된`), 소문자, 곱슬곱슬한 치열 교정기({,})과 설명문(‾)),[5]괍니다(ISO-IR-96고(、 동 아시아 스타일의 쉼표를 생략 등기)과 전체 정류장(。),interpunct(・)과 집합을(ISO으로 등록되었고 이외에 작은니다),[6]의 하위 집합을 포함한다.-IR-95) ISO-IR-93과 [7]동일한 코드 포인트에 할당된 백슬래시만 포함합니다.

JIS C 6527 글꼴은 슬래시[5] 및 백슬래시[7] 문자를 더블 어피아란스로 스타일링합니다.지정된 문자 이름은 "Solidus"[5] 및 "Reverse Solidus"[7]로, ASCII 슬래시 및 백슬래시의 [8]유니코드 문자 이름과 일치합니다.단, Unicode 광학 문자 인식 블록에는 "OCR Double Backslash"(),)에 대한 추가 코드 포인트가 포함되어 있습니다.단, 이중 슬래시는 [9]U+2같이 다른 곳에서 사용 가능하지만 이중 슬래시를 사용할 수 없습니다.AFD double Double Solidus 오퍼레이터.

E-13B의 문자 세트

ISO-IR-98 문자 레퍼토리를 나타내는 MICR E-13B 글꼴.

ISO 2033에 의해 정의되는 ISO-IR-98 부호화는 E13B 글꼴의 문자 레퍼토리를 자기 잉크 문자 [10]인식과 함께 사용하여 부호화합니다.ISO 2033 에서는 다른 부호화도 지정되어 있습니다만, E-13B 의 부호화는, 다음과 같은 부호화입니다.ISO_2033_1983Perl libintl [11]asISO_2033-1983또는csISO2033IANA[12]의해.기타 등록된 라벨은 다음과 같습니다.iso-ir-98, ISO-IR 등록번호 및 단순e13b를 클릭합니다.[12]

숫자는 ASCII 로케이션에 보존됩니다.E13B 글꼴에서 사용할 수 없는 문자와 기호는 생략되고 E13B 글꼴에 포함된 은행 수표에 대한 특수 구두점은 추가됩니다.동일한 기호는 Unicode의 광학 문자 인식 블록에서도 사용할 수 있습니다.

ISO 2033: 1983 E-13B 세트[11]
0 1 2 3 4 5 6 7 8 9 A B C D E F
0x 없음 SOH STX ETX 전원 ENQ ACK BS HT LF VT FF CR 그렇게 SI
1배 DLE DC1 DC2 DC3 DC4 NAK 동기 ETB 할 수 있다 전자파 후보선수 ESC FS GS RS 미국
2배 SP
3배 0 1 2 3 4 5 6 7 8 9
2446

2447

2448

2449
4배
5배
6배
7배
ASC와 비교하여 정의II

레퍼런스

  1. ^ ISO/IEC JTC 1/SC 2 (1983). Information processing — Coding of machine readable characters (MICR and OCR). ISO. ISO 2033:1983.
  2. ^ a b ISO/TC97/SC2 (1985-08-01). ISO-IR-91: Japanese OCR-A Graphic Character Set (PDF). ITSCJ/IPSJ.
  3. ^ a b ISO/TC97/SC2 (1985-08-01). ISO-IR-92: Japanese OCR-B Basic Graphic Character Set (PDF). ITSCJ/IPSJ.
  4. ^ ISO/TC97/SC2 (1985-08-01). ISO-IR-93: Japanese OCR-B - Additional Graphic Character Set (PDF). ITSCJ/IPSJ.
  5. ^ a b c d ISO/TC97/SC2 (1985-08-01). ISO-IR-94: Japanese Basic Hand-printed Graphic Character Set for OCR (PDF). ITSCJ/IPSJ.
  6. ^ ISO/TC97/SC2 (1985-08-01). ISO-IR-96: Katakana Hand-printed Graphic Character Set for OCR (PDF). ITSCJ/IPSJ.
  7. ^ a b c ISO/TC97/SC2 (1985-08-01). ISO-IR-95: Japanese Additional Hand-printed Graphic Character Set for OCR (PDF). ITSCJ/IPSJ.
  8. ^ Unicode Consortium. "C0 Controls and Basic Latin" (PDF). The Unicode Standard.
  9. ^ Unicode Consortium. "Optical Character Recognition" (PDF). The Unicode Standard.
  10. ^ ISO/TC97/SC2 (1985-08-01). ISO-IR-98: A set of 14 graphic characters of the E13B font (PDF). ITSCJ/IPSJ.
  11. ^ a b Flohr, Guido. "Conversion routines for ISO_2033_1983". libintl. Locale::RecodeData::ISO_2033_1983.
  12. ^ a b "Character Sets". IANA.

외부 링크