광학 문자 인식(유니코드 블록)

Optical Character Recognition (Unicode block)
광학 문자 인식
범위U+2440..U+245F
(32 코드 포인트)
평면BMP
스크립트공통의
기호 집합OCR 컨트롤
맡겨진11개 코드 포인트
사용되지 않음21개의 예약된 코드 포인트
소스 표준ISO 2033
유니코드 버전 기록
1.0.0(1991)11 (+11)
참고:

광학 문자 인식OCRMICR 표준용 신호 문자를 포함하는 유니코드 블록이다.

블록

광학 문자 인식[1][2]
공식 유니코드 컨소시엄 코드 차트(PDF)
0 1 2 3 4 5 6 7 8 9 A B C D E F
U+244x
U+245x
메모들
1.^ 유니코드 버전 14.0 기준
2.^ 회색 영역은 할당되지 않은 코드 포인트를 나타냄

부제목

광학 문자 인식 블록은 문자 집합 내에 OCR-A, MICR, OCR의 세 가지 비공식 하위 제목(그룹)이 있다.[3]

OCR-A

OCR-A 하위 표제는 ISO 1073-1:1976 표준에 설명된 OCR-A 글꼴에서 가져온 6개의 문자를 포함한다.U+2440 OCR HOOK, U+2441 OCR CHEER, U+2442 OCR FOK, U+2443 OCR INPK, U+2444 OCR 벨트 버클, U+2445 OCR BOW TI.OCR 나비넥타이는 "독특한 별자리"라는 유익한 가명을 받는다.

MICR

MICR 부제목은 자기 잉크 문자 인식 E-13B 글꼴(ISO 1004:1995 표준으로 지정됨)에서 가져온 은행 수표 식별자에 대한 문장 부호 문자 4개를 포함한다.U+2446 OCR 지점 은행 식별, U+2447 OCR 확인, U+2448 OCR DASHU+2449 OCR 고객 계좌 번호

후자의 두 글자는 잘못 명명되었다:[4] 1993년 (첫 번째) ISO/IEC 10646 에디션에서 이름이 바뀌었을 때 실수로 이름이 바뀌었다. 이는 유니코드 1.0.0 이후 발생한 실수였다.[5]비록 유니코드 안정성 정책 때문에 공식 명칭은 변경되지 않지만, 둘 다 다음과 같은 규범적 별칭을 수정했다.U+2448 ⑈은 MICR ON US 심볼이고, U+2449 ⑉은 MICR DASH 심볼[6](MICR DASH 심볼)이다("유니코드 문자 이름에 여러 오노머가 포함되어 있다"는 표준 주의).

이 기호들은 이전에 ISO 2033:1983에 의해 정의된 ISO-IR-98 인코딩에 의해 인코딩되었으며, 이 인코딩에서 단순히 기호 1에서 기호 4까지로 명명되었다.[7]네 문자 모두 유니코드 차트에서 각각 "transit", "금액", " on us", "dash"의 유익한 별칭을 가지고 있다.

OCR

OCR 부제목은 단일 문자로 구성된다.U+244A OCR Double BackSlash.

역사

다음의 유니코드 관련 문서는 광학 문자 인식 블록에 특정 문자를 정의하기 위한 목적과 과정을 기록한다.

버전 최종코드 포인트[a] 카운트 L2 ID WG2 ID 문서
1.0.0 U+2440..244A 11 (확정)
L2/10-416r Moore, Lisa (2010-11-09), "Consensus 125-C39", UTC #125 / L2 #222 Minutes, Create two formal aliases, U+2448 MICR ON US SYMBOL and U+2449 MICR DASH SYMBOL for Unicode 6.1.
N4103 "T.3. Optical Character Recognition", Unconfirmed minutes of WG 2 meeting 58, 2012-01-03
  1. ^ 제안된 코드 포인트 및 문자 이름은 최종 코드 포인트 및 이름과 다를 수 있음

참조

  1. ^ "Unicode character database". The Unicode Standard. Retrieved 2016-07-09.
  2. ^ "Enumerated Versions of The Unicode Standard". The Unicode Standard. Retrieved 2016-07-09.
  3. ^ "Unicode Code Charts: Optical Character Recognition" (PDF). The Unicode Standard, Version 6.3. Retrieved 27 February 2014.
  4. ^ ISO/IEC JTC 1/SC 2/WG 2 (2012-01-03). "T.3. Optical Character Recognition". Unconfirmed minutes of WG 2 meeting 58 (PDF). p. 29. SC2 N4188 / WG2 N4103. These Magnetic Ink Character Recognition (MICR) symbols are used by banks on checks. The names of these characters were inadvertently mixed up in the 1993 edition of ISO/IEC 10646.
  5. ^ "3.8: Block-by-Block Charts" (PDF). The Unicode Standard. version 1.0. Unicode Consortium.
  6. ^ Freytag, Asmus; McGowan, Rick; Whistler, Ken (2017-04-10). Known Anomalies in Unicode Character Names (4 ed.). Unicode Consortium. Unicode Technical Note #27.
  7. ^ ISO/TC97/SC2 (1985-08-01). "ISO-IR-98: A set of 14 graphic characters of the E13B font" (PDF). ITSCJ/IPSJ.