광학 문자 인식(유니코드 블록)
Optical Character Recognition (Unicode block)| 광학 문자 인식 | |
|---|---|
| 범위 | U+2440..U+245F (32 코드 포인트) |
| 평면 | BMP |
| 스크립트 | 공통의 |
| 기호 집합 | OCR 컨트롤 |
| 맡겨진 | 11개 코드 포인트 |
| 사용되지 않음 | 21개의 예약된 코드 포인트 |
| 소스 표준 | ISO 2033 |
| 유니코드 버전 기록 | |
| 1.0.0(1991) | 11 (+11) |
| 참고: | |
광학 문자 인식은 OCR 및 MICR 표준용 신호 문자를 포함하는 유니코드 블록이다.
블록
| 광학 문자 인식[1][2] 공식 유니코드 컨소시엄 코드 차트(PDF) | ||||||||||||||||
| 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
| U+244x | ⑀ | ⑁ | ⑂ | ⑃ | ⑄ | ⑅ | ⑆ | ⑇ | ⑈ | ⑉ | ⑊ | |||||
| U+245x | ||||||||||||||||
메모들
| ||||||||||||||||
부제목
광학 문자 인식 블록은 문자 집합 내에 OCR-A, MICR, OCR의 세 가지 비공식 하위 제목(그룹)이 있다.[3]
OCR-A
OCR-A 하위 표제는 ISO 1073-1:1976 표준에 설명된 OCR-A 글꼴에서 가져온 6개의 문자를 포함한다.U+2440 ⑀ OCR HOOK, U+2441 ⑁ OCR CHEER, U+2442 ⑂ OCR FOK, U+2443 ⑃ OCR INPK, U+2444 ⑄ OCR 벨트 버클, U+2445 ⑅ OCR BOW TI.OCR 나비넥타이는 "독특한 별자리"라는 유익한 가명을 받는다.
MICR
MICR 부제목은 자기 잉크 문자 인식 E-13B 글꼴(ISO 1004:1995 표준으로 지정됨)에서 가져온 은행 수표 식별자에 대한 문장 부호 문자 4개를 포함한다.U+2446 ⑆ OCR 지점 은행 식별, U+2447 ⑇ OCR 확인, U+2448 ⑈ OCR DASH 및 U+2449 ⑉ OCR 고객 계좌 번호
후자의 두 글자는 잘못 명명되었다:[4] 1993년 (첫 번째) ISO/IEC 10646 에디션에서 이름이 바뀌었을 때 실수로 이름이 바뀌었다. 이는 유니코드 1.0.0 이후 발생한 실수였다.[5]비록 유니코드 안정성 정책 때문에 공식 명칭은 변경되지 않지만, 둘 다 다음과 같은 규범적 별칭을 수정했다.U+2448 ⑈은 MICR ON US 심볼이고, U+2449 ⑉은 MICR DASH 심볼[6](MICR DASH 심볼)이다("유니코드 문자 이름에 여러 오노머가 포함되어 있다"는 표준 주의).
이 기호들은 이전에 ISO 2033:1983에 의해 정의된 ISO-IR-98 인코딩에 의해 인코딩되었으며, 이 인코딩에서 단순히 기호 1에서 기호 4까지로 명명되었다.[7]네 문자 모두 유니코드 차트에서 각각 "transit", "금액", " on us", "dash"의 유익한 별칭을 가지고 있다.
OCR
OCR 부제목은 단일 문자로 구성된다.U+244A ⑊ OCR Double BackSlash.
역사
다음의 유니코드 관련 문서는 광학 문자 인식 블록에 특정 문자를 정의하기 위한 목적과 과정을 기록한다.
| 버전 | 최종코드 포인트[a] | 카운트 | L2 ID | WG2 ID | 문서 |
|---|---|---|---|---|---|
| 1.0.0 | U+2440..244A | 11 | (확정) | ||
| L2/10-416r | Moore, Lisa (2010-11-09), "Consensus 125-C39", UTC #125 / L2 #222 Minutes, Create two formal aliases, U+2448 MICR ON US SYMBOL and U+2449 MICR DASH SYMBOL for Unicode 6.1. | ||||
| N4103 | "T.3. Optical Character Recognition", Unconfirmed minutes of WG 2 meeting 58, 2012-01-03 | ||||
| |||||
참조
- ^ "Unicode character database". The Unicode Standard. Retrieved 2016-07-09.
- ^ "Enumerated Versions of The Unicode Standard". The Unicode Standard. Retrieved 2016-07-09.
- ^ "Unicode Code Charts: Optical Character Recognition" (PDF). The Unicode Standard, Version 6.3. Retrieved 27 February 2014.
- ^ ISO/IEC JTC 1/SC 2/WG 2 (2012-01-03). "T.3. Optical Character Recognition". Unconfirmed minutes of WG 2 meeting 58 (PDF). p. 29. SC2 N4188 / WG2 N4103.
These Magnetic Ink Character Recognition (MICR) symbols are used by banks on checks. The names of these characters were inadvertently mixed up in the 1993 edition of ISO/IEC 10646.
- ^ "3.8: Block-by-Block Charts" (PDF). The Unicode Standard. version 1.0. Unicode Consortium.
- ^ Freytag, Asmus; McGowan, Rick; Whistler, Ken (2017-04-10). Known Anomalies in Unicode Character Names (4 ed.). Unicode Consortium. Unicode Technical Note #27.
- ^ ISO/TC97/SC2 (1985-08-01). "ISO-IR-98: A set of 14 graphic characters of the E13B font" (PDF). ITSCJ/IPSJ.