OCR-A

OCR-A
OCR-A
OCR-A font.svg
카테고리산세리프
설계자American Type Founders(아메리칸 타입의 설립자)
위탁자미국표준협회
발매일1968년[1]
바리에이션OCR-A 확장
Typeface specimen OCR A.svg
샘플

OCR-A는 컴퓨터 광학 문자 인식의 초기인 1968년에 만들어진 글꼴로, 당시 컴퓨터뿐만 아니라 [2]인간도 인식할 수 있는 글꼴이 필요했습니다.OCR-A는 단순하고 굵은 스트로크를 사용하여 인식 가능한 문자를 [3]형성합니다.이 글꼴은 고정폭(고정폭)으로 되어 있으며, 프린터는 0.254cm(0.10인치) 간격으로 배치해야 하며 판독기는 0.2286cm(0.09인치)에서 0.4572cm(0.18인치) 사이간격을 두어야 합니다.

표준화

OCR-A 글꼴은 ANSI(American National Standards Institute)에 의해 ANSI X3.17-1981로 표준화되었습니다.X3.4는 INCITS가 되었고 OCR-A 표준은 현재 ISO 1073-1:1976으로 불립니다.OCR-A에는 DIN [4]66008이라는 독일 표준도 있습니다.

실장

1968년 American Type Founders는 미국 표준국에서 정한 기준을 충족하는 최초의 광학 문자 인식 서체 중 하나인 OCR-A를 생산했습니다.디자인은 심플하고 기계로 읽기 쉽지만, 사람의 눈으로 [5]읽기에는 더 어렵습니다.

Tor Lillqvist는 금속활자가 컴퓨터 기반의 조형물로 대체되자 메타폰트를 사용하여 OCR-A [when?]글꼴을 기술했습니다.그 정의는 나중에 리차드 B에 의해 개선되었다.웨일즈,[6] CTAN에서 그들의 작업을 볼 수 있습니다

Microsoft Windows 사용자가 글꼴의 무료 버전을 보다 쉽게 액세스할 수 있도록 하기 위해 John Sauter는 2004년 [7]포트레이스와 FontForge사용하여 메타폰트 정의를 TrueType으로 변환했습니다.2007년, Gurkan Sengün은 이 [8]실장으로부터 Debian 패키지를 작성했습니다.2008년에.Luc Devroye는 John Sauter의 구현에서 수직 위치를 수정하고 소문자 [9]z의 이름을 수정했습니다.

Matthew[10] Skala는 2006년에 mftrace를[11] 사용하여 메타폰 정의를 TrueType 형식으로 변환했습니다.2011년에는 메타폰트 정의를 METATYPE1과 함께 작업하도록 고쳐 쓴 새로운 버전을 출시하여 중간 추적 단계 없이 직접 개요를 생성합니다.2012년 9월 27일, 그는 [12]구현을 버전 0.2로 업데이트했습니다.

OCR-A의 이러한 무료 구현 외에도 여러 벤더가 판매하는 구현도 있습니다.농담으로, Tobias Frere-Jones는 1995년에 스와시 s로 재설계된 Estupido-Espezial을 만들었습니다.그것은 롤링 [13][14]스톤의 "테크놀로지"를 주제로 한 코너에 사용되었다.

사용하다

독일 은행 수표에 OCR-A가 있어요「」, 「」, 및 「」의 문자는, 머신 판독 가능한 행의 특정의 필드를 구분하기 위해서 사용됩니다(여기서는 부분적으로 리다이렉트 되어 있습니다).

광학 문자 인식 기술은 더 이상 단순한 글꼴이 필요하지 [15]않을 정도로 발전했지만, OCR-A 글꼴은 여전히 사용되고 있다.전 세계 수표 부호화에서 여전히 널리 사용되고 있다.일부 록박스 업체들은 여전히 어음반납용지의 계좌번호와 금액을 OCR-A로 [16]출력해야 한다고 주장하고 있으며, 특이한 외관 때문에 광고나 디스플레이 그래픽에 사용되기도 한다.

특히, 그것은 블랙리스트와 같은 영화와 텔레비전 시리즈의 자막과 프레텐더주요 타이틀에 사용된다.또한 OCR-A는 영화 크림슨 타이드와 13시간: 벵가지비밀 병사에 사용된다.

코드 포인트

글꼴은 문자 모양 또는 글리프의 집합입니다.컴퓨터가 글꼴을 사용하려면 문자 집합의 각 문자에는 코드 포인트가 할당되어야 합니다.OCR-A가 표준화되었을 때 일반적인 문자 코딩은 미국 표준 정보 교환 코드(ASCII)였습니다.OCR-A의 모든 글자가 ASCII에 적합한 것은 아니며, 5개의 글자에 대해 대체 글자가 있어 두 번째 글꼴이 필요했을 수 있습니다.그러나 편의성과 효율성을 위해 모든 문자는 ASCII 코딩을 사용하여 단일 글꼴로 액세스할 수 있으며, 그렇지 않았다면 사용되지 않았을 코딩 지점에 추가 문자가 배치될 것으로 예상되었습니다.

ASCII의 현대적 후예는 ISO 10646으로도 알려진 유니코드입니다.Unicode에는 ASCII가 포함되어 있으며 OCR 문자에 대한 특별한 규정이 있기 때문에 OCR-A의 일부 구현에서는 문자 코드 할당에 대한 지침을 Unicode에 주목하고 있습니다.

Unicode 이전 표준 표현

ISO 표준 ISO 2033:1983 및 대응하는 일본 산업 표준 JIS X 9010:1984(원래 JIS C6229-1984)는 OCR-A, OCR-BE-13B에 대한 문자 인코딩을 정의하고 있습니다.OCR-A의 경우 대문자, 숫자, 구두점 및 기호 서브셋 및 추가 [17]기호만을 포함하는 수정된7비트 ASCII 세트(ISO-IR 번호 ISO-IR-91로도 알려져 있습니다)를 정의합니다.ASCII에 대해 단순히 생략하는 것이 아니라 재정의되는 코드를 다음에 나타냅니다.

성격 이미지 위치 ASCII의 경우 평.
£ Pound Sign 0x23 # ISO 646[18]영국 버전인 BS 4730과 일치합니다.
{ Left Curly Bracket 0x28 ( 문자 이름은 대괄호를 표시함에도 불구하고 여전히 "왼쪽 괄호"입니다.일반적인 왼쪽 괄호 ASCII 코드 0x7B는 [17]생략됩니다.
} Right Curly Bracket 0x29 ) 문자 이름은 괄호를 사용해도 여전히 "오른쪽 괄호"입니다.일반 오른쪽 괄호 ASCII 코드 0x7D는 [17]생략됩니다.
OCR Hook 0x3C < >
OCR Chair 0x3E >
¥ Yen Sign 0x5C \ JIS X 0201과 일치합니다.JIS X 9010에는 포함되지만 ISO 2033에서는 [17]제외됩니다.
OCR Fork 0x5D ]

또한 긴 수직 마크()Long Vertical Mark는 ASCII 수직 막대()[17]에 해당하는 0x7C로 인코딩됩니다.

Unicode 전용 OCR-A 문자

다음 문자는 제어 목적으로 정의되었으며 현재 "광학 문자 인식" 유니코드 범위 2440 ~ 245F에 있습니다.

ASCII 및 Unicode[19] 기반의 전용 OCR-A 코드 포인트
이름. 이미지 본문 유니코드
OCR 훅 OCR Hook U+2440
OCR 의자 OCR Chair U+2441
OCR 포크 OCR Fork U+2442
OCR 반전 포크 U+2443
OCR 벨트 버클 U+2444
OCR 보우타이 U+2445

공백, 숫자 및 강조되지 않은 문자

OCR-A 번호
OCR-강세가 없는 대문자
OCR-강세가 없는 작은 글자

OCR-A 의 모든 실장에서는, 스페이스에 U+0020, 10 진수에 U+0030 ~ U+0039, 대소문자에 U+0041 ~ U+005A, 소문자에 U+0061 ~ U+007A 를 사용합니다.

일반 문자

OCR-A의 많은 문자는 숫자 및 강조되지 않은 문자 외에 ASCII에서 명확한 코드 포인트를 가지고 있습니다.그렇지 않은 경우, OCR-A의 악센트 문자를 포함한 대부분은 유니코드 코드 포인트를 가지고 있습니다.

ASCII 및 Unicode에 기반한 추가 OCR-A 코드 포인트
이름. 글리프 유니코드
느낌표 Exclamation Mark U+0021
따옴표 Quotation Mark U+0022
번호 기호 Number Sign U+0023
달러 기호 Dollar Sign U+0024
퍼센트 기호 Percent Sign U+0025
앰퍼샌드 Ampersand U+0026
아포스트로피 Apostrophe U+0027
왼쪽 괄호 Left Parenthesis U+0028
오른쪽 괄호 Right Parenthesis U+0029
아스타리스크 Asterisk U+002A
플러스 기호 Plus Sign U+002B
콤마 Comma U+002C
하이픈-마이너스 Hyphen-Minus U+002D
완전 정지(기간) Full Stop (Period) U+002E
Solidus (슬래시) Solidus (Slash) U+002F
콜론 Colon U+003A
세미콜론 Semicolon U+003B
Less-Than 표지판 Less-Than Sign U+003C
등호 Equals Sign U+003D
더 큰 기호 Greater-Than Sign U+003E
물음표 Question Mark U+003F
커머셜 앳 Commercial At U+0040
왼쪽 대괄호 Left Square Bracket U+005B
리버스 솔리더스(백슬래시) Reverse Solidus U+005C
오른쪽 대괄호 Right Square Bracket U+005D
곡절 악센트 Circumflex Accent U+005E
왼쪽 곱슬 괄호 Left Curly Bracket U+007B
오른쪽 곱슬 괄호 Right Curly Bracket U+007D
파운드 기호(스털링) Pound Sign U+00A3
옌사인 Yen Sign U+00A5
디에레시스가 있는 라틴 대문자 A Latin Capital Letter A with Dieresis U+00C4
링 위 라틴 대문자 A Latin Capital Letter A with Ring Above U+00C5
라틴 대문자 AE Latin Capital Letter AE U+00C6
라틴 대문자 N(칠데 포함) Latin Capital Letter N with Tilde U+00D1
디에레시스가 있는 라틴 대문자 O Latin Capital Letter O with Dieresis U+00D6
스트로크 포함 라틴 대문자 O Latin Capital Letter O with Stroke U+00D8
디에레시스가 있는 라틴 대문자 U Latin Capital Letter U with Dieresis U+00DC

나머지 문자

라이노타입은 OCR-A의 나머지 문자를 다음과 같이 코드화했습니다[20].

기타 OCR-A 문자
이름. 글리프 유니코드 유니코드 이름
긴 세로 표시 Long Vertical Mark U+007C 세로줄

추가 문자

Tor Lillqvist와 Richard B의 작품에서 파생된 글꼴입니다.Wales는 OCR-A에 없는 4개의 문자를 정의하여 ASCII 문자 집합을 채웁니다.이러한 모양은 OCR-A 문자 모양과 동일한 스타일을 사용합니다.다음과 같은 것이 있습니다.

기타 ASCII 문자
이름. 글리프 유니코드
로우 라인 Low Line U+005F
그레이브 엑센트 Grave Accent U+0060
세로줄 Vertical Line U+007C
칠데 Tilde U+007E

Linotype은 추가 [21]문자도 정의합니다.

예외

일부 구현에서는 일부 문자에 대해 위의 코드 포인트 할당을 사용하지 않습니다.

정확아이디

PrecisionOCR-A의 ID 구현에는 다음과 같은 비표준 코드 [22]포인트가 있습니다.

  • U+007E에서의 OCR 후크
  • U+00C1의 OCR 의자
  • U+00C2에서의 OCR 포크
  • U+0080의 유로사인

바코드 소프트

OCR-A의 Barcodesoft 구현에는 다음과 같은 비표준 코드 [23][24]포인트가 있습니다.

  • U+0060의 OCR 후크
  • U+007E의 OCR 의자
  • U+005F의 OCR 포크
  • U+007C의 긴 수직 표시(Linotype과 일치)
  • U+0008 문자 삭제

모로비아

OCR-A의 Morovia 구현에는 다음과 같은 비표준 코드 [25]포인트가 있습니다.

  • U+007E의 OCR 후크(Precision과 동일)아이디)
  • U+00F0의 OCR 의자
  • U+005F의 OCR 포크(바코드소프트와 합의)
  • U+007C의 긴 수직 표시(Linotype과 일치)

IDAutomation

OCR-A의 IDAutomation 구현에는 다음과 같은 비표준 코드 [26]포인트가 있습니다.

  • U+007E의 OCR 후크(Precision과 동일)아이디)
  • U+00C1의 OCR 의자(Precision과 동의)아이디)
  • U+00C2에서의 OCR 포크(Precision과 동일)아이디)
  • U+00C3의 OCR 벨트 버클

폰트 기준 판매자

「 」를 참조해 주세요.

메모들

  1. ^ Adobe의 OCR-A 글꼴 배경
  2. ^ 현미경의 OCR-A 동기 부여
  3. ^ "Background on OCR from Embedded Software Engineering". Archived from the original on 2016-09-17. Retrieved 2012-09-01.
  4. ^ DIN 66008-1 광학 문자 인식용 글꼴 A, 문자 및 공칭 치수
  5. ^ Adobe의 OCR-A 배경
  6. ^ CTAN으로부터의 OCR-A의 MetaFont 소스
  7. ^ 이러한 MetaFont 소스로부터의 John Sauter의 2004 OCR-A 글꼴
  8. ^ John Sauter의 SourceForge 프로젝트에 기반한 글꼴 ocr-a Debian 패키지
  9. ^ John Sauter의 OCR-A 구현에 대한 변경에 대한 Luc Devroye의 설명
  10. ^ 매튜 스칼라의 홈페이지
  11. ^ mftrace Debian 패키지
  12. ^ MetaFont 소스로부터의 Matthew Skala의 2012 OCR-A 글꼴
  13. ^ Hoefler, Jonathan. "Two Fools". Hoefler & Co. Retrieved 18 September 2021.
  14. ^ "Technology, Fall '97". Rolling Stone. No. 774. 1997-11-27. p. 59.
  15. ^ "The History of OCR". Data Processing Magazine. 12: 46. 1970.
  16. ^ 잠금 상자 서비스에 대한 설명, "청구서에는 스캔 가능한 광학 문자 인식(OCR) 라인에 환자 정보가 포함된 청구서와 명세서가 포함되어 있습니다.OCR 라인은 신용카드 명세서나 전화요금 청구서에 나와 있는 것과 외관이 비슷합니다.
  17. ^ a b c d e ISO/TC97/SC2 (1985-08-01). Japanese OCR-A Graphic Character Set (PDF). ITSCJ/IPSJ. ISO-IR-91.
  18. ^ BSI (1975-12-01). The set of graphic characters of the United Kingdom 7-bit data code (PDF). ITSCJ/IPSJ. ISO-IR-4.
  19. ^ https://www.unicode.org/charts/PDF/U2440.pdf[베어 URL PDF]
  20. ^ Linotype의 OCR-A 글꼴: 캐릭터 맵을 선택하여 문자와 그 코딩을 확인합니다.
  21. ^ Linotype의 OCR-A 확장 글꼴: [문자표]를 선택한 후 [모두 표시
  22. ^ 정확Precision 사용자 가이드OCR-A 글꼴 ID 구현
  23. ^ OCR-A 글꼴의 바코드 구현을 위한 정보 페이지
  24. ^ 바코드 글꼴에 대한 다른 정보 원본
  25. ^ OCR-A 글꼴의 Morovia 구현 정보 페이지
  26. ^ OCR-A 및 OCR-B 글꼴 IDAutomation 구현 정보 페이지

외부 링크