OCR-A
OCR-A![]() | |
카테고리 | 산세리프 |
---|---|
설계자 | American Type Founders(아메리칸 타입의 설립자) |
위탁자 | 미국표준협회 |
발매일 | 1968년[1] |
바리에이션 | OCR-A 확장 |
![]() | |
샘플 |
OCR-A는 컴퓨터 광학 문자 인식의 초기인 1968년에 만들어진 글꼴로, 당시 컴퓨터뿐만 아니라 [2]인간도 인식할 수 있는 글꼴이 필요했습니다.OCR-A는 단순하고 굵은 스트로크를 사용하여 인식 가능한 문자를 [3]형성합니다.이 글꼴은 고정폭(고정폭)으로 되어 있으며, 프린터는 0.254cm(0.10인치) 간격으로 배치해야 하며 판독기는 0.2286cm(0.09인치)에서 0.4572cm(0.18인치) 사이의 간격을 두어야 합니다.
표준화
OCR-A 글꼴은 ANSI(American National Standards Institute)에 의해 ANSI X3.17-1981로 표준화되었습니다.X3.4는 INCITS가 되었고 OCR-A 표준은 현재 ISO 1073-1:1976으로 불립니다.OCR-A에는 DIN [4]66008이라는 독일 표준도 있습니다.
실장
1968년 American Type Founders는 미국 표준국에서 정한 기준을 충족하는 최초의 광학 문자 인식 서체 중 하나인 OCR-A를 생산했습니다.디자인은 심플하고 기계로 읽기 쉽지만, 사람의 눈으로 [5]읽기에는 더 어렵습니다.
Tor Lillqvist는 금속활자가 컴퓨터 기반의 조형물로 대체되자 메타폰트를 사용하여 OCR-A [when?]글꼴을 기술했습니다.그 정의는 나중에 리차드 B에 의해 개선되었다.웨일즈,[6] CTAN에서 그들의 작업을 볼 수 있습니다
Microsoft Windows 사용자가 글꼴의 무료 버전을 보다 쉽게 액세스할 수 있도록 하기 위해 John Sauter는 2004년 [7]포트레이스와 FontForge를 사용하여 메타폰트 정의를 TrueType으로 변환했습니다.2007년, Gurkan Sengün은 이 [8]실장으로부터 Debian 패키지를 작성했습니다.2008년에.Luc Devroye는 John Sauter의 구현에서 수직 위치를 수정하고 소문자 [9]z의 이름을 수정했습니다.
Matthew[10] Skala는 2006년에 mftrace를[11] 사용하여 메타폰 정의를 TrueType 형식으로 변환했습니다.2011년에는 메타폰트 정의를 METATYPE1과 함께 작업하도록 고쳐 쓴 새로운 버전을 출시하여 중간 추적 단계 없이 직접 개요를 생성합니다.2012년 9월 27일, 그는 [12]구현을 버전 0.2로 업데이트했습니다.
OCR-A의 이러한 무료 구현 외에도 여러 벤더가 판매하는 구현도 있습니다.농담으로, Tobias Frere-Jones는 1995년에 스와시와 긴 s로 재설계된 Estupido-Espezial을 만들었습니다.그것은 롤링 [13][14]스톤의 "테크놀로지"를 주제로 한 코너에 사용되었다.
사용하다

광학 문자 인식 기술은 더 이상 단순한 글꼴이 필요하지 [15]않을 정도로 발전했지만, OCR-A 글꼴은 여전히 사용되고 있다.전 세계 수표 부호화에서 여전히 널리 사용되고 있다.일부 록박스 업체들은 여전히 어음반납용지의 계좌번호와 금액을 OCR-A로 [16]출력해야 한다고 주장하고 있으며, 특이한 외관 때문에 광고나 디스플레이 그래픽에 사용되기도 한다.
특히, 그것은 블랙리스트와 같은 영화와 텔레비전 시리즈의 자막과 프레텐더의 주요 타이틀에 사용된다.또한 OCR-A는 영화 크림슨 타이드와 13시간: 벵가지의 비밀 병사에 사용된다.
코드 포인트
글꼴은 문자 모양 또는 글리프의 집합입니다.컴퓨터가 글꼴을 사용하려면 문자 집합의 각 문자에는 코드 포인트가 할당되어야 합니다.OCR-A가 표준화되었을 때 일반적인 문자 코딩은 미국 표준 정보 교환 코드(ASCII)였습니다.OCR-A의 모든 글자가 ASCII에 적합한 것은 아니며, 5개의 글자에 대해 대체 글자가 있어 두 번째 글꼴이 필요했을 수 있습니다.그러나 편의성과 효율성을 위해 모든 문자는 ASCII 코딩을 사용하여 단일 글꼴로 액세스할 수 있으며, 그렇지 않았다면 사용되지 않았을 코딩 지점에 추가 문자가 배치될 것으로 예상되었습니다.
ASCII의 현대적 후예는 ISO 10646으로도 알려진 유니코드입니다.Unicode에는 ASCII가 포함되어 있으며 OCR 문자에 대한 특별한 규정이 있기 때문에 OCR-A의 일부 구현에서는 문자 코드 할당에 대한 지침을 Unicode에 주목하고 있습니다.
Unicode 이전 표준 표현
ISO 표준 ISO 2033:1983 및 대응하는 일본 산업 표준 JIS X 9010:1984(원래 JIS C6229-1984)는 OCR-A, OCR-B 및 E-13B에 대한 문자 인코딩을 정의하고 있습니다.OCR-A의 경우 대문자, 숫자, 구두점 및 기호 서브셋 및 추가 [17]기호만을 포함하는 수정된7비트 ASCII 세트(ISO-IR 번호 ISO-IR-91로도 알려져 있습니다)를 정의합니다.ASCII에 대해 단순히 생략하는 것이 아니라 재정의되는 코드를 다음에 나타냅니다.
성격 | 이미지 | 위치 | ASCII의 경우 | 평. |
---|---|---|---|---|
£ | ![]() | 0x23 | # | ISO 646의 [18]영국 버전인 BS 4730과 일치합니다. |
{ | ![]() | 0x28 | ( | 문자 이름은 대괄호를 표시함에도 불구하고 여전히 "왼쪽 괄호"입니다.일반적인 왼쪽 괄호 ASCII 코드 0x7B는 [17]생략됩니다. |
} | ![]() | 0x29 | ) | 문자 이름은 괄호를 사용해도 여전히 "오른쪽 괄호"입니다.일반 오른쪽 괄호 ASCII 코드 0x7D는 [17]생략됩니다. |
⑀ | ![]() | 0x3C | < > | |
⑁ | ![]() | 0x3E | > | |
¥ | ![]() | 0x5C | \ | JIS X 0201과 일치합니다.JIS X 9010에는 포함되지만 ISO 2033에서는 [17]제외됩니다. |
⑂ | ![]() | 0x5D | ] |
또한 긴 수직 마크()는 ASCII 수직 막대()[17]에 해당하는 0x7C로 인코딩됩니다.
Unicode 전용 OCR-A 문자
다음 문자는 제어 목적으로 정의되었으며 현재 "광학 문자 인식" 유니코드 범위 2440 ~ 245F에 있습니다.
ASCII 및 Unicode[19] 기반의 전용 OCR-A 코드 포인트이름. | 이미지 | 본문 | 유니코드 |
---|---|---|---|
OCR 훅 | ![]() | ⑀ | U+2440 |
OCR 의자 | ![]() | ⑁ | U+2441 |
OCR 포크 | ![]() | ⑂ | U+2442 |
OCR 반전 포크 | ⑃ | ⑃ | U+2443 |
OCR 벨트 버클 | ⑄ | ⑄ | U+2444 |
OCR 보우타이 | ⑅ | ⑅ | U+2445 |
공백, 숫자 및 강조되지 않은 문자
OCR-A 의 모든 실장에서는, 스페이스에 U+0020, 10 진수에 U+0030 ~ U+0039, 대소문자에 U+0041 ~ U+005A, 소문자에 U+0061 ~ U+007A 를 사용합니다.
일반 문자
OCR-A의 많은 문자는 숫자 및 강조되지 않은 문자 외에 ASCII에서 명확한 코드 포인트를 가지고 있습니다.그렇지 않은 경우, OCR-A의 악센트 문자를 포함한 대부분은 유니코드 코드 포인트를 가지고 있습니다.
나머지 문자
라이노타입은 OCR-A의 나머지 문자를 다음과 같이 코드화했습니다[20].
이름. | 글리프 | 유니코드 | 유니코드 이름 |
---|---|---|---|
긴 세로 표시 | ![]() | U+007C | 세로줄 |
추가 문자
Tor Lillqvist와 Richard B의 작품에서 파생된 글꼴입니다.Wales는 OCR-A에 없는 4개의 문자를 정의하여 ASCII 문자 집합을 채웁니다.이러한 모양은 OCR-A 문자 모양과 동일한 스타일을 사용합니다.다음과 같은 것이 있습니다.
이름. | 글리프 | 유니코드 |
---|---|---|
로우 라인 | ![]() | U+005F |
그레이브 엑센트 | ![]() | U+0060 |
세로줄 | ![]() | U+007C |
칠데 | ![]() | U+007E |
Linotype은 추가 [21]문자도 정의합니다.
예외
일부 구현에서는 일부 문자에 대해 위의 코드 포인트 할당을 사용하지 않습니다.
정확아이디
PrecisionOCR-A의 ID 구현에는 다음과 같은 비표준 코드 [22]포인트가 있습니다.
- U+007E에서의 OCR 후크
- U+00C1의 OCR 의자
- U+00C2에서의 OCR 포크
- U+0080의 유로사인
바코드 소프트
OCR-A의 Barcodesoft 구현에는 다음과 같은 비표준 코드 [23][24]포인트가 있습니다.
- U+0060의 OCR 후크
- U+007E의 OCR 의자
- U+005F의 OCR 포크
- U+007C의 긴 수직 표시(Linotype과 일치)
- U+0008 문자 삭제
모로비아
OCR-A의 Morovia 구현에는 다음과 같은 비표준 코드 [25]포인트가 있습니다.
- U+007E의 OCR 후크(Precision과 동일)아이디)
- U+00F0의 OCR 의자
- U+005F의 OCR 포크(바코드소프트와 합의)
- U+007C의 긴 수직 표시(Linotype과 일치)
IDAutomation
OCR-A의 IDAutomation 구현에는 다음과 같은 비표준 코드 [26]포인트가 있습니다.
- U+007E의 OCR 후크(Precision과 동일)아이디)
- U+00C1의 OCR 의자(Precision과 동의)아이디)
- U+00C2에서의 OCR 포크(Precision과 동일)아이디)
- U+00C3의 OCR 벨트 버클
폰트 기준 판매자
- Amazon.com에서 ANSI를 통해 배포되는 ISO 1073-1:backet의 하드카피
- ISO 1073-1은 ANSI 및 ISO 표준을 배포하는 Techstreet에서도 구할 수 있습니다.
「 」를 참조해 주세요.
- 자기 잉크 문자 인식
- 광학 문자 인식
- Westminster(서체)는 MICR의 외관을 닮도록 설계된 서체입니다.
- OCR-B
메모들
- ^ Adobe의 OCR-A 글꼴 배경
- ^ 현미경의 OCR-A 동기 부여
- ^ "Background on OCR from Embedded Software Engineering". Archived from the original on 2016-09-17. Retrieved 2012-09-01.
- ^ DIN 66008-1 광학 문자 인식용 글꼴 A, 문자 및 공칭 치수
- ^ Adobe의 OCR-A 배경
- ^ CTAN으로부터의 OCR-A의 MetaFont 소스
- ^ 이러한 MetaFont 소스로부터의 John Sauter의 2004 OCR-A 글꼴
- ^ John Sauter의 SourceForge 프로젝트에 기반한 글꼴 ocr-a Debian 패키지
- ^ John Sauter의 OCR-A 구현에 대한 변경에 대한 Luc Devroye의 설명
- ^ 매튜 스칼라의 홈페이지
- ^ mftrace Debian 패키지
- ^ MetaFont 소스로부터의 Matthew Skala의 2012 OCR-A 글꼴
- ^ Hoefler, Jonathan. "Two Fools". Hoefler & Co. Retrieved 18 September 2021.
- ^ "Technology, Fall '97". Rolling Stone. No. 774. 1997-11-27. p. 59.
- ^ "The History of OCR". Data Processing Magazine. 12: 46. 1970.
- ^ 잠금 상자 서비스에 대한 설명, "청구서에는 스캔 가능한 광학 문자 인식(OCR) 라인에 환자 정보가 포함된 청구서와 명세서가 포함되어 있습니다.OCR 라인은 신용카드 명세서나 전화요금 청구서에 나와 있는 것과 외관이 비슷합니다.
- ^ a b c d e ISO/TC97/SC2 (1985-08-01). Japanese OCR-A Graphic Character Set (PDF). ITSCJ/IPSJ. ISO-IR-91.
- ^ BSI (1975-12-01). The set of graphic characters of the United Kingdom 7-bit data code (PDF). ITSCJ/IPSJ. ISO-IR-4.
- ^ https://www.unicode.org/charts/PDF/U2440.pdf[베어 URL PDF]
- ^ Linotype의 OCR-A 글꼴: 캐릭터 맵을 선택하여 문자와 그 코딩을 확인합니다.
- ^ Linotype의 OCR-A 확장 글꼴: [문자표]를 선택한 후 [모두 표시
- ^ 정확Precision 사용자 가이드OCR-A 글꼴 ID 구현
- ^ OCR-A 글꼴의 바코드 구현을 위한 정보 페이지
- ^ 바코드 글꼴에 대한 다른 정보 원본
- ^ OCR-A 글꼴의 Morovia 구현 정보 페이지
- ^ OCR-A 및 OCR-B 글꼴 IDAutomation 구현 정보 페이지
외부 링크
