ISO/IEC 8859-8

ISO/IEC 8859-8
ISO-8859-8: 라틴어/히브루
MIME / IANAISO-8859-8
별칭iso-ir-138, 히브리어, csISolatinHebru
언어히브리어, 영어
표준ISO/IEC 8859-8, ECMA-121, SI 1311
분류확장 ASCII, ISO 8859
에 기반을 둔DEC 히브리어(8비트), ISO/IEC 8859-1
기타 관련 인코딩윈도-1255

ISO/IEC 8859-8, 정보 기술 8비트 단일 바이트 코딩 그래픽 문자 세트 Part 8: 라틴/히브루 알파벳ISO/IEC 8859 시리즈 ASCII 기반 표준 문자 인코딩의 일부다. 1999년의 ISO/IEC 8859-8:1999는 1988년 제1판 ISO/IEC 8859-8:1988에 이어 두 번째 및 현재 개정판을 나타낸다. 그것은 비공식적으로 라틴어/히브루라고 불린다. ISO/IEC 8859-8히브리 문자를 모두 포함하지만 히브리 모음 기호는 포함하지 않는다. IBM은 여기코드 페이지 916(CCSID 916 및 5012)을 할당했다.[2][3][4] 이 문자 집합은 이스라엘 표준 SI1311:2002에서도 일부 연장과 함께 채택되었다.

ISO-8859-8ISO/IEC 6429C0 C1 제어 코드로 보완되었을 때 이 표준에 대해 IANA가 선호하는 문자 집합 이름이다. 텍스트는 (일반적으로) 논리적인 순서로 되어 있기 때문에 표시하기 위해서는 bidi 처리가 필요하다. 명목상 ISO-8859-8(코드 페이지 28598)은 "시각적 순서"를, ISO-8859-8-I(코드 페이지 38598)는 논리적 순서를 나타낸다. 그러나 일반적으로 XML 문서에 요구되며 ISO-8859-8은 논리 순서 텍스트를 의미하기도 한다.[citation needed] HTML5에서 사용하는 WHTWG 인코딩 표준은 레이아웃 방향에 대한 영향으로 ISO-8859-8과 ISO-8859-8-I를 동일한 매핑을 가진 별개의 인코딩으로 취급하지만, 이는 ISO-8859-6(아랍어)에만 더 이상 적용되지 않는다는 점에 유의한다.[5]

또한 특수 제어 문자로 방향성을 명시적으로 지정해야 하는 ISO-8859-8-E도 있다. 이 후자의 변형은 실제로 사용되지 않는다.

히브리어용 Microsoft Windows 코드 페이지인 Windows-1255는 이중 밑줄을 생략하고 일반 통화 부호(¤)를 셰켈 부호(₪)로 대체하는 것을 제외하고는 대부분 C1 제어 없이 ISO/IEC 8859-8의 연장선이다. 그것은 결합한 문자로 모음 포인트에 대한 지원을 더하고, 일부 구두점을 추가한다.

이 표준이 발표된 후 10년이 넘는 기간 동안 적어도 인터넷[6](UTF-8이라는 뜻, 웹 페이지의 지배적인 인코딩)에는 유니코드가 선호된다. ISO-8859-8은 웹사이트의 0.1%에 의해 사용된다.[7]

코드 페이지 레이아웃

ISO/IEC 8859-8[8][9][10][11]
0 1 2 3 4 5 6 7 8 9 A B C D E F
0x
1배
2배 SP ! " # $ % & ' ( ) * + , - . /
3배 0 1 2 3 4 5 6 7 8 9 : ; < = > ?
4배 @ A B C D E F G H I J K L M N O
5배 P Q R S T U V W X Y Z [ \ ] ^ _
6배 ` a b c d e f g h i j k l m n o
7배 p q r s t u v w x y z { } ~
8배
9배
도끼 NBSP ¢ £ ¤ ¥ ¦ § ¨ © × « ¬ 샤이 ® ¯
Bx ° ± ² ³ ´ µ · ¸ ¹ ÷ » ¼ ½ ¾
Cx
Dx
Ex א ב ג ד ה ו ז ח ט י ך כ ל ם מ ן
FX נ ס ע ף פ ץ צ ק ר ש ת LRM RLM
DEC 히브리어(8비트)ISO-8859-1과 모두 다르다.

FD는 ISO/IEC 8859-8:1999로 새로운 개정에 명시된 바와 같이 왼쪽에서 오른쪽으로(U+200E), 오른쪽에서 왼쪽으로(U+200F)이다.

2002년 이스라엘 표준 연장

이스라엘 표준 SI1311:2002는 유로 기호, 새로운 세켈 기호 및 보다 진보된 명시적 양방향 형식에 대한 다수의 추가 문자 할당을 제외하고 ISO/IEC 8859-8:1999와 일치한다.[12]

SI1311:2002[12]
0 1 2 3 4 5 6 7 8 9 A B C D E F
Dx LRO RLO PDF
Ex א ב ג ד ה ו ז ח ט י ך כ ל ם מ ן
FX נ ס ע ף פ ץ צ ק ר ש ת LRE RLE LRM RLM
ISO/IEC 8859-8:1999에 없음, SI1311:2002에 추가됨.

참고 항목

참조

  1. ^ Character Sets, Internet Assigned Numbers Authority (IANA), 2018-12-12
  2. ^ "Code page 916 information document". Archived from the original on 2017-02-16.
  3. ^ "CCSID 916 information document". Archived from the original on 2014-11-29.
  4. ^ "CCSID 5012 information document". Archived from the original on 2016-03-27.
  5. ^ van Kesteren, Anne. "9. Legacy single-byte encodings". Encoding Standard. WHATWG. Note: ISO-8859-8 and ISO-8859-8-I are distinct encoding names, because ISO-8859-8 has influence on the layout direction. And although historically this might have been the case for ISO-8859-6 and "ISO-8859-6-I" as well, that is no longer true.
  6. ^ John, Nicholas A. (2013). "The Construction of the Multilingual Internet: Unicode, Hebrew, and Globalization". Journal of Computer-Mediated Communication. 18 (3): 321–338. doi:10.1111/jcc4.12015. ISSN 1083-6101. Background: the problem of Hebrew and the Internet
  7. ^ "Usage Statistics of ISO-8859-8 for Websites, January 2019". w3techs.com. Retrieved 2019-01-17.
  8. ^ Code Page CPGID 00916 (pdf) (PDF), IBM
  9. ^ Code Page CPGID 00916 (txt), IBM
  10. ^ International Components for Unicode (ICU), ibm-916_P100-1995.ucm, 2002-12-03
  11. ^ International Components for Unicode (ICU), ibm-5012_P100-1999.ucm, 2002-12-03
  12. ^ a b Standards Institution of Israel. "ISO-IR 234: Latin/Hebrew character set for 8-bit codes" (PDF). Information Technology Standards Commission of Japan (ITSCJ/IPSJ).

외부 링크