ISO/IEC 8859-6

ISO/IEC 8859-6
ISO-8859-6(ASMO 708)
MIME / IANAISO-8859-6
에일리어스iso-ir-127, ECMA-114, ASMO-708, 아랍어, CSISOLatinArabic[1]
표준.ASMO 708, ECMA-114, ISO/IEC 8859-6
분류확장 ASCII, ISO 8859
내선번호OEM-708, Mac OS 아랍어(거의)
선행ASMO 449
기타 관련 부호화Windows-1256 (비호환, 여러 글자 이동)

ISO/IEC 8859-6:1999, 정보 테크놀로지 - 8비트 싱글 바이트 코드 그래픽 문자 세트 - Part 6: 라틴/아랍 문자 - 는 ASCII 기반의 표준 문자 인코딩일부이며, 1987년에 초판되었습니다.그것은 비공식적으로 라틴어/아랍어라고 불린다.그것은 아랍어를 다루도록 설계되었다.공칭 문자만 부호화되며, 문자의 사전 호핑 형식은 없으므로 표시에 쉐이핑 처리가 필요합니다.아랍어 이외의 대부분의 아랍어 스크립트 언어(페르시아어, 우르두어 등)를 쓰는 데 필요한 추가 문자는 포함되어 있지 않습니다.

ISO-8859-6은 ISO/IEC 6429C0C1 제어 코드로 보완되는 경우 이 표준의 IANA 우선 문자 집합 이름입니다.텍스트는 논리적인 순서로 표시되므로 BiDi 처리가 필요합니다.명목상 ISO-8859-6(코드 페이지 28596)은 '시각적 순서'를 나타내고 ISO-8859-6-I(코드 페이지 38596)는 논리 순서를 나타냅니다.그러나 실제로는 ISO-8859-6은 논리 순서 텍스트를 나타내며 HTML 및 XML 문서에서도 필요합니다.또한 ISO-8859-6-E가 있어 방향성을 특수 제어 문자로 명시적으로 지정해야 합니다. 후자의 변형은 실제로 사용되지 않습니다.IBM은 ISO 8859-6에 [2][3]코드 페이지/CCSID 1089를 할당했습니다.AIX 운영체제에 대한 에뮬레이션입니다.

ISO-8859-6은 현재 기술적으로 [4]구식이며, Unicode는 특히 인터넷상의 현대 응용 프로그램에서 선호됩니다. 즉, 웹 페이지의 주요 UTF-8 인코딩을 의미합니다(완전한 커버리지는 ISO-8859-6이나 Windows 1256과 달리 Unicode의 아랍어 스크립트 참조).전체 웹 페이지의 0.1%가 ISO-8859-6을 [5][6]사용합니다.

역사

ASMO 708은 1986년 현재는 폐지된 아랍 표준 도량형[7] 기구에 의해 아랍어권 국가에서 사용되는 8비트 표준으로 고안되었습니다.이 문자 집합의 디자인은 이전 7비트 표준인 ASMO 449에서 영감을 얻었지만 단순히 7비트 문자 집합이 위쪽으로 이동한 것이 아니라 몇 가지 차이가 있습니다.

ASMO 708은 쌍방향 문자 집합입니다.문자 집합의 하위 부분은 숫자 및 일부 구두점에서 표준 ISO 646과 다릅니다.문맥에 따라(숫자가 라틴 문자 또는 아랍 문자 중 어느 쪽이든) 숫자는 라틴 숫자 또는 아랍 숫자로 렌더링됩니다.또, 문맥에 따라 대칭적인 구두점을 반전시켜, 즉 개구부 구두점이 있을 때마다, 스크립트의 방향에 따라 형상이 다르게 그려진다.

문자 집합의 위쪽에는 아랍어 문자, 라틴어 구두점과는 다른 아랍어 구두점 및 기타 몇 개의 문자만 있습니다.

ASMO 708은 1986년 자체 ECMA-114 규격으로 채택한 ECMA와 긴밀히 협력하여 설계되었습니다[8].또한 ISO [9]8859-6으로 ISO 표준으로 승인되었습니다.1986년에 IR[10] 127로 국제 부호화 문자 집합 등록부에 등록되었습니다.

다른 문자 집합과의 관계

ASMO 708과 관련된 기타 문자 세트도 있습니다.

  • ASMO 708/프랑스어[11] 1에는 프랑스어 소문자가 추가되어 있습니다.
  • 프랑스어 1/ASMO 708[11] ISO 8859-1 코드 포인트에 프랑스어 소문자를 추가하고 아랍어를 뒤바꿔 놓는다.
  • ISO/IR[12] 167에는 프랑스어 및 독일어 문자가 추가되어 있습니다.
  • MS-DOS용 Microsoft 코드 페이지 708코드 페이지 437의 일반적인 코드 포인트에 프랑스어 문자를 추가하고 상자 그리기 문자를 추가합니다.
  • MS-DOS의 경우 마이크로소프트의 코드 페이지 710(투명 아랍어)과 마이크로소프트의 코드 페이지 720(투명 ASMO) 모두 코드 페이지 437의 일반적인 코드 포인트에 프랑스어 문자를 추가하지만 코드 페이지 437의 상자 그리기 문자가 원래 코드 포인트에 있도록 아랍 문자를 탈선시킵니다.
  • Microsoft 의 Windows 1256 에서는, Windows 1252 의 코드 포인트에 프랑스어 소문자가 추가되어 아랍어의 코드 포인트가 어긋납니다.

코드 차트

ISO/IEC 8859-6[13][14][15][16]
0 1 2 3 4 5 6 7 8 9 A B C D E F
0x
1x
2배 SP ! " # $ %/최소 & ' ( ) */최소 + , - . /
3배 0/٠ 1/١ 2/٢ 3/٣ 4/٤ 5/٥ 6/٦ 7/٧ 8/٨ 9/٩ : ; < > = > ?
4배 @ A B C D E F G H I J K L M N O
5배 P Q R S T U V W X Y Z [ \ ] ^ _
6배 ` a b c d e f g h i j k l m n o
7배 p q r s t u v w x y z { } ~
8배
9배
도끼를 NBSP ¤ ، 부끄럽다
Bx ؛ ؟
철형 ء آ أ ؤ إ ئ ا ب ة ت ث ج ح خ د
Dx ذ ر ز س ش ص ض ط ظ ع غ
ـ ف ق ك ل م ن ه و ى ي ◌ً ◌ٌ ◌ٍ ◌َ ◌ُ
Fx ◌ِ ◌ّ ◌ْ

코드값 0xEB~0xF2는 조합된 문자에 할당됩니다.

「 」를 참조해 주세요.

레퍼런스

  1. ^ Character Sets, Internet Assigned Numbers Authority (IANA), 2018-12-12
  2. ^ "Code page 1089 information document". Archived from the original on 2016-03-17.
  3. ^ "CCSID 1089 information document". Archived from the original on 2016-03-27.
  4. ^ 컴퓨팅과 코란 - 몇 가지 경고, 2007, Thomas Milo
  5. ^ "Usage Statistics of ISO-8859-6 for Websites, January 2019". w3techs.com. Retrieved 2019-01-17.
  6. ^ "Frequenty Asked Questions".
  7. ^ Le codage informatique de l'criture arabe : d'ASMO 449 unicode Unicode et ISO/CEI 10646
  8. ^ 표준 ECMA-114
  9. ^ ISO/IEC 8859-6:1999
  10. ^ "Right-Hand Part of Latin/Arabic Alphabet" (PDF). Archived from the original (PDF) on 2016-12-21. Retrieved 2017-02-20.
  11. ^ a b Printronix ACA 에뮬레이션 프로그래머 레퍼런스 매뉴얼
  12. ^ 아랍어/프랑스어/독일어 세트
  13. ^ "ISO 8859-6:1999 to Unicode". 1999-07-27.
  14. ^ Code Page CPGID 01089 (pdf) (PDF), IBM
  15. ^ Code Page CPGID 01089 (txt), IBM
  16. ^ International Components for Unicode (ICU), ibm-1089_P100-1995.ucm, 2002-12-03

외부 링크

  • ISO/IEC 8859-6:1999
  • 표준 ECMA-114: 8비트 싱글바이트 코드 그래픽스 문자 세트 - 라틴/아랍어 알파벳 제2판 (2000년 12월)
  • ISO-IR 127 라틴어/아랍어 알파벳 오른쪽 부분 (1986년 11월 30일)