ISO/IEC 8859-11

ISO/IEC 8859-11

ISO/IEC 8859-11:2001, 정보 테크놀로지 - 8비트 싱글 바이트 코드 그래픽 문자 세트 - Part 11: 라틴/태국어 알파벳은 ASCII 기반의 표준 문자 인코딩의 일부이며, 2001년에 초판되었습니다.그것은 비공식적으로 라틴어/태국어라고 불린다.이는 태국 국가 표준 TIS-620(1990년)과 거의 동일합니다.유일한 차이점은 ISO/IEC 8859-11이 코드 0xA0에 브레이크가 없는 공간을 할당하고 TIS-620은 정의되지 않은 상태로 유지한다는 것입니다.(실제로 이 작은 차이는 무시됩니다).

ISO-8859-11은 ISO 8859 시리즈를 기반으로 한 IANA 문자 집합의 일반 패턴을 따르지만 메인 등록된 IANA 문자 집합 이름이 아닙니다.단, no-break 공간에는 TIS-620에서 할당되지 않은 코드가 있기 때문에 ISO/IEC 8859-11에서는 문제없이 사용할 수 있는 근접한 동등한 TIS-620의 에일리어스로[1] 정의됩니다.Microsoft는 코드 페이지 28601을 할당했습니다.Windows [2]의 경우, Windows-28601 에서 ISO-8859-11 로 이동합니다.초안에는 태국어 글자가 여러 [3]곳에 적혀 있었다.

모든 종류의 ISO/IEC 8859와 마찬가지로 하위 128개 코드는 ASCII에 해당합니다.공백 없는 공간을 제외한 추가 문자는 Unicode에서 동일한 순서로 검색되며 0xA1에서 U+0E01 등으로 이동됩니다.

Microsoft Windows 코드 페이지 874Apple Macintosh 의 태국판 MacThai 로 사용되고 있는 코드 페이지는, TIS-620 의 변형입니다.다만, 서로 호환성이 없습니다.

문자 집합

ISO/IEC 8859-11[4]
0 1 2 3 4 5 6 7 8 9 A B C D E F
0x
1배
2배 SP ! " # $ % & ' ( ) * + , - . /
3배 0 1 2 3 4 5 6 7 8 9 : ; < > = > ?
4배 @ A B C D E F G H I J K L M N O
5배 P Q R S T U V W X Y Z [ \ ] ^ _
6배 ` a b c d e f g h i j k l m n o
7배 p q r s t u v w x y z { } ~
8배
9배
도끼 NBSP
Bx
Cx
Dx ◌ั ◌ิ ◌ี ◌ึ ◌ื ◌ุ ◌ู ◌ฺ ฿
◌็ ◌่ ◌้ ◌๊ ◌๋ ◌์ ◌ํ ◌๎
Fx

코드값 D1, D4-DA, E7-EE는 문자를 조합하고 있습니다.

벤더 확장

코드 페이지 874 (IBM) / 9066

IBM 코드 페이지 874(CP874, IBM-874, x-IBM874)는 코드 페이지 9066(IBM-9066)[5]이라고도 하며, 다음 [6][7][8]표에 표시된 9개의 기호만 ISO/IEC 8859-11과 다릅니다.

IBM 코드 페이지 874/9066(ISO-8859-11과의 [9][10][11]차이점)
0 1 2 3 4 5 6 7 8 9 A B C D E F
도끼 ◌่
Bx
Cx
Dx ◌ั ◌ิ ◌ี ◌ึ ◌ื ◌ุ ◌ู ◌ฺ ◌้︀ ◌๊︀ ◌๋︀ ◌์︀ ฿
◌็ ◌่ ◌้ ◌๊ ◌๋ ◌์ ◌ํ ◌๎
Fx ¢ ¬ ¦ NBSP
ISO 8859-11과의 차이점

코드 페이지 1161

코드 페이지 1161(CP116, IBM-1161)은 IBM 코드 페이지 874의 변형입니다.유일한 차이점은 위치hex DE(222)[12][13]의 유로 기호(€)입니다.

코드 페이지 874 (Microsoft) / 1162

IBM에 [14][15]의해 코드 페이지 1162(CP1162, IBM-1162)로 알려진 Windows 코드 페이지 874(윈도우 874, MS874, x-윈도우 874)는 Microsoft Windows에서 사용됩니다.ISO/IEC 8859-11과는 다음 표와 같이 9개의 기호만 다릅니다.

코드 페이지 1162 (IBM) / 874 (Microsoft) : ISO-8859-11과의[16][17][18][19] 차이점
0 1 2 3 4 5 6 7 8 9 A B C D E F
8배
9배
ISO 8859-11과의 차이점

Mac OS 태국어

이것은 Classic Mac OS에서 사용되는 변형입니다.

Mac OS[20] 태국어
0 1 2 3 4 5 6 7 8 9 A B C D E F
8배 « » ◌่ ◌้ ◌๊ ◌๋ ◌์ ◌่ ◌้ ◌๊ ◌๋ ◌์ ◌ํ
9배 ◌ั ◌็ ◌ิ ◌ี ◌ึ ◌ื ◌่ ◌้ ◌๊ ◌๋ ◌์
도끼 NBSP
Bx
Cx
Dx ◌ั ◌ิ ◌ี ◌ึ ◌ื ◌ุ ◌ู ◌ฺ WJ ZWSP ฿
◌็ ◌่ ◌้ ◌๊ ◌๋ ◌์ ◌ํ
Fx ® ©
ISO 8859-11과의 차이점

「 」를 참조해 주세요.

각주

레퍼런스

  1. ^ "IANA Character Sets".
  2. ^ "js-codepage, Getting codepages". GitHub. 12 October 2021.
  3. ^ Everson, Michael. "Proposed ISO 8859-11".
  4. ^ Whistler, Ken (2002-10-07), ISO/IEC 8859-11:2001 to Unicode, Unicode Consortium
  5. ^ IBM; Unicode Consortium. "convrtrs.txt". International Components for Unicode. v. 59180.0.1. Yes ibm-874 == ibm-9066. ibm-1161 has the euro update.
  6. ^ "Code page 874 information document". Archived from the original on 2017-01-16.
  7. ^ "CCSID 874 information document". Archived from the original on 2016-03-27.
  8. ^ "CCSID 9066 information document". Archived from the original on 2016-03-27.
  9. ^ IBM. "Code Page CPGID 00874" (PDF). REGISTRY: Graphic Character Sets and Code Pages.
  10. ^ Code Page CPGID 00874 (txt), IBM
  11. ^ "Converter Explorer: ibm-874_P100-1995". International Components for Unicode. Unicode Consortium.
  12. ^ "Code Page 01161" (PDF).
  13. ^ "CCSID 1161 information document". Archived from the original on 2016-03-27.
  14. ^ "Code page 1162 information document". Archived from the original on 2016-03-17.
  15. ^ "CCSID 1162 information document". Archived from the original on 2016-03-27.
  16. ^ "Code Page 01162" (PDF).
  17. ^ Steele, Shawn (1998-02-28). "cp874 to Unicode table". Unicode Consortium, Microsoft.
  18. ^ Code Page CPGID 01162 (txt), IBM
  19. ^ International Components for Unicode (ICU), ibm-1162_P100-1999.ucm, 2002-12-03
  20. ^ Apple (2005-04-05). "Map (external version) from Mac OS Thai character set to Unicode 3.2 and later". Unicode Consortium.

외부 링크