ISO/IEC 8859-11
ISO/IEC 8859-11ISO/IEC 8859-11:2001, 정보 테크놀로지 - 8비트 싱글 바이트 코드 그래픽 문자 세트 - Part 11: 라틴/태국어 알파벳은 ASCII 기반의 표준 문자 인코딩의 일부이며, 2001년에 초판되었습니다.그것은 비공식적으로 라틴어/태국어라고 불린다.이는 태국 국가 표준 TIS-620(1990년)과 거의 동일합니다.유일한 차이점은 ISO/IEC 8859-11이 코드 0xA0에 브레이크가 없는 공간을 할당하고 TIS-620은 정의되지 않은 상태로 유지한다는 것입니다.(실제로 이 작은 차이는 무시됩니다).
ISO-8859-11은 ISO 8859 시리즈를 기반으로 한 IANA 문자 집합의 일반 패턴을 따르지만 메인 등록된 IANA 문자 집합 이름이 아닙니다.단, no-break 공간에는 TIS-620에서 할당되지 않은 코드가 있기 때문에 ISO/IEC 8859-11에서는 문제없이 사용할 수 있는 근접한 동등한 TIS-620의 에일리어스로[1] 정의됩니다.Microsoft는 코드 페이지 28601을 할당했습니다.Windows [2]의 경우, Windows-28601 에서 ISO-8859-11 로 이동합니다.초안에는 태국어 글자가 여러 [3]곳에 적혀 있었다.
모든 종류의 ISO/IEC 8859와 마찬가지로 하위 128개 코드는 ASCII에 해당합니다.공백 없는 공간을 제외한 추가 문자는 Unicode에서 동일한 순서로 검색되며 0xA1에서 U+0E01 등으로 이동됩니다.
Microsoft Windows 코드 페이지 874 와 Apple Macintosh 의 태국판 MacThai 로 사용되고 있는 코드 페이지는, TIS-620 의 변형입니다.다만, 서로 호환성이 없습니다.
문자 집합
| ISO/IEC 8859-11[4] | ||||||||||||||||
| 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
| 0x | ||||||||||||||||
| 1배 | ||||||||||||||||
| 2배 | SP | ! | " | # | $ | % | & | ' | ( | ) | * | + | , | - | . | / |
| 3배 | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | : | ; | < > | = | > | ? |
| 4배 | @ | A | B | C | D | E | F | G | H | I | J | K | L | M | N | O |
| 5배 | P | Q | R | S | T | U | V | W | X | Y | Z | [ | \ | ] | ^ | _ |
| 6배 | ` | a | b | c | d | e | f | g | h | i | j | k | l | m | n | o |
| 7배 | p | q | r | s | t | u | v | w | x | y | z | { | } | ~ | ||
| 8배 | ||||||||||||||||
| 9배 | ||||||||||||||||
| 도끼 | NBSP | ก | ข | ฃ | ค | ฅ | ฆ | ง | จ | ฉ | ช | ซ | ฌ | ญ | ฎ | ฏ |
| Bx | ฐ | ฑ | ฒ | ณ | ด | ต | ถ | ท | ธ | น | บ | ป | ผ | ฝ | พ | ฟ |
| Cx | ภ | ม | ย | ร | ฤ | ล | ฦ | ว | ศ | ษ | ส | ห | ฬ | อ | ฮ | ฯ |
| Dx | ะ | ◌ั | า | ำ | ◌ิ | ◌ี | ◌ึ | ◌ื | ◌ุ | ◌ู | ◌ฺ | ฿ | ||||
| 예 | เ | แ | โ | ใ | ไ | ๅ | ๆ | ◌็ | ◌่ | ◌้ | ◌๊ | ◌๋ | ◌์ | ◌ํ | ◌๎ | ๏ |
| Fx | ๐ | ๑ | ๒ | ๓ | ๔ | ๕ | ๖ | ๗ | ๘ | ๙ | ๚ | ๛ | ||||
코드값 D1, D4-DA, E7-EE는 문자를 조합하고 있습니다.
벤더 확장
코드 페이지 874 (IBM) / 9066
IBM 코드 페이지 874(CP874, IBM-874, x-IBM874)는 코드 페이지 9066(IBM-9066)[5]이라고도 하며, 다음 [6][7][8]표에 표시된 9개의 기호만 ISO/IEC 8859-11과 다릅니다.
| IBM 코드 페이지 874/9066(ISO-8859-11과의 [9][10][11]차이점) | ||||||||||||||||
| 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
| 도끼 | ◌่ | ก | ข | ฃ | ค | ฅ | ฆ | ง | จ | ฉ | ช | ซ | ฌ | ญ | ฎ | ฏ |
| Bx | ฐ | ฑ | ฒ | ณ | ด | ต | ถ | ท | ธ | น | บ | ป | ผ | ฝ | พ | ฟ |
| Cx | ภ | ม | ย | ร | ฤ | ล | ฦ | ว | ศ | ษ | ส | ห | ฬ | อ | ฮ | ฯ |
| Dx | ะ | ◌ั | า | ำ | ◌ิ | ◌ี | ◌ึ | ◌ื | ◌ุ | ◌ู | ◌ฺ | ◌้︀ | ◌๊︀ | ◌๋︀ | ◌์︀ | ฿ |
| 예 | เ | แ | โ | ใ | ไ | ๅ | ๆ | ◌็ | ◌่ | ◌้ | ◌๊ | ◌๋ | ◌์ | ◌ํ | ◌๎ | ๏ |
| Fx | ๐ | ๑ | ๒ | ๓ | ๔ | ๕ | ๖ | ๗ | ๘ | ๙ | ๚ | ๛ | ¢ | ¬ | ¦ | NBSP |
코드 페이지 1161
코드 페이지 1161(CP116, IBM-1161)은 IBM 코드 페이지 874의 변형입니다.유일한 차이점은 위치hex DE(222)[12][13]의 유로 기호(€)입니다.
코드 페이지 874 (Microsoft) / 1162
IBM에 [14][15]의해 코드 페이지 1162(CP1162, IBM-1162)로 알려진 Windows 코드 페이지 874(윈도우 874, MS874, x-윈도우 874)는 Microsoft Windows에서 사용됩니다.ISO/IEC 8859-11과는 다음 표와 같이 9개의 기호만 다릅니다.
| 코드 페이지 1162 (IBM) / 874 (Microsoft) : ISO-8859-11과의[16][17][18][19] 차이점 | ||||||||||||||||
| 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
| 8배 | € | … | ||||||||||||||
| 9배 | ‘ | ’ | “ | ” | • | – | — | |||||||||
Mac OS 태국어
이것은 Classic Mac OS에서 사용되는 변형입니다.
| Mac OS[20] 태국어 | ||||||||||||||||
| 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
| 8배 | « | » | … | ◌่ | ◌้ | ◌๊ | ◌๋ | ◌์ | ◌่ | ◌้ | ◌๊ | ◌๋ | ◌์ | “ | ” | ◌ํ |
| 9배 | • | ◌ั | ◌็ | ◌ิ | ◌ี | ◌ึ | ◌ื | ◌่ | ◌้ | ◌๊ | ◌๋ | ◌์ | ‘ | ’ | ||
| 도끼 | NBSP | ก | ข | ฃ | ค | ฅ | ฆ | ง | จ | ฉ | ช | ซ | ฌ | ญ | ฎ | ฏ |
| Bx | ฐ | ฑ | ฒ | ณ | ด | ต | ถ | ท | ธ | น | บ | ป | ผ | ฝ | พ | ฟ |
| Cx | ภ | ม | ย | ร | ฤ | ล | ฦ | ว | ศ | ษ | ส | ห | ฬ | อ | ฮ | ฯ |
| Dx | ะ | ◌ั | า | ำ | ◌ิ | ◌ี | ◌ึ | ◌ื | ◌ุ | ◌ู | ◌ฺ | WJ | ZWSP | – | — | ฿ |
| 예 | เ | แ | โ | ใ | ไ | ๅ | ๆ | ◌็ | ◌่ | ◌้ | ◌๊ | ◌๋ | ◌์ | ◌ํ | ™ | ๏ |
| Fx | ๐ | ๑ | ๒ | ๓ | ๔ | ๕ | ๖ | ๗ | ๘ | ๙ | ® | © | ||||
「 」를 참조해 주세요.
각주
레퍼런스
- ^ "IANA Character Sets".
- ^ "js-codepage, Getting codepages". GitHub. 12 October 2021.
- ^ Everson, Michael. "Proposed ISO 8859-11".
- ^ Whistler, Ken (2002-10-07), ISO/IEC 8859-11:2001 to Unicode, Unicode Consortium
- ^ IBM; Unicode Consortium. "convrtrs.txt". International Components for Unicode. v. 59180.0.1.
Yes ibm-874 == ibm-9066. ibm-1161 has the euro update.
- ^ "Code page 874 information document". Archived from the original on 2017-01-16.
- ^ "CCSID 874 information document". Archived from the original on 2016-03-27.
- ^ "CCSID 9066 information document". Archived from the original on 2016-03-27.
- ^ IBM. "Code Page CPGID 00874" (PDF). REGISTRY: Graphic Character Sets and Code Pages.
- ^ Code Page CPGID 00874 (txt), IBM
- ^ "Converter Explorer: ibm-874_P100-1995". International Components for Unicode. Unicode Consortium.
- ^ "Code Page 01161" (PDF).
- ^ "CCSID 1161 information document". Archived from the original on 2016-03-27.
- ^ "Code page 1162 information document". Archived from the original on 2016-03-17.
- ^ "CCSID 1162 information document". Archived from the original on 2016-03-27.
- ^ "Code Page 01162" (PDF).
- ^ Steele, Shawn (1998-02-28). "cp874 to Unicode table". Unicode Consortium, Microsoft.
- ^ Code Page CPGID 01162 (txt), IBM
- ^ International Components for Unicode (ICU), ibm-1162_P100-1999.ucm, 2002-12-03
- ^ Apple (2005-04-05). "Map (external version) from Mac OS Thai character set to Unicode 3.2 and later". Unicode Consortium.
외부 링크
- ISO/IEC 8859-11:2001
- ISO/IEC 8859-11:1999 - 8비트 싱글바이트 코딩 그래픽 문자 세트, Part 11: 라틴어/태국어 문자 세트(1999년 6월 22일 초안, ISO/IEC 8859-11:2001, 2001년 12월 15일 발행)
- Windows 코드 페이지 874
- ISO-IR 166 태국어 문자 집합(1992년 7월 13일, 태국 표준 TIS 620-2533(1990년)에서)
- 태국어 표준화와 구현 PDF 175k