ISO/IEC 8859-14
ISO/IEC 8859-14MIME / IANA | ISO-8859-14 |
---|---|
에일리어스 | iso-ir-199, latin8, iso-199, l8[1] |
언어 | 아일랜드어, Manx, 스코틀랜드 게일어, 웨일스어, 콘월어, 브르타뉴어, 영어 |
표준. | ISO/IEC 8859-14:1998 |
분류 | ISO/IEC 8859(확장 ASCII, ISO/IEC 4873 레벨 1) |
확장 | US-ASCII |
에 기반을 둔 | ISO-IR-182 |
ISO/IEC 8859-14:1998, 정보기술 - 8비트 싱글 바이트 코드 그래픽 문자 세트 - Part 14: 라틴 문자 No.8 (셀틱)는 ASCII 기반의 표준 문자 인코딩 ISO/IEC 8859 시리즈의 일부로 1998년에 초판되었습니다.그것은 비공식적으로 라틴-8 또는 켈트어로 불린다.그것은 아일랜드어, 맨스어, 스코틀랜드 게일어, 웨일스어, 코니쉬어, 브르타뉴어와 같은 켈트어 언어들을 다루기 위해 고안되었다.
ISO-8859-14는 ISO/IEC 6429의 C0 및 C1 제어 코드로 보완되는 경우 이 표준의 IANA 우선 문자 집합 이름입니다.CeltScript는 Extended Latin-8이라고 불리는 윈도우용 확장을 만들었다.Microsoft는 코드 페이지 28604 a.k.a.를 할당했습니다.Windows-28604에서 [2]ISO-8859-14로
역사
ISO-8859-14는 원래 Sami [3]언어용으로 제안되었습니다.켈트족을 위해 ISO [4]8859-12가 제안되었다.나중에 데바나가리에 대해 ISO 8859-12가 제안되었고, 따라서 켈트족 제안은 ISO 8859-14로 변경되었다.Sami 제안서는 ISO 8859-15로 [5]변경되었지만 ISO-IR-197로 [6]등록되었지만 ISO/IEC 8859 부품으로 거부되었습니다.
최초 제안서는 다른 배열의 포인트 0xA1을 사용했다.BF.[4] 명세서의 위원회 초안 단계에서 [7]0xAE에 닷리스 i가 포함되었고, 최종 간행물에서 등록 상표 기호(ISO-8859-1 매칭)로 변경되었다.
ISO-8859-1의 이전(1994년에 등록된) 수정사항인 ISO-IR-182는 웨일스어 [8]사용을 위해 문자 ,, ẃ, ,, ỳ, , 및 그 소문자 형식(이미 포함된 , 제외)을 추가하였다.ISO-8859-14의 최종판에는 ISO-IR-182에 나타난 것과 같은 위치에 이러한 문자가 포함되어 있습니다.
코드 페이지 레이아웃
ISO-8859-1과의 차이점은 문자 아래에 유니코드 코드 포인트 번호가 있습니다.
ISO/IEC 8859-14[9][10] | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
0x | ||||||||||||||||
1x | ||||||||||||||||
2배 | SP | ! | " | # | $ | % | & | ' | ( | ) | * | + | , | - | . | / |
3배 | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | : | ; | < > | = | > | ? |
4배 | @ | A | B | C | D | E | F | G | H | I | J | K | L | M | N | O |
5배 | P | Q | R | S | T | U | V | W | X | Y | Z | [ | \ | ] | ^ | _ |
6배 | ` | a | b | c | d | e | f | g | h | i | j | k | l | m | n | o |
7배 | p | q | r | s | t | u | v | w | x | y | z | { | } | ~ | ||
8배 | ||||||||||||||||
9배 | ||||||||||||||||
도끼를 | NBSP | Ḃ 1E02 | ḃ 1E03 | £ | Ċ 010A | ċ 010B | Ḋ 1E0A | § | Ẁ 1E80 | © | Ẃ 1E82 | ḋ 1E0B | Ỳ 1EF2 | 부끄럽다 | ® | Ÿ 0178 |
Bx | Ḟ 1E1E | ḟ 1E1F | Ġ 0120 | ġ 0121 | Ṁ 1E40 | ṁ 1E41 | Ṗ 1E56 | ẁ 1E81 | ṗ 1E57 | ẃ 1E83 | Ṡ 1E60 | ỳ 1EF3 | Ẅ 1E84 | ẅ 1E85 | ṡ 1E61 | |
철형 | à | 아아 | 」 | ã | ä | å | ᄋ | 츠 | è | 에 | ê | ë | ì | Ⅱ | Î | Ï |
Dx | Ŵ 0174 | ñ | Ò | ó | o | Õ | 외 | Ṫ 1E6A | ø | Ù | u | Û | ü | Ý | Ŷ 0176 | ß |
예 | 아 | 아 | ★ | ã | ä | å | æ | 츠 | è | 에 | ê | ë | ì | ii | î | ï |
Fx | ŵ 0175 | ñ | ò | o | o | õ | ö | ṫ 1E6B | ø | ù | u | û | ü | ý | ŷ 0177 | ÿ |
초안 레이아웃
초안에서는 A0-BF의 입장이 달랐다.그것은 필크로우 사인은 포함하지 않고 대신 라틴어 1 위치에 센트 사인은 포함시켰다.그 후, 필크로우 사인이 일반적이기 때문에, 필크로우 사인은 라틴 1의 위치에 머무르고, 대신 센트 사인은 제거되었다.
ISO-8859-14와의 차이점은 아래에 유니코드 코드 포인트가 있습니다.
ISO/IEC 8859-14 초안[4] 제안서 행만 변경됨 | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
도끼를 | NBSP | Ḃ | ¢ 00A2 | £ | ḃ 1E03 | Ċ 010A | ċ 010B | § | Ẁ | © | Ẃ | Ṡ 1E60 | Ỳ | 부끄럽다 | ® | Ÿ |
Bx | Ḋ 1E0A | ḋ 1E0B | Ḟ 1E1E | ḟ 1E1F | Ġ 0120 | ġ 0121 | Ṁ 1E40 | ṁ 1E41 | ẁ | Ṗ 1E56 | ẃ | ṡ 1E61 | ỳ | Ẅ | ẅ | ṗ 1E57 |
레퍼런스
- ^ Character Sets, Internet Assigned Numbers Authority (IANA), 2018-12-12
- ^ "SheetJS/js-codepage". GitHub. 12 October 2021.
- ^ Everson, Michael. "Proposed ISO 8859-14 (later 15)".
- ^ a b c Everson, Michael. "Proposed ISO 8859-12 (later 14)".
- ^ Everson, Michael (1996-06-19). Proposal for a new part of ISO/IEC 8859: Latin alphabet No. 9 (Sámi).
- ^ Swedish Institute for Standards (1997-01-24). ISO-IR-197: Sami supplementary Latin set (PDF). ITSCJ/IPSJ.
- ^ Everson, Michael (1997-05-05). "ISO/IEC CD 8859-14:1997 — Latin alphabet No. 8 (Celtic)" (Committee Draft).
- ^ British Standards Institution (1994-03-16). ISO-IR-182: Welsh variant of Latin Alphabet No. 1 (right-hand part) (PDF). ITSCJ/IPSJ.
- ^ Kuhn, Markus; Whistler, Ken (1999-07-27). "ISO/IEC 8859-14:1998 to Unicode". 8859 to Unicode mapping tables. Unicode, Inc.
- ^ International Components for Unicode (ICU), iso-8859_14-1998.ucm, 1999-07-27
외부 링크
- ISO/IEC 8859-14:1998
- ISO-IR 199 켈트 보충 라틴어 세트(1998년 5월 1일, 아일랜드 기구 NSAI/AGITS/WG6에 의해 제출됨)