ISO/IEC 8859-15
ISO/IEC 8859-15MIME / IANA | ISO-8859-15 |
---|---|
에일리어스 | latin-9, latin-0 |
표준. | ISO/IEC 8859 |
분류 | ISO 8859(확장 ASCII, ISO 4873 레벨 1) |
확장 | US-ASCII |
에 기반을 둔 | ISO-8859-1 |
선행 | ISO-8859-1 |
ISO/IEC 8859-15:1999, 정보 테크놀로지 - 8비트 싱글 바이트 코드 그래픽 문자 세트 - Part 15: 라틴 문자 번호 9는 ASCII 기반의 표준 문자 인코딩의 일부이며, 1999년에 초판되었습니다.이것은 비공식적으로 Latin-9(및 잠시 동안 Latin-0)이라고 불립니다.ISO 8859-1과 유사하기 때문에 "서유럽" 언어에도 적용되지만,[1] 일부 덜 일반적인 기호를 유로 기호와 필요하다고 간주된 문자로 대체한다.
A4 | A6 | A8 | B4 | B8 | BC | BD | 있다 | |
---|---|---|---|---|---|---|---|---|
8859-1 | ¤ | ¦ | ¨ | ´ | ¸ | ¼ | ½ | ¾ |
8859-15 | € | š | š | ž | 쯔 | Œ | œ | Ÿ |
ISO-8859-15는 ISO/IEC 6429의 C0 및 C1 제어 코드로 보완되는 경우 이 표준의 IANA 우선 문자 집합 이름입니다.
Microsoft는 코드 페이지 28605 a.k.a.를 할당했습니다.Windows-28605에서 ISO-8859-15로IBM은 ISO 8859-15에 [2][3]코드 페이지 923(CCSID 923)을 할당했습니다.
ISO/IEC 8859-1 및 ISO/IEC 8859-15 의 인쇄 가능한 문자는, 모두 Windows-1252 에 있습니다.2016년 10월 이후 ISO-8859-15를 [4][5]사용하는 웹사이트는 0.1%(실제 0.02% 미만) 미만입니다.
역사
ISO 8859-15라는 식별자는 1996년 사미어족에 제안되었으나 결국 거부되었으나 ISO-IR [6][7][8]197로 통과되었다.
ISO 8859-0이라고 불리는 제안은 1997년에 이루어졌으며, 사용되지 않거나 거의 사용되지 않는 ISO 8859-1 문자(,, ,, ))를 €, became, became, [9]became로 대체하기 위해 유로 도입 시 필요하게 되었다.œ와 are는 프랑스어 연결로 프랑스어 텍스트를 소문자에서 all-caps로 변환하고 손실 없이 다시 되돌릴 수 있도록 ÿ가 필요합니다.아이러니하게도 마지막 3개는 이미 1983년에 ECMA-94(1985년)와 ISO-8859-1(1987년)이 파생된 문자 집합인 DEC의 다국적 문자 집합(MCS)에 존재했다.원래 코드 포인트는 이제 다른 캐릭터에 의해 사용되고 있기 때문에, 논리적인 코드 포인트의 재도입을 위해 덜 논리적인 코드를 선택해야 했습니다.
또, 6 문자(,, ±, ±, ,, ), ))를 「최대 언어를 커버할 수 있는 그 외의 문자」[9]로 대체하는 것을 추천합니다.유로화 기호의 경우, 일부는 통화 기호 대신 플러스 기호로 바꾸기를 원했다.통화 기호는 일부 응용 프로그램에서 필드 구분 기호로 사용되고 다른 응용 프로그램에서는 소계를 나타냅니다.이에 대한 강한 반대가 있었다.한 사람은 "제안된 +-는 거의 쓰이지 않지만 이 수열은 이미 β±와 상당히 다른 수학적인 의미를 가지고 있기 때문에 적절한 폴백은 아니다"며 "독자가 문맥에서 의도된 의미인 β±를 추론한다고 해도 적어도 β+는 물리학자의 감정에 큰 상처를 줄 수 있다"고 말했다.프랑스어 전화기의 O-E 끈..결국 ±와 θ는 교체되지 않았다.결국 러시아 차용어와 이름을 번역하기 위해 핀란드어와 에스토니아어로 사용되는 ,, [citation needed],, ž, ž의 네 글자가 선택되었다.제안서는 ISO 8859-15로 [when?]이름이 변경되었습니다.
ISO 8859-15를 8비트 통신용 기본 문자 집합으로 만들려는 시도가 있었지만 인기 있는 ISO 8859-1을 대체할 수는 없었습니다.유로 부호가 필요할 때 Linux에서 텍스트 콘솔 및 터미널 프로그램의 기본 문자 집합으로 일부 사용되었지만, 완전한 유니코드를 사용하는 것은 실용적이지 않았지만, 그 이후 UTF-8로 대체되었습니다.
범위
ISO 8859-15는 "라틴 문자 번호 9"를 인코딩합니다.이 문자 집합은 아메리카, 서유럽, 오세아니아 및 아프리카의 대부분에서 사용됩니다.또한 동아시아 언어의 표준 로마자 표기법에서도 일반적으로 사용됩니다.
각 문자는 단일 8비트 코드 값으로 인코딩됩니다.이러한 코드 값은 거의 모든 데이터 교환 시스템에서 다음과 같은 언어로 통신할 수 있습니다.
- 알파벳을 완벽하게 포함하는 현대 언어
|
- 메모들
구두점 부호 및 아포스트로피 적용 범위
위에 나열된 일부 언어에서는 올바른 따옴표가 누락되어 있습니다.이는 ,, ,, ,, are만 포함되어 있기 때문입니다.
또한 이 부호화는 아포스트로피 및 방향의 단일 큰따옴표에는 올바른 문자를 제공하지 않지만 일부 텍스트는 ISO 8859-1의 일부인 6자형/9자형 따옴표 또는 아포스트로피 대신 공백의 중대 액센트와 간격의 첨두 악센트를 사용합니다(또한 일부 글꼴 스타일에서 안정적으로 작동합니다).이 모든 문자는 기울어진 웨지 글리프로 표시됩니다).
코드 페이지 레이아웃
ISO-8859-1과의 차이점은 문자 아래에 유니코드 코드 포인트가 표시됩니다.
ISO/IEC 8859-15[11][12][13] | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
0x | ||||||||||||||||
1x | ||||||||||||||||
2배 | SP | ! | " | # | $ | % | & | ' | ( | ) | * | + | , | - | . | / |
3배 | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | : | ; | < > | = | > | ? |
4배 | @ | A | B | C | D | E | F | G | H | I | J | K | L | M | N | O |
5배 | P | Q | R | S | T | U | V | W | X | Y | Z | [ | \ | ] | ^ | _ |
6배 | ` | a | b | c | d | e | f | g | h | i | j | k | l | m | n | o |
7배 | p | q | r | s | t | u | v | w | x | y | z | { | } | ~ | ||
8배 | ||||||||||||||||
9배 | ||||||||||||||||
도끼를 | NBSP | ¡ | ¢ | £ | € 20AC | ¥ | š 0160 | § | š 0161 | © | ª | « | ¬ | 부끄럽다 | ® | ¯ |
Bx | ° | ± | ² | ³ | ž 017D | µ | · | 쯔 017E | ¹ | º | » | Œ 0152 | œ 0153 | Ÿ 0178 | ¿ | |
철형 | à | 아아 | 」 | ã | ä | å | ᄋ | 츠 | è | 에 | ê | ë | ì | Ⅱ | Î | Ï |
Dx | ð | ñ | Ò | ó | o | Õ | 외 | × | ø | Ù | u | Û | ü | Ý | Þ | ß |
예 | 아 | 아 | ★ | ã | ä | å | æ | 츠 | è | 에 | ê | ë | ì | ii | î | ï |
Fx | ð | ñ | ò | o | o | õ | ö | ÷ | ø | ù | u | û | ü | ý | þ | ÿ |
에일리어스
ISO 8859-15에는 다음과 같은 벤더 고유의 에일리어스도 있습니다.
「 」를 참조해 주세요.
레퍼런스
- ^ "ISO-8859-15". IANA. Retrieved 8 March 2016.
- ^ "Code page 923 information document". Archived from the original on 2013-02-28.
- ^ "CCSID 923 information document". Archived from the original on 2014-12-01.
- ^ "Historical trends in the usage of character encodings, November 2018". w3techs.com.
- ^ "Frequently Asked Questions". w3techs.com.
- ^ TIEKE representing Finnish Standards Association SFS (1999-12-07). Sami supplementary Latin set no 2 (PDF). ITSCJ/IPSJ. ISO-IR-209.
- ^ Everson, Michael. "Proposed ISO 8859-15". Retrieved 26 February 2017.
- ^ Everson, Michael. "Proposed ISO 8859-14 (later 15)". Retrieved 26 February 2017.
- ^ a b Everson, Michael. "Proposed ISO 8859-0 (later 15)". Retrieved 26 February 2017.
- ^ Stolz, Otto (July 11, 1997). "Re: New Draft ISO 8859-0". Unicode Mail List (Mailing list).
- ^ Code Page CPGID 00923 (pdf) (PDF), IBM
- ^ Code Page CPGID 00923 (txt), IBM
- ^ International Components for Unicode (ICU), ibm-923_P100-1998.ucm, 2002-12-03
- ^ Baird, Cathy; Chiba, Dan; Chu, Winson; Fan, Jessica; Ho, Claire; Law, Simon; Lee, Geoff; Linsley, Peter; Matsuda, Keni; Oscroft, Tamzin; Takeda, Shige; Tanaka, Linus; Tozawa, Makoto; Trute, Barry; Tsujimoto, Mayumi; Wu, Ying; Yau, Michael; Yu, Tim; Wang, Chao; Wong, Simon; Zhang, Weiran; Zheng, Lei; Zhu, Yan; Moore, Valarie (2002) [1996]. "Appendix A: Locale Data". Oracle9i Database Globalization Support Guide (PDF) (Release 2 (9.2) ed.). Oracle Corporation. Oracle A96529-01. Archived (PDF) from the original on 2017-02-14. Retrieved 2017-02-14.
외부 링크
- ISO/IEC 8859-15:1999
- ISO/IEC 8859-15:1998 - 8비트 싱글 바이트 코드 그래픽 문자 세트, Part 15: 라틴 문자 번호 9 (1997년 8월 1일 초안, ISO/IEC 8859-15:1999, 1999년 3월 15일 발행)
- ISO Latin 1과 비교하여 ISO Latin 9
- ISO-IR 203 유럽 보충 라틴어 세트 (1998년 9월 16일)