ISO/IEC 8859
ISO/IEC 8859표준. | ISO/IEC 8859 |
---|---|
분류 | 8비트 확장 ASCII, ISO/IEC 4873 레벨 1 |
확장 | US-ASCII |
선행 | ISO/IEC 646 |
에 의해 성공자 | ISO/IEC 10646(유니코드) |
기타 관련 부호화 | ISO/IEC 10367, Windows-125x |
ISO/IEC 8859는 8비트 문자 인코딩용 ISO 및 IEC의 공동 표준 시리즈입니다.일련의 표준은 ISO/IEC 8859-1, ISO/IEC 8859-2 등과 같은 번호가 매겨진 부품으로 구성됩니다.폐기된 ISO/IEC 8859-12를 제외한 15개의 부품이 있습니다.이 일련의 표준을 유지하는 ISO 작업 그룹은 해체되었습니다.
ISO/IEC 8859 파트1, 2, 3, 및 4는 원래 Ecma International 표준 ECMA-94
서론
인쇄 가능한 95개의 ASCII 문자의 비트 패턴은 현대 영어로 정보를 교환하기에 충분하지만, 라틴 문자를 사용하는 대부분의 다른 언어에는 ASCII에서 다루지 않는 추가 기호가 필요합니다.ISO/IEC 8859는 8비트 바이트의 8번째 비트를 사용하여 다른 96자의 인쇄 가능한 문자를 배치할 수 있도록 함으로써 이 문제를 해결하려고 했습니다.초기 인코딩은 일부 데이터 전송 프로토콜의 제한과 부분적으로 역사적 이유로 인해 7비트로 제한되었습니다.그러나 단일 8비트 문자 인코딩에 들어가는 것보다 더 많은 문자가 필요했기 때문에 다양한 라틴 알파벳에 적합한 최소 10개의 매핑을 포함하여 여러 개의 매핑이 개발되었습니다.
ISO/IEC 8859 표준 부품은 ISO/IEC 4873에 따라 바이트 범위 0x00–1F 및 0x7F–9F를 "그래픽 문자를 나타내지 않는 조합"(즉 제어 문자로 사용하도록 예약된 조합)으로 명시적으로 구분하지만 인쇄 가능한 문자만 정의합니다.ISO 6429 또는 ISO 6630 [1]등의 이러한 바이트와 관련된 제어 기능을 정의하는 dard.이를 위해 IANA에 등록된 일련의 부호화에서는 ISO 646에서 C0 컨트롤 세트(바이트 0~31에 매핑된 제어 문자)와 ISO 6429에서 C1 컨트롤 세트(바이트 128~159에 매핑된 제어 문자)가 추가되어 모든 바이트가 할당되지는 않더라도 대부분 8비트 문자 맵이 생성됩니다.이러한 세트에는 우선 MIME 이름으로서 ISO-8859-n이 있습니다.우선 MIME 이름이 지정되지 않은 경우에는 표준 이름이 포함됩니다.많은 사람들이 ISO/IEC 8859-n과 ISO-8859-n이라는 용어를 서로 바꾸어 사용합니다.ISO/IEC 8859-11은 TIS 620과 거의 동일하기 때문에 이러한 문자 집합을 할당받지 못했습니다.
성격.
ISO/IEC 8859 표준은 타이포그래피가 아닌 신뢰성 높은 정보 교환을 목적으로 설계되었습니다.표준에서는 옵션의 연결부호, 곱슬따옴표, 대시 등 고품질 타이포그래피에 필요한 기호를 생략하고 있습니다.그 결과, 고품질 조판 시스템에서는, ASCII 및 ISO/IEC 8859 규격에 가세해 독자적인 확장자 또는 유니코드를 사용하는 경우가 많습니다.
실제 경험에 기초한 부정확한 규칙은 문자나 기호가 이미 널리 사용되는 데이터 처리 문자 집합의 일부가 아니며 일반적으로 국가 언어용 타자기에 제공되지 않는 경우 해당 문자나 기호가 입력되지 않는다는 것입니다.따라서 일부 유럽 언어에서 사용되는 방향성 큰따옴표 and과 used는 포함되지만 영어 및 기타 언어에서는 방향성 큰따옴표 "과 used는 포함되지 않았다.
프랑스어는 'oe'로 입력할 수 있기 때문에 and과 lig의 결합자를 얻지 못했다.마찬가지로 all-caps 텍스트에 필요한 ÿ도 [2][3][4]폐기되었습니다.코드 포인트는 다르지만, 이 세 문자는 나중에 1999년에 ISO/IEC 8859-15에서 다시 도입되었고, 새로운 유로 기호 문자 €도 도입되었다.마찬가지로 네덜란드어는 and과 letters를 받지 않았습니다.네덜란드어 사용자들은 이것을 두 글자로 입력하는 데 익숙해졌기 때문입니다.
루마니아어는 처음에는 ș/ and(쉼표 포함) 및 // ((쉼표 포함) 문자를 받지 않았다. 왜냐하면 이 문자들은 처음에 유니코드 컨소시엄에 의해 ş/ and(세딜라 포함) 및 )/ ced(세딜라 포함)로 통일되었기 때문이다.단, 아래에 명시적인 쉼표가 있는 문자는 나중에 유니코드 표준에 추가되었으며 ISO/IEC 8859-16에도 포함되어 있습니다.
ISO/IEC 8859 인코딩의 대부분은 라틴어 스크립트를 사용하는 다양한 유럽 언어에 필요한 분음 기호를 제공합니다.그 외의 알파벳은, 다음과 같습니다.그리스어, 키릴어, 히브리어, 아랍어, 태국어.태국어, 히브리어 및 아랍어 인코딩에는 조합 문자도 포함되지만 대부분의 인코딩에는 공백 문자만 포함됩니다.
이 규격은 동아시아 언어(CJK)의 문자 표기 체계에 수천 개의 코드 포인트가 필요하기 때문에 그 문자는 제공하지 않는다.라틴어 기반 문자를 사용하지만 베트남어는 96자리에도 맞지 않습니다(Windows-1258과 같은 분음 부호를 사용하지 않는 경우).각 일본어 음절 문자(히라가나 또는 가타카나 참조)는 JIS X 0201과 같이 적합하지만, 다른 세계의 여러 알파벳과 마찬가지로 ISO/IEC 8859 체계에서는 부호화되지 않습니다.
ISO/IEC 8859 부품
ISO/IEC 8859는 다음과 같은 부분으로 나뉩니다.
일부 | 이름. | 리비전 | 기타 표준 | 묘사 |
---|---|---|---|---|
파트 1 | 라틴어-1 서유럽의 | 1987, 1998 | ECMA-94(1985, 1986년) | ISO/IEC 8859에서 가장 널리 사용되는 부분은 대부분의 서유럽 언어입니다.덴마크어(부분),[nb 1]네덜란드어(부분),[nb 2] 영어, 페로어, 핀란드어(부분),[nb 3]프랑스어(일부),[nb 3] 독일어, 아이슬란드어, 아일랜드어, 이탈리아어, 노르웨이어, 포르투갈어, Rhaeto-Romanic, 스코틀랜드 게일어, 스페인어, 카탈로니아어 및 스웨덴어.동유럽 알바니아어, 동남아시아 인도네시아어, 아프리카어 아프리칸스어, 스와힐리어를 포함한 세계 다른 지역 언어들도 포함됩니다. DEC MCS의 수정. ECMA 레벨의 최초의(1985) 표준 버전에는 타임 부호와 분할 오벨러스가 결여되어 있으며, 다음 해에 추가되었다.누락된 유로 기호와 대문자 δ는 개정판 ISO/IEC 8859-15에 있습니다(아래 참조).대응하는 IANA 문자 세트는 ISO-8859-1 입니다. |
파트 2 | 라틴어-2 중앙유럽어 | 1987, 1999 | ECMA-94(1986)[nb 4] | 보스니아어, 폴란드어, 크로아티아어, 체코어, 슬로바키아어, 슬로베니아어, 세르비아어, 헝가리어 등 라틴 알파벳을 사용하는 중앙 및 동유럽 언어를 지원합니다.누락된 유로 기호는 ISO/IEC 8859-16 버전에서 찾을 수 있습니다. |
파트 3 | 라틴어-3 남유럽어 | 1988, 1999 | 터키어, 몰타어, 에스페란토어.터키어용 ISO/IEC 8859-9로 대체되었습니다. | |
제4부 | 라틴어-4 북유럽어 | 1988, 1998 | 에스토니아어, 라트비아어, 리투아니아어, 그린란드어, 사미어. | |
파트 5 | 라틴어/키릴어 | 1988, 1999 | ECMA-113(1988, 1999)[nb 5] | 벨라루스어, 불가리아어, 마케도니아어, 러시아어, 세르비아어, 우크라이나어(일부)[nb 6]를 포함한 키릴 문자를 사용하는 슬라브어가 대부분입니다. |
파트 6 | 라틴어/아랍어 | 1987, 1999 | 가장 일반적인 아랍어 문자를 포함합니다.아랍어 스크립트를 사용하는 다른 언어는 지원하지 않습니다.표시를 위해 BiDi 및 필기 접합을 처리해야 합니다. | |
파트 7 | 라틴어/그리스어 | 1987, 2003 | 현대 그리스어(단조 철자법)에 대해 설명합니다.악센트 없이 쓰여진 고대 그리스어나 단조로운 철자법에도 사용할 수 있지만, 다조성 철자법에는 발음이 부족합니다.이것들은 유니코드와 함께 도입되었다.유로 기호, 드라크마 기호 및 ypogeggrammeni 띄어쓰기를 추가하기 위해 2003년 업데이트. | |
파트 8 | 라틴어/헤브루어 | 1988, 1999 | 이스라엘에서 사용되는 현대 히브리어 알파벳을 포함합니다.실제로는 논리 순서(표시를 위해 BiDi를 처리해야 함)와 시각 순서(좌우)의 2개의 다른 부호화가 존재합니다(실제로 bidi 처리 후 및 줄 바꿈).추가할 1999 업데이트LRM과 RLM. 2002년 국가 표준 수준에서 업데이트되어 유로와 셰켈 기호와 더 많은 양방향 형식 이펙터를 추가하였다. 2002년 추가는 ISO 표준 버전에 다시 통합되지 않았다. | |
파트 9 | 라틴어-5 터키어 | 1989, 1999 | ISO/IEC 8859-1과 거의 동일하며, 거의 사용되지 않는 아이슬란드 문자를 터키 문자로 대체한다. | |
파트 10 | 라틴어-6 북유럽어 | 1992년, 1998 | ECMA-144(1990, 1992, 2000) | Latin-4의 재배열.북유럽 언어에서 더 유용한 것으로 간주됩니다.발트어에는 라틴어 4가 더 많이 사용된다. |
파트 11 | 라틴어/태국어 | 2001 | TIS-620(1986, 1990) | 태국어에 필요한 문자가 포함되어 있습니다.1986년 TIS 620으로 국가 표준 수준에서 첫 번째 개정판이 제정되었습니다.2001년에 ISO 8859의 일부로 ISO 표준으로 승격되었으며, 중단 없는 공간이 추가되었습니다. |
라틴어/데바나가리 | 없음 | - | 데바나가리를 위한 8859의 일부를 만드는 작업은 1997년에 공식적으로 중단되었다.ISCII 및 Unicode/ISO/IEC 10646은 Devanagari에 대응하고 있습니다. | |
파트 13 | 라틴어-7 발트해 연안 | 1998 | - | Latin-4 및 Latin-6에서 누락된 발트어용 문자를 추가했습니다.이전에 공개된[nb 7] Windows-1257 관련. |
제14부 | 라틴어-8 켈트족 | 1998 | - | 게일어, 브르타뉴어 등 켈트어를 망라합니다.웨일스 문자는 이전의 (1994) ISO-IR-182에 대응한다. |
파트 15 | 라틴-9 | 1999 | - | 8859-1의 개정판으로, 거의 사용되지 않는 기호를 제거하고, 유로 기호 €와 프랑스어, 핀란드어 및 에스토니아어의 적용범위를 완성하는 문자 €, š, ,, the로 대체한다. |
파트 16 | 라틴-10 남동유럽어 | 2001 | SR 14111 (1998) | 알바니아어, 크로아티아어, 헝가리어, 이탈리아어, 폴란드어, 루마니아어, 슬로베니아어뿐만 아니라 핀란드어, 프랑스어, 독일어 및 아일랜드 게일어(새로운 철자법)도 사용할 수 있습니다.초점은 기호보다는 글자에 있다.통화 기호는 유로 기호로 대체됩니다. |
ISO/IEC 8859의 각 파트는 서로 차용되는 언어를 지원하도록 설계되어 있기 때문에 각 언어에 필요한 문자는 보통 1개의 파트로 대응됩니다.그러나 문자 변환 없이는 수용되지 않는 문자 및 언어 조합이 있습니다.가능한 한 부드럽게 전환하기 위해 노력했습니다.예를 들어, 독일어는 모든 라틴어 변형(1-4, 9, 10, 13-16)의 동일한 위치에 7개의 특수 문자를 모두 가지고 있으며, 많은 위치에서는 문자 집합 간의 발음이 다를 뿐입니다.특히, 변형 1-4는 공동으로 설계되었으며, 모든 인코딩된 문자가 주어진 위치에 나타나거나 전혀 나타나지 않는 특성을 가지고 있다.
테이블
바이너리 | 10월 | 12월 | 16진수 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 13 | 14 | 15 | 16 | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
1010 0000 | 240 | 160 | A0 | Non-breaking space(NBSP) | |||||||||||||||
1010 0001 | 241 | 161 | A1 | ¡ | Ą | Ħ | Ą | Ё | ‘ | ¡ | Ą | ก | ” | Ḃ | ¡ | Ą | |||
1010 0010 | 242 | 162 | A2 | ¢ | ˘ | ĸ | Ђ | ’ | ¢ | ¢ | Ē | ข | ¢ | ḃ | ¢ | ą | |||
1010 0011 | 243 | 163 | A3 | £ | ł | £ | Ŗ | Ѓ | £ | Ģ | ฃ | £ | ł | ||||||
1010 0100 | 244 | 164 | A4 | ¤ | Є | ¤ | € | ¤ | Ī | ค | ¤ | Ċ | € | ||||||
1010 0101 | 245 | 165 | 답 5 | ¥ | Ľ | Ĩ | Ѕ | ₯ | ¥ | Ĩ | ฅ | „ | ċ | ¥ | „ | ||||
1010 0110 | 246 | 166 | A6 | ¦ | Ś | Ĥ | Ļ | І | ¦ | Ķ | ฆ | ¦ | Ḋ | š | |||||
1010 0111 | 247 | 167 | A7 | § | Ї | § | ง | § | |||||||||||
1010 1000 | 250 | 168 | A8 | ¨ | Ј | ¨ | Ļ | จ | ø | Ẁ | š | ||||||||
1010 1001 | 251 | 169 | A9 | © | š | I i | š | Љ | © | DH | ฉ | © | |||||||
1010 1010 | 252 | 170 | AA | ª | şSH | Ē | Њ | ͺ | × | ª | š | ช | Ŗ | Ẃ | ª | Ș | |||
1010 1011 | 253 | 171 | AB | « | Ť | Ğ | Ģ | Ћ | « | Ŧ | ซ | « | ḋ | « | |||||
1010 1100 | 254 | 172 | AC | ¬ | Ź | Ĵ | Ŧ | Ќ | ، | ¬ | ž | ฌ | ¬ | Ỳ | ¬ | Ź | |||
1010 1101 | 255 | 173 | AD | 소프트 하이픈(SHY) | ญ | 부끄럽다 | |||||||||||||
1010 1110 | 256 | 174 | AE | ® | ž | ž | Ў | ® | ū | ฎ | ® | ź | |||||||
1010 1111 | 257 | 175 | AF | ¯ | Ż | ¯ | Џ | ― | ¯ | Ŋ | ฏ | ᄋ | Ÿ | ¯ | Ż | ||||
1011 0000 | 260 | 176 | B0 | ° | А | ° | ฐ | ° | Ḟ | ° | |||||||||
1011 0001 | 261 | 177 | 지하 1층 | ± | ą | ħ | ą | Б | ± | ą | ฑ | ± | ḟ | ± | |||||
1011 0010 | 262 | 178 | B2 | ² | ˛ | ² | ˛ | В | ² | ē | ฒ | ² | Ġ | ² | 챠 | ||||
1011 0011 | 263 | 179 | B3 | ³ | ł | ³ | ŗ | Г | ³ | ģ | ณ | ³ | ġ | ³ | ł | ||||
1011 0100 | 264 | 180 | B4 | ´ | Д | ΄ | ´ | ī | ด | “ | Ṁ | ž | |||||||
1011 0101 | 265 | 181 | B5 | µ | ľ | µ | ĩ | Е | ΅ | µ | ĩ | ต | µ | ṁ | µ | ” | |||
1011 0110 | 266 | 182 | B6 | ś | ĥ | ļ | Ж | Ά | ķ | ถ | |||||||||
1011 0111 | 267 | 183 | B7 | · | ˇ | · | ˇ | З | · | ท | · | Ṗ | · | ||||||
1011 1000 | 270 | 184 | B8 | ¸ | И | Έ | ¸ | ļ | ธ | ø | ẁ | 쯔 | |||||||
1011 1001 | 271 | 185 | B9 | ¹ | š | ı | š | Й | Ή | ¹ | ᄃ | น | ¹ | ṗ | ¹ | č | |||
1011 1010 | 272 | 186 | BA | º | ş | ē | К | Ί | ÷ | º | š | บ | ŗ | ẃ | º | ș | |||
1011 1011 | 273 | 187 | BB | » | ť | ğ | ģ | Л | ؛ | » | ŧ | ป | » | Ṡ | » | ||||
1011 1100 | 274 | 188 | BC | ¼ | ź | ĵ | ŧ | М | Ό | ¼ | 쯔 | ผ | ¼ | ỳ | Œ | ||||
1011 1101 | 275 | 189 | BD | ½ | ˝ | ½ | Ŋ | Н | ½ | ― | ฝ | ½ | Ẅ | œ | |||||
1011 1110 | 276 | 190 | 있다 | ¾ | 쯔 | 쯔 | О | Ύ | ¾ | u | พ | ¾ | ẅ | Ÿ | |||||
1011 1111 | 277 | 191 | BF | ¿ | ż | ŋ | П | ؟ | Ώ | ¿ | ŋ | ฟ | æ | ṡ | ¿ | ż | |||
1100 0000 | 300 | 192 | C0 | à | Ŕ | à | ā | Р | ΐ | à | ā | ภ | Ą | à | |||||
1100 0001 | 301 | 193 | C1 | 아아 | С | ء | 알파 | 아아 | ม | Į | 아아 | ||||||||
1100 0010 | 302 | 194 | C2 | 」 | Т | آ | β | 」 | ย | ā | 」 | ||||||||
1100 0011 | 303 | 195 | C3 | ã | 에러 | ã | У | أ | Γ | ã | ร | ć치 | ã | 에러 | |||||
1100 0100 | 304 | 196 | C4 | ä | Ф | ؤ | Δ | ä | ฤ | ä | |||||||||
1100 0101 | 305 | 197 | C5 | å | Ĺ | Ċ | å | Х | إ | Ε | å | ล | å | ć치 | |||||
1100 0110 | 306 | 198 | C6 | ᄋ | ć치 | Ĉ | ᄋ | Ц | ئ | Ζ | ᄋ | ฦ | Ę | ᄋ | |||||
1100 0111 | 307 | 199 | C7 | 츠 | Į | Ч | ا | Η | 츠 | Į | ว | Ē | 츠 | ||||||
1100 1000 | 310 | 200 | C8 | è | 챠 | è | 챠 | Ш | ب | Θ | è | 챠 | ศ | 챠 | è | ||||
1100 1001 | 311 | 201 | C9 | 에 | Щ | ة | Ι | 에 | ษ | 에 | |||||||||
1100 1010 | 312 | 202 | CA | ê | Ę | ê | Ę | Ъ | ت | Κ | ê | Ę | ส | Ź | ê | ||||
1100 1011 | 313 | 203 | CB | ë | Ы | ث | Λ | ë | ห | Ė | ë | ||||||||
1100 1100 | 314 | 204 | 참조 | ì | Ě | ì | Ė | Ь | ج | 마이크로미터 | ì | Ė | ฬ | Ģ | ì | ||||
1100 1101 | 315 | 205 | CD | Ⅱ | Э | ح | Ν | Ⅱ | อ | Ķ | Ⅱ | ||||||||
1100 1110 | 316 | 206 | CE | Î | Ю | خ | Ξ | Î | ฮ | Ī | Î | ||||||||
1100 1111 | 317 | 207 | CF | Ï | Ď | Ï | Ī | Я | د | ο | Ï | ฯ | Ļ | Ï | |||||
바이너리 | 10월 | 12월 | 16진수 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 13 | 14 | 15 | 16 | |
1101 0000 | 320 | 208 | D0 | ð | DH | DH | а | ذ | Π | Ğ | ð | ะ | š | Ŵ | ð | ||||
1101 0001 | 321 | 209 | D1 | ñ | Ń | ñ | Ņ | б | ر | Ρ | ñ | Ņ | ั | Ń | ñ | Ń | |||
1101 0010 | 322 | 210 | D2 | Ò | Ň | Ò | O | в | ز | Ò | O | า | Ņ | Ò | |||||
1101 0011 | 323 | 211 | D3 | ó | Ķ | г | س | Σ | ó | ำ | ó | ||||||||
1101 0100 | 324 | 212 | D4 | o | д | ش | Τ | o | ิ | O | o | ||||||||
1101 0101 | 325 | 213 | D5 | Õ | Ő | Ġ | Õ | е | ص | Υ | Õ | ี | Ő | ||||||
1101 0110 | 326 | 214 | D6 | 외 | ж | ض | Φ | 외 | ึ | 외 | |||||||||
1101 0111 | 327 | 215 | D7 | × | з | ط | Χ | × | Ũ | ื | × | Ṫ | × | Ś | |||||
1101 1000 | 330 | 216 | D8 | ø | Ř | Ĝ | ø | и | ظ | Ψ | ø | ุ | Ų | ø | Ű | ||||
1101 1001 | 331 | 217 | D9 | Ù | Ů | Ù | Ų | й | ع | Ω | Ù | Ų | ู | ł | Ù | ||||
1101 1010 | 332 | 218 | DA | u | к | غ | Ϊ | u | ฺ | Ś | u | ||||||||
1101 1011 | 333 | 219 | DB | Û | Ű | Û | л | Ϋ | Û | ū | Û | ||||||||
1101 1100 | 334 | 220 | 직류 | ü | м | ά | ü | ü | |||||||||||
1101 1101 | 335 | 221 | DD | Ý | Ŭ | Ũ | н | έ | I i | Ý | Ż | Ý | Ę | ||||||
1101 1110 | 336 | 222 | DE | Þ | Ţ | Ŝ | ū | о | ή | şSH | Þ | ž | Ŷ | Þ | Ț | ||||
1101 1111 | 337 | 223 | DF | ß | п | ί | ‗ | ß | ฿ | ß | |||||||||
1110 0000 | 340 | 224 | E0 | 아 | ŕ | 아 | 아 | р | ـ | ΰ | א | 아 | 아 | เ | ą | 아 | |||
1110 0001 | 341 | 225 | E1 | 아 | с | ف | α | ב | 아 | แ | į | 아 | |||||||
1110 0010 | 342 | 226 | E2 | ★ | т | ق | β | ג | ★ | โ | 아 | ★ | |||||||
1110 0011 | 343 | 227 | E3 | ã | ă | ã | у | ك | γ | ד | ã | ใ | ć | ã | ă | ||||
1110 0100 | 344 | 228 | E4 | ä | ф | ل | δ | ה | ä | ไ | ä | ||||||||
1110 0101 | 345 | 229 | E5 | å | ĺ | ċ | å | х | م | ε | ו | å | ๅ | å | ć | ||||
1110 0110 | 346 | 230 | E6 | æ | ć | ĉ | æ | ц | ن | ζ | ז | æ | ๆ | ę | æ | ||||
1110 0111 | 347 | 231 | E7 | 츠 | į | ч | ه | η | ח | 츠 | į | ็ | ē | 츠 | |||||
1110 1000 | 350 | 232 | E8 | è | č | è | č | ш | و | θ | ט | è | č | ่ | č | è | |||
1110 1001 | 351 | 233 | E9 | 에 | щ | ى | ι | י | 에 | ้ | 에 | ||||||||
1110 1010 | 352 | 234 | EA | ê | ę | ê | ę | ъ | ي | κ | ך | ê | ę | ๊ | ź | ê | |||
1110 1011 | 353 | 235 | 이비 | ë | ы | ً | λ | כ | ë | ๋ | ė | ë | |||||||
1110 1100 | 354 | 236 | EC | ì | ě | ì | ė | ь | ٌ | μ | ל | ì | ė | ์ | ģ | ì | |||
1110 1101 | 355 | 237 | ED | ii | э | ٍ | ν | ם | ii | ํ | ķ | ii | |||||||
1110 1110 | 356 | 238 | EE | î | ю | َ | ξ | מ | î | ๎ | ī | î | |||||||
1110 1111 | 357 | 239 | EF | ï | ď | ï | ī | я | ُ | opus | ן | ï | ๏ | ļ | ï | ||||
1111 0000 | 360 | 240 | F0 | ð | ᄃ | ᄃ | № | ِ | π | נ | ğ | ð | ๐ | š | ŵ | ð | ᄃ | ||
1111 0001 | 361 | 241 | F1 | ñ | ń | ñ | ņ | ё | ّ | ρ | ס | ñ | ņ | ๑ | ń | ñ | ń | ||
1111 0010 | 362 | 242 | F2 | ò | ň | ò | o | ђ | ْ | ς | ע | ò | o | ๒ | ņ | ò | |||
1111 0011 | 363 | 243 | F3 | o | ķ | ѓ | σ | ף | o | ๓ | o | ||||||||
1111 0100 | 364 | 244 | F4 | o | є | τ | פ | o | ๔ | o | o | ||||||||
1111 0101 | 365 | 245 | F5 | õ | ő | ġ | õ | ѕ | υ | ץ | õ | ๕ | ő | ||||||
1111 0110 | 366 | 246 | F6 | ö | і | φ | צ | ö | ๖ | ö | |||||||||
1111 0111 | 367 | 247 | F7 | ÷ | ї | χ | ק | ÷ | ũ | ๗ | ÷ | ṫ | ÷ | ś | |||||
1111 1000 | 370 | 248 | F8 | ø | ř | ĝ | ø | ј | ψ | ר | ø | ๘ | ų | ø | ű | ||||
1111 1001 | 371 | 249 | F9 | ù | ů | ù | ų | љ | ω | ש | ù | ų | ๙ | ł | ù | ||||
1111 1010 | 372 | 250 | FA | u | њ | ϊ | ת | u | ๚ | ś | u | ||||||||
1111 1011 | 373 | 251 | FB | û | ű | û | ћ | ϋ | û | ๛ | u | û | |||||||
1111 1100 | 374 | 252 | FC | ü | ќ | ό | ü | ü | |||||||||||
1111 1101 | 375 | 253 | FD | ý | ŭ | ũ | § | ύ | LRM | ı | ý | ż | ý | ę | |||||
1111 1110 | 376 | 254 | FE | þ | ţ | ŝ | u | ў | ώ | RLM | ş | þ | 쯔 | ŷ | þ | ț | |||
1111 1111 | 377 | 255 | FF | ÿ | ˙ | џ | ÿ | ĸ | ’ | ÿ | |||||||||
바이너리 | 10월 | 12월 | 16진수 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 13 | 14 | 15 | 16 |
위치 0xA0에는 항상 비브레이킹스페이스가 있고, 0xAD에는 대부분 줄 바꿈에만 표시되는 소프트하이픈이 있습니다.다른 빈 필드는 다음 중 하나입니다. 할당되지 않았거나 사용되는 시스템에서 표시할 수 없습니다.
ISO/IEC 8859-7:2003 및 ISO/IEC 8859-8:1999 버전으로 새롭게 추가되었습니다.LRM은 왼쪽에서 오른쪽으로 마크(U+200E), RLM은 오른쪽에서 왼쪽으로 마크(U+200F)를 나타냅니다.
Unicode 및 UCS와의 관계
1991년부터 유니코드 컨소시엄은 ISO 및 IEC와 협력하여 유니코드 표준 및 ISO/IEC 10646: 유니버설 문자 집합(UCS)을 개발해왔다.ISO/IEC 8859의 새로운 에디션에서는 Unicode/UCS 이름 및 U+nnnn 표기법에 따라 문자가 표현되므로 ISO/IEC 8859의 각 부분은 사실상 Unicode/UCS 문자 인코딩 방식으로 UCS의 매우 작은 서브셋을 단일 8비트바이트에 매핑할 수 있습니다.Unicode 와 UCS 의 선두 256 문자는, ISO/IEC-8859-1(라틴-1) 의 문자와 같습니다.
ISO/IEC 8859의 일부와 그 파생어를 포함한 단일 바이트 문자 집합은 1990년대 내내 선호되었으며, 소프트웨어에서 잘 확립되고 쉽게 구현된다는 장점이 있습니다. 1바이트 대 1문자의 방정식은 단순하며 대부분의 단일 언어 애플리케이션에 적합하며, 조합된 문자는 없습니다.에러 또는 배리언트 형식.유니코드 대응의 operating system이 보급됨에 따라, ISO/IEC 8859와 그 외의 레거시 인코딩의 인기는 낮아졌습니다.ISO 8859 및 단일 바이트 문자 모델의 잔재는 많은 운영 체제, 프로그래밍 언어, 데이터 스토리지 시스템, 네트워킹 애플리케이션, 디스플레이 하드웨어 및 최종 사용자 애플리케이션 소프트웨어에서 그대로 남아 있지만, 대부분의 최신 컴퓨팅 애플리케이션은 내부적으로 Unicode를 사용하며 다른 인코딩과 매핑하기 위해 변환 테이블을 사용합니다.gs, 필요한 경우
현황
ISO/IEC 8859 표준은 ISO/IEC 공동 기술 위원회 1, 소위원회 2, 작업 그룹 3(ISO/IEC JTC 1/SC 2/WG 3)에 의해 유지되었다.2004년 6월, WG 3은 해체되었고, 유지관리 업무는 SC 2로 이관되었습니다.소위원회의 유일한 작업 그룹인 WG 2가 유니코드의 범용 코드 문자 집합 개발에 집중하고 있기 때문에, 이 표준은 현재 갱신되지 않고 있다.
WHATWG Encoding Standard([6]HTML5에서 지원되는 문자 인코딩을 규정하는 WHATWG Encoding Standard)에는 ISO/IEC 8859의 [7]대부분이 포함되어 있습니다.단,[8] 파트 1, 9, 11은 각각 Windows-1252, Windows-1254 및 Windows-874로 해석됩니다.새 페이지의 작성자와 새 프로토콜 설계자는 [8]대신 UTF-8을 사용하도록 지시받습니다.
「 」를 참조해 주세요.
- 컴퓨터 문자 집합 목록
- 번호 폼
- RPL 문자 세트(HP 계산기의 ISO/IEC 8859-1 슈퍼셋, 'ECMA-94'라고도 함)
- DEC 다국어 문자 집합(MCS)
- DEC National Replacement Character Set(NRCS; 국가 대체 문자 집합)
메모들
- ^ ǿ, ǿ 등 악센트가 있는 모음이 몇 개 누락되어 있습니다.이러한 모음을 악센트가 없는 모음으로 대체할 수 있지만 모호성이 높아집니다.
- ^ ij/ ((문자 IJ)만 누락되어 있습니다.보통은 IJ로 표시됩니다.
- ^ a b ISO/IEC 8859-15에 문자가 누락되어 있다.
- ^ 1985년판에는 ISO-8859-1 버전만 포함되어 있습니다.
- ^ 1986년판에서는 완전히 다른 인코딩인 KOI8-E를 정의하고 있습니다.
- ^ 8859-5는 1990년에 우크라이나 문자에 다시 도입된 ґ/ letter 문자를 누락했다.
- ^ 1995년 발행,[5] 1996년 등록.
레퍼런스
- ^ ISO/IEC JTC 1/SC 2/WG 3 (1998-02-12). Final Text of DIS 8859-1, 8-bit single-byte coded graphic character sets—Part 1: Latin alphabet No.1 (PDF). ISO/IEC FDIS 8859-1:1998; JTC1/SC2/N2988; WG3/N411.
This set of coded graphic characters may be regarded as a version of an 8-bit code according to ISO/IEC 2022 or ISO/IEC 4873 at level 1. […] The shaded positions in the code table correspond to bit combinations that do not represent graphic characters. Their use is outside the scope of ISO/IEC 8859; it is specified in other International Standards, for example ISO/IEC 6429.
- ^ Haralambous, Yannis (September 2007). Fonts & Encodings. Translated by Horne, P. Scott (1st ed.). Sebastopol, California, USA: O'Reilly Media, Inc. pp. 37–38. ISBN 978-0-596-10242-5.
[…] According to an urban legend, the French delegate was out sick the day when the standard came up for a vote and had to have his Belgian counterpart act as his proxy. In fact, the French delegate was an engineer, who was convinced that this ligature was useless, and the Swiss and German representatives pressed hard to have the mathematical symbols × and ÷ included at the positions where Œ and œ would logically appear. […]
- ^ André, Jacques (2003-10-15) [2003-10-02]. André, Bernard; Baron, Georges-Louis; Bruillard, Éric (eds.). "Histoire d'Œ, histoire d'@ des rumeurs typographiques et de leurs enseignements". Traitement de Texte et Production de Documents INRP/GEDIAPS (in French): 19–34. Archived from the original on 2016-12-08. Retrieved 2016-12-09.
- ^ André, Jacques (November 1996). "ISO Latin-1, norme de codage des caractères européens? trois caractères français en sont absents!" (PDF). Cahiers GUTenberg (in French) (25): 65–77. Archived from the original (PDF) on 2008-11-30.
- ^ Lazhintseva, Katya (1996-05-03). "Registration of new MIME charset: Windows-1257". IANA.
- ^ "8.2.2.3. Character encodings". HTML 5.1 2nd Edition. W3C.
User agents must support the encodings defined in the WHATWG Encoding standard, including, but not limited to […]
- ^ van Kesteren, Anne. "Legacy single-byte encodings". Encoding Standard. WHATWG.
- ^ a b van Kesteren, Anne. "Names and labels". Encoding Standard. WHATWG.
- ISO/IEC 8859의 각 파트의 공개 버전은 ISO 카탈로그 사이트와 IEC 웹 스토어에서 유료로 구할 수 있다.
- ISO/IEC JTC 1/SC 2/WG 3에 제출된 ISO/IEC 8859 일부 부분의 최종 초안의 PDF 버전은 WG 3 웹사이트에서 구할 수 있습니다.
- ISO/IEC 8859-1:1998 - 8비트 싱글바이트 부호화 그래픽 문자 세트, Part 1: 라틴 알파벳 No.1 (1998년 2월 12일 초안, 1998년 4월 15일 발행)
- ISO/IEC 8859-4:1998 - 8비트 싱글바이트 코드 그래픽 문자 세트, Part 4: 라틴 문자 번호 4 (1998년 2월 12일 초안, 1998년 7월 1일 발행)
- ISO/IEC 8859-7:1999 - 8비트 싱글바이트 코딩 그래픽 문자 세트, 파트 7: 라틴/그리스어 알파벳 (초안 1999년 6월 10일, ISO/IEC 8859-7:2003으로 대체, 2003년 10월 10일 발행)
- ISO/IEC 8859-10:1998 - 8비트 싱글 바이트 코드 그래픽 문자 세트, Part 10: 라틴 문자 번호 6 (1998년 2월 12일 초안, 1998년 7월 15일 발행)
- ISO/IEC 8859-11:1999 - 8비트 싱글바이트 코딩 그래픽 문자 세트, Part 11: 라틴어/태국어 문자 세트(1999년 6월 22일 초안, ISO/IEC 8859-11:2001, 2001년 12월 15일 발행)
- ISO/IEC 8859-13:1998 - 8비트 싱글바이트 코드 그래픽 문자 세트, Part 13: 라틴 알파벳 No.7 (1998년 4월 15일 초안, 1998년 10월 15일 발행)
- ISO/IEC 8859-15:1998 - 8비트 싱글 바이트 코드 그래픽 문자 세트, Part 15: 라틴 문자 번호 9 (1997년 8월 1일 초안, ISO/IEC 8859-15:1999, 1999년 3월 15일 발행)
- ISO/IEC 8859-16:2000 - 8비트 싱글바이트 코드 그래픽 문자 세트, Part 16: 라틴 문자 번호 10 (초안 1999년 11월 15일, ISO/IEC 8859-16:2001로 대체, 2001년 7월 15일 발행)
- ECMA 표준은 ISO/IEC 8859 문자 집합 표준과 정확히 일치하며, 다음 사이트에서 확인할 수 있습니다.
- 표준 ECMA-94: 8비트 싱글 바이트 코드 그래픽스 문자 세트 - 라틴어 알파벳 No.1 ~ No.4 제2판 (1986년 6월)
- 표준 ECMA-113: 8비트 싱글 바이트 코드 그래픽스 문자 세트 - 라틴/키릴 알파벳 제3판 (1999년 12월)
- 표준 ECMA-114: 8비트 싱글바이트 코드 그래픽스 문자 세트 - 라틴/아랍어 알파벳 제2판 (2000년 12월)
- 표준 ECMA-118: 8비트 싱글바이트 부호화 그래픽스 문자 세트 - 라틴/그리스어 알파벳 (1986년 12월)
- 표준 ECMA-121: 8비트 싱글바이트 코드 그래픽스 문자 세트 - 라틴/헤브루 알파벳 제2판 (2000년 12월)
- 표준 ECMA-128: 8비트 싱글 바이트 코드 그래픽스 문자 세트 - 라틴 알파벳 No.5 제2판 (1999년 12월)
- 표준 ECMA-144: 8비트 싱글바이트 부호화 문자 세트 - 라틴 알파벳 No.6 제3판 (2000년 12월)
- ISO/IEC 8859-1과 Unicode 매핑테이블(일반 텍스트파일)은 Unicode FTP 사이트에 있습니다.
- 대부분의 ISO/IEC 8859 표준에 대한 비공식 설명 및 코드 차트는 ISO/IEC 8859 알파벳 수프(Mirror)에서 제공됩니다.