ISO/IEC 8859-2

ISO/IEC 8859-2
ISO/IEC 8859-2
MIME / IANAISO-8859-2
에일리어스iso-ir-101, csISOLatin2, latin2, l2, IBM111
언어(아래 참조)
표준.ECMA-94: 1986, ISO/IEC 8859
분류확장 ASCII, ISO/IEC 8859
확장US-ASCII
에 기반을 둔ISO-8859-1
기타 관련 부호화Windows-1250, MacCroatian

ISO/IEC 8859-2:1999, 정보 테크놀로지 - 8비트 싱글 바이트 부호화 그래픽 문자 세트 - Part 2: 라틴 문자 No.2는 ASCII 기반의 표준 문자 인코딩 ISO/IEC 8859 시리즈의 일부로 1987년에 초판되었습니다.이것은 비공식적으로 "라틴-2"라고 불립니다.일반적으로 라틴 문자로 쓰여진 중앙 또는 "동유럽" 언어를 대상으로 합니다[1].ISO/IEC 8859-2는 체코 [2]및 슬로바키아 지역에서는 "Latin-2"라고도 불리는 코드 페이지 852(MS-DOS 라틴 2, PC 라틴 2)와는 크게 다릅니다.코드 페이지 912는 확장입니다.

ISO-8859-2는 ISO/IEC 6429C0C1 제어 코드로 보완되는 경우 이 표준의 IANA 우선 문자 집합 이름입니다.[3] 2018년 12월 전체 웹 페이지의 0.1%가 ISO-8859-2를 사용합니다.Microsoft는 코드 페이지 28592 a.k.a.를 할당했습니다.Windows의 경우 Windows-28592에서 ISO-8859-2로.IBM은 코드 페이지 1111을 ISO 8859-2에 할당했습니다.

Windows-1250은 ISO-8859-2와 유사하며 인쇄 가능한 문자 및 기타 문자가 모두 포함되어 있습니다.다만, 그 중 몇 개는 재배치되어 있습니다(ISO-8859-1의 모든 인쇄 가능한 문자를 같은 장소에 보관 유지하는 Windows-1252와는 다릅니다).

언어 범위

이러한 코드 값은 다음 언어에 사용할 수 있습니다.

  1. ^ 독일어 텍스트용 ISO/IEC 8859-1과 완전히 호환됩니다.

루마니아어에도 사용할 수 있지만, 아래에 콤마가 있는 문자 s와 t가 없기 때문에 루마니아어에는 적합하지 않습니다.단, s와 t에는 비슷한 모양의 세딜라가 포함되어 있습니다.이러한 문자는 유니코드 표준의 첫 번째 버전에서 통일되었습니다.즉, 세딜라 또는 콤마를 사용한 문자는 별개의 문자가 아니라 글리프 선택으로 취급되었습니다.따라서 루마니아어와 함께 사용하기 위한 글꼴은 이론적으로 이러한 코드 포인트에 쉼표가 있는 문자를 사용해야 합니다.

마이크로소프트는 루마니아에서 판매되는 컴퓨터에는 실제로 이러한 글꼴을 제공하지 않았다.다만, ISO 8859-2 와 Windows-1250(같은 문제가 있는 경우)은 루마니아어로 많이 사용되고 있습니다.그 후 Unicode는 콤마 바리안트를 Cedilla 바리안트로부터 분리하여 웹 페이지의 선두를 차지하게 되었습니다.다만, 대부분의 경우, Cedilla에 s 와 t 가 붙어 있습니다.Unicode는 2014년 현재[citation needed] 아래의 콤마로 문자를 분리하는 것은 실수이며 루마니아 데이터의 손상을 초래하고 있습니다.기존 데이터와 입력 방식에는 오래된 세딜라 코드 포인트가 포함되어 텍스트 검색이 복잡해집니다.

코드 페이지 레이아웃

ISO-8859-1과의 차이점은 아래에 유니코드 코드 포인트 번호가 있습니다.

ISO/IEC 8859-2(라틴어-2)
0 1 2 3 4 5 6 7 8 9 A B C D E F
0x
1배
2배 SP ! " # $ % & ' ( ) * + , - . /
3배 0 1 2 3 4 5 6 7 8 9 : ; < > = > ?
4배 @ A B C D E F G H I J K L M N O
5배 P Q R S T U V W X Y Z [ \ ] ^ _
6배 ` a b c d e f g h i j k l m n o
7배 p q r s t u v w x y z { } ~
8배
9배
도끼를 NBSP Ą
0104
˘
02D8
ł
0141
¤ Ľ
013D
Ś
015A
§ ¨ š
0160
şSH
015E
Ť
0164
Ź
0179
부끄럽다 ž
017D
Ż
017B
Bx ° ą
0105
˛
02DB
ł
0142
´ ľ
013E
ś
015B
ˇ
02C7
¸ š
0161
ş
015F
ť
0165
ź
017A
˝
02DD

017E
ż
017C
철형 Ŕ
0154
아아 에러
0102
ä Ĺ
0139
ć치
0106

010C
Ę
0118
ë Ě
011A
Î Ď
010E
Dx DH
0110
Ń
0143
Ň
0147
ó o Ő
0150
× Ř
0158
Ů
016E
u Ű
0170
ü Ý Ţ
0162
ß
ŕ
0155
ă
0103
ä ĺ
013A
ć
0107
č
010D
ę
0119
ë ě
011B
ii î ď
010F
Fx
0111
ń
0144
ň
0148
o o ő
0151
ö ÷ ř
0159
ů
016F
u ű
0171
ü ý ţ
0163
˙
02D9

「 」를 참조해 주세요.

레퍼런스

  1. ^ "Microsoft Outlook Message Encodings".
  2. ^ "The Czech and Slovak Character Encoding Mess Explained". luki.sdf-eu.org. Retrieved 2022-02-27.
  3. ^ "Historical trends in the usage statistics of character encodings for websites, February 2022".

외부 링크