Windows-1251

Windows-1251
Windows-1251
MIME / IANA윈도-1251
에일리어스cp1251 (코드페이지 1251)
언어러시아어, 우크라이나어, 벨라루스어, 불가리아어, 세르비아어 키릴어, 보스니아어, 마케도니아어, 루신어, 영어
작성자마이크로소프트
표준.WHATWG 부호화 표준
분류확장 ASCII, Windows-125x
기타 관련 부호화아미가-1251, KZ-1048,
RFC 1345의 "EMA-키릴어"

Windows-12518비트 문자 인코딩으로 러시아어, 우크라이나어, 벨라루스어, 불가리아어, 세르비아어 키릴어, 마케도니아어 및 기타 언어 키릴 문자사용하는 언어를 지원하도록 설계되었습니다.

세계에서 두 번째로 많이 사용되는 단일 바이트 문자 인코딩이며 키릴 문자를 지원하는 문자 인코딩 중 가장 많이 사용됩니다.2022년 3월 현재 전체 웹사이트의 0.5%가 Windows-1251을 [1][2]사용하고 있습니다.그러나 UTF-8에 이어 두 번째로 인기 있는 러시아어(.ru) 웹사이트의 [3][4][5]7.8%에서 사용되고 있습니다.Linux에서는 이 인코딩은 cp1251로 [6]알려져 있습니다.IBM은 코드 페이지 [7][8][9][10][11][12][13]1251(CCSID 1251 및 Euro Sign 확장 CCSID 5347)을 Windows-1251에 사용합니다.

Windows-1251 및 KOI8-R(또는 우크라이나어 버전 KOI8-U)은 ISO 8859-5('웹 사이트의 0.1% 미만'[14]에서 사용)보다 훨씬 일반적으로 사용됩니다.Windows-1252ISO 8859-1과 달리 Windows-1251은 ISO 8859-5와 밀접한 관계가 없습니다.

Unicode는 Windows-1251 또는 기타 키릴 문자 인코딩보다 선호됩니다.UTF-8은 웹 페이지의 주요 인코딩입니다.(Unicode의 완전한 커버리지, 오래된 키릴 문자를 포함한 436개의 키릴 문자/코드 포인트, Windows-1251과 같은 단일 바이트 문자 인코딩 방법에 대해 더 자세히 설명합니다.KOI8-R은 제공할 수 없습니다.유니코드 키릴 문자를 참조해 주세요.)

문자 집합

다음 표에 Windows-1251을 나타냅니다.각 문자는 유니코드 대응 문자 및 Alt 코드와 함께 표시됩니다.

Windows-1251[15]
0 1 2 3 4 5 6 7 8 9 A B C D E F
0x 없음 SOH STX ETX 전원 ENQ ACK BS HT LF VT FF CR 그렇게 SI
1배 DLE DC1 DC2 DC3 DC4 NAK 동기 ETB 할 수 있다 전자파 후보선수 ESC FS GS RS 미국
2배 SP ! " # $ % & ' ( ) * + , - . /
3배 0 1 2 3 4 5 6 7 8 9 : ; < > = > ?
4배 @ A B C D E F G H I J K L M N O
5배 P Q R S T U V W X Y Z [ \ ] ^ _
6배 ` a b c d e f g h i j k l m n o
7배 p q r s t u v w x y z { } ~
8배 Ђ Ѓ ѓ Љ Њ Ќ Ћ Џ
9배 ђ љ њ ќ ћ џ
도끼 NBSP Ў ў Ј ¤ Ґ ¦ § Ё © Є « ¬ 부끄럽다 ® Ї
Bx ° ± І і ґ µ · ё є » ј Ѕ ѕ ї
Cx А Б В Г Д Е Ж З И Й К Л М Н О П
Dx Р С Т У Ф Х Ц Ч Ш Щ Ъ Ы Ь Э Ю Я
а б в г д е ж з и й к л м н о п
Fx р с т у ф х ц ч ш щ ъ ы ь э ю я
Windows-1252와의 차이점

카자흐스탄어 변종

변경된 버전의 Windows-1251은 카자흐스탄에서 표준 STRK1048로 표준화되었으며 레이블로 알려져 있습니다.KZ-1048아래 행에서 다릅니다.

KZ-1048 (STRK1048-2002)[16]
0 1 2 3 4 5 6 7 8 9 A B C D E F
8배 Ђ Ѓ ѓ Љ Њ Қ Һ Џ
9배 ђ љ њ қ һ џ
도끼 NBSP Ұ ұ Ә ¤ Ө ¦ § Ё © Ғ « ¬ 부끄럽다 ® Ү
Bx ° ± І і ө µ · ё ғ » ә Ң ң ү
Windows-1251과의 차이점

아미가 변종

아미가-1251
MIME / IANA아미가-1251
에일리어스아미1251
언어영어, 러시아어
분류확장 ASCII
에 기반을 둔Windows-1251, ISO-8859-1, ISO-8859-15

러시아 아미가 OS 시스템은 키릴 문자의 러시아어 서브셋에 Windows-1251과 일치하는 코드 페이지 1251 버전을 사용했지만, 그 외에는 대부분 ISO-8859-1을 따릅니다.이 버전은 Amiga-1251[17]알려져 있으며 IANA[18]등록되어 있습니다.

아미가-1251[17]
0 1 2 3 4 5 6 7 8 9 A B C D E F
8배 XXX XXX BPH NBH IND NEL SSA ESA HTS HTJ VTS PLD PLU SS2 SS3
9배 DCS PU1 PU2 STS CCH MW SPA EPA SOS XXX SCI CSI 세인트 OSC PM APC
도끼 NBSP ¡ ¢ £ [a] ¥ ¦ § Ё © [b] « ¬ 부끄럽다 ® ¯
Bx ° ± ² ³ ´ µ · ё ¹ º » ¼ ½ ¾ ¿
ISO-8859-1과 일치하는 Windows-1251과 다름
Windows-1251 및 ISO-8859-1과의 차이점
  1. ^ ISO-8859-15와 일치(Windows-1251과는 다른 위치)
  2. ^ Windows-1251에 존재하지만 다른 위치에 있음(ISO-8859-1/15에는 없음)

레퍼런스

  1. ^ "Historical trends in the usage of character encodings, March 2022". Retrieved 2022-03-16.
  2. ^ "Frequently Asked Questions".
  3. ^ "Distribution of Character Encodings among websites that use .ru". w3techs.com. Retrieved 2022-03-30.
  4. ^ "Distribution of Character Encodings among websites that use Russian". w3techs.com. Retrieved 2021-10-07.
  5. ^ "Distribution of Character Encodings among websites that use Russian Federation". w3techs.com. Retrieved 2021-11-05.
  6. ^ "cp1251(7) - Linux manual page". man7.org. Retrieved 2018-07-01.
  7. ^ "Code page 1251 information document". Archived from the original on 2016-03-03.
  8. ^ "CCSID 1251 information document". Archived from the original on 2014-11-29.
  9. ^ "CCSID 5347 information document". Archived from the original on 2014-11-29.
  10. ^ Code Page CPGID 01251 (pdf) (PDF), IBM
  11. ^ Code Page CPGID 01251 (txt), IBM
  12. ^ International Components for Unicode (ICU), ibm-1251_P100-1995.ucm, 2002-12-03
  13. ^ International Components for Unicode (ICU), ibm-5347_P100-1998.ucm, 2002-12-03
  14. ^ "Usage Statistics of Character Encodings for Websites". w3techs.com. Archived from the original on 2012-05-30.
  15. ^ Steele, Shawn (1998). CP1251 to Unicode table. Unicode Consortium. CP1251.TXT.
  16. ^ Whistler, Ken (2007). KZ-1048 to Unicode. Unicode Consortium. KZ1048.TXT.
  17. ^ a b Malyshev, Michael (2003). "Amiga-1251 to Unicode table". Registration of new charset [Amiga-1251]. IANA.
  18. ^ "Character Sets". IANA.

추가 정보

  • Kornai, Andras; Birnbaum, David J.; da Cruz, Frank; Davis, Bur; Fowler, George; Paine, Richard B.; Paperno, Slava; Simonsen, Keld J.; Thobe, Glenn E.; Vulis, Dimitri; van Wingen, Johan W. (1993-03-13). "CYRILLIC ENCODING FAQ Version 1.3". Retrieved 2020-06-24.

외부 링크