Windows-1251
Windows-1251MIME / IANA | 윈도-1251 |
---|---|
에일리어스 | cp1251 (코드페이지 1251) |
언어 | 러시아어, 우크라이나어, 벨라루스어, 불가리아어, 세르비아어 키릴어, 보스니아어, 마케도니아어, 루신어, 영어 |
작성자 | 마이크로소프트 |
표준. | WHATWG 부호화 표준 |
분류 | 확장 ASCII, Windows-125x |
기타 관련 부호화 | 아미가-1251, KZ-1048, RFC 1345의 "EMA-키릴어" |
Windows-1251은 8비트 문자 인코딩으로 러시아어, 우크라이나어, 벨라루스어, 불가리아어, 세르비아어 키릴어, 마케도니아어 및 기타 언어 등 키릴 문자를 사용하는 언어를 지원하도록 설계되었습니다.
세계에서 두 번째로 많이 사용되는 단일 바이트 문자 인코딩이며 키릴 문자를 지원하는 문자 인코딩 중 가장 많이 사용됩니다.2022년 3월[update] 현재 전체 웹사이트의 0.5%가 Windows-1251을 [1][2]사용하고 있습니다.그러나 UTF-8에 이어 두 번째로 인기 있는 러시아어(.ru) 웹사이트의 [3][4][5]7.8%에서 사용되고 있습니다.Linux에서는 이 인코딩은 cp1251로 [6]알려져 있습니다.IBM은 코드 페이지 [7][8][9][10][11][12][13]1251(CCSID 1251 및 Euro Sign 확장 CCSID 5347)을 Windows-1251에 사용합니다.
Windows-1251 및 KOI8-R(또는 우크라이나어 버전 KOI8-U)은 ISO 8859-5('웹 사이트의 0.1% 미만'[14]에서 사용)보다 훨씬 일반적으로 사용됩니다.Windows-1252 및 ISO 8859-1과 달리 Windows-1251은 ISO 8859-5와 밀접한 관계가 없습니다.
Unicode는 Windows-1251 또는 기타 키릴 문자 인코딩보다 선호됩니다.UTF-8은 웹 페이지의 주요 인코딩입니다.(Unicode의 완전한 커버리지, 오래된 키릴 문자를 포함한 436개의 키릴 문자/코드 포인트, Windows-1251과 같은 단일 바이트 문자 인코딩 방법에 대해 더 자세히 설명합니다.및 KOI8-R은 제공할 수 없습니다.유니코드 키릴 문자를 참조해 주세요.)
문자 집합
다음 표에 Windows-1251을 나타냅니다.각 문자는 유니코드 대응 문자 및 Alt 코드와 함께 표시됩니다.
Windows-1251[15] | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
0x | 없음 | SOH | STX | ETX | 전원 | ENQ | ACK | 벨 | BS | HT | LF | VT | FF | CR | 그렇게 | SI |
1배 | DLE | DC1 | DC2 | DC3 | DC4 | NAK | 동기 | ETB | 할 수 있다 | 전자파 | 후보선수 | ESC | FS | GS | RS | 미국 |
2배 | SP | ! | " | # | $ | % | & | ' | ( | ) | * | + | , | - | . | / |
3배 | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | : | ; | < > | = | > | ? |
4배 | @ | A | B | C | D | E | F | G | H | I | J | K | L | M | N | O |
5배 | P | Q | R | S | T | U | V | W | X | Y | Z | [ | \ | ] | ^ | _ |
6배 | ` | a | b | c | d | e | f | g | h | i | j | k | l | m | n | o |
7배 | p | q | r | s | t | u | v | w | x | y | z | { | } | ~ | 델 | |
8배 | Ђ | Ѓ | ‚ | ѓ | „ | … | † | ‡ | € | ‰ | Љ | ‹ | Њ | Ќ | Ћ | Џ |
9배 | ђ | ‘ | ’ | “ | ” | • | – | — | ™ | љ | › | њ | ќ | ћ | џ | |
도끼 | NBSP | Ў | ў | Ј | ¤ | Ґ | ¦ | § | Ё | © | Є | « | ¬ | 부끄럽다 | ® | Ї |
Bx | ° | ± | І | і | ґ | µ | · | ё | № | є | » | ј | Ѕ | ѕ | ї | |
Cx | А | Б | В | Г | Д | Е | Ж | З | И | Й | К | Л | М | Н | О | П |
Dx | Р | С | Т | У | Ф | Х | Ц | Ч | Ш | Щ | Ъ | Ы | Ь | Э | Ю | Я |
예 | а | б | в | г | д | е | ж | з | и | й | к | л | м | н | о | п |
Fx | р | с | т | у | ф | х | ц | ч | ш | щ | ъ | ы | ь | э | ю | я |
카자흐스탄어 변종
변경된 버전의 Windows-1251은 카자흐스탄에서 표준 STRK1048로 표준화되었으며 레이블로 알려져 있습니다.KZ-1048
아래 행에서 다릅니다.
KZ-1048 (STRK1048-2002)[16] | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
8배 | Ђ | Ѓ | ‚ | ѓ | „ | … | † | ‡ | € | ‰ | Љ | ‹ | Њ | Қ | Һ | Џ |
9배 | ђ | ‘ | ’ | “ | ” | • | – | — | ™ | љ | › | њ | қ | һ | џ | |
도끼 | NBSP | Ұ | ұ | Ә | ¤ | Ө | ¦ | § | Ё | © | Ғ | « | ¬ | 부끄럽다 | ® | Ү |
Bx | ° | ± | І | і | ө | µ | · | ё | № | ғ | » | ә | Ң | ң | ү |
아미가 변종
MIME / IANA | 아미가-1251 |
---|---|
에일리어스 | 아미1251 |
언어 | 영어, 러시아어 |
분류 | 확장 ASCII |
에 기반을 둔 | Windows-1251, ISO-8859-1, ISO-8859-15 |
러시아 아미가 OS 시스템은 키릴 문자의 러시아어 서브셋에 Windows-1251과 일치하는 코드 페이지 1251 버전을 사용했지만, 그 외에는 대부분 ISO-8859-1을 따릅니다.이 버전은 Amiga-1251로 [17]알려져 있으며 IANA에 [18]등록되어 있습니다.
아미가-1251[17] | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
8배 | XXX | XXX | BPH | NBH | IND | NEL | SSA | ESA | HTS | HTJ | VTS | PLD | PLU | 리 | SS2 | SS3 |
9배 | DCS | PU1 | PU2 | STS | CCH | MW | SPA | EPA | SOS | XXX | SCI | CSI | 세인트 | OSC | PM | APC |
도끼 | NBSP | ¡ | ¢ | £ | €[a] | ¥ | ¦ | § | Ё | © | №[b] | « | ¬ | 부끄럽다 | ® | ¯ |
Bx | ° | ± | ² | ³ | ´ | µ | · | ё | ¹ | º | » | ¼ | ½ | ¾ | ¿ |
- ^ ISO-8859-15와 일치(Windows-1251과는 다른 위치)
- ^ Windows-1251에 존재하지만 다른 위치에 있음(ISO-8859-1/15에는 없음)
레퍼런스
- ^ "Historical trends in the usage of character encodings, March 2022". Retrieved 2022-03-16.
- ^ "Frequently Asked Questions".
- ^ "Distribution of Character Encodings among websites that use .ru". w3techs.com. Retrieved 2022-03-30.
- ^ "Distribution of Character Encodings among websites that use Russian". w3techs.com. Retrieved 2021-10-07.
- ^ "Distribution of Character Encodings among websites that use Russian Federation". w3techs.com. Retrieved 2021-11-05.
- ^ "cp1251(7) - Linux manual page". man7.org. Retrieved 2018-07-01.
- ^ "Code page 1251 information document". Archived from the original on 2016-03-03.
- ^ "CCSID 1251 information document". Archived from the original on 2014-11-29.
- ^ "CCSID 5347 information document". Archived from the original on 2014-11-29.
- ^ Code Page CPGID 01251 (pdf) (PDF), IBM
- ^ Code Page CPGID 01251 (txt), IBM
- ^ International Components for Unicode (ICU), ibm-1251_P100-1995.ucm, 2002-12-03
- ^ International Components for Unicode (ICU), ibm-5347_P100-1998.ucm, 2002-12-03
- ^ "Usage Statistics of Character Encodings for Websites". w3techs.com. Archived from the original on 2012-05-30.
- ^ Steele, Shawn (1998). CP1251 to Unicode table. Unicode Consortium. CP1251.TXT.
- ^ Whistler, Ken (2007). KZ-1048 to Unicode. Unicode Consortium. KZ1048.TXT.
- ^ a b Malyshev, Michael (2003). "Amiga-1251 to Unicode table". Registration of new charset [Amiga-1251]. IANA.
- ^ "Character Sets". IANA.
추가 정보
- Kornai, Andras; Birnbaum, David J.; da Cruz, Frank; Davis, Bur; Fowler, George; Paine, Richard B.; Paperno, Slava; Simonsen, Keld J.; Thobe, Glenn E.; Vulis, Dimitri; van Wingen, Johan W. (1993-03-13). "CYRILLIC ENCODING FAQ Version 1.3". Retrieved 2020-06-24.
외부 링크
- Windows 1251 레퍼런스 차트
- IANA 문자 집합 이름 등록
- Windows 1251의 Unicode 매핑과 "최적합"
- Universal Cyrillic 디코더. Windows-1251 또는 기타 문자 인코딩이 깨진 경우 읽기 어려운 키릴 문자를 복구하는 데 도움이 될 수 있는 온라인 프로그램입니다.