ISO/IEC 8859-5
ISO/IEC 8859-5에일리어스 | ISO-IR-144, 키릴 문자, CSISOLatin[1] 키릴 문자 |
---|---|
언어 | 러시아어, 불가리아어, 벨라루스어, 마케도니아어, 세르비아어, 우크라이나어(일부) |
표준. | ISO/IEC 8859-5, ECMA-113(1988년판 이후) |
분류 | 확장 ASCII, ISO 8859 |
확장 | US-ASCII, ISO-IR-153 |
에 기반을 둔 | 메인 코드 페이지[2] |
내선번호 | IBM-915 |
선행 | ECMA-113:1986(ISO-IR-111) |
기타 관련 부호화 | IBM-1124 |
ISO/IEC 8859-5:1999, 정보 테크놀로지 - 8비트 싱글 바이트 코드 그래픽 문자 세트 - Part 5: 라틴/키릴 문자 - 는 ASCII 기반의 표준 문자 인코딩 ISO/IEC 8859 시리즈의 일부이며, 1988년에 초판되었습니다.그것은 비공식적으로 라틴어/키릴어라고 불린다.불가리아어, 벨라루스어, 러시아어, 세르비아어, 마케도니아어와 같은 키릴 문자를 사용하는 언어를 포함하도록 설계되었지만 널리 사용되지 않았다.1933년부터 1990년까지 소련 내 우크라이나어에도 사용 가능했지만, 우크라이나어 철자 ge에 필요한 우크라이나 문자 ge, ,가 누락되어 있다.그 결과 IBM은 코드 페이지 1124를 만들었습니다.
ISO-8859-5는 ISO/IEC 6429의 C0 및 C1 제어 코드로 보완되는 경우 이 표준의 IANA 우선 문자 집합 이름입니다.
8비트 인코딩 KOI8-R 및 KOI8-U, CP866 및 Windows-1251이 훨씬 일반적으로 사용됩니다.Windows-1252 및 ISO 8859-1과 달리 Windows-1251은 ISO 8859-5와 밀접한 관계가 없습니다.ISO-8859-5의 Windows 코드 페이지는 코드 페이지 28595 a.k.a 입니다.Windows-28595.[3]
유니코드 기본 키릴 블록은 ISO-8859-5에 기반한 레이아웃을 사용합니다.
코드 페이지 레이아웃
ISO 8859-1과의 차이는 유니코드 등가 코드 포인트로 표시됩니다.
ISO/IEC 8859-5 | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
0x | ||||||||||||||||
1배 | ||||||||||||||||
2배 | SP | ! | " | # | $ | % | & | ' | ( | ) | * | + | , | - | . | / |
3배 | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | : | ; | < > | = | > | ? |
4배 | @ | A | B | C | D | E | F | G | H | I | J | K | L | M | N | O |
5배 | P | Q | R | S | T | U | V | W | X | Y | Z | [ | \ | ] | ^ | _ |
6배 | ` | a | b | c | d | e | f | g | h | i | j | k | l | m | n | o |
7배 | p | q | r | s | t | u | v | w | x | y | z | { | } | ~ | ||
8배 | ||||||||||||||||
9배 | ||||||||||||||||
도끼 | NBSP | Ё 0401 | Ђ 0402 | Ѓ 0403 | Є 0404 | Ѕ 0405 | І 0406 | Ї 0407 | Ј 0408 | Љ 0409 | Њ 040A | Ћ 040B | Ќ 040C | 부끄럽다 | Ў 040E | Џ 040F |
Bx | А 0410 | Б 0411 | В 0412 | Г 0413 | Д 0414 | Е 0415 | Ж 0416 | З 0417 | И 0418 | Й 0419 | К 041A | Л 041B | М 041C | Н 041D | О 041E | П 041F |
Cx | Р 0420 | С 0421 | Т 0422 | У 0423 | Ф 0424 | Х 0425 | Ц 0426 | Ч 0427 | Ш 0428 | Щ 0429 | Ъ 042A | Ы 042B | Ь 042C | Э 042D | Ю 042E | Я 042F |
Dx | а 0430 | б 0431 | в 0432 | г 0433 | д 0434 | е 0435 | ж 0436 | з 0437 | и 0438 | й 0439 | к 043A | л 043B | м 043C | н 043D | о 043E | п 043F |
예 | р 0440 | с 0441 | т 0442 | у 0443 | ф 0444 | х 0445 | ц 0446 | ч 0447 | ш 0448 | щ 0449 | ъ 044A | ы 044B | ь 044C | э 044D | ю 044E | я 044F |
Fx | № 2116 | ё 0451 | ђ 0452 | ѓ 0453 | є 0454 | ѕ 0455 | і 0456 | ї 0457 | ј 0458 | љ 0459 | њ 045A | ћ 045B | ќ 045C | § 00A7 | ў 045E | џ 045F |
ECMA-113 규격은 제2판부터 ISO-8859-5와 동등하며, 초판([4]ISO-IR-111)은 가능한 한 ASCII 로마자 표기법과 동일한 방식으로 러시아어 문자를 배치하는 이전 KOI-8(GOST 19768-74)의 확장판입니다.ISO-8859-5의 초기 초안(DIS-8859-5:1987)은 ISO-IR-111을 따랐으나, 1987년 GOST 19768-74가 새로운 ISO-IR-153으로 대체된[5] 후 수정되었으며[4], 러시아 문자를 알파벳 순으로 정렬하였다(except [5][6]제외).ISO-IR-153에는 ё를 포함한 러시아어 문자와 공백이 없는 소프트 하이픈이 포함되어 있으며 ISO-8859-5의 완전한 키릴 문자 세트는 ISO-IR-144라고도 불립니다.[7]
아마도 이 혼란의 결과로, RFC 1345는 ISO-8859-5의 레터 순서와 케이스 순서를 ISO-IR-111의 행 순서와 조합한 다른 코드 페이지를 「ISO-IR-111」[8][2]이라고 잘못 표시하고 있습니다(결과적으로는 실제로는 어느 쪽에도 대응하지 않지만, Windows-1251과 부분적으로[2] 호환성이 있습니다).
IBM Code 915 페이지는 ISO/IEC 8859-5의 확장판으로, C1 영역에 일부 반문자 및 기타 기호를 추가합니다.IBM Code 1124 페이지는 대부분 ISO-8859-5와 동일하지만 우크라이나에서는 with를 for로 대체합니다.
ISO-IR-200, "우랄어 보조 키릴어 집합"[9]은 1998년 [10]Everson Gunn Teoranta에 의해 등록되었으며(2001년 Evertype이 설립되기 전에 Michael Everson이 이사였으며) 러시아어가 아닌 문자를 몇 개 변경하여 Kildin Sami, Komiets, 지원 언어를 지원한다.Michael Everson은 또한 Mac OS에서 동일한 언어로 Mac OS Barents Cyrillic을 발표했습니다.
ISO-IR[9] 200 (ISO-8859-5와의 차이점) | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
도끼 | NBSP | Ё | Ӈ 04C7 | Ӓ 04D2 | Ӭ 04EC | Ҍ 048C | І | Ӧ 04E6 | Ҋ 048A | Ӆ 04C5 | Ӊ 04C9 | « 00AB | Ӎ 04CD | 부끄럽다 | Ҏ 048E | ʼ 02BC |
Fx | № | ё | ӈ 04C8 | ӓ 04D3 | ӭ 04ED | ҍ 048D | і | ӧ 04E7 | ҋ 048B | ӆ 04C6 | ӊ 04CA | » 00BB | ӎ 04CE | § | ҏ 048F | ˮ 02EE |
ISO-IR-201 "볼가어 보조 키릴어 집합"[11]은 러시아의 명목 공화국에서 사용되는 추바시어, 코미어, 마리어, 우드무르트어를 지원하기 위해 에버슨 군 테오란타에 의해 유사하게 도입되었다.
ISO-IR[11] 201(ISO-8859-5와의 차이점) | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
도끼 | NBSP | Ё | Ӑ 04D0 | Ӓ 04D2 | Ӗ 04D6 | Ҫ 04AA | І | Ӧ 04E6 | Ӥ 04E4 | Ӝ 04DC | Ҥ 04A4 | Ӹ 04F8 | Ӟ 04DE | 부끄럽다 | Ӱ 04F0 | Ӵ 04F4 |
Fx | № | ё | ӑ 04D1 | ӓ 04D3 | ӗ 04D7 | ҫ 04 AB | і | ӧ 04E7 | ӥ 04E5 | ӝ 04DD | ҥ 04A5 | ӹ 04F9 | ӟ 04DF | § | ӱ 04F1 | ӵ 04F5 |
레퍼런스
- ^ 를 클릭합니다Character Sets, Internet Assigned Numbers Authority (IANA), 2018-12-12.
- ^ a b c Nechayev, Valentin (2013) [2001]. "Review of 8-bit Cyrillic encodings universe". Archived from the original on 2016-12-05. Retrieved 2016-12-05.
- ^ 코드 페이지 식별자.
- ^ a b ECMA-113. 8비트 싱글바이트 부호화 그래픽 문자 세트 - 라틴/키릴 문자 (제2판, 1988년 6월)
- ^ a b Czyborra, Roman (1998-11-30) [1998-05-25]. "The Cyrillic Charset Soup". Archived from the original on 2016-12-03. Retrieved 2016-12-03.
- ^ http://czyborra.com/charsets/gost19768-87.txt.gz
- ^ "ISO-IR-144" (PDF). 1 May 1988.
- ^ Sokolov, Michael (2003-04-05). "ECMA-cyrillic alias iso-ir-111 sore". IETF Charsets Mailing List.
- ^ a b "ISO-IR 200: Uralic Supplementary Cyrillic Set" (PDF).
- ^ Gunn, Marion; Everson, Michael (2001-09-20). "Everson Gunn Teoranta (EGT) & Everson Typography". Unicode Mail List Archive. Unicode Consortium.
- ^ a b "ISO-IR 201: Volgaic Supplementary Cyrillic Set" (PDF).
외부 링크
- ISO/IEC 8859-5:1999
- 표준 ECMA-113: 8비트 싱글 바이트 코드 그래픽스 문자 세트 - 라틴/키릴 알파벳 제3판 (1999년 12월)
- ISO-IR 144 키릴 문자 부분 (1988년 5월 1일, ISO 8859-5 2차 버전에서)