ISO/IEC 8859-5

ISO/IEC 8859-5
ISO-8859-5
에일리어스ISO-IR-144, 키릴 문자, CSISOLatin[1] 키릴 문자
언어러시아어, 불가리아어, 벨라루스어, 마케도니아어, 세르비아어, 우크라이나어(일부)
표준.ISO/IEC 8859-5,
ECMA-113(1988년판 이후)
분류확장 ASCII, ISO 8859
확장US-ASCII, ISO-IR-153
에 기반을 둔메인 코드 페이지[2]
내선번호IBM-915
선행ECMA-113:1986(ISO-IR-111)
기타 관련 부호화IBM-1124

ISO/IEC 8859-5:1999, 정보 테크놀로지 - 8비트 싱글 바이트 코드 그래픽 문자 세트 - Part 5: 라틴/키릴 문자 - 는 ASCII 기반의 표준 문자 인코딩 ISO/IEC 8859 시리즈의 일부이며, 1988년에 초판되었습니다.그것은 비공식적으로 라틴어/키릴어라고 불린다.불가리아어, 벨라루스어, 러시아어, 세르비아어, 마케도니아어같은 키릴 문자를 사용하는 언어를 포함하도록 설계되었지만 널리 사용되지 않았다.1933년부터 1990년까지 소련우크라이나어에도 사용 가능했지만, 우크라이나어 철자 ge에 필요한 우크라이나 문자 ge, ,가 누락되어 있다.그 결과 IBM은 코드 페이지 1124를 만들었습니다.

ISO-8859-5는 ISO/IEC 6429C0C1 제어 코드로 보완되는 경우 이 표준의 IANA 우선 문자 집합 이름입니다.

8비트 인코딩 KOI8-RKOI8-U, CP866Windows-1251이 훨씬 일반적으로 사용됩니다.Windows-1252ISO 8859-1과 달리 Windows-1251은 ISO 8859-5와 밀접한 관계가 없습니다.ISO-8859-5의 Windows 코드 페이지는 코드 페이지 28595 a.k.a 입니다.Windows-28595.[3]

유니코드 기본 키릴 블록은 ISO-8859-5에 기반한 레이아웃을 사용합니다.

코드 페이지 레이아웃

ISO 8859-1과의 차이는 유니코드 등가 코드 포인트로 표시됩니다.

ISO/IEC 8859-5
0 1 2 3 4 5 6 7 8 9 A B C D E F
0x
1배
2배 SP ! " # $ % & ' ( ) * + , - . /
3배 0 1 2 3 4 5 6 7 8 9 : ; < > = > ?
4배 @ A B C D E F G H I J K L M N O
5배 P Q R S T U V W X Y Z [ \ ] ^ _
6배 ` a b c d e f g h i j k l m n o
7배 p q r s t u v w x y z { } ~
8배
9배
도끼 NBSP Ё
0401
Ђ
0402
Ѓ
0403
Є
0404
Ѕ
0405
І
0406
Ї
0407
Ј
0408
Љ
0409
Њ
040A
Ћ
040B
Ќ
040C
부끄럽다 Ў
040E
Џ
040F
Bx А
0410
Б
0411
В
0412
Г
0413
Д
0414
Е
0415
Ж
0416
З
0417
И
0418
Й
0419
К
041A
Л
041B
М
041C
Н
041D
О
041E
П
041F
Cx Р
0420
С
0421
Т
0422
У
0423
Ф
0424
Х
0425
Ц
0426
Ч
0427
Ш
0428
Щ
0429
Ъ
042A
Ы
042B
Ь
042C
Э
042D
Ю
042E
Я
042F
Dx а
0430
б
0431
в
0432
г
0433
д
0434
е
0435
ж
0436
з
0437
и
0438
й
0439
к
043A
л
043B
м
043C
н
043D
о
043E
п
043F
р
0440
с
0441
т
0442
у
0443
ф
0444
х
0445
ц
0446
ч
0447
ш
0448
щ
0449
ъ
044A
ы
044B
ь
044C
э
044D
ю
044E
я
044F
Fx
2116
ё
0451
ђ
0452
ѓ
0453
є
0454
ѕ
0455
і
0456
ї
0457
ј
0458
љ
0459
њ
045A
ћ
045B
ќ
045C
§
00A7
ў
045E
џ
045F

이력 및 관련 코드 페이지

ECMA-113 규격은 제2판부터 ISO-8859-5와 동등하며, 초판([4]ISO-IR-111)은 가능한 한 ASCII 로마자 표기법과 동일한 방식으로 러시아어 문자를 배치하는 이전 KOI-8(GOST 19768-74)의 확장판입니다.ISO-8859-5의 초기 초안(DIS-8859-5:1987)은 ISO-IR-111을 따랐으나, 1987년 GOST 19768-74가 새로운 ISO-IR-153으로 대체된[5] 후 수정되었으며[4], 러시아 문자를 알파벳 순으로 정렬하였다(except [5][6]제외).ISO-IR-153에는 ё를 포함한 러시아어 문자와 공백이 없는 소프트 하이픈이 포함되어 있으며 ISO-8859-5의 완전한 키릴 문자 세트는 ISO-IR-144라고도 불립니다.[7]

아마도 이 혼란의 결과로, RFC 1345는 ISO-8859-5의 레터 순서와 케이스 순서를 ISO-IR-111의 행 순서와 조합한 다른 코드 페이지를 「ISO-IR-111」[8][2]이라고 잘못 표시하고 있습니다(결과적으로는 실제로는 어느 쪽에도 대응하지 않지만, Windows-1251과 부분적으로[2] 호환성이 있습니다).

IBM Code 915 페이지는 ISO/IEC 8859-5의 확장판으로, C1 영역에 일부 반문자 및 기타 기호를 추가합니다.IBM Code 1124 페이지는 대부분 ISO-8859-5와 동일하지만 우크라이나에서는 with를 for로 대체합니다.

ISO-IR-200, "우랄어 보조 키릴어 집합"[9]은 1998년 [10]Everson Gunn Teoranta에 의해 등록되었으며(2001년 Evertype이 설립되기 전에 Michael Everson이 이사였으며) 러시아어가 아닌 문자를 몇 개 변경하여 Kildin Sami, Komiets, 지원 언어를 지원한다.Michael Everson은 또한 Mac OS에서 동일한 언어로 Mac OS Barents Cyrillic을 발표했습니다.

ISO-IR[9] 200 (ISO-8859-5와의 차이점)
0 1 2 3 4 5 6 7 8 9 A B C D E F
도끼 NBSP Ё Ӈ
04C7
Ӓ
04D2
Ӭ
04EC
Ҍ
048C
І Ӧ
04E6
Ҋ
048A
Ӆ
04C5
Ӊ
04C9
«
00AB
Ӎ
04CD
부끄럽다 Ҏ
048E
ʼ
02BC
Fx ё ӈ
04C8
ӓ
04D3
ӭ
04ED
ҍ
048D
і ӧ
04E7
ҋ
048B
ӆ
04C6
ӊ
04CA
»
00BB
ӎ
04CE
§ ҏ
048F
ˮ
02EE

ISO-IR-201 "볼가어 보조 키릴어 집합"[11]은 러시아의 명목 공화국에서 사용되는 추바시어, 코미어, 마리어, 우드무르트어를 지원하기 위해 에버슨 군 테오란타에 의해 유사하게 도입되었다.

ISO-IR[11] 201(ISO-8859-5와의 차이점)
0 1 2 3 4 5 6 7 8 9 A B C D E F
도끼 NBSP Ё Ӑ
04D0
Ӓ
04D2
Ӗ
04D6
Ҫ
04AA
І Ӧ
04E6
Ӥ
04E4
Ӝ
04DC
Ҥ
04A4
Ӹ
04F8
Ӟ
04DE
부끄럽다 Ӱ
04F0
Ӵ
04F4
Fx ё ӑ
04D1
ӓ
04D3
ӗ
04D7
ҫ
04 AB
і ӧ
04E7
ӥ
04E5
ӝ
04DD
ҥ
04A5
ӹ
04F9
ӟ
04DF
§ ӱ
04F1
ӵ
04F5

레퍼런스

  1. ^ 를 클릭합니다Character Sets, Internet Assigned Numbers Authority (IANA), 2018-12-12.
  2. ^ a b c Nechayev, Valentin (2013) [2001]. "Review of 8-bit Cyrillic encodings universe". Archived from the original on 2016-12-05. Retrieved 2016-12-05.
  3. ^ 코드 페이지 식별자.
  4. ^ a b ECMA-113. 8비트 싱글바이트 부호화 그래픽 문자 세트 - 라틴/키릴 문자 (제2판, 1988년 6월)
  5. ^ a b Czyborra, Roman (1998-11-30) [1998-05-25]. "The Cyrillic Charset Soup". Archived from the original on 2016-12-03. Retrieved 2016-12-03.
  6. ^ http://czyborra.com/charsets/gost19768-87.txt.gz
  7. ^ "ISO-IR-144" (PDF). 1 May 1988.
  8. ^ Sokolov, Michael (2003-04-05). "ECMA-cyrillic alias iso-ir-111 sore". IETF Charsets Mailing List.
  9. ^ a b "ISO-IR 200: Uralic Supplementary Cyrillic Set" (PDF).
  10. ^ Gunn, Marion; Everson, Michael (2001-09-20). "Everson Gunn Teoranta (EGT) & Everson Typography". Unicode Mail List Archive. Unicode Consortium.
  11. ^ a b "ISO-IR 201: Volgaic Supplementary Cyrillic Set" (PDF).

외부 링크

  • ISO/IEC 8859-5:1999
  • 표준 ECMA-113: 8비트 싱글 바이트 코드 그래픽스 문자 세트 - 라틴/키릴 알파벳 제3판 (1999년 12월)
  • ISO-IR 144 키릴 문자 부분 (1988년 5월 1일, ISO 8859-5 2차 버전에서)