코드 페이지 866

Code page 866
코드 페이지 866
Octets in conformant CP866 ordered by nibbles.png
MIME / IANAIBM866
에일리어스cp866, 866[1]
언어러시아어, 불가리아어
부분 지원:
우크라이나어,[a] 벨라루스어[b]
표준.WHATWG 부호화 표준
분류OEM 코드 페이지, 확장 ASCII
확장US-ASCII
에 기반을 둔대체 코드 페이지
기타 관련 부호화(아래 참조)

Code page 866 [2](CCSID 866) (CP 866, "DOS Cyrillic Russian")[3]는 러시아의 DOSOS/2에서[4] 키릴 문자[5][6]작성하기 위해 사용되는 코드 페이지입니다.It is based on the "alternative code page" (Russian: Альтернативная кодировка) developed in 1984 in IHNA AS USSR and published in 1986 by a research group at the Academy of Science of the USSR.[7]코드 페이지는 코드 페이지 437의 모든 의사 기호가 유지되고 ("메인 코드 페이지" 또는 코드 페이지 855와 달리) 키릴 문자의 알파벳 순서(비연속적이지만)가 유지되기 때문에 DOS 시대에 널리 사용되었다.처음에 이 인코딩은 러시아어 버전의 MS-DOS 4.01(1990)과 MS-DOS 6.22 이후 모든 언어 버전에서만 사용할 수 있었습니다.

WHATWG Encoding Standard에는 준거 브라우저가 [8]지원해야 하는 HTML5에서 허용되는 문자 인코딩을 지정하는 코드 페이지 866이 [9]포함되어 있습니다.ISO 8859 부품, Mac OS 고유 인코딩, Microsoft Windows 고유 인코딩(Windows-874 또는 Windows-125x) 또는 KOI-8 [9]변종으로 이름이 지정되지 않은 유일한 싱글 바이트 인코딩입니다.새 페이지의 작성자와 새 프로토콜 설계자는 [10]대신 UTF-8을 사용하도록 지시받습니다.

동일하지는 않지만 GOST R 34.303-92에서는[11] 매우 유사한 2개의 인코딩이 KOI-8 N1 및 KOI-8 N2로 표준화되어 있다(원래 KOI-8과 혼동하지 말 것).

문자 집합

각 문자는 대응하는 Unicode 코드 포인트와 함께 표시됩니다.테이블의 후반부(코드 포인트 128~255)만 표시되고 전반부(코드 포인트 0~127)는 코드 페이지 437과 동일합니다.

코드 페이지 866[12][5][3][13][14][15]
0 1 2 3 4 5 6 7 8 9 A B C D E F
8배 А
0410
Б
0411
В
0412
Г
0413
Д
0414
Е
0415
Ж
0416
З
0417
И
0418
Й
0419
К
041A
Л
041B
М
041C
Н
041D
О
041E
П
041F
9배 Р
0420
С
0421
Т
0422
У
0423
Ф
0424
Х
0425
Ц
0426
Ч
0427
Ш
0428
Щ
0429
Ъ
042A
Ы
042B
Ь
042C
Э
042D
Ю
042E
Я
042F
도끼 а
0430
б
0431
в
0432
г
0433
д
0434
е
0435
ж
0436
з
0437
и
0438
й
0439
к
043A
л
043B
м
043C
н
043D
о
043E
п
043F
Bx
2591

2592

2593

2502

2524

2561

2562

2556

2555

2563

2551

2557

255D

255C

255B

2510
Cx
2514

2534

252C

251C

2500

253C

255E

255F

255A

2554

2569

2566

2560

2550

256C

2567
Dx
2568

2564

2565

2559

2558

2552

2553

256B

256A

2518

250도

2588

2584

258C

2590

2580
р
0440
с
0441
т
0442
у
0443
ф
0444
х
0445
ц
0446
ч
0447
ш
0448
щ
0449
ъ
044A
ы
044B
ь
044C
э
044D
ю
044E
я
044F
Fx Ё
0401
ё
0451
Є
0404
є
0454
Ї
0407
ї
0457
Ў
040E
ў
045E
°
00B0

2219
·
00B7

221A

2116
¤
00A4

25A0
NBSP

변종

코드 페이지에는 몇 가지 변형이 있었지만, 그 차이는 대부분 마지막 16개의 코드 포인트(240~255)에서 나타났습니다.

대체 코드 페이지

The original version of the code page by Bryabrin et al. (1986)[7] is called the "Alternative code page" (Russian: Альтернативная кодировка), to distinguish it from the "Main code page" (Russian: Основная кодировка) by the same authors.러시아어와 불가리아어만 지원합니다.코드 F2hex~F7hex(866페이지가 우크라이나어 벨로루시 문자로 변경됨hex) 및 코드hex F8~FB(866페이지가 코드 페이지 437페이지와 일치함)를 제외하면 코드 페이지 866과 거의 동일합니다.다른 행은 다음과 같습니다.

대체 코드[17] 페이지
0 1 2 3 4 5 6 7 8 9 A B C D E F
Fx Ё
0401
ё
0451
🮣
1FBA3
🮢
1FBA2
🮠
1FBA0
🮡
1FBA1

2192

2190

2193

2191
÷
00F7
±
00B1

2116
¤
00A4

25A0
NBSP
나중에 코드 페이지 866에 의해 문자가 변경되었습니다.

수정 코드 페이지 866

코드 포인트 240~255가 코드 페이지 437과 동일한 비공식 변형입니다.단, 보통 240과 241로 [18]되어 있습니다.이 버전은 러시아어와 불가리아어만 지원합니다.다른 행은 다음과 같습니다.

CP 866 변경
0 1 2 3 4 5 6 7 8 9 A B C D E F
Fx Ё
0401
ё
0451

2265

2264

2320

2321
÷
00F7

2248
°
00B0

2219
·
00B7

221A

207F
²
00B2

25A0
NBSP
OEM-US에 대응한 준거 코드 페이지 866과는 다릅니다.

리투아니아어 변종

KBL

KBL 코드 페이지(비공식적으로 [19]코드 페이지 771)[20]는 리투아니아어를 위한 최초의 DOS 문자 인코딩입니다.대부분 코드 페이지 866 및 대체 코드 페이지와 일치하지만 마지막 행과 일부 블록 문자는 ASCII에는 없는 리투아니아 알파벳 문자로 대체됩니다.KOI-7과 마찬가지로 러시아어 [20]δ/ is는 지원되지 않습니다.

수정된 버전인 코드 페이지 773도 존재하며, 키릴 문자를 라트비아어 및 에스토니아어로 대체한다.[20]

KBL(코드 페이지 771)[21][22]
0 1 2 3 4 5 6 7 8 9 A B C D E F
Dx
2568

2564

2565

2559

2558

2552

2553

256B

256A

2518

250도

2588
Ą
0104
ą
0105

010C
č
010D
р
0440
с
0441
т
0442
у
0443
ф
0444
х
0445
ц
0446
ч
0447
ш
0448
щ
0449
ъ
044A
ы
044B
ь
044C
э
044D
ю
044E
я
044F
Fx Ę
0118
ę
0119
Ė
0116
ė
0117
Į
012E
į
012F
š
0160
š
0161
Ų
0172
ų
0173
ū
016A
u
016B
ž
017D

017E

25A0
NBSP
코드 페이지 866 및 대체 코드 페이지와 다릅니다.

LST 1284

코드 페이지 1119 또는 코드 페이지 772로 [19]비공식적으로 알려진 리투아니아 표준 LST 1284:1993은 마지막 줄에 따옴표를 추가하고 혼합된 단일 이중 상자 그리기 문자를 리투아니아 문자로 대체한 것을 제외하고 대부분 "수정된" 코드 페이지 866과 일치한다(850페이지 비교).KBL과 달리 러시아어 ё/ is는 유지됩니다.

LST 1283(코드페이지 774/1118)에 부속되어 있습니다.LST 1284와 같은 장소에서 추가 리투아니아 문자를 부호화하지만, 대신에 코드 페이지 437에 근거하고 있습니다.이후 LST 1590-1(코드 페이지 775)[19]로 대체되었으며, 같은 위치에 이러한 리투아니아 문자를 인코딩하지만 키릴 문자는 포함하지 않고 라트비아어 및 에스토니아어 문자로 [20]대체되었다.

LST 1284:1993(코드 페이지 772/1119)[23][24]
0 1 2 3 4 5 6 7 8 9 A B C D E F
Bx
2591

2592

2593

2502

2524
Ą
0104

010C
Ę
0118
Ė
0116

2563

2551

2557

255D
Į
012E
š
0160

2510
Cx
2514

2534

252C

251C

2500

253C
Ų
0172
ū
016A

255A

2554

2569

2566

2560

2550

256C
ž
017D
Dx ą
0105
č
010D
ę
0119
ė
0117
į
012F
š
0161
ų
0173
u
016B

017E

2518

250도

2588

2584

258C

2590

2580
р
0440
с
0441
т
0442
у
0443
ф
0444
х
0445
ц
0446
ч
0447
ш
0448
щ
0449
ъ
044A
ы
044B
ь
044C
э
044D
ю
044E
я
044F
Fx Ё
0401
ё
0451

2265

2264

201E

201C
÷
00F7

2248
°
00B0

2219
·
00B7

221A

207F
²
00B2

25A0
NBSP
코드 페이지 866과는 다릅니다.

우크라이나어 및 벨라루스어 변종

우크라이나 표준 RST 2018-91은 IBM에 의해 Code page 1125(CCSID 1125)[25]로 지정되며 CP1125로 약칭되며 CP866U, CP866NAV 또는 [26]RUSCII로도 알려져 있습니다.우크라이나 [27]문자로 대체되는 F2에서hex F9를hex 제외한 모든 포인트의 원래 대체 코드 페이지와 일치합니다.코드 페이지/CCSID 1131은[28][29] 글머리 기호(θhex)[30][31]hex F9에서 FE로 치환하는 과정에서 F8hex, F9hexFChexhex 제외한 모든 포인트에 대해 코드 페이지 866과 일치한다.다른 행은 다음과 같습니다.

IBM 코드 페이지 1125(우크라이나 표준 RST 2018-91)[27][32][33][34]
0 1 2 3 4 5 6 7 8 9 A B C D E F
Fx Ё
0401
ё
0451
Ґ
0490
ґ
0491
Є
0404
є
0454
І
0406
і
0456
Ї
0407
ї
0457
÷
00F7
±
00B1

2116
¤
00A4

25A0
NBSP
코드 페이지 1125가 대체 코드 페이지와 다릅니다.
IBM 코드 페이지 1131(벨라루스어)[35][36][37]
0 1 2 3 4 5 6 7 8 9 A B C D E F
Fx Ё
0401
ё
0451
Є
0404
є
0454
Ї
0407
ї
0457
Ў
040E
ў
045E
І
0406
і
0456
·
00B7
¤
00A4
Ґ
0490
ґ
0491

2219
NBSP
코드 페이지 1131은 코드 페이지 866과 다릅니다.

유로 기호 업데이트

IBM 코드 페이지/CCSID 808은 코드 페이지/CCSID 866의 변형으로, 유로 기호(€, U+20AC)가 FD 위치에hex 있어 범용 통화 기호([38][39][40] the)를 대체합니다.

IBM 코드 페이지/CCSID 848은 코드 페이지/CCSID 1125의 변형으로, FD에hex 유로 기호가 붙어 있으며, [41][42][43]replacing를 대체합니다.

IBM 코드 페이지/CCSID 849는 코드 페이지/CCSID 1131의 변형으로, FB에hex 유로 기호가 있어 [44][45][46]¤를 대체합니다.

GOST R 34.303-92

GOST R 34.303-92 표준은 두 가지 변종을 정의합니다.보다 광범위한 바리안트인 KOI-8 N2(다만 KOI-8 인코딩과 혼동하지 않음)는 마지막 행(코드 240~255 또는 F0hex~FFhex)까지 코드 페이지 866 및 대체 코드페이지와 일치합니다.마지막 줄에는 러시아어 외에 벨라루스어우크라이나어 문자를 지원하지만 코드 페이지 866 또는 1125와 관련이 없는 레이아웃으로 되어 있습니다.특히 러시아어 ё/ё(대체 코드 페이지와 코드 페이지 866 사이에 변경되지 않음)도 다른 위치에 있습니다.다른 행은 [11]다음과 같습니다.

KOI-8 N2 (GOST R 34.303-92)
0 1 2 3 4 5 6 7 8 9 A B C D E F
Fx 부끄럽다
2116
Ґ
0490
ґ
0491
Ё
0401
ё
0451
Є
0404
є
0454
І
0406
і
0456
Ї
0407
ї
0457
Ў
040E
ў
045E

25A0
NBSP
코드 페이지 866 및 대체 코드 페이지와 다릅니다.

또 다른 변형인 KOI-8 N1은 러시아어 이외의 키릴 문자와 혼합된 단일/이중 줄 상자 그리기 문자를 생략한 KOI-8 N2의 하위 집합으로, 추가 국제화를 위해 비워 둡니다(코드 페이지 850과 비교).영향을 받는 행을 [11]다음에 나타냅니다.

KOI-8 N1 (GOST R 34.303-92)
0 1 2 3 4 5 6 7 8 9 A B C D E F
Bx
2591

2592

2593

2502

2524

2563

2551

2557

255D

2510
Cx
2514

2534

252C

251C

2500

253C

255A

2554

2569

2566

2560

2550

256C
Dx
2518

250도

2588

2584

258C

2590

2580
р
0440
с
0441
т
0442
у
0443
ф
0444
х
0445
ц
0446
ч
0447
ш
0448
щ
0449
ъ
044A
ы
044B
ь
044C
э
044D
ю
044E
я
044F
Fx 부끄럽다
2116
Ё
0401
ё
0451

25A0
NBSP

레너-체코 수정

Michael Lehner와 Peter R. Checho가 개발한 소프트웨어에 사용되는 비공식 수정입니다.그것은 러시아어에서 일반적으로 사용되는 세 개의 수학 기호와 구간 기호로 대체한다.(Lehner와 체코어는 헝가리어의 CWI-2, 체코어슬로바키아어의 카메니키 기반의 문자 세트, 폴란드어의 마조비아 변종 문자 세트, 리투아니아어의 독특한 부호화 문자 세트 등 다른 유럽 언어에도 많은 대체 문자 세트를 만들었습니다.변경된 행은 다음과 같습니다.

레너-체코 수정
0 1 2 3 4 5 6 7 8 9 A B C D E F
Fx Ё
0401
ё
0451
Є
0404
є
0454
Ї
0407
ї
0457
Ў
040E
ў
045E
»
00BB
«
00AB
·
00B7
§
00A7

2116
¤
00A4

25A0
NBSP
코드 페이지 866과 다름

라트비아어 변종

Star 프린터와 FreeDOS에서 지원되는 라트비아어 버전은 코드 페이지 3012입니다.이 인코딩에는 RusLat이라는 [47]닉네임이 붙습니다.

CP3012
0 1 2 3 4 5 6 7 8 9 A B C D E F
Bx
2591

2592

2593

2502

2524
ā
0100

2562
ņ
0146

2555

2563

2551

2557

255D
O
014C

255B

2510
Cx
2514

2534

252C

251C

2500

253C

0101

255F

255A

2554

2569

2566

2560

2550

256C

2567
Dx š
0160

2564
č
010D

010C

2558

2552
ģ
0123
Ī
012A
ī
012B

2518

250도

2588

2584
u
016B
ū
016A

2580
р
0440
с
0441
т
0442
у
0443
ф
0444
х
0445
ц
0446
ч
0447
ш
0448
щ
0449
ъ
044A
ы
044B
ь
044C
э
044D
ю
044E
я
044F
Fx Ē
0112
ē
0113
Ģ
0122
ķ
0137
Ķ
0136
ļ
013C
Ļ
013B

017E
ž
017D
o
014D
·
00B7

221A
Ņ
0145
š
0161

25A0
NBSP
코드 페이지 866과 다름

FreeDOS

FreeDOS는 다양한 비슬라브 [48]언어용 코드 페이지 866의 비공식 확장을 제공합니다.

코드 페이지 900

1990년 1월 마이크로소프트(MS)의 프란츠 라우(Franz Rau)에 의해 IBM에 러시아어 MS-DOS 4.01의 최종 코드 페이지가 CP866으로 등록되기 전에는 Dialogue의 Yuri Starikov(ik ( ( ( (ююююю)가 개발한 초안 버전은 내부적으로도 900페이지로 불렸다.문서가 제품 출시 전 새로운 이름을 반영하도록 수정되었지만, 1989년 가을에 추가된 우크라이나어와 벨라루스 문자가 없는 코드 페이지 900으로 명명된 이전 초안 버전의 스케치는 [49]1990년에 러시아 언론에 발표되었다.코드 페이지 900은 러시아의 MS-DOS 5.0 LCD 배포판에 삽입되었습니다.CPI 코드 페이지 정보 파일.[50]

메모들

  1. ^ 우크라이나어와 Rusyn 문자 єї를 명확하게 포함하지만, 라틴어 ,와 구별되는 distinct는 없으며, 소련식 맞춤법(예: ґ 생략)을 구현한다.이것들은 일부 수정에 의해 추가됩니다.
  2. ^ 벨라루스어 ў는 고유하게 포함되지만, 라틴어 (과 구별되는 distinct는 없습니다(단, 일부 변경으로 추가됨).

레퍼런스

  1. ^ Character Sets, Internet Assigned Numbers Authority (IANA), 2018-12-12
  2. ^ "CCSID 866 information document". Archived from the original on 2016-03-27.
  3. ^ a b Steele, Shawn (1996-04-24). "CP866.TXT: cp866_DOSCyrillicRussian to Unicode table". Unicode Consortium.
  4. ^ "OS/2" (in Russian). Archived from the original on 2016-08-13. Retrieved 2016-06-19.
  5. ^ a b "Code page 866 information document". Archived from the original on 2016-03-16.
  6. ^ "Code Pages Supported by Windows: OEM Code Pages". Go Global Development Center. Microsoft. Archived from the original on 2011-11-02. Retrieved 2011-10-11.
  7. ^ a b (러시아어) ( 、 、 、 、 、 、 、 、 、 、 、 、 ( ( 。- 4 4. - с. 61 ~ 64 。
  8. ^ "8.2.2.3. Character encodings". HTML 5.1 2nd Edition. W3C. User agents must support the encodings defined in the WHATWG Encoding standard, including, but not limited to […]
  9. ^ a b van Kesteren, Anne. "Legacy single-byte encodings". Encoding Standard. WHATWG.
  10. ^ van Kesteren, Anne. "Names and labels". Encoding Standard. WHATWG.
  11. ^ a b c (러시아어) 34.303-92.8비트 코드 교환용 8비트 부호화 문자 세트= 8비트 부호화 문자 세트.
  12. ^ "OEM 866". Go Global Development Center. Microsoft. Archived from the original on 2012-02-04. Retrieved 2011-10-17.
  13. ^ van Kesteren, Anne (2018-01-06). "Index index-ibm866". Encoding Standard. WHATWG.
  14. ^ Code Page CPGID 00866 (pdf) (PDF), IBM
  15. ^ Code Page CPGID 00866 (txt), IBM
  16. ^ International Components for Unicode (ICU), ibm-866_P100-1995.ucm, 2002-12-03
  17. ^ (러시아어) ( 、 、 、 、 、 、 、 、 、 、 、 、 ( ( 。- 4 4. - с 64
  18. ^ (러시아어) pc ( 、 IBM PC 、 --- 。- 2- - ( 。- м : 1992 . : с 279 。
  19. ^ a b c "Codepages: Comprehensive list". Aivosto.
  20. ^ a b c d "Rašmenų koduotės". Lietuvių kalba informacinėse technologijose (in Lithuanian).
  21. ^ "771 kodų lentelė" (in Lithuanian). Likit.
  22. ^ "771 kodų lentelė". Lietuvių kalba informacinėse technologijose – Rašmenų koduotės (in Lithuanian).
  23. ^ "772 kodų lentelė" (in Lithuanian). Likit.
  24. ^ "772 kodų lentelė". Lietuvių kalba informacinėse technologijose – Rašmenų koduotės (in Lithuanian).
  25. ^ "CCSID 1125 information document". Archived from the original on 2014-12-02.
  26. ^ Nechayev, Valentin (2013) [2001]. "Review of 8-bit Cyrillic encodings universe". Archived from the original on 2016-12-05.
  27. ^ a b Code Page CPGID 01125 (pdf) (PDF), IBM
  28. ^ "CCSID 1131 information document". Archived from the original on 2016-03-27.
  29. ^ "Code page 1131 information document". Archived from the original on 2016-03-17.
  30. ^ IBM. "Code page identifiers: CP 01131". IBM Globalization. Archived from the original on 2016-03-17.
  31. ^ IBM. "Code Page 01131" (PDF). Archived from the original (PDF) on 2015-07-08.
  32. ^ Code Page CPGID 01125 (txt), IBM
  33. ^ International Components for Unicode (ICU), ibm-1125_P100-1997.ucm, 2002-12-03
  34. ^ (우크라이나어) 2018-91.Система обробки інформації.에잇-에잇-에잇-에잇-에잇-에잇-에잇-에잇-에잇-에잇-에잇-에잇-에잇-에잇-에잇-에잇-에잇-에잇-에잇-에잇-에잇-에잇-에잇.
  35. ^ Code Page CPGID 01131 (pdf) (PDF), IBM
  36. ^ Code Page CPGID 01131 (txt), IBM
  37. ^ International Components for Unicode (ICU), ibm-1131_P100-1997.ucm, 2002-12-03
  38. ^ "CCSID 808 information document". Archived from the original on 2014-12-01.
  39. ^ Code Page CPGID 00808 (pdf) (PDF), IBM
  40. ^ Code Page CPGID 00808 (txt), IBM
  41. ^ "CCSID 848 information document". Archived from the original on 2014-12-01.
  42. ^ Code Page CPGID 00848 (pdf) (PDF), IBM
  43. ^ Code Page CPGID 00848 (txt), IBM
  44. ^ "CCSID 849 information document". Archived from the original on 2016-03-26.
  45. ^ Code Page CPGID 00849 (pdf) (PDF), IBM
  46. ^ Code Page CPGID 00849 (txt), IBM
  47. ^ "LC-8021 Dot Matrix Printer, User's Manual" (PDF).
  48. ^ "CPIDOS - CPX files (Code Page Information) Pack v3.0 - DOS codepages". FreeDOS. Archived from the original on 2018-05-12. Retrieved 2018-01-30.
  49. ^ Starikov, Yuri (2005-04-11). "15-летию Russian MS-DOS 4.01 посвящается" [15 Years of Russian MS-DOS 4.01] (in Russian). Archived from the original on 2016-12-04. Retrieved 2014-05-07.
  50. ^ Paul, Matthias R. (2001-06-10) [1995]. "Overview on DOS, OS/2, and Windows codepages" (CODEPAGE.LST file) (1.59 preliminary ed.). Archived from the original on 2016-04-20. Retrieved 2016-08-20.

추가 정보

  • Kornai, Andras; Birnbaum, David J.; da Cruz, Frank; Davis, Bur; Fowler, George; Paine, Richard B.; Paperno, Slava; Simonsen, Keld J.; Thobe, Glenn E.; Vulis, Dimitri; van Wingen, Johan W. (1993-03-13). "CYRILLIC ENCODING FAQ Version 1.3". 1.3. Retrieved 2020-06-04.