KOI 문자 인코딩

KOI(кк)는 키릴 문자의 여러 코드 페이지로 이루어진 패밀리입니다.The name stands for Kod obmena informatsiey (Russian: Код обмена информацией) which means "Code for Information Interchange".

KOI 코드 페이지의 특별한 특징은 맨 왼쪽 비트가 제거되어도 7비트 폭의 문자만 처리할 수 있는 기기 또는 소프트웨어를 실수로 통과해도 텍스트가 사람이 읽을 수 있는 상태로 유지된다는 것입니다.이는 문자가 특수한 순서(라틴 문자 이외의 코드 포인트 128개)에 배치되기 때문입니다.다만, 키릴 문자로 쓰여진 언어에서는 알파벳 순서에 대응하지 않기 때문에, 정렬을 실시하기 위해서 룩업 테이블을 사용할 필요가 있습니다.

이러한 인코딩은 이미 러시아어 모스 부호의 방언과 MTK-2 전신 부호에 사용된 라틴어와 키릴어(거의 음운)의 대응에 기초한 ASCII에서 파생되었습니다.KOI8-R의 а(0xE1)에서 처음 26자는 charact, б, the, the, the, the, the, the, the, the, the, the, the, the, the, the, the, the, the, the, the, the, the, the, the, the, the, the, the, the, the, the, the, the, the, the, the, the, the, the, the, the, the, the,

KOI-7

원래의 KOI 부호화(1967)는 KOI-7(ко-7)이라는 이름의 7비트 코드페이지로 소문자가 포함되지 않았습니다.KOI-7에서는 31 또는 32개의 러시아 문자의 코드가 라틴 문자에 따라 정렬됩니다.기타 코드 포인트는 ASCII와 동일합니다(단, 달러 기호 $(코드 포인트_hex 24)는 범용 통화 기호 ¤로 대체될 수 있습니다).

KOI-8

1974년 GOST 19768에 의해 표준화된 KOI-8(δδ-8)은 ^[1]^[2]ASCII의 8비트 확장입니다.원래는 32개의 소문자와 31개의 대문자 러시아 문자만 포함되었습니다.

이후 KOI-8 유도체는 KOI8, KOI8 및 KOI-8로 다양하게 알려진 인코딩 패밀리를 구성합니다.

가족 구성원은 다음과 같습니다.

KOI8-B ('' 및 '''^[1] 포함)
러시아어 및 불가리아어용 KOI8-R / KOI8-RUSIA(RFC 1489)^[3]
KOI8-U/KOI8-UKRENA(우크라이나어용) (RFC 2319).^[3]
우크라이나어, 벨로루시어 및 러시아어용 KOI8-RU.^[4]^[5]^[6]^[7]^[8]
타지크어용 KOI8-T.^[9]
KOI8-C, 또한 KOI8-CA는 코카서스와 중앙아시아를 위한 제안으로 거의 ^[10]사용되지 않았습니다.
ISO-IR-111 / KOI8-E^[11] (ECMA-113 (제1판, 1986년),^[12] 슬라브어용 다국어)
KOI8-F, KOI-8 통합.KOI8-U 및 KOI8-E로부터의 ^[13]^[14]문자 할당과 KOI8-R로부터의 의사 그래픽의 서브셋이 포함됩니다.
KOI8-K1 "키릴 1" (CSN 36 9103, ST SEV 358-88에서 정의)
옛 러시아어 ^[15]맞춤법용 KOI8-O(구 KOI8-C)

또한 GOST R 34.303-92에서는 ISO-IR-153인 'KOI-8 V1'과 코드 페이지 866의 ^[16]변형인 'KOI-8 N1' 및 'KOI-8 N2'가 정의되어 있습니다.이것들은 KOI-8 레이아웃에 따르지 않습니다.

DKOI

DKOI는 ES EVM 메인프레임에서 사용되는EBCDIC 기반의 부호화입니다GOST 19768-74/ST SEV 358-76, ST SEV 358-88/GOST 19768-93, CSN 36 9103의 ^[17]표준으로 정의되어 있습니다.

두 가지 종류가 있습니다.

DKOI K1(кд),),),),),),),),),1)은 각 키릴 문자에 고유한 코드 포인트를 부여한다.
DKOI K2(к),),),2), 키릴 문자(а, а, е, к, ,, ,, р, р, р, р, р, р, d, d, d, d, d, d, d, d, d, d, d, d, d, d, d, d, d, d, d, d, d, d, d, d, d, d, d, d, d, d, d, d,

라틴어 변종

일부 인코딩은 KOI라고 불리지만 다음과 같이 라틴 문자를 정의합니다.

Comecon이 고안한 체코 및 슬로바키아용 KOI8-CS^[18]/KOI8-CS2^[17](CHSN(체코 기술 표준) 369103)이 인코딩된 라틴어는 체코어와 슬로바키아어에서 사용되는 것과 같이 분음 부호가 사용되었지만, 기본 개념은 동일했다. 즉, 텍스트는 8번째 비트가 지워진 상태에서도 읽을 수 있어야 하기 때문에, 예를 들어 C 등이 되었다.)
KOI8-L2 "Latin-2"(CSN 36 9103에 정의), ISO IR^[19] 139(ISO 8859-2(1987년)와 거의 동일하지만 달러 기호와 통화 기호가 교환됨)
DKOI CS2(CSN 36 9103에서 ^[17]정의)
DKOI L2(CSN 36 9103에서 ^[17]정의)

레퍼런스

^ ^a ^b Czyborra, Roman (1998-11-30) [1998-05-25]. "The Cyrillic Charset Soup". Archived from the original on 2016-12-03. Retrieved 2016-12-03.
^ Flohr, Guido; Chernov, Andrey A. (2016) [2006]. "Locale::RecodeData::KOI_8 - Conversion routines for KOI-8". CPAN libintl-perl. 1.0. Archived from the original on 2017-01-15. Retrieved 2017-01-15.
^ ^a ^b da Cruz, Frank (2010-04-02). "Kermit and MIME Character-Set Names". The Kermit Project. Columbia University, New York, USA. Archived from the original on 2016-12-03. Retrieved 2016-12-02.
^ 유리 뎀첸코.우크라이나 키릴 문자 집합 KOI8-RU(러시아어 KOI8-R 및 ISO-IR-111의 확장자) 등록(인터넷 초안).1997년. (만료)
^ Flohr, Guido (2016) [2006]. "Locale::RecodeData::KOI8_RU - Conversion routines for KOI8-RU". CPAN libintl-perl. Archived from the original on 2017-01-15. Retrieved 2017-01-15.
^ "SBCS code page information - CPGID: 01167 / Name: Belarusian/Ukrainian KOI8-RU". IBM Software: Globalization: Coded character sets and related resources: Code pages by CPGID: Code page identifiers. IBM. C-H 3-3220-050. Archived from the original on 2017-02-18. Retrieved 2017-02-18. [1] [2]
^ "CCSID information document; CCSID 1167; KOI8-RU". IBM. Archived from the original on 2017-02-18. Retrieved 2017-02-18.
^ Leisher, Mark (2008) [1999-12-20]. "KOI8-RU Belorusian/Ukrainian Cyrillic to Unicode 2.1 mapping table". Department of Mathematical Sciences, New Mexico State University. Archived from the original on 2017-02-19. Retrieved 2017-02-18.
^ Flohr, Guido; Davis, Michael (2016) [2006]. "Locale::RecodeData::KOI8_T - Conversion routines for KOI8-T". CPAN libintl-perl. Archived from the original on 2017-01-15. Retrieved 2017-01-15.
^ 논의
^ "IANA Character Sets".
^ ECMA-113. 8비트 싱글바이트 부호화 그래픽 문자 세트 - 라틴/키릴 문자 (제1판, 1986년 6월)
^ "Cyrillic encodings (Charsets). Small description".
^ Leisher, Mark (2008) [1998-03-05]. "KOI8 Unified Cyrillic to Unicode 2.1 mapping table". Department of Mathematical Sciences, New Mexico State University. Archived from the original on 2017-02-19. Retrieved 2017-02-18.
^ Serge Winitzki.확장 키릴 문자 집합 KOI8-C(인터넷 초안).2002년 (만료)
^ (러시아어) 34.303-92.8비트 코드 교환용 8비트 부호화 문자 세트= 8비트 부호화 문자 세트.
^ ^a ^b ^c ^d Petrlik, Lukas (1996-06-19). "The Czech and Slovak Character Encoding Mess Explained". cs-encodings-faq. 1.10. Archived from the original on 2016-06-21. Retrieved 2016-06-21.
^ "Archived copy". Archived from the original on 2011-03-21. Retrieved 2011-04-19.{{cite web}}: CS1 maint: 제목으로 아카이브된 복사(링크)
^ ISO-IR-139

추가 정보

Kornai, Andras; Birnbaum, David J.; da Cruz, Frank; Davis, Bur; Fowler, George; Paine, Richard B.; Paperno, Slava; Simonsen, Keld J.; Thobe, Glenn E.; Vulis, Dimitri; van Wingen, Johan W. (1993-03-13). "CYRILLIC ENCODING FAQ Version 1.3". 1.3. Retrieved 2017-02-18.
"Kodierungen und Zeichensätze" [Encodings and character sets]. Robotron Technik (Virtual computer museum) (in German). 2016-11-29. ASCII-Code / KOI-Code. Retrieved 2017-02-21.

외부 링크

"The Home of the KOI8-R since 1995". 1995. Retrieved 2016-12-05.
Hohlov, Yu. E. "Cyrillic Information Representation in Electronic Form - Character Set (Code Page) Tables". Archived from the original on 2016-12-05. Retrieved 2016-12-05.
Nechayev, Valentin (2013) [2001]. "Review of 8-bit Cyrillic encodings universe". Archived from the original on 2016-12-05. Retrieved 2016-12-05.

[Czyborra_1998_Cyrillic-1] Czyborra, Roman (1998-11-30) [1998-05-25]. "The Cyrillic Charset Soup". Archived from the original on 2016-12-03. Retrieved 2016-12-03.

[Flohr_2016_KOI8-2] Flohr, Guido; Chernov, Andrey A. (2016) [2006]. "Locale::RecodeData::KOI_8 - Conversion routines for KOI-8". CPAN libintl-perl. 1.0. Archived from the original on 2017-01-15. Retrieved 2017-01-15.

[Cruz_2010_Kermit-3] Cruz, Frank (2010-04-02). "Kermit and MIME Character-Set Names". The Kermit Project. Columbia University, New York, USA. Archived from the original on 2016-12-03. Retrieved 2016-12-02.

[4] 유리 뎀첸코.우크라이나 키릴 문자 집합 KOI8-RU(러시아어 KOI8-R 및 ISO-IR-111의 확장자) 등록(인터넷 초안).1997년. (만료)

[Flohr_2016_KOI8-RU-5] Flohr, Guido (2016) [2006]. "Locale::RecodeData::KOI8_RU - Conversion routines for KOI8-RU". CPAN libintl-perl. Archived from the original on 2017-01-15. Retrieved 2017-01-15.

[IBM_1167-6] "SBCS code page information - CPGID: 01167 / Name: Belarusian/Ukrainian KOI8-RU". IBM Software: Globalization: Coded character sets and related resources: Code pages by CPGID: Code page identifiers. IBM. C-H 3-3220-050. Archived from the original on 2017-02-18. Retrieved 2017-02-18. [1] [2]

[IBM_1167_2-7] "CCSID information document; CCSID 1167; KOI8-RU". IBM. Archived from the original on 2017-02-18. Retrieved 2017-02-18.

[Leisher_1998_KOI8-RU-8] Leisher, Mark (2008) [1999-12-20]. "KOI8-RU Belorusian/Ukrainian Cyrillic to Unicode 2.1 mapping table". Department of Mathematical Sciences, New Mexico State University. Archived from the original on 2017-02-19. Retrieved 2017-02-18.

[Flohr_2016_KOI8-T-9] Flohr, Guido; Davis, Michael (2016) [2006]. "Locale::RecodeData::KOI8_T - Conversion routines for KOI8-T". CPAN libintl-perl. Archived from the original on 2017-01-15. Retrieved 2017-01-15.

[10] 논의

[IANA_Character_Sets-11] "IANA Character Sets".

[12] ECMA-113. 8비트 싱글바이트 부호화 그래픽 문자 세트 - 라틴/키릴 문자 (제1판, 1986년 6월)

[Segfault-13] "Cyrillic encodings (Charsets). Small description".

[Leisher_1998_KOI8-UNI-14] Leisher, Mark (2008) [1998-03-05]. "KOI8 Unified Cyrillic to Unicode 2.1 mapping table". Department of Mathematical Sciences, New Mexico State University. Archived from the original on 2017-02-19. Retrieved 2017-02-18.

[15] Serge Winitzki.확장 키릴 문자 집합 KOI8-C(인터넷 초안).2002년 (만료)

[gost_r_34.303-92-16] (러시아어) 34.303-92.8비트 코드 교환용 8비트 부호화 문자 세트= 8비트 부호화 문자 세트.

[Petrlik_1996_CZ-Encodings-17] Petrlik, Lukas (1996-06-19). "The Czech and Slovak Character Encoding Mess Explained". cs-encodings-faq. 1.10. Archived from the original on 2016-06-21. Retrieved 2016-06-21.

[r1234-18] "Archived copy". Archived from the original on 2011-03-21. Retrieved 2011-04-19.{{cite web}}: CS1 maint: 제목으로 아카이브된 복사(링크)

[19] ISO-IR-139

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]

[15]

[16]

[17]

[18]

[19]

v t 문자 부호화
초기 통신	전신코드 바늘 모스 라틴어 이외의 와분/가나 중국인 키릴 문자 한국인입니다 보도와 머레이 Fieldata ASCII ISO/IEC 646 BCDIC 텔레텍스 및 비디오텍스/텔레텍스트 T.51/ISO/IEC 6937 ITU T.61 ITU T.101 월드 시스템 텔레텍스트 배경 놓다 트랜스코드
ISO/IEC 8859	승인된 부품 - 1 (서유럽) - 2 (중앙유럽) - 3 (말티즈/에스페란토) - 4 (북유럽) -5(키릴 문자) -6 (아랍어) -7(그리스어) -8 (헤브루) -9(터키어) -10 (노르딕) -11(태국) - 13 (발트어) -14 (셀틱) - 15 (신서유럽) -16(로마) 폐기 부품 - 12 (데바나가리) 제안되었지만 승인되지 않음 KOI-8 키릴 문자 사미 적응 웨일스어 바렌츠 키릴 문자 에스토니아어 우크라이나어 키릴 문자
서지학적 용도	MARC-8 앤젤 CCCI/EACC ISO 5426 5426-2 5427 5428 6438 6862
국가 표준	암SCII 브라스키 CNS 11643 DIN 66003 ELOT 927 GOST 10859 GB 2312 GB 12345 GB 12052 GB 18030 HKSCS ISCII JIS X 0201 JIS X 0208 JIS X 0212 JIS X 0213 KOI-7 KPS 9566 KS X 1001 KS X 1002 LST 1564 LST 1590-4 패스 시프트 JIS SI 960 TIS-620 TSCII 가시 SCSII YUSCII
ISO/IEC 2022	ISO/IEC 8859 ISO/IEC 10367 확장 UNIX 코드 / EUC
Mac OS 코드 페이지 ("구체")	아르메니아어 아랍어 바렌츠 키릴 문자 켈트족 중앙유럽어 크로아티아어 키릴 문자 데바나가리 Farsi(페르시아어) 글꼴 X(커밋) 게일어 그루지야어 그리스어 구자라티 구르무키 히브리어 아이슬란드 이누이트 키보드 라틴어(Kermit) 몰타/에스페란토 오감 로마인 루마니아어 사미 터키어 투르크어 키릴 문자 우크라이나어 VT100
DOS 코드 페이지	437 668 708 720 737 770 773 775 776 777 778 850 851 852 853 855 856 857 858 859 860 861 862 863 864 865 866 867 868 869 897 899 903 904 932 936 942 949 950 951 1040 1042 1043 1046 1098 1115 1116 1117 1118 1127 3846 아비콤프 CS 인디케이터 CSX 표시기 CSX+ 표시기 CWI-2 이란 시스템 카메니쿠 마조비아 마이크
IBM AIX 코드 페이지	895 896 912 915 921 922 1006 1008 1009 1010 1012 1013 1014 1015 1016 1017 1018 1019 1124 1133
Windows 코드 페이지	CER-GS 932 936 (GBK) 950 1169 확장 Latin-8 1250 1251 1252 1253 1254 1255 1256 1257 1258 1270 키릴어 + 핀란드어 키릴어 + 프랑스어 키릴어 + 독일어 폴리톤 그리스어
EBCDIC 코드 페이지	37 EBCD의 일본어IC DKOI
DEC 단자(VTX)	다국어(MCS) National Replacement(NRCS) 프랑스계 캐나다인 스위스인 스페인어 영국 네덜란드어 핀란드어 프랑스어 노르웨이어 및 덴마크어 스웨덴어 노르웨이어 및 덴마크어(대체) 8비트 그리스어 8 비트 터키어 SI 960 히브리어 특수 그래픽스 테크니컬(TCS)
플랫폼 고유의	1057 도토리 Adobe Standard(Adobe Standard) 어도비 라틴어 1 암스트라드 CPC 애플 II ATASCII 아타리 ST BIOS Casio 계산기 CDC 콤푸콜라 II CP/M+ DEC 기수 50 DEC MCS/NRCS DG 인터내셔널 Fieldata 보석. GSM 03.38 HP 로마자 HP 포커셜 HP RPL 스퀴즈 LICS LMBCS MSX NEC APC 다음 분. 펫스키 세가 SC-3000 날카로운 계산기 샤프 MZ 싱클레어 QL 기호. 텔레텍스트 TI 계산기 TRS-80 Ventura International WISCII XCCS ZX80 ZX81 ZX 스펙트럼
Unicode/ISO/IEC 10646	UTF-1 UTF-7 UTF-8 UTF-16 UTF-32 UTF-EBCDIC GB 18030 BOCU-1 CESU-8 SCSU TACE16 Unicode 인코딩 비교
TeX 조판 시스템	코르크 마개 LY1 OML OMS OT1
기타 코드 페이지	아비콤프 ASMO 449 빅5 APL 기호의 디지털 부호화 ISO-IR-68 ARIB STD-B24 HZ IEC-P27-1 INIS 7비트 8비트 ISO-IR-169 ISO 2033 KOI KOI8-R KOI8-RU KOI8-U 모지쿄 바다 스탠포드/그것의. 트론 통일 한글 코드
제어 문자	모스 프로시그 C0 및 C1 제어 코드 ISO/IEC 6429 JIS X 0211 유니코드 제어, 형식 및 구분 문자 공백 문자
관련 토픽	CCSID HTML 문자 인코딩 Charset 검출 한통일 하드웨어 코드 페이지 MICR 코드 모지바케 가변 폭 부호화
문자 집합

Search