KOI 문자 인코딩
KOI character encodingsKOI(кк)는 키릴 문자의 여러 코드 페이지로 이루어진 패밀리입니다.The name stands for Kod obmena informatsiey (Russian: Код обмена информацией) which means "Code for Information Interchange".
KOI 코드 페이지의 특별한 특징은 맨 왼쪽 비트가 제거되어도 7비트 폭의 문자만 처리할 수 있는 기기 또는 소프트웨어를 실수로 통과해도 텍스트가 사람이 읽을 수 있는 상태로 유지된다는 것입니다.이는 문자가 특수한 순서(라틴 문자 이외의 코드 포인트 128개)에 배치되기 때문입니다.다만, 키릴 문자로 쓰여진 언어에서는 알파벳 순서에 대응하지 않기 때문에, 정렬을 실시하기 위해서 룩업 테이블을 사용할 필요가 있습니다.
이러한 인코딩은 이미 러시아어 모스 부호의 방언과 MTK-2 전신 부호에 사용된 라틴어와 키릴어(거의 음운)의 대응에 기초한 ASCII에서 파생되었습니다.KOI8-R의 а(0xE1)에서 처음 26자는 charact, б, the, the, the, the, the, the, the, the, the, the, the, the, the, the, the, the, the, the, the, the, the, the, the, the, the, the, the, the, the, the, the, the, the, the, the, the, the, the, the, the, the, the,
KOI-7
원래의 KOI 부호화(1967)는 KOI-7(ко-7)이라는 이름의 7비트 코드페이지로 소문자가 포함되지 않았습니다.KOI-7에서는 31 또는 32개의 러시아 문자의 코드가 라틴 문자에 따라 정렬됩니다.기타 코드 포인트는 ASCII와 동일합니다(단, 달러 기호 $(코드 포인트hex 24)는 범용 통화 기호 ¤로 대체될 수 있습니다).
KOI-8
1974년 GOST 19768에 의해 표준화된 KOI-8(δδ-8)은 [1][2]ASCII의 8비트 확장입니다.원래는 32개의 소문자와 31개의 대문자 러시아 문자만 포함되었습니다.
이후 KOI-8 유도체는 KOI8, KOI8 및 KOI-8로 다양하게 알려진 인코딩 패밀리를 구성합니다.
가족 구성원은 다음과 같습니다.
- KOI8-B ('' 및 '''[1] 포함)
- 러시아어 및 불가리아어용 KOI8-R / KOI8-RUSIA(RFC 1489)[3]
- KOI8-U/KOI8-UKRENA(우크라이나어용) (RFC 2319).[3]
- 우크라이나어, 벨로루시어 및 러시아어용 KOI8-RU.[4][5][6][7][8]
- 타지크어용 KOI8-T.[9]
- KOI8-C, 또한 KOI8-CA는 코카서스와 중앙아시아를 위한 제안으로 거의 [10]사용되지 않았습니다.
- ISO-IR-111 / KOI8-E[11] (ECMA-113 (제1판, 1986년),[12] 슬라브어용 다국어)
- KOI8-F, KOI-8 통합.KOI8-U 및 KOI8-E로부터의 [13][14]문자 할당과 KOI8-R로부터의 의사 그래픽의 서브셋이 포함됩니다.
- KOI8-K1 "키릴 1" (CSN 36 9103, ST SEV 358-88에서 정의)
- 옛 러시아어 [15]맞춤법용 KOI8-O(구 KOI8-C)
또한 GOST R 34.303-92에서는 ISO-IR-153인 'KOI-8 V1'과 코드 페이지 866의 [16]변형인 'KOI-8 N1' 및 'KOI-8 N2'가 정의되어 있습니다.이것들은 KOI-8 레이아웃에 따르지 않습니다.
DKOI
DKOI는 ES EVM 메인프레임에서 사용되는EBCDIC 기반의 부호화입니다GOST 19768-74/ST SEV 358-76, ST SEV 358-88/GOST 19768-93, CSN 36 9103의 [17]표준으로 정의되어 있습니다.
두 가지 종류가 있습니다.
- DKOI K1(кд),),),),),),),),),1)은 각 키릴 문자에 고유한 코드 포인트를 부여한다.
- DKOI K2(к),),),2), 키릴 문자(а, а, е, к, ,, ,, р, р, р, р, р, р, d, d, d, d, d, d, d, d, d, d, d, d, d, d, d, d, d, d, d, d, d, d, d, d, d, d, d, d, d, d, d, d,
라틴어 변종
일부 인코딩은 KOI라고 불리지만 다음과 같이 라틴 문자를 정의합니다.
- Comecon이 고안한 체코 및 슬로바키아용 KOI8-CS[18]/KOI8-CS2[17](CHSN(체코 기술 표준) 369103)이 인코딩된 라틴어는 체코어와 슬로바키아어에서 사용되는 것과 같이 분음 부호가 사용되었지만, 기본 개념은 동일했다. 즉, 텍스트는 8번째 비트가 지워진 상태에서도 읽을 수 있어야 하기 때문에, 예를 들어 C 등이 되었다.)
- KOI8-L2 "Latin-2"(CSN 36 9103에 정의), ISO IR[19] 139(ISO 8859-2(1987년)와 거의 동일하지만 달러 기호와 통화 기호가 교환됨)
- DKOI CS2(CSN 36 9103에서 [17]정의)
- DKOI L2(CSN 36 9103에서 [17]정의)
레퍼런스
- ^ a b Czyborra, Roman (1998-11-30) [1998-05-25]. "The Cyrillic Charset Soup". Archived from the original on 2016-12-03. Retrieved 2016-12-03.
- ^ Flohr, Guido; Chernov, Andrey A. (2016) [2006]. "Locale::RecodeData::KOI_8 - Conversion routines for KOI-8". CPAN libintl-perl. 1.0. Archived from the original on 2017-01-15. Retrieved 2017-01-15.
- ^ a b da Cruz, Frank (2010-04-02). "Kermit and MIME Character-Set Names". The Kermit Project. Columbia University, New York, USA. Archived from the original on 2016-12-03. Retrieved 2016-12-02.
- ^ 유리 뎀첸코.우크라이나 키릴 문자 집합 KOI8-RU(러시아어 KOI8-R 및 ISO-IR-111의 확장자) 등록(인터넷 초안).1997년. (만료)
- ^ Flohr, Guido (2016) [2006]. "Locale::RecodeData::KOI8_RU - Conversion routines for KOI8-RU". CPAN libintl-perl. Archived from the original on 2017-01-15. Retrieved 2017-01-15.
- ^ "SBCS code page information - CPGID: 01167 / Name: Belarusian/Ukrainian KOI8-RU". IBM Software: Globalization: Coded character sets and related resources: Code pages by CPGID: Code page identifiers. IBM. C-H 3-3220-050. Archived from the original on 2017-02-18. Retrieved 2017-02-18. [1] [2]
- ^ "CCSID information document; CCSID 1167; KOI8-RU". IBM. Archived from the original on 2017-02-18. Retrieved 2017-02-18.
- ^ Leisher, Mark (2008) [1999-12-20]. "KOI8-RU Belorusian/Ukrainian Cyrillic to Unicode 2.1 mapping table". Department of Mathematical Sciences, New Mexico State University. Archived from the original on 2017-02-19. Retrieved 2017-02-18.
- ^ Flohr, Guido; Davis, Michael (2016) [2006]. "Locale::RecodeData::KOI8_T - Conversion routines for KOI8-T". CPAN libintl-perl. Archived from the original on 2017-01-15. Retrieved 2017-01-15.
- ^ 논의
- ^ "IANA Character Sets".
- ^ ECMA-113. 8비트 싱글바이트 부호화 그래픽 문자 세트 - 라틴/키릴 문자 (제1판, 1986년 6월)
- ^ "Cyrillic encodings (Charsets). Small description".
- ^ Leisher, Mark (2008) [1998-03-05]. "KOI8 Unified Cyrillic to Unicode 2.1 mapping table". Department of Mathematical Sciences, New Mexico State University. Archived from the original on 2017-02-19. Retrieved 2017-02-18.
- ^ Serge Winitzki.확장 키릴 문자 집합 KOI8-C(인터넷 초안).2002년 (만료)
- ^ (러시아어) 34.303-92.8비트 코드 교환용 8비트 부호화 문자 세트= 8비트 부호화 문자 세트.
- ^ a b c d Petrlik, Lukas (1996-06-19). "The Czech and Slovak Character Encoding Mess Explained". cs-encodings-faq. 1.10. Archived from the original on 2016-06-21. Retrieved 2016-06-21.
- ^ "Archived copy". Archived from the original on 2011-03-21. Retrieved 2011-04-19.
{{cite web}}
: CS1 maint: 제목으로 아카이브된 복사(링크) - ^ ISO-IR-139
추가 정보
- Kornai, Andras; Birnbaum, David J.; da Cruz, Frank; Davis, Bur; Fowler, George; Paine, Richard B.; Paperno, Slava; Simonsen, Keld J.; Thobe, Glenn E.; Vulis, Dimitri; van Wingen, Johan W. (1993-03-13). "CYRILLIC ENCODING FAQ Version 1.3". 1.3. Retrieved 2017-02-18.
- "Kodierungen und Zeichensätze" [Encodings and character sets]. Robotron Technik (Virtual computer museum) (in German). 2016-11-29. ASCII-Code / KOI-Code. Retrieved 2017-02-21.
외부 링크
- "The Home of the KOI8-R since 1995". 1995. Retrieved 2016-12-05.
- Hohlov, Yu. E. "Cyrillic Information Representation in Electronic Form - Character Set (Code Page) Tables". Archived from the original on 2016-12-05. Retrieved 2016-12-05.
- Nechayev, Valentin (2013) [2001]. "Review of 8-bit Cyrillic encodings universe". Archived from the original on 2016-12-05. Retrieved 2016-12-05.