MIK(문자 집합)

MIK (character set)

MIK(MIK)는 DOS에서 사용되는 8비트 키릴 코드 페이지입니다.불가리아 프라베츠[1] 16 IBM PC 호환 시스템에서 사용되는 문자 집합을 기반으로 합니다.Kermit는 이 문자 집합을 "BULGARIA-PC" / "Bulgaria-pc"[2][3][4]라고 부릅니다.불가리아에서는 코드 페이지 856으로 잘못 언급되기도 했습니다(히브리어 코드 페이지에 대한 IBM의 정의와 충돌). 코드 페이지는 FreeDOS에서 코드 페이지 3021로 알려져 있습니다.

이 페이지는 CP 808, CP 855, CP 866 또는 CP 872아닌 불가리아에서 가장 널리 사용되는 DOS/OEM 코드 페이지입니다.

불가리아에서 작성된 거의 모든 DOS 프로그램(불가리아 문자열 포함)은 MIK를 인코딩으로 사용하고 있으며, 현재도 많은 프로그램이 사용되고 있다.

문자 집합

각 문자는 동등한 유니코드 코드 포인트와 십진 코드 포인트와 함께 표시됩니다.테이블의 후반부(코드포인트 128~255)만 표시되고 전반부(코드포인트 0~127)는 ASCII와 동일합니다.

마이크[5][6][4]
0 1 2 3 4 5 6 7 8 9 A B C D E F
8배 А Б В Г Д Е Ж З И Й К Л М Н О П
9배 Р С Т У Ф Х Ц Ч Ш Щ Ъ Ы Ь Э Ю Я
도끼 а б в г д е ж з и й к л м н о п
Bx р с т у ф х ц ч ш щ ъ ы ь э ю я
Cx
Dx §
α ß[nb 1] Γ π Σ[nb 2] σ µ[nb 3] τ Φ Θ Ω[nb 4] δ φ ε[nb 5]
Fx ± ÷ ° · ² NBSP

테이블을 Unicode에 매핑하는 구현자에 대한 참고 사항

테이블을 Unicode 에 매핑 하는 실장자는, MIC 코드 페이지에 다음의 몇개의 문자가 통합되어 있는 것에 주의해 주세요.

  1. ^ 0xE1은 독일 샤프 S(U+00DF, β) 및 그리스 소문자 베타(U+03B2, β)이다.
  2. ^ 0xE4는 n-ary 합계 부호(U+2211, δ)와 그리스 대문자 시그마(U+03A3, δ)이다.
  3. ^ 0xE6은 마이크로 기호(U+00B5, µ)와 그리스 소문자 mu(U+03BC, μ)이다.
  4. ^ 0xEA는 옴 기호(U+2126, ω)와 그리스 대문자 오메가(U+03A9, ω)이다.
  5. ^ 0xE는 기호 요소(U+2208, ))와 그리스 소문자 엡실론(U+03B5, ))입니다.

이진 문자 조작

MIK 코드 페이지는 모든 키릴 문자를 알파벳 순서로 유지 관리하므로 바이너리 형식의 문자를 매우 쉽게 조작할 수 있습니다.

10xxxxxx - 키릴 문자

100xxxxx - 대문자 키릴 문자

101xxxxx - 소문자 키릴 문자

이 경우 테스트 및 문자 조작 기능은 다음과 같습니다.

IsAlpha(), IsUpper(), IsLower(), ToUpper() 및 ToLower(),

are 비트 연산 및 정렬은 문자 값을 단순 비교함으로써 이루어집니다.

「 」를 참조해 주세요.

레퍼런스

  1. ^ "Pravetz 16". Archived from the original on 2016-12-06. Retrieved 2016-12-06.
  2. ^ da Cruz, Frank (2010-04-02). "Kermit and MIME Character-Set Names". The Kermit Project. Columbia University, New York, USA. Archived from the original on 2016-12-03. Retrieved 2016-12-02.
  3. ^ "Kermit 95 - Cyrillic Character Sets".
  4. ^ a b http://www.columbia.edu/kermit/ftp/charsets/cp856.txt[베어 URL 플레인텍스트 파일]
  5. ^ Czyborra, Roman (1998-11-30) [1998-05-25]. "The Cyrillic Charset Soup". Archived from the original on 2016-12-03. Retrieved 2016-12-03. [1] [2]
  6. ^ Hohlov, Yu. E. "Cyrillic Information Representation in Electronic Form - Character Set (Code Page) Tables". Archived from the original on 2016-12-05. Retrieved 2016-12-05.

외부 링크

  • https://www.unicode.org/Public/MAPPINGS/VENDORS/IBM/IBM_conversions.html Unicode Consortium의 IBM 코드 페이지와 유니코드 간 매핑
  • http://www.cl.cam.ac.uk/~mgk25/migraph.disp #conv UTF-8 및 Unicode FAQ by Markus Kuhn