내부코드

Internal code

중국에서 neima(內, 内码; pinyin:néimă; jyutping:noi6 maaa5, 문자 그대로 내부 코드)는 일부 문자 집합에서 문자를 인코딩하거나, 사용 중인 문자 인코딩에 해당된다. 그것은 그 자체로 인코딩이 아니며, 참조되는 실제 인코딩은 문맥에 의해 결정되어야 한다.

어떤 컴퓨터 시스템에서든 내부 코드는 사용되고 있는 네이티브 인코딩이다. 예를 들어, Big5 기반 시스템(예: 중국어 번체로 지역화된 Microsoft Windows 3.1)에서 내부 코드는 Big5이고, 마찬가지로 GB 기반 시스템(예: CCDOS를 실행하는 DOS)에서 내부 코드는 GB2312가 될 것이다. 초기 컴퓨터에서는 중국어 카드가 내부 코드를 받아 화면에 해당하는 한자를 렌더링한다.[1] 많은 현대적인 운영 체제(모든 현대 마이크로소프트 윈도우즈 시스템 등)에서 내부 코드는 유니코드의 한 형태다.

특정 인코딩 내에서 특정 문자의 내부 코드는 단순히 해당 문자를 나타내기 위해 사용된 코드 포인트의 값을 의미한다. 예를 들어, 빅5 인코딩에서 문자 "一"(중국어, 점등. 1)은 내부 코드 A440(헥사데시멀)을 가지며, GB 인코딩에서는 동일한 문자가 D2BB의 내부 코드를 가진다.

니마법

내부 코드가 유니코드일 때의 자세한 예는 유니코드를 참조하십시오.

내부코드는 한자를 입력하는 입력방법으로 사용할 수 있다. 이 입력방법은 보통 중국어로 碼碼이라고 하며, Big5 및 GB 내부코드에 주로 제공되며, 영어로는 "neima", "internal code", "raw code" 또는 기타 유사한 명칭으로 다양하게 불릴 수 있다.

예를 들어, 빅5 기반의 시스템에서는 「내부 코드」의 입력 방식을 이용하여 「A440」을 입력해 一자를 입력할 수 있다. 반면에 GB 기반 시스템에서는 문자를 입력하기 위해 "D2BB"를 입력한다.

NeiMa는 사용자가 사용자-초센 문자 집합 내에서 그 값을 제공함으로써 원하는 문자를 입력하기를 기대한다.

예를 들어 한자 "不" (Pinyin "bù" - 영어 "not")를 입력하려면 Neima 편집기를 시작하고 유니코드 문자 인코딩 모드로 전환한 다음 유니코드의 표에 "bù"의 16진수 값(4E0D)을 입력하면 된다. NeiMa는 사용자가 필요한 모든 문자의 코드 포인트를 알아야 하기 때문에 문자를 입력하는 매우 어색한 방법이다.

좀 더 일반적으로 말해서 유니코드 모드의 NeiMa는 유니코드 테이블 내의 어떤 코드 포인트도 수용하기 때문에 사용자는 한자를 입력하는 것에 국한되지 않고 유니코드 테이블 안에서 찾을 수 있는 다른 모든 문자도 수용한다. 예를 들어 라틴 대문자 A, A는 A의 유니코드 코드 포인트인 0041을 사용하여 NeiMa로 입력할 수 있다.

유니코드 기반 시스템에서는 유니코드 번호를 16진수로 입력하여 문자를 입력할 수 있다. 이러한 입력 방법은 "니마"라고도 불릴 수도 있고, "유니코드"라고도 불릴 수도 있다.

JIS 기반 시스템(일본어)에서는, 「쿠텐 형태」라고 하는 내부 코드의 형태를 이용하여 문자를 입력할 수 있는 쿠텐 입력 방식이 있을 수 있는데, 이러한 입력 방식을 GB 기반 시스템(중국어)에서는 퀘웨이라고 한다. 쿠텐(쿼이) 형태는 내부 코드와 관련이 있지만, 이러한 입력 방식은 보통 "내부 코드" 입력 방식이라고 하지 않는다.

입력 문자에 "내부 코드" 입력 방법을 사용하는 것은 일반적으로 매우 실용적이지 않을 것이다. 그러나 다른 입력 방법을 사용하여 입력할 수 없는 특수 기호를 입력하는 데 유용하다. 그러나 사용자는 내부 코드가 있는 문자 표가 있어야 한다.

참고 항목

참조

  1. ^ 朱, 巧明 (2005). 中文信息处理技术教程. p. 162. ISBN 9787302117612.