한국어와 컴퓨터

Korean language and computers
대한민국 표준 두벌식(2세트형) 레이아웃.

한글의 문자 체계인 한글음절 블록으로 구성된 알파벳으로, 문자는 왼쪽에서 오른쪽으로 쓸 수 없다. 이 때문에 한글로 가능한 모든 음절은 글자체로 음절 블록으로 표기하거나 별도로 인코딩해야 한다. 유니코드는 후자의 옵션을 사용한다. 예를 들어 음절인 하(ha)는 ㅎ(h)와 ㅏ(a)로 구성되어 있으나, 둘 다 따로 인코딩되어 있다.

북한 표준 두벌식 배치

캐릭터 인코딩

RFC 1557에서는 e-메일에 한글 7비트 인코딩을 위한 ISO-2022-KR이라고 알려진 방법이 설명되었다. 8비트가 허용되는 경우 EUC-KR 인코딩을 선호한다. 이 두 인코딩은 미국 ASCII(ISO 646)와 한국 표준 KS X 1001:1992[1](이전 명칭: KS C 5601:1987)를 결합한 것이다. 북한에서는 KPS 9566이라는 별도의 문자 집합이 사용되고 있는데, 이는 오히려 KS X 1001과 비슷하다.

국제 유니코드 표준은 한글 고유음표 체계에서 한국어를 나타내는 특수문자를 포함하고 있다. 유니코드가 지원하는 두 가지 방법이 있다. 마이크로소프트 윈도우가 사용하는 방법은 11,172개의 음절 조합 중 하나를 코드와 미리 형성된 글꼴 문자로 만드는 것이다. 또 다른 방법은 문자(자모)를 인코딩하고, 소프트웨어가 이를 올바른 조합으로 결합하도록 하는 것인데, 윈도에서는 지원되지 않는다. 물론 이전 방법은 더 많은 글꼴 메모리가 필요하지만, 문서를 작성할 때 선호할 수 있는 완전히 스타일리쉬하게 올바른 조합을 만드는 것이 복잡하기 때문에 더 나은 모양을 얻을 수 있는 가능성을 준다.

또한 글자체가 커서 왼쪽이나 캐럿에 삽입된 0폭의 간격의 중간 및 최종 자모(자모)를 가진 경우, 필요하다면 (자모) 이니셜(자모) 위에 (자모)의 연속 및/또는 중한 피치 마크를 단순히 쌓을 가능성도 있다.따라서 초기의 오른쪽이나 아래의 올바른 위치에 나타난다. 만약 음절에 가로음절( (, , , , - 또는 -)이 있다면, 첫 음절은 세로음절에 예약되어 있어야 하는 공간 때문에 미리 만들어진 음절보다 완전한 음절에서 더 왼쪽으로 나타나게 될 것이며, 이는 레서디 없이 중 한글 문자를 표시할 수 있는 유일한 방법일 수 있는 미학적으로 초라한 모습을 보이게 할 것이다.ng 이미지, 로마자화, 사용되지 않는 자모 교체 또는 비표준 인코딩. 그러나 대부분의 현재 글꼴은 이를 지원하지 않는다.

유니코드 표준은 또 한자를 렌더링하기 위해 언어나 지역별로 차별이 없는 한한 통일 과정을 통해 한자(한자)뿐만 아니라 한자(한자) 파생어를 나타낼 수 있는 통일 CJK 문자 세트도 만들려고 시도했다. 전통은 등장인물이 어떻게 생겼는지와 관련하여 큰 차이를 가져오지 않았다 – 최근 중국 본토에서 작은 변화만을 겪은 등장인물의 는 이미지:신주-지우-지싱.png을 참조하라. 한통일은 일부 비판에 직면해 있다.

텍스트 입력

한국의 컴퓨터 키보드에서 텍스트는 일반적으로 적절한 자모 키를 누르면 입력된다. 운영체제는 각각의 합성 문자를 즉석에서 만든다. IME와 자판 배열에 따라 Shift 버튼을 누르면 이중 자음을 입력할 수 있다. 음절 블록을 구성하는 모든 자모가 입력되었을 때, 사용자는 키보드 단축키나 인터페이스 버튼을 사용하여 한자 또는 다른 특수 문자로의 변환을 시작할 수 있다. 한국 키보드에는 이를 위한 별도의 키가 있다. 이후 반자동화된 한자 변환은 워드프로세서에서 다양한 수준으로 지원된다.

다른 언어의 자판을 사용할 때 대부분의 운영체제는 사용자가 원래의 한글 자판 배열을 사용하여 타이핑하도록 하는데, 그 중 가장 흔한 것이 2(du)벌식이다. 이는 일본어처럼 비원어 키보드의 로마자 표기 시스템을 사용하여 텍스트를 입력할 수 있는 일부 다른 언어와는 대조적이다.

Linux와 같은 대부분의 운영체제는 엔진/한글/한글-키보드='ro'를 허용하지 않는데, 이는 로마자 키보드로, 여기서 '성계'를 키로 하면 성이 된다.[2] 이 구성에서 ㄲ은 shift-g가 아닌 "gg"로 얻는다. 이를 통해 키잉 '자아산군'이 자아산을 제공하는 '자아산군'을 키잉하는 대신 '자아산군'을 얻어낼 수 있게 됐다.

한글 타자기의 역사

대한민국의 프리 디비전

한국어 텍스트 입력의 역사는 컴퓨터 이전의 한글 타자기의 역사와 관련이 있다. 최초의 한글 타자기가 무엇이었는지는 불분명하다. 장봉선에 따르면 1900년대경 호레이스 그랜트 언더우드가 한글 타자기를 만들었다.[3] 1914년 미국에 거주하던 이원익이 '첫' 타자기를 만들었다.[4][5] 1927년 송기주는 시카고에 있는 동안 최초의 두볼식 타자기를 발명했지만 오늘날에는 존재하지 않는다. 그러나 그의 1934년 타자기는 현존하는 가장 오래된 한글 타자기로 한글박물관에 보관되어 있다.[6] 타자기의 발명은 김준성이 1945년, 공병우가 1950년 발명한 다른 타자기의 발전으로 이어졌다.[7]

대한민국의 분단

한국은 원래 네벌식 표준을 가지고 있었지만, 이후 1985년에 두벌식이 표준이 되었다.[8]

한자

위에서 언급한 변환 문제 외에도 일부 한글 글꼴에는 한자가 포함되어 있지 않다. 동시에, 현재의 워드프로세서는 텍스트에서 발생할 수 있는 어떤 한자에 대해 예비로 사용할 글꼴을 사용자가 지정할 수 없게 한다. 이 경우 각 한자의 순서는 원하는 글꼴로 나타나도록 수동으로 포맷해야 한다.

특수한 상황

세로줄로 텍스트를 실행하는 것은 HTML과 대부분의 워드프로세서에 의해 지원되거나 전혀 지원되지 않지만, 이것은 현대 한국어에서는 보통 가로로 쓰이기 때문에 문제가 되지 않는다. 그러나 20세기 후반까지 한국어는 수직으로 쓰여진 경우가 많았다. 한글로 쓰여진 15세기 텍스트는 대부분의 현재의 글꼴도 적절히 지원하지 못하지만 유니코드에 포함되는 음절의 왼쪽에 음절 표시가 있었다.

더 이상 사용되지 않는 자모는 위의 문자 인코딩 섹션을 참조하십시오.

프로그램

한국어 관련 용도로 특별히 설계된 주목할 만한 프로그램은 다음과 같다.

유니코드 한글

유니코드로 된 한글 자모 문자
유니코드의 한글 호환성 자모 블록

한글 문자는 유니코드 규격의 여러 개별 부분에 자세히 설명되어 있다.

한글 음절 블록

유니코드의 한글 음절 블록에서 사전 컴파일된 한글 음절은 다음 공식을 사용하여 알고리즘으로 정의된다.

[(iii) × 588 + (중간) × 28 + (최종) + 44032
  • 초성
  • 중모음
  • 자음

예를 들어 유니코드에서 "한국"의 코드 포인트를 찾고자 하는 경우:

  • 초성 consonant의 값은 18이다.
  • 중모음 ㅏ의 값은 0이다.
  • 최종 자음 ㄴ의 값은 4이다.

위의 공식에 이러한 값을 대입하면 [(18 × 588) + (0 × 28) + 4] + 44032 = 54620이 된다. 이것은 유니코드 값이 소수점 54620이라는 것을 의미한다. 한 숫자 문자 참조 및 U+D55C 16진수 유니코드 표기법.

한글 호환성 자모 블록

한글 호환성 자모 블록은 KS X 1001 문자 집합과의 호환성을 위해 할당된 유니코드의 일부다. 그것은 보통 초기최종을 구분하지 않고 한글 자모를 그 자체로 나타내기 위해 사용된다.

한글 자모 블록

한글 자모, 한글 자모 확장-A, 한글 자모 확장-B 블록에는 초기의 자모, 메디알 자모, 마지막 자모가 들어 있는데, 여기에는 구식 자모를 포함한다.

한양민간이용구역코드

한글(워드 프로세서)은 한양 정보통신의 글꼴과 함께 배송된다. 그들의 글꼴은 쓸모없는 한글 문자를 유니코드의 개인용도 영역에 매핑한다. 전용 암호문 대신 사적 사용 지역을 사용함에도 불구하고, 한양의 지도는 2007년 현재 한국에서 구식 한글을 나타내는 가장 인기 있는 방법이었다.

한글 2010년부터 한컴은 한양 PUA 코드를 부정하고 유니코드에서 한글 자모를 사용하여 구식 한글 문자를 표현하는 것을 선택했다.

참고 항목

참조

  1. ^ "KS X 1001:1992" (PDF).
  2. ^ "Libhangul/Ibus-hangul". GitHub. May 29, 2021.
  3. ^ 장봉선(Jang bong Seon) (1989). 한글풀어쓰기교본. 한풀문화사(Hanpul). p. 84.
  4. ^ "이원익 타자기". scienceall.com. December 7, 2012.
  5. ^ "정보화 시대 이전, 타자기가 있었다<한글 타자기 전성시대>". Hangul museum.
  6. ^ "[역사특집] 한국교회사에서 건진 근대문화유산들, 등록문화재로 새롭게 지정". Christian newspaper. February 27, 2020.
  7. ^ "最古 한글타자기, 한글박물관서 본다". Yonhap news. October 8, 2014.
  8. ^ "한글 타자 자판표준화 등 한글 기계화(1969년)". theme.archives.go.kr.
  9. ^ a b 김치관 (December 2, 2000). 문답으로 보는 북한 정보화의 현주소. Tongilnews.com (in Korean). Retrieved December 3, 2006.
  10. ^ a b c 김효석 (December 2, 2000). "<국회자료집> 북한 S/W 현황과 시연자료". Tongilnews.com (in Korean). Retrieved December 3, 2006.
  11. ^ Yonhap (January 7, 1998). 북한의 컴퓨터산업 어디까지 왔나. Tongilnews.com (in Korean). Retrieved December 3, 2006.[데드링크]
  12. ^ "북한용어사전: 평양정보센터(PIC)" (in Korean). Archived from the original on September 28, 2007. Retrieved December 3, 2006.

외부 링크