가시

VISCII
가시
MIME / IANA가시
언어베트남어, 영어
작성자베트남 표준 그룹
정의들RFC 1456
분류8비트 SBCS
에 기반을 둔ASCII

VISCII는 컴퓨터에서 베트남어를 사용하기 위해 비공식적으로 정의ASCII 문자 인코딩입니다.동일한 이름의 공식 등록된 VSCII 인코딩과 혼동하지 마십시오.VISCII 는, ASCII 의 95 문자의 인쇄 가능 문자를 변경하지 않고 보관 유지합니다만, 33 개의 제어 문자 중 6 개의 문자를 인쇄 가능 문자로 치환합니다.128개의 사전 구성 문자가 추가됩니다.현재 Unicode 및 Windows-1258 코드 페이지는 거의 모든 베트남 컴퓨터 [citation needed]데이터에 사용되고 있지만 기존 VCII 및 VISCII 파일은 변환이 필요할 수 있습니다.

이력 및 명명

VISCII는 Christopher Cuong T가 이끄는 베트남 표준화 작업 그룹([1]Vietnam Standardization Working Group, 베트남 표준 그룹)응웬, 쿠옹엠Bui와 Hoc D. Ngo는 1992년 Unicode 컨소시엄과 협력하여 사전 구성된 베트남 문자를 Unicode 표준에 포함시키는 동안 캘리포니아 실리콘 밸리에 기반을 두고 있습니다.VISCII는 VIQR과 함께 1992년 9월 2개 국어 보고서에서 처음 발표되었으며, 이 보고서에서 "정보 교환을 위한 베트남 표준 코드"[2]로 명명되었다.보고서는 베트남에서의 컴퓨터 사용의 급증과 해외의 베트남인들 사이의 컴퓨터 기반 통신량의 증가, 기존 애플리케이션이 서로 상호 운용할 수 없는 벤더 고유의 인코딩을 사용하고 있기 때문에 벤더 간의 표준화가 필요하다고 지적했다.Unicode 1.0에 베트남어가 사전 작곡되어 성공적으로 포함된 것은 8비트 VISCII 및 7비트 [2]VIQR의 개발에서 얻은 교훈의 결과입니다.

이듬해인 1993년 베트남은 정보기술 분야[3]첫 국가표준인 TCVN 5712를 채택했다.이는 TCVN 정보 기술 위원회(TCVN/TC1)가 개발한 VCII라는 이름의 문자 인코딩을 정의했으며, 그 이름은 "정보 교환을 위한 베트남 표준 코드"[3]를 나타냅니다.VSCII는 이전에 공개된 [4]VISCII와 호환되지 않거나 관련이 없습니다.VISCII와 달리 VSCII는 국가 표준이라는 의미에서 '베트남 표준'이다.

VISCII와 VIQR은 정보 상태 RFC1456으로 승인되었으며, 1993년 5월호이다.IETF RFC의 경우와 마찬가지로 RFC 1456에서는 Usenet의 해외 베트남어 화자에 의해 사용되는 「컨벤션」이며, 「표준의 레벨은 지정되어 있지 않다」라고 하고 있습니다.그럼에도 불구하고 VISCII는 계속해서 "VIetian Standard Code for Information Interchange"([5]VCII에서 사용하는 동일한 이름)라고 부르고 있습니다.라벨VISCII그리고.csVISCII는 RFC 1456을 [6]참조하여 VISCII의 IANA에 등록되어 있습니다.(반면 TCVN 5712 / VSCII의 공식 IANA 라벨은 없습니다만,x-viet-tcvn5712는 이전에 Mozilla Firefox에서 지원되었습니다.)[7]

설계.

기존의 확장 ASCII 문자 집합은 ASCII 세트에 최대 128자로 구성됩니다.베트남어는 추가로 134개의 문자와 발음을 조합해야 하는데, 이는 6개가 더 많은 숫자이다.(VCII-3과 같이 대문자 톤 마크의 드롭을 서포트하지 않는 경우) 기본적으로 이 문제에 대처하는 방법은 4가지가 있습니다.

  1. 가변폭 부호화 사용(UTF-8과 동일)
  2. 마크(VCII-2Windows-1258) 또는 일반적인 분음 부호(ANSELVNI)의 조합도 포함합니다.
  3. ISO 646에서 불변하지 않는 일부 ASCII 구두점을 교체합니다(DOS의 VNI와 동일).
  4. 기본 ASCII 제어 문자 중 최소 6자 교체(VPSVSCII-1과 동일)

VISCII는 마지막 옵션을 사용하여 문제가 가장 적은6개의 C0 제어 코드(STX, ENQ, ACK, DC4, EM 및 RS)[2]를 가장 적게 사용되는6개의 대문자와 발음이 조합된 것으로 대체했습니다.이 옵션은 VISCII 텍스트를 처리할 때 이러한 제어 코드를 사용하는 프로그램이 오작동하는 원인이 될 수 있지만 다른 두 가지 옵션보다 복잡성이 적습니다(설계자는 8비트 이외의 클린 전송이 제어 문자를 [2]재사용하는 것보다 실제로 더 어렵다는 것을 발견했습니다).단, ISO-8859-1, Mac OS Roman 및 OEM-US에서 C0 또는 C1 제어문자의 위치와 구분되지 않는 공간에 사용되는 코드는 의도적으로 대문자로 할당되어 그래픽 문자를 표시할 수 없는 경우 모두 대문자로 된 소문자 코드 포인트를 사용할 수 있습니다.r 그 코드들.[2]

그러나 악센트 문자의 확장 코드 포인트를 모두 사용하면 대부분의 다른 확장 ASCII 문자 집합과 마찬가지로 유용한 기호, 대문자, 곡면 따옴표, 적절한 대시 등을 추가할 여지가 없습니다.

문자의 위치는 대부분 ISO-8859-1에 따릅니다.이 경우, 2개의 코드 페이지간에 공통의 문자(예외로서 대문자가 기재되어 있습니다)가 있어, 유저의 친화성에 관한 [2]염려가 있습니다.

지지하다

VISCII는 캘리포니아의 TriChor Software Group에 의해 부분적으로 지원됩니다.이 그룹은 MS-DOS 및 Windows, Unix 및 Macintosh용 다양한 VISCI 호환 소프트웨어 패키지, 라이브러리 및 글꼴을 출시했습니다.VISCII 준거 소프트웨어는, 많은 FTP 사이트에서 입수할 수 있습니다.

VISCII는 지금까지 Mozilla Thunderbird에 의해 발신 이메일 인코딩으로 제공되었습니다.또한 Christopher Cuong T가 만든 Windows 베트남어 키보드 소프트웨어 WinVNKey에서도 지원되었습니다.Nguyen 및 이후 Hoc D. Ngo 등의 [8]다양한 Windows 버전을 통해 업그레이드되었습니다.

VISCII는 주로 해외 베트남어 사용자들이 사용했으며, 베트남 북부에서는 VSCII(TCVN)가,[9] 베트남 남부에서는 VNI가 더 인기가 있었다.

문자 집합

가시
0 1 2 3 4 5 6 7 8 9 A B C D E F
0x 없음 SOH
1EB2
ETX 전원
1EB4

1EAA
BS HT LF VT FF CR 그렇게 SI
1배 DLE DC1 DC2 DC3
1EF6
NAK 동기 ETB 할 수 있다
1EF8
후보선수 ESC FS GS
1EF4
미국
2배 SP ! " # $ % & ' ( ) * + , - . /
3배 0 1 2 3 4 5 6 7 8 9 : ; < > = > ?
4배 @ A B C D E F G H I J K L M N O
5배 P Q R S T U V W X Y Z [ \ ] ^ _
6배 ` a b c d e f g h i j k l m n o
7배 p q r s t u v w x y z { } ~
8배
1EA0

1EAE

1EB0

1EB6

1EA4

1EA6

1EA8

1EAC

1 EBC

1EB8

1EBE

1EC0

1EC2

1EC4

1EC6

1ED0
9배
1ED2

1ED4

1ED6

1ED8

1EE2

1EDA

1EDC

1EDE

1ECA

1ECE

1ECC

1EC8

1EE6
Ũ
0168

1EE4

1EF2
도끼 Õ
00D5

1EAF

1EB1

1EB7

1EA5

1EA7

1EA9

1EAD

1EBD

1EB9
ế
1EBF

1EC1

1EC3

1EC5

1EC7

1ED1
Bx
1ED3

1ED5

1ED7

1EE0
ơ
01A0

1ED9

1ED

1EDF

1ECB

1EF0

1EE8

1 EEA

1EEC
ơ
01A1

1EDB
Ư
01 AF
Cx à 아아 ã
1EA2
에러
0102

1EB3

1EB5
è ê
1EBA
ì Ĩ
0128

1EF3
Dx DH
0110

1EE9
Ò ó o
1EA1

1EF7

1EEB

1EED
Ù u
1EF9

1EF5
Ý
1EE1
ư
01B0
ã
1EA3
ă
0103

1EEF

1EAB
è ê
1EBB
ì ii ĩ
0129

1EC9
Fx
0111

1EF1
ò o o õ
1ECF

1ECD

1EE5
ù u ũ
0169

1EE7
ý
1EE3

1EE
ISO-8859-1과의 차이점

「 」를 참조해 주세요.

레퍼런스

  1. ^ Phung, Quang; Ngo, Hoc D.; Bui, Cuong. "Vietnamese-Standard Working Group Home Page". Viet-Std Group. Retrieved 2019-08-23.
  2. ^ a b c d e f Vietnamese Character Encoding Standardization Report - VISCII And VIQR 1.1 Character Encoding Specifications (Technical report). Viet-Std Group. 1992.
  3. ^ a b "[news] TCVN 5712:1993 (VSCII) -- Vietnamese national standard". 1993-06-02. Archived from the original on 2017-01-11.
  4. ^ Lunde, Ken (13 January 2009). "Chapter 1: CJKV Information Processing Overview (§ Are VISCII and VSCII identical? What about TCVN?)". CJKV Information Processing (2nd ed.). p. 17. ISBN 978-0-596-51447-1.
  5. ^ Vietnamese Standardization Working Group (May 1993). Conventions for Encoding the Vietnamese Language. IETF. doi:10.17487/RFC1456. RFC 1456.
  6. ^ "Character Sets". IANA.
  7. ^ Sivonen, Henri (2014-09-26). "Character encoding changes in m-c require c-c action". mozilla.dev.apps.thunderbird.
  8. ^ Sivonen, Henri (2014-09-26). "Character encoding changes in m-c require c-c action". mozilla.dev.apps.thunderbird. VISCII and armscii-8 are special in the sense that, for long time, Thunderbird itself (misguidedly) provided these encodings in the user interface for the choice of outgoing character encoding when composing a message. Therefore, it is possible that there exists a Thunderbird-created legacy of VISCII and armscii-8 email and Usenet posts.
  9. ^ Ngo, Hoc Dinh; Tran, TuBinh. "5. Why Having Vietnamese Charset (Character Set – Encoding) Conversion?". Some special functions of WinVNKey.

추가 정보

외부 링크