SCSII

VSCII
SCSII
에일리어스x-viet-tcvn5712[1]
언어베트남어, 영어
작성자TCVN/TC1
표준.TCVN 5712:1993
분류8비트 SBCS
확장 ASCII(VSCII-2/-3)

컴퓨터와의 베트남어를 사용하여 밀접하게 관련된 세 베트남 국가 표준 문자 인코딩, TCVN 기술 위원회 정보 테크에에 의해 개발된 VSCII(베트남 표준 정보 교환용 부호), 또한 TCVN 5712,[2]ISO-IR-180,[3].VN,[4]ABC[4]하거나 단순히 TCVN encodings,[4][5]로 알려진 세트이다.nology(TCVN/TC1)1993년에 처음 채택되었다(TCVN 5712:1993).[2]

해외 베트남어 [4]사용자가 사용하는 비공식 VISCII 인코딩과 혼동해서는 안 됩니다.VISCII는 베트남 정보 교환 표준 코드(Standard Code for Information Interchange)[6]의 약자이기도 하지만 VSCII와는 관련이 없습니다.

베트남 북부에서는 VCII(TCVN)가 널리 사용되었고 [4]남부에서는 VNI가 인기를 끌었다.현재는 거의 모든 베트남 컴퓨터 데이터에 Unicode 및 Windows-1258 코드 [citation needed]페이지가 사용되고 있지만 레거시 파일 또는 아카이브된 메시지에는 변환이 필요할 수 있습니다.

인코딩

VSCII 의 3 형식 모두, 인쇄 가능한 ASCII 의 95 문자는 변경되지 않습니다.

VSCII-3은 TCVN 5712-3, VN3, [7]또는 단순히 TCVN3이라고도 하며 할당이 가장 적습니다.128개의 모든 ASCII 코드를 변경하지 않고 유지하기 때문에 확장 ASCII입니다.C0C1 제어 코드는 재할당하지 않습니다.ASCII와 비교하여 75자가 추가됩니다.

  • 67자의 소문자를 사용하여 완전한 소문자를 지원할 수 있습니다.
  • 7개의 대문자로 톤 마크 없이 29개의 기본 문자를 대문자로 지원할 수 있습니다.
  • 깨지지 않는 공간.

TCVN3에서는 대문자 모음의 톤 마크는 모두 대문자 [8]글꼴로 전환함으로써 실현됩니다.

VSCII-2는 TCVN 5712-2 및 VN2라고도 불리며 VSCII-3의 슈퍼셋입니다.128개의 모든 ASCII 코드를 변경하지 않고 유지하기 때문에 확장 ASCII입니다.C0C1 제어 코드를 재할당하지 않으므로 96-set으로 [2][3]ISO 2022에 준거합니다.VSCII-3과 비교하여 (총 96개의 비ASC에 대해)II 문자:

  • 톤 마크가 사전 구성된 16자 이상의 대문자(총 23자 비ASCII 대문자)
  • 5는 톤 마크의 분음 부호를 조합하여 대문자 및 톤 마크의 다른 조합을 나타낼 수 있도록 합니다.조합 마크는 (ANSEL이 아닌) VNI에서와 같이 기본[2] 문자를 따릅니다.

VSCII-1은 TCVN 5712-1 및 VN1이라고도 불리며 VSCII-2의 확장자이며 33개의 제어 문자 중 12개를 사전 구성된 문자로 대체하기 때문에 ASCII가 변경된 것입니다.VSCII-2와 비교하여 (총 140의 비ASC)II 문자:

  • 사전 구성된 대문자 44개를 추가하여 소문자와 동일한 수로 지정
  • 이를 위해 12개의 ASCII 제어 문자를 대체하고 32개의 그래픽 문자를 C1 제어 영역에 할당하여 ISO 2022 호환성을 깨뜨립니다.

VSCII-3에서 VSCII-2 또는 VSCII-1로 변환하거나 VSCII-2에서 VSCII-1로 변환할 필요는 없지만 파일 크기가 작아질 수 있습니다.

VSCII-1에서 VSCII-2 또는 VSCII-3으로 변환하고 VSCII-2에서 VSCII-3으로 변환하려면 사전 구성된 일부 문자를 확장해야 합니다.

문자 집합

VSCII-1[2]
0 1 2 3 4 5 6 7 8 9 A B C D E F
0x 없음 u
00DA

1EE4
ETX
1 EEA

1EEC

1EE
BS HT LF VT FF CR 그렇게 SI
1배 DLE
1EE8

1EF0

1EF2

1EF6

1EF8
Ý
00DD

1EF4
할 수 있다 전자파 후보선수 ESC FS GS RS 미국
2배 SP ! " # $ % & ' ( ) * + , - . /
3배 0 1 2 3 4 5 6 7 8 9 : ; < > = > ?
4배 @ A B C D E F G H I J K L M N O
5배 P Q R S T U V W X Y Z [ \ ] ^ _
6배 ` a b c d e f g h i j k l m n o
7배 p q r s t u v w x y z { } ~
8배 à
00C0

1EA2
ã
00C3
아아
00C1

1EA0

1EB6

1EAC
è
00C8

1EBA

1 EBC

00C9

1EB8

1EC6
ì
00CC

1EC8
Ĩ
0128
9배
00CD

1ECA
Ò
00D2

1ECE
Õ
00D5
ó
00D3

1ECC

1ED8

1EDC

1EDE

1EE0

1EDA

1EE2
Ù
00D9

1EE6
Ũ
0168
도끼 NBSP 에러
0102

00C2
ê
00CA
o
00D4
ơ
01A0
Ư
01 AF
DH
0110
ă
0103

00E2
ê
00EA
o
00F4
ơ
01A1
ư
01B0

0111

1EB0
Bx ◌̀
0300
◌̉
0309
◌̃
0303
◌́
0301
◌̣
0323

00E0

1EA3
ã
00E3

00E1

1EA1

1EB2

1EB1

1EB3

1EB5

1EAF

1EB4
Cx
1EAE

1EA6

1EA8

1EAA

1EA4

1EC0

1EB7

1EA7

1EA9

1EAB

1EA5

1EAD
è
00E8

1EC2

1EBB

1EBD
Dx
00E9

1EB9

1EC1

1EC3

1EC5
ế
1EBF

1EC7
ì
00EC

1EC9

1EC4

1EBE

1ED2
ĩ
0129
ii
00ED

1ECB
ò
00F2

1ED4

1ECF
õ
00F5
o
00F3

1ECD

1ED3

1ED5

1ED7

1ED1

1ED9

1ED

1EDF

1EE1

1EDB

1EE3
ù
00F9
Fx
1ED6

1EE7
ũ
0169
u
00FA

1EE5

1EEB

1EED

1EEF

1EE9

1EF1

1EF3

1EF7

1EF9
ý
1EF5

1ED0
VSCII-3
VSCII-2 추가 사항
VSCII-1[9] 추가 사항

레퍼런스

  1. ^ Sivonen, Henri (2014-09-26). "Character encoding changes in m-c require c-c action". mozilla.dev.apps.thunderbird.
  2. ^ a b c d e "[news] TCVN 5712:1993 (VSCII) -- Vietnamese national standard". 1993-06-02. Archived from the original on 2017-01-11.
  3. ^ a b TCVN (1993). ISO-IR-180: Right-hand Part of the VSCII-2 Code Table (PDF). ITSCJ/IPSJ.
  4. ^ a b c d e Ngo, Hoc Dinh; Tran, TuBinh. "5. Why Having Vietnamese Charset (Character Set – Encoding) Conversion?". Some special functions of WinVNKey.
  5. ^ Nguyen, Minh T. "Vietnamese Conversions (Vietnet/VIQR, VNI, VPS, VISCII, VNU, TCVN, VietWare, unicode)".
  6. ^ Lunde, Ken (13 January 2009). "Chapter 1: CJKV Information Processing Overview (§ Are VISCII and VSCII identical? What about TCVN?)". CJKV Information Processing (2nd ed.). p. 17. ISBN 978-0-596-51447-1.
  7. ^ "Unicode & Vietnamese Legacy Character Encodings". Vietnamese Unicode FAQs.
  8. ^ "Unicode & Vietnamese Legacy Character Encodings". Vietnamese Unicode FAQs. TCVN3 is not double-byte, but due to the nature of its encoding, capital letters (vowels) are mapped to a separate, capital font that is similar to the normal, lowercase one.
  9. ^ Lunde, Ken (13 January 2009). "Appendix L: Vietnamese Character Sets" (PDF). CJKV Information Processing (2nd ed.). ISBN 978-0-596-51447-1.

외부 링크