SCSII
VSCII에일리어스 | x-viet-tcvn5712 [1] |
---|---|
언어 | 베트남어, 영어 |
작성자 | TCVN/TC1 |
표준. | TCVN 5712:1993 |
분류 | 8비트 SBCS 확장 ASCII(VSCII-2/-3) |
컴퓨터와의 베트남어를 사용하여 밀접하게 관련된 세 베트남 국가 표준 문자 인코딩, TCVN 기술 위원회 정보 테크에에 의해 개발된 VSCII(베트남 표준 정보 교환용 부호), 또한 TCVN 5712,[2]ISO-IR-180,[3].VN,[4]ABC[4]하거나 단순히 TCVN encodings,[4][5]로 알려진 세트이다.nology(TCVN/TC1)1993년에 처음 채택되었다(TCVN 5712:1993).[2]
해외 베트남어 [4]사용자가 사용하는 비공식 VISCII 인코딩과 혼동해서는 안 됩니다.VISCII는 베트남 정보 교환 표준 코드(Standard Code for Information Interchange)[6]의 약자이기도 하지만 VSCII와는 관련이 없습니다.
베트남 북부에서는 VCII(TCVN)가 널리 사용되었고 [4]남부에서는 VNI가 인기를 끌었다.현재는 거의 모든 베트남 컴퓨터 데이터에 Unicode 및 Windows-1258 코드 [citation needed]페이지가 사용되고 있지만 레거시 파일 또는 아카이브된 메시지에는 변환이 필요할 수 있습니다.
인코딩
VSCII 의 3 형식 모두, 인쇄 가능한 ASCII 의 95 문자는 변경되지 않습니다.
VSCII-3은 TCVN 5712-3, VN3, [7]또는 단순히 TCVN3이라고도 하며 할당이 가장 적습니다.128개의 모든 ASCII 코드를 변경하지 않고 유지하기 때문에 확장 ASCII입니다.C0 및 C1 제어 코드는 재할당하지 않습니다.ASCII와 비교하여 75자가 추가됩니다.
TCVN3에서는 대문자 모음의 톤 마크는 모두 대문자 [8]글꼴로 전환함으로써 실현됩니다.
VSCII-2는 TCVN 5712-2 및 VN2라고도 불리며 VSCII-3의 슈퍼셋입니다.128개의 모든 ASCII 코드를 변경하지 않고 유지하기 때문에 확장 ASCII입니다.C0 및 C1 제어 코드를 재할당하지 않으므로 96-set으로 [2][3]ISO 2022에 준거합니다.VSCII-3과 비교하여 (총 96개의 비ASC에 대해)II 문자:
- 톤 마크가 사전 구성된 16자 이상의 대문자(총 23자 비ASCII 대문자)
- 5는 톤 마크의 분음 부호를 조합하여 대문자 및 톤 마크의 다른 조합을 나타낼 수 있도록 합니다.조합 마크는 (ANSEL이 아닌) VNI에서와 같이 기본[2] 문자를 따릅니다.
VSCII-1은 TCVN 5712-1 및 VN1이라고도 불리며 VSCII-2의 확장자이며 33개의 제어 문자 중 12개를 사전 구성된 문자로 대체하기 때문에 ASCII가 변경된 것입니다.VSCII-2와 비교하여 (총 140의 비ASC)II 문자:
- 사전 구성된 대문자 44개를 추가하여 소문자와 동일한 수로 지정
- 이를 위해 12개의 ASCII 제어 문자를 대체하고 32개의 그래픽 문자를 C1 제어 영역에 할당하여 ISO 2022 호환성을 깨뜨립니다.
VSCII-3에서 VSCII-2 또는 VSCII-1로 변환하거나 VSCII-2에서 VSCII-1로 변환할 필요는 없지만 파일 크기가 작아질 수 있습니다.
VSCII-1에서 VSCII-2 또는 VSCII-3으로 변환하고 VSCII-2에서 VSCII-3으로 변환하려면 사전 구성된 일부 문자를 확장해야 합니다.
문자 집합
VSCII-1[2] | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
0x | 없음 | u 00DA | Ụ 1EE4 | ETX | Ừ 1 EEA | Ử 1EEC | Ữ 1EE | 벨 | BS | HT | LF | VT | FF | CR | 그렇게 | SI |
1배 | DLE | Ứ 1EE8 | Ự 1EF0 | Ỳ 1EF2 | Ỷ 1EF6 | Ỹ 1EF8 | Ý 00DD | Ỵ 1EF4 | 할 수 있다 | 전자파 | 후보선수 | ESC | FS | GS | RS | 미국 |
2배 | SP | ! | " | # | $ | % | & | ' | ( | ) | * | + | , | - | . | / |
3배 | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | : | ; | < > | = | > | ? |
4배 | @ | A | B | C | D | E | F | G | H | I | J | K | L | M | N | O |
5배 | P | Q | R | S | T | U | V | W | X | Y | Z | [ | \ | ] | ^ | _ |
6배 | ` | a | b | c | d | e | f | g | h | i | j | k | l | m | n | o |
7배 | p | q | r | s | t | u | v | w | x | y | z | { | } | ~ | 델 | |
8배 | à 00C0 | Ả 1EA2 | ã 00C3 | 아아 00C1 | Ạ 1EA0 | Ặ 1EB6 | Ậ 1EAC | è 00C8 | Ẻ 1EBA | Ẽ 1 EBC | 에 00C9 | Ẹ 1EB8 | Ệ 1EC6 | ì 00CC | Ỉ 1EC8 | Ĩ 0128 |
9배 | Ⅱ 00CD | Ị 1ECA | Ò 00D2 | Ỏ 1ECE | Õ 00D5 | ó 00D3 | Ọ 1ECC | Ộ 1ED8 | Ờ 1EDC | Ở 1EDE | Ỡ 1EE0 | Ớ 1EDA | Ợ 1EE2 | Ù 00D9 | Ủ 1EE6 | Ũ 0168 |
도끼 | NBSP | 에러 0102 | 」 00C2 | ê 00CA | o 00D4 | ơ 01A0 | Ư 01 AF | DH 0110 | ă 0103 | ★ 00E2 | ê 00EA | o 00F4 | ơ 01A1 | ư 01B0 | ᄃ 0111 | Ằ 1EB0 |
Bx | ◌̀ 0300 | ◌̉ 0309 | ◌̃ 0303 | ◌́ 0301 | ◌̣ 0323 | 아 00E0 | ả 1EA3 | ã 00E3 | 아 00E1 | ạ 1EA1 | Ẳ 1EB2 | ằ 1EB1 | ẳ 1EB3 | ẵ 1EB5 | ắ 1EAF | Ẵ 1EB4 |
Cx | Ắ 1EAE | Ầ 1EA6 | Ẩ 1EA8 | Ẫ 1EAA | Ấ 1EA4 | Ề 1EC0 | ặ 1EB7 | ầ 1EA7 | ẩ 1EA9 | ẫ 1EAB | ấ 1EA5 | ậ 1EAD | è 00E8 | Ể 1EC2 | ẻ 1EBB | ẽ 1EBD |
Dx | 에 00E9 | ẹ 1EB9 | ề 1EC1 | ể 1EC3 | ễ 1EC5 | ế 1EBF | ệ 1EC7 | ì 00EC | ỉ 1EC9 | Ễ 1EC4 | Ế 1EBE | Ồ 1ED2 | ĩ 0129 | ii 00ED | ị 1ECB | ò 00F2 |
예 | Ổ 1ED4 | ỏ 1ECF | õ 00F5 | o 00F3 | ọ 1ECD | ồ 1ED3 | ổ 1ED5 | ỗ 1ED7 | ố 1ED1 | ộ 1ED9 | ờ 1ED | ở 1EDF | ỡ 1EE1 | ớ 1EDB | ợ 1EE3 | ù 00F9 |
Fx | Ỗ 1ED6 | ủ 1EE7 | ũ 0169 | u 00FA | ụ 1EE5 | ừ 1EEB | ử 1EED | ữ 1EEF | ứ 1EE9 | ự 1EF1 | ỳ 1EF3 | ỷ 1EF7 | ỹ 1EF9 | ý | ỵ 1EF5 | Ố 1ED0 |
레퍼런스
- ^ Sivonen, Henri (2014-09-26). "Character encoding changes in m-c require c-c action". mozilla.dev.apps.thunderbird.
- ^ a b c d e "[news] TCVN 5712:1993 (VSCII) -- Vietnamese national standard". 1993-06-02. Archived from the original on 2017-01-11.
- ^ a b TCVN (1993). ISO-IR-180: Right-hand Part of the VSCII-2 Code Table (PDF). ITSCJ/IPSJ.
- ^ a b c d e Ngo, Hoc Dinh; Tran, TuBinh. "5. Why Having Vietnamese Charset (Character Set – Encoding) Conversion?". Some special functions of WinVNKey.
- ^ Nguyen, Minh T. "Vietnamese Conversions (Vietnet/VIQR, VNI, VPS, VISCII, VNU, TCVN, VietWare, unicode)".
- ^ Lunde, Ken (13 January 2009). "Chapter 1: CJKV Information Processing Overview (§ Are VISCII and VSCII identical? What about TCVN?)". CJKV Information Processing (2nd ed.). p. 17. ISBN 978-0-596-51447-1.
- ^ "Unicode & Vietnamese Legacy Character Encodings". Vietnamese Unicode FAQs.
- ^ "Unicode & Vietnamese Legacy Character Encodings". Vietnamese Unicode FAQs.
TCVN3 is not double-byte, but due to the nature of its encoding, capital letters (vowels) are mapped to a separate, capital font that is similar to the normal, lowercase one.
- ^ Lunde, Ken (13 January 2009). "Appendix L: Vietnamese Character Sets" (PDF). CJKV Information Processing (2nd ed.). ISBN 978-0-596-51447-1.