다국어 문자 집합
Multinational Character SetMIME / IANA | DEC-MCS |
---|---|
에일리어스 | IBM1100, CP1100, WE8DEC, csDECMCS, DEC |
언어 | 영어, 기타 여러 가지 |
확장 | US-ASCII |
에 의해 성공자 | ISO 8859-1, LICS, BrasSCII, Cork 부호화 |
Multinational Character Set(DMCS 또는 MCS; 다국적 문자 세트)는, 1983년에 Digital Equipment Corporation(DEC; 디지털 이퀴먼트 코퍼레이션)에 의해서, 일반적인 VT220 단말기에서 사용하기 위해서 작성된 문자 부호화입니다.악센트 문자, 통화 기호 및 7비트 ASCII에서 누락된 기타 문자를 추가한 ASCII의 8비트 확장판입니다.이것은 VT220 National Replacement Character Set(NRCS;[1][2] 국가 교환 문자 집합)에 실장되어 있는 코드 페이지 중 하나일 뿐입니다.MCS는 [3][4]1992년부터 IBM 코드 페이지/CCSID 1100(Multinational Emulation)으로 등록되어 있습니다.관련된 정렬에 따라 Oracle에서는 WE8DEC, N8DEC, DK8DEC,[5][6] S8DEC 또는 SF8DEC라고 부릅니다.
이러한 "확장 ASCII" 집합은 일반적이지만(National Replacement Character Set은 12개 이상의 유럽 언어에 대한 집합을 제공함), MCS는 1985년[7] ECMA-94와 [8]1987년 ISO 8859-1의 시초가 된 특징을 가지고 있습니다.
ECMA-94, ISO 8859-1을 탑재한 MCS의 코드 차트 및 Unicode의 첫 번째 256 코드 포인트에는 차이점보다 많은 유사점이 있습니다.사용되지 않는 코드 포인트 외에 ISO 8859-1과의 차이는 다음과 같습니다.
MCS 코드 포인트 | 유니코드 매핑 | 성격 |
---|---|---|
0xA8 | U+00A4 | ¤ |
0xD7 | U+0152 | Œ |
0xDD | U+0178 | Ÿ |
0xF7 | U+0153 | œ |
0xFD | U+00FF | ÿ |
문자 집합
DEC 다국어 문자[3][9][10][11][12][13][14] 집합 | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
0_ | 없음 | SOH | STX | ETX | 전원 | ENQ | ACK | 벨 | BS | HT | LF | VT | FF | CR | 그렇게 | SI |
1_ | DLE | DC1 | DC2 | DC3 | DC4 | NAK | 동기 | ETB | 할 수 있다 | 전자파 | 후보선수 | ESC | FS | GS | RS | 미국 |
2_ | SP | ! | " | # | $ | % | & | ' | ( | ) | * | + | , | - | . | / |
3_ | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | : | ; | < > | = | > | ? |
4_ | @ | A | B | C | D | E | F | G | H | I | J | K | L | M | N | O |
5_ | P | Q | R | S | T | U | V | W | X | Y | Z | [ | \ | ] | ^ | _ |
6_ | ` | a | b | c | d | e | f | g | h | i | j | k | l | m | n | o |
7_ | p | q | r | s | t | u | v | w | x | y | z | { | } | ~ | 델 | |
8_ | IND | NEL | SSA | ESA | HTS | HTJ | VTS | PLD | PLU | 리 | SS2 | SS3 | ||||
9_ | DCS | PU1 | PU2 | STS | CCH | MW | SPA | EPA | CSI | 세인트 | OSC | PM | APC | |||
A_ | ¡ | ¢ | £ | ¥ | § | ¤ 00A4 | © | ª | « | |||||||
B_ | ° | ± | ² | ³ | µ | · | ¹ | º | » | ¼ | ½ | ¿ | ||||
C_ | à | 아아 | 」 | ã | ä | å | ᄋ | 츠 | è | 에 | ê | ë | ì | Ⅱ | Î | Ï |
D_ | ñ | Ò | ó | o | Õ | 외 | Œ 0152 | ø | Ù | u | Û | ü | Ÿ 0178 | ß | ||
E_ | 아 | 아 | ★ | ã | ä | å | æ | 츠 | è | 에 | ê | ë | ì | ii | î | ï |
F_ | ñ | ò | o | o | õ | ö | œ 0153 | ø | ù | u | û | ü | ÿ 00FF |
「 」를 참조해 주세요.
- 매우 유사한 문자 집합인 Lotus International Character Set(LICS; 국제 문자 집합)
- 매우 유사한 문자 집합인 BrasSCII
- 8 비트 DEC 그리스어 (코드 페이지 1287 )
- 8 비트 DEC 터키어 (코드 페이지 1288 )
- 8 비트 DEC 히브리어
- 8비트 DEC 키릴 문자(KOI-8 키릴 문자)
- 8 비트 DEC 스페셜 그래픽스 (VT100 선 그리기) (DEC-SPECIAL)
- 8비트 DEC 테크니컬 문자 집합 (DEC-TECHNICAL)
- DEC 한자(JIS X 0208)
레퍼런스
- ^ "VT220 Programmer Reference Manual" (2 ed.). Digital Equipment Corporation (DEC). 1984 [1983].
- ^ "TinyTERM Emulator — National Replacement Character Set (NRCS)". Century Software. Archived from the original on 2016-12-01. Retrieved 2016-12-01. [아쉬움]
- ^ a b "SBCS code page information - CPGID: 01100 / Name: Multinational Emulation". IBM Software: Globalization: Coded character sets and related resources: Code pages by CPGID: Code page identifiers. 1. IBM. 1992-10-01. Archived from the original on 2016-12-03. Retrieved 2016-12-02. [1] [2] [3]
- ^ "CCSID 1100 information document". Archived from the original on 2014-12-01.
- ^ Baird, Cathy; Chiba, Dan; Chu, Winson; Fan, Jessica; Ho, Claire; Law, Simon; Lee, Geoff; Linsley, Peter; Matsuda, Keni; Oscroft, Tamzin; Takeda, Shige; Tanaka, Linus; Tozawa, Makoto; Trute, Barry; Tsujimoto, Mayumi; Wu, Ying; Yau, Michael; Yu, Tim; Wang, Chao; Wong, Simon; Zhang, Weiran; Zheng, Lei; Zhu, Yan; Moore, Valarie (2002) [1996]. "Appendix A: Locale Data". Oracle9i Database Globalization Support Guide (PDF) (Release 2 (9.2) ed.). Oracle Corporation. Oracle A96529-01. Archived (PDF) from the original on 2017-02-14. Retrieved 2017-02-14.
- ^ "Oracle characterset descriptions for 9.2". Daylight Chemical Information Systems. 2017. Archived from the original on 2016-06-17. Retrieved 2017-02-14.
- ^ Standard ECMA-94: 8-bit Single-Byte Coded Graphic Character Set (PDF) (1 ed.). European Computer Manufacturers Association (ECMA). March 1985 [1984-12-14]. Archived (PDF) from the original on 2016-12-02. Retrieved 2016-12-01.
Since 1982 the urgency of the need for an 8-bit single-byte coded character set was recognized in ECMA as well as in ANSI/X3L2 and numerous working papers were exchanged between the two groups. In February 1984 ECMA TC1 submitted to ISO/TC97/SC2 a proposal for such a coded character set. At its meeting of April 1984 SC decided to submit to TC97 a proposal for a new item of work for this topic. Technical discussions during and after this meeting led TC1 to adopt the coding scheme proposed by X3L2. Part 1 of Draft International Standard DTS 8859 is based on this joint ANSI/ECMA proposal.... Adopted as an ECMA Standard by the General Assembly of Dec. 13–14, 1984.
- ^ Czyborra, Roman (1998). "ISO 8859-1 and MCS". ISO 8859 Alphabet Soup. Archived from the original on 2016-12-01. Retrieved 2016-12-01. [4] [5]
- ^ "VT220 Programmer Reference Manual". Digital Equipment Corporation (DEC). Table 2-3: DEC Multinational Character Set (C1 and GR Codes). Retrieved 2016-12-02.
- ^ VAX/VMS User's Manual. Digital Equipment Corporation (DEC). April 1986. AI-Y517A-TE.
- ^ DEC (February 1992) [November 1989]. "Chapter 2: Character Encoding - DEC Supplemental Graphic Character Set". VT420 Programmer Reference Manual (PDF) (2 ed.). Digital Equipment Corporation. pp. 24–25. EK–VT420–RM.002. Archived (PDF) from the original on 2017-01-29. Retrieved 2017-01-29.
- ^ Flohr, Guido (2016) [2006]. "Locale::RecodeData::DEC_MCS - Conversion routines for DEC_MCS". CPAN libintl-perl. 1.0. Archived from the original on 2017-01-14. Retrieved 2017-01-14.
- ^ Kostis, Kosta. "DEC Multinational Character Set (DEC MCS)". 1.20. Archived from the original on 2017-01-16. Retrieved 2017-01-16.
- ^ Cowan, John Woldemar (1999-07-07). "DEC Multinational Character Set (1987) to Unicode". 0.1. Unicode, Inc. Archived from the original on 2017-02-18. Retrieved 2017-02-18.