라틴-1 보충판(유니코드 블록)
Latin-1 Supplement (Unicode block)C1 제어 및 라틴-1 보충판 | |
---|---|
범위 | U+0080..U+00FF (암호 코드 포인트) |
평면 | BMP |
스크립트 | 라틴어(64자) 공통(64자) |
주요 문자 | 프랑스어 독일어 아이슬란드어 스페인어 |
기호 집합 | 구두점 수학 통화 |
맡겨진 | 128개 코드 포인트 33 제어 또는 형식 |
사용되지 않음 | 예약된 코드 포인트 0개 |
소스 표준 | ISO/IEC 8859-1 |
유니코드 버전 기록 | |
1.0.0 (1991) | 128 (+128) |
참고: |
라틴-1 보충판(C1 Controls and Latin-1 보충판이라고도 함)은 유니코드 표준의 두 번째 유니코드 블록이다. ISO 8859-1: 80(U+0080) - FF(U+00FF)의 상위 범위를 인코딩한다. 컨트롤 C1(0080–009F)은 그래픽이 아니다. 이 블록의 범위는 U+0080에서 U+00FF까지이며 128자를 포함하고 있으며 C1 제어장치, 라틴-1 문장 부호 및 기호, 30쌍의 불가결한 악센트 라틴 문자 및 2개의 수학적 연산자를 포함한다.
C1 컨트롤과 라틴-1 보충 블록은 유니코드 표준 1.0 버전 이후 동일한 문자 레퍼토리로 현재 형태에 포함되었다.[3] 유니코드 1.0의 그것의 블록 이름은 단순히 라틴어1이었다.[4]
문자표
코드 | 결과 | 설명 | 약어 |
---|---|---|---|
C1 컨트롤 | |||
U+0080 | 패딩 문자 | 패드 | |
U+0081 | 하이 옥텟 사전 설정 | 깡충깡 | |
U+0082 | 여기서 브레이크 허용됨 | BPH | |
U+0083 | 여기서 끊기면 안 함 | NBH | |
U+0084 | 색인 | 인디아 | |
U+0085 | 넥스트 라인 | 넬 | |
U+0086 | 선택한 영역의 시작 | SSA | |
U+0087 | 선택한 영역의 끝 | ESA | |
U+0088 | 문자(수평) 표 집합 | HTS | |
U+0089 | 맞춤이 있는 문자(수평) 표 | HTJ | |
U+008A | 선(수직) 표 집합 | LTS | |
U+008B | 부분 선 앞쪽(아래쪽) | PLD | |
U+008C | 부분 라인 후진(위) | PLU | |
U+008D | 리버스 라인 피드(색인) | RI | |
U+008E | 싱글 시프트 2 | SS2 | |
U+008F | 싱글 시프트 3 | SS3 | |
U+0090 | 장치 제어 문자열 | DCS | |
U+0091 | 개인용도원 | PU1 | |
U+0092 | 개인 용도 2 | PU2 | |
U+0093 | 전송 상태 설정 | STS | |
U+0094 | 캐릭터 취소 | CCH | |
U+0095 | 메시지 대기 중 | MW | |
U+0096 | 보호구역 시작 | SPA | |
U+0097 | 보호 구역 끝 | EPA | |
U+0098 | 문자열의 시작 | SOS | |
U+0099 | 싱글 그래픽 캐릭터 소개서 | SGCI | |
U+009A | 싱글 캐릭터 소개서 | SCI | |
U+009B | 제어 시퀀스 소개기 | CSI | |
U+009C | 문자열 터미네이터 | 세인트 | |
U+009D | 운영 체제 명령 | OSC | |
U+009E | 개인 메시지 | PM | |
U+009F | 응용 프로그램 명령 | APC | |
라틴-1 구두점 및 기호 | |||
U+00A0 | 깨지지 않는 공간 | NBSP | |
U+00A1 | ¡ | 반전 느낌표 | |
U+00A2 | ¢ | 센트 기호 | |
U+00A3 | £ | 파운드 기호 | |
U+00A4 | ¤ | 통화 기호 | |
U+00A5 | ¥ | 엔 부호 | |
U+00A6 | ¦ | 부러진 막대 | |
U+00A7 | § | 단면 기호 | |
U+00A8 | ¨ | 디아레시스 | |
U+00A9 | © | 저작권 기호 | |
U+00AA | ª | 여성 서수 표시기 | |
U+00AB | « | 좌점 2각 따옴표 | |
U+00AC | ¬ | 부호 없음 | |
U+00AD | 소프트 하이픈 | 샤이 | |
U+00AE | ® | 등록 기호 | |
U+00AF | ¯ | 마크롱 | |
U+00B0 | ° | 도 기호 | |
U+00B1 | ± | 플러스마이너스 부호 | |
U+00B2 | ² | 위첨자 2 | |
U+00B3 | ³ | 위첨자 3 | |
U+00B4 | ´ | 급성 사투리 | |
U+00B5 | µ | 마이크로 부호 | |
U+00B6 | 필라우 부호 | ||
U+00B7 | · | 중간점 | |
U+00B8 | ¸ | 세딜라 | |
U+00B9 | ¹ | 위첨자 1 | |
U+00BA | º | 남성 서수 표시기 | |
U+00BB | » | 오른쪽을 가리키는 이중각 따옴표 | |
U+00BC | ¼ | 저속분수 1/4 | |
U+00BD | ½ | 저속분수 1/2 | |
U+00BE | ¾ | 저속분수 3/4 | |
U+00BF | ¿ | 반전 물음표 | |
편지들 | |||
U+00C0 | À | 무덤이 있는 라틴어 대문자 A | |
U+00C1 | Á | 라틴 대문자 A(급성 포함) | |
U+00C2 | Â | 라틴 대문자 A(원곡선 포함) | |
U+00C3 | Ã | 라틴 대문자 A와 tilde. | |
U+00C4 | Ä | 라틴 대문자 A(다이아레시스 포함) | |
U+00C5 | Å | 위에 링이 있는 라틴 대문자 A | |
U+00C6 | Æ | 라틴 대문자 AE | |
U+00C7 | Ç | 라틴 대문자 C(세딜라 포함) | |
U+00C8 | È | 라틴 대문자 E(무덤 포함 | |
U+00C9 | É | 라틴 대문자 E(급성 포함) | |
U+00CA | Ê | 라틴 대문자 E(원곡선 포함) | |
U+00CB | Ë | 라틴 대문자 E(다이아레시스 포함) | |
U+00CC | Ì | 라틴어 대문자 I과 무덤 | |
U+00CD | Í | 라틴어 대문자 I(급성 포함) | |
U+00CE | Î | 라틴어 대문자 I(원곡선 포함) | |
U+00CF | Ï | 라틴어 대문자 I(다이아레시스 포함) | |
U+00D0 | Ð | 라틴어 대문자 Eth | |
U+00D1 | Ñ | 라틴 대문자 N과 tilde | |
U+00D2 | Ò | 무덤이 있는 라틴 대문자 O | |
U+00D3 | Ó | 라틴 대문자 O(급성 포함) | |
U+00D4 | Ô | 라틴 대문자 O(원곡선 포함) | |
U+00D5 | Õ | 라틴 대문자 O와 tilde | |
U+00D6 | Ö | 라틴 대문자 O(다이아레시스 포함) | |
수학적 연산자 | |||
U+00D7 | × | 곱셈 부호 | |
편지들 | |||
U+00D8 | Ø | 스트로크가 있는 라틴 대문자 O | |
U+00D9 | Ù | 라틴 대문자 U자(무덤 포함) | |
U+00DA | Ú | 라틴 대문자 U(급성 포함) | |
U+00DB | Û | Hatin Capital Letter U(원곡선 포함) | |
U+00DC | Ü | 라틴 대문자 U(다이아레시스 포함) | |
U+00DD | Ý | 라틴 대문자 Y(급성 | |
U+00DE | Þ | 라틴 대문자 가시 | |
U+00DF | ß | 라틴 스몰 레터 샤프 S | |
U+00E0 | à | 무덤이 있는 라틴어 작은 글자 A | |
U+00E1 | á | 라틴어 작은 글자 A(급성 포함) | |
U+00E2 | â | 라틴어 작은 글자 A(원곡선 포함) | |
U+00E3 | ã | 글씨가 있는 라틴어 작은 글자 A | |
U+00E4 | ä | 라틴어 작은 글자 A(다이아레시스 포함) | |
U+00E5 | å | 위에 링이 있는 라틴어 작은 글자 A | |
U+00E6 | æ | 라틴 문자 AE | |
U+00E7 | ç | 세딜라가 있는 라틴어 작은 글자 C | |
U+00E8 | è | 무덤이 있는 라틴어 작은 글자 E | |
U+00E9 | é | 라틴어 작은 글자 E(급성 포함) | |
U+00EA | ê | 라틴어 작은 글자 E(원곡선 포함) | |
U+00EB | ë | 라틴어 작은 글자 E(다이아레시스 포함) | |
U+00EC | ì | 무덤이 있는 라틴어 작은 글자 1 | |
U+00ED | í | 급성 Latin Small Letter I | |
U+00EE | î | 라틴어 작은 글자 I(원곡선 포함) | |
U+00EF | ï | 라틴어 작은 글자 I(다이아레시스 포함) | |
U+00F0 | ð | 라틴 스몰 레터 에트 | |
U+00F1 | ñ | 라틴어 작은 글자 N(틸드 포함) | |
U+00F2 | ò | 무덤이 있는 라틴어 작은 글자 O | |
U+00F3 | ó | 라틴어 작은 글자 O(급성 포함) | |
U+00F4 | ô | 라틴어 작은 글자 O(원곡선 포함) | |
U+00F5 | õ | 라틴어 작은 글자 O와 tilde 포함 | |
U+00F6 | ö | 라틴어 작은 글자 O(다이아레시스 포함) | |
수학적 연산자 | |||
U+00F7 | ÷ | 분할 기호 | |
편지들 | |||
U+00F8 | ø | 스트로크가 있는 라틴어 작은 글자 O | |
U+00F9 | ù | 무덤이 있는 라틴 스몰 레터 | |
U+00FA | ú | 급성 Latin Small Letter U | |
U+00FB | û | 라틴 소문자 U(원곡선 포함) | |
U+00FC | ü | 라틴어 작은 글자 U(다이아레시스 포함) | |
U+00FD | ý | 라틴어 작은 문자 Y(급성 포함) | |
U+00FE | þ | 라틴 작은 글자 가시 | |
U+00FF | ÿ | 라틴어 작은 문자 Y(다이아레시스 포함) |
부제목
C1 Controls 및 Latin-1 보충 블록에는 C1 컨트롤, Latin-1 문장 부호, 문자 및 Mathematical 연산자의 네 가지 하위 제목이 있다.[5]
C1 제어 장치
C1 제어 서브헤딩에는 ISO/IEC 8859-1에서 상속된 32개의 보조 제어 코드와 기타 많은 8비트 문자 표준이 포함되어 있다. C0 및 C1 제어 코드의 별칭 이름은 ISO/IEC 6429:1992에서 따왔다.[5]
라틴-1 구두점 및 기호
라틴-1 문장 부호 표제에는 반전된 느낌표와 물음표와 같은 32자의 공통 국제 문장 부호 및 중간 점, 그리고 통화 기호, 간격 분음부 표시, 저속한 분수 및 위첨자 번호와 같은 기호가 포함되어 있다.[5]
편지들
편지 부제목에는 서유럽 언어를 위한 30쌍의 불가분자, 마이너스자 악센트 또는 참신한 라틴어 문자와, 일반적으로 단어 초창기에 사용되지 않는 두 개의 엑스트라 빼어난 빼어난 빼어난 글자가 포함되어 있다.[5]
수학적 연산자
수학 연산자 부제목은 곱셈과 나누기 부호에 사용된다.[5]
기호, 문자 및 제어 코드 수
아래 표는 C1 제어 및 라틴-1 보충 블록의 각 하위 제목에 있는 각 문자, 기호 및 제어 코드 수를 보여준다.
부제목 유형 | 기호수 | 문자 범위 |
---|---|---|
C1 제어 장치 | 32개의 제어 코드 | U+0080 ~ U+009F |
라틴-1 구두점 및 기호 | 32 구두점 및 기호 | U+00A0에서 U+00BF로 |
편지들 | 30쌍의 불가분하고 미미한 라틴 문자 | U+00C0 ~ U+00D6, U+00D8 ~ U+00F6 및 U+00F8 ~ U+00FF |
수학적 연산자 | U+00D7 × 곱셈 부호 및 U+00F7 ÷ DIVEL SIGN 기호. | U+00D7 및 U+00F7 |
2. 라틴-1 보충판
C1 제어 및 라틴-1 보충판[1] 공식 유니코드 컨소시엄 코드 차트(PDF) | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
U+008x | XXX | XXX | BPH | NBH | 인디아 | 넬 | SSA | ESA | HTS | HTJ | VTS | PLD | PLU | RI | SS2 | SS3 |
U+009x | DCS | PU1 | PU2 | STS | CCH | MW | SPA | EPA | SOS | XXX | SCI | CSI | 세인트 | OSC | PM | APC |
U+00Ax | NBSP | ¡ | ¢ | £ | ¤ | ¥ | ¦ | § | ¨ | © | ª | « | ¬ | 샤이 | ® | ¯ |
U+00Bx | ° | ± | ² | ³ | ´ | µ | · | ¸ | ¹ | º | » | ¼ | ½ | ¾ | ¿ | |
U+00Cx | À | Á | Â | Ã | Ä | Å | Æ | Ç | È | É | Ê | Ë | Ì | Í | Î | Ï |
U+00Dx | Ð | Ñ | Ò | Ó | Ô | Õ | Ö | × | Ø | Ù | Ú | Û | Ü | Ý | Þ | ß |
U+00Ex | à | á | â | ã | ä | å | æ | ç | è | é | ê | ë | ì | í | î | ï |
U+00Fx | ð | ñ | ò | ó | ô | õ | ö | ÷ | ø | ù | ú | û | ü | ý | þ | ÿ |
1.^ 유니코드 버전 14.0 기준 |
에모지
라틴-1 보충 블록에는 두 개의 이모지가 포함되어 있다. U+00A9 및 U+00AE.[6][7]
블록에는 2개의 이모지에 대해 이모지 스타일(U+FE0F VS16) 또는 텍스트 표시(U+FE0E VS15)를 지정하도록 정의된 4개의 표준 변형이 있으며, 이 두 가지 모두 텍스트 표시로 기본 설정된다.[8]
U+ | 00A9 | 00AE |
기준코드 포인트 | © | ® |
base+VS15(텍스트) | ©︎ | ®︎ |
base+VS16(에모지) | ©️ | ®️ |
역사
다음의 유니코드 관련 문서는 라틴-1 보충 블록에 특정 문자를 정의하기 위한 목적과 과정을 기록한다.
버전 | 최종코드 포인트[a] | 카운트 | L2 ID | WG2 ID | 문서 |
---|---|---|---|---|---|
1.0.0 | U+0080..009층 | 32 | X3L2/95-002 | PDAM No. 3 to ISO/IEC 10646-1 on coding of C1 controls, 1994-11-01 | |
X3L2/95-028 | N1148 | Nine tables of replies to repeated/extended votes, 1995-02-22 | |||
N1203년 | Umamaheswaran, V. S.; Ksar, Mike (1995-05-03), "5.3", Unconfirmed minutes of SC2/WG2 Meeting 27, Geneva | ||||
X3L2/95-061 | DAM no.3 to ISO/IEC 10646-1 (Coding of C1 controls), 1995-06-01 | ||||
N1307 | Table of replies to JTC1 letter ballot on 10646 DAM 3, Coding of C1 Controls, (SC2 N 2666), 1996-01-15 | ||||
N1309 | Paterson, Bruce (1996-01-17), Report and Disposition of Comments on DAM 1, UTF 16 and DAM 2, UTF-8, DAM 3, Coding of C1 Controls, and DAM 4, Removal of Annex G: UTF1 | ||||
N1312년 | Paterson, Bruce (1996-01-17), Draft Final Text of 10646 AMD-3, Coding of C1 Controls | ||||
L2/99-048 | Umamaheswaran, V. S. (1999-02-04), C1 controls in the code charts | ||||
L2/99-054r | Aliprand, Joan (1999-06-21), "C1 Controls", Approved Minutes from the UTC/L2 meeting in Palo Alto, February 3-5, 1999 | ||||
N3046 | Suignard, Michel (2006-02-22), Improving formal definition for control characters | ||||
N3103(pdf, doc) | Umamaheswaran, V. S. (2006-08-25), "M48.33", Unconfirmed minutes of WG 2 meeting 48, Mountain View, CA, USA; 2006-04-24/27 | ||||
U+00A0..00FF | 96 | (확정) | |||
X3L2/94-077 | N994년 | Davis, Mark (1994-03-03), ISO/IEC 10646-1 - Proposed Draft Corrigendum 1 | |||
X3L2/94-098 | N1033(pdf, doc) | Umamaheswaran, V. S.; Ksar, Mike (1994-06-01), "8.1.15", Unconfirmed Minutes of ISO/IEC JTC 1/SC 2/WG 2 Meeting 25, Falez Hotel, Antalya, Turkey, 1994-04-18--22 | |||
L2/11-016 | Moore, Lisa (2011-02-15), "Correct mistakes in property assignments for super and subscripted letters (B.13.4) [U+00AA, U+00BA]", UTC #126 / L2 #223 Minutes | ||||
L2/11-116 | Moore, Lisa (2011-05-17), "Consensus 127-C14", UTC #127 / L2 #224 Minutes, Change the general category of to U+00AA FEMININE ORDINAL INDICATOR and U+00BA MASCULINE ORDINAL INDICATOR "Lo" for Unicode 6.1. | ||||
L2/11-261R2 | Moore, Lisa (2011-08-16), "Consensus 128-C6", UTC #128 / L2 #225 Minutes, Change the general category from "So" to "Po" ... [U+00A7 and U+00B6] | ||||
L2/15-050R[b][c] | Davis, Mark; et al. (2015-01-29), Additional variation selectors for emoji | ||||
|
참고 항목
참조
- ^ "Unicode character database". The Unicode Standard. Retrieved 2016-07-09.
- ^ "Enumerated Versions of The Unicode Standard". The Unicode Standard. Retrieved 2016-07-09.
- ^ The Unicode Standard Version 1.0, Volume 1. Addison-Wesley Publishing Company, Inc. 1991 [1990]. ISBN 0-201-56788-1.
- ^ "3.8: Block-by-Block Charts" (PDF). The Unicode Standard. version 1.0. Unicode Consortium.
- ^ a b c d e "Unicode 6.2 code charts" (PDF). The Unicode Standard. Retrieved 1 April 2013.
- ^ "UTR #51: Unicode Emoji". Unicode Consortium. 2020-02-11.
- ^ "UCD: Emoji Data for UTR #51". Unicode Consortium. 2021-08-26.
- ^ "UTS #51 Emoji Variation Sequences". The Unicode Consortium.