라틴-1 보충판(유니코드 블록)

Latin-1 Supplement (Unicode block)
C1 제어 및 라틴-1 보충판
범위U+0080..U+00FF
(암호 코드 포인트)
평면BMP
스크립트라틴어(64자)
공통(64자)
주요 문자프랑스어
독일어
아이슬란드어
스페인어
기호 집합구두점
수학
통화
맡겨진128개 코드 포인트
33 제어 또는 형식
사용되지 않음예약된 코드 포인트 0개
소스 표준ISO/IEC 8859-1
유니코드 버전 기록
1.0.0 (1991)128 (+128)
참고:

라틴-1 보충판(C1 Controls and Latin-1 보충판이라고도 함)은 유니코드 표준의 두 번째 유니코드 블록이다. ISO 8859-1: 80(U+0080) - FF(U+00FF)의 상위 범위를 인코딩한다. 컨트롤 C1(0080–009F)은 그래픽이 아니다. 이 블록의 범위는 U+0080에서 U+00FF까지이며 128자를 포함하고 있으며 C1 제어장치, 라틴-1 문장 부호 기호, 30쌍의 불가결악센트 라틴 문자 및 2개의 수학적 연산자를 포함한다.

C1 컨트롤과 라틴-1 보충 블록은 유니코드 표준 1.0 버전 이후 동일한 문자 레퍼토리로 현재 형태에 포함되었다.[3] 유니코드 1.0의 그것의 블록 이름은 단순히 라틴어1이었다.[4]

문자표

코드 결과 설명 약어
C1 컨트롤
U+0080 패딩 문자 패드
U+0081 하이 옥텟 사전 설정 깡충깡
U+0082 여기서 브레이크 허용됨 BPH
U+0083 여기서 끊기면 안 함 NBH
U+0084 색인 인디아
U+0085 넥스트 라인
U+0086 선택한 영역의 시작 SSA
U+0087 선택한 영역의 끝 ESA
U+0088 문자(수평) 표 집합 HTS
U+0089 맞춤이 있는 문자(수평) 표 HTJ
U+008A 선(수직) 표 집합 LTS
U+008B 부분 선 앞쪽(아래쪽) PLD
U+008C 부분 라인 후진(위) PLU
U+008D 리버스 라인 피드(색인) RI
U+008E 싱글 시프트 2 SS2
U+008F 싱글 시프트 3 SS3
U+0090 장치 제어 문자열 DCS
U+0091 개인용도원 PU1
U+0092 개인 용도 2 PU2
U+0093 전송 상태 설정 STS
U+0094 캐릭터 취소 CCH
U+0095 메시지 대기 중 MW
U+0096 보호구역 시작 SPA
U+0097 보호 구역 끝 EPA
U+0098 문자열의 시작 SOS
U+0099 싱글 그래픽 캐릭터 소개서 SGCI
U+009A 싱글 캐릭터 소개서 SCI
U+009B 제어 시퀀스 소개기 CSI
U+009C 문자열 터미네이터 세인트
U+009D 운영 체제 명령 OSC
U+009E 개인 메시지 PM
U+009F 응용 프로그램 명령 APC
라틴-1 구두점 및 기호
U+00A0 깨지지 않는 공간 NBSP
U+00A1 ¡ 반전 느낌표
U+00A2 ¢ 센트 기호
U+00A3 £ 파운드 기호
U+00A4 ¤ 통화 기호
U+00A5 ¥ 엔 부호
U+00A6 ¦ 부러진 막대
U+00A7 § 단면 기호
U+00A8 ¨ 디아레시스
U+00A9 © 저작권 기호
U+00AA ª 여성 서수 표시기
U+00AB « 좌점 2각 따옴표
U+00AC ¬ 부호 없음
U+00AD 소프트 하이픈 샤이
U+00AE ® 등록 기호
U+00AF ¯ 마크롱
U+00B0 ° 도 기호
U+00B1 ± 플러스마이너스 부호
U+00B2 ² 위첨자 2
U+00B3 ³ 위첨자 3
U+00B4 ´ 급성 사투리
U+00B5 µ 마이크로 부호
U+00B6 필라우 부호
U+00B7 · 중간점
U+00B8 ¸ 세딜라
U+00B9 ¹ 위첨자 1
U+00BA º 남성 서수 표시기
U+00BB » 오른쪽을 가리키는 이중각 따옴표
U+00BC ¼ 저속분수 1/4
U+00BD ½ 저속분수 1/2
U+00BE ¾ 저속분수 3/4
U+00BF ¿ 반전 물음표
편지들
U+00C0 À 무덤이 있는 라틴어 대문자 A
U+00C1 Á 라틴 대문자 A(급성 포함)
U+00C2 Â 라틴 대문자 A(원곡선 포함)
U+00C3 Ã 라틴 대문자 A와 tilde.
U+00C4 Ä 라틴 대문자 A(다이아레시스 포함)
U+00C5 Å 위에 링이 있는 라틴 대문자 A
U+00C6 Æ 라틴 대문자 AE
U+00C7 Ç 라틴 대문자 C(세딜라 포함)
U+00C8 È 라틴 대문자 E(무덤 포함
U+00C9 É 라틴 대문자 E(급성 포함)
U+00CA Ê 라틴 대문자 E(원곡선 포함)
U+00CB Ë 라틴 대문자 E(다이아레시스 포함)
U+00CC Ì 라틴어 대문자 I과 무덤
U+00CD Í 라틴어 대문자 I(급성 포함)
U+00CE Î 라틴어 대문자 I(원곡선 포함)
U+00CF Ï 라틴어 대문자 I(다이아레시스 포함)
U+00D0 Ð 라틴어 대문자 Eth
U+00D1 Ñ 라틴 대문자 N과 tilde
U+00D2 Ò 무덤이 있는 라틴 대문자 O
U+00D3 Ó 라틴 대문자 O(급성 포함)
U+00D4 Ô 라틴 대문자 O(원곡선 포함)
U+00D5 Õ 라틴 대문자 O와 tilde
U+00D6 Ö 라틴 대문자 O(다이아레시스 포함)
수학적 연산자
U+00D7 × 곱셈 부호
편지들
U+00D8 Ø 스트로크가 있는 라틴 대문자 O
U+00D9 Ù 라틴 대문자 U자(무덤 포함)
U+00DA Ú 라틴 대문자 U(급성 포함)
U+00DB Û Hatin Capital Letter U(원곡선 포함)
U+00DC Ü 라틴 대문자 U(다이아레시스 포함)
U+00DD Ý 라틴 대문자 Y(급성
U+00DE Þ 라틴 대문자 가시
U+00DF ß 라틴 스몰 레터 샤프 S
U+00E0 à 무덤이 있는 라틴어 작은 글자 A
U+00E1 á 라틴어 작은 글자 A(급성 포함)
U+00E2 â 라틴어 작은 글자 A(원곡선 포함)
U+00E3 ã 글씨가 있는 라틴어 작은 글자 A
U+00E4 ä 라틴어 작은 글자 A(다이아레시스 포함)
U+00E5 å 위에 링이 있는 라틴어 작은 글자 A
U+00E6 æ 라틴 문자 AE
U+00E7 ç 세딜라가 있는 라틴어 작은 글자 C
U+00E8 è 무덤이 있는 라틴어 작은 글자 E
U+00E9 é 라틴어 작은 글자 E(급성 포함)
U+00EA ê 라틴어 작은 글자 E(원곡선 포함)
U+00EB ë 라틴어 작은 글자 E(다이아레시스 포함)
U+00EC ì 무덤이 있는 라틴어 작은 글자 1
U+00ED í 급성 Latin Small Letter I
U+00EE î 라틴어 작은 글자 I(원곡선 포함)
U+00EF ï 라틴어 작은 글자 I(다이아레시스 포함)
U+00F0 ð 라틴 스몰 레터 에트
U+00F1 ñ 라틴어 작은 글자 N(틸드 포함)
U+00F2 ò 무덤이 있는 라틴어 작은 글자 O
U+00F3 ó 라틴어 작은 글자 O(급성 포함)
U+00F4 ô 라틴어 작은 글자 O(원곡선 포함)
U+00F5 õ 라틴어 작은 글자 O와 tilde 포함
U+00F6 ö 라틴어 작은 글자 O(다이아레시스 포함)
수학적 연산자
U+00F7 ÷ 분할 기호
편지들
U+00F8 ø 스트로크가 있는 라틴어 작은 글자 O
U+00F9 ù 무덤이 있는 라틴 스몰 레터
U+00FA ú 급성 Latin Small Letter U
U+00FB û 라틴 소문자 U(원곡선 포함)
U+00FC ü 라틴어 작은 글자 U(다이아레시스 포함)
U+00FD ý 라틴어 작은 문자 Y(급성 포함)
U+00FE þ 라틴 작은 글자 가시
U+00FF ÿ 라틴어 작은 문자 Y(다이아레시스 포함)

부제목

C1 Controls 및 Latin-1 보충 블록에는 C1 컨트롤, Latin-1 문장 부호, 문자 및 Mathematical 연산자의 네 가지 하위 제목이 있다.[5]

C1 제어 장치

C1 제어 서브헤딩에는 ISO/IEC 8859-1에서 상속된 32개의 보조 제어 코드와 기타 많은 8비트 문자 표준이 포함되어 있다. C0 및 C1 제어 코드의 별칭 이름은 ISO/IEC 6429:1992에서 따왔다.[5]

라틴-1 구두점 및 기호

라틴-1 문장 부호 표제에는 반전된 느낌표와 물음표와 같은 32자의 공통 국제 문장 부호 및 중간 점, 그리고 통화 기호, 간격 분음부 표시, 저속한 분수 및 위첨자 번호와 같은 기호가 포함되어 있다.[5]

편지들

편지 부제목에는 서유럽 언어를 위한 30쌍의 불가분자, 마이너스자 악센트 또는 참신한 라틴어 문자와, 일반적으로 단어 초창기에 사용되지 않는 두 개의 엑스트라 빼어난 빼어난 빼어난 글자가 포함되어 있다.[5]

수학적 연산자

수학 연산자 부제목은 곱셈과 나누기 부호에 사용된다.[5]

기호, 문자 및 제어 코드 수

아래 표는 C1 제어 및 라틴-1 보충 블록의 각 하위 제목에 있는 각 문자, 기호 및 제어 코드 수를 보여준다.

부제목 유형 기호수 문자 범위
C1 제어 장치 32개의 제어 코드 U+0080 ~ U+009F
라틴-1 구두점 및 기호 32 구두점 및 기호 U+00A0에서 U+00BF로
편지들 30쌍의 불가분하고 미미한 라틴 문자 U+00C0 ~ U+00D6, U+00D8 ~ U+00F6 및 U+00F8 ~ U+00FF
수학적 연산자 U+00D7 × 곱셈 부호U+00F7 ÷ DIVEL SIGN 기호. U+00D7 및 U+00F7

2. 라틴-1 보충판

C1 제어 및 라틴-1 보충판[1]
공식 유니코드 컨소시엄 코드 차트(PDF)
0 1 2 3 4 5 6 7 8 9 A B C D E F
U+008x XXX XXX BPH NBH 인디아 SSA ESA HTS HTJ VTS PLD PLU RI SS2 SS3
U+009x DCS PU1 PU2 STS CCH MW SPA EPA SOS XXX SCI CSI 세인트 OSC PM APC
U+00Ax NBSP ¡ ¢ £ ¤ ¥ ¦ § ¨ © ª « ¬ 샤이 ® ¯
U+00Bx ° ± ² ³ ´ µ · ¸ ¹ º » ¼ ½ ¾ ¿
U+00Cx À Á Â Ã Ä Å Æ Ç È É Ê Ë Ì Í Î Ï
U+00Dx Ð Ñ Ò Ó Ô Õ Ö × Ø Ù Ú Û Ü Ý Þ ß
U+00Ex à á â ã ä å æ ç è é ê ë ì í î ï
U+00Fx ð ñ ò ó ô õ ö ÷ ø ù ú û ü ý þ ÿ
1.^ 유니코드 버전 14.0 기준

에모지

라틴-1 보충 블록에는 두 개의 이모지가 포함되어 있다. U+00A9 및 U+00AE.[6][7]

블록에는 2개의 이모지에 대해 이모지 스타일(U+FE0F VS16) 또는 텍스트 표시(U+FE0E VS15)를 지정하도록 정의된 4개의 표준 변형이 있으며, 이 두 가지 모두 텍스트 표시로 기본 설정된다.[8]

이모지변동순서
U+ 00A9 00AE
기준코드 포인트 © ®
base+VS15(텍스트) ©︎ ®︎
base+VS16(에모지) ©️ ®️

역사

다음의 유니코드 관련 문서는 라틴-1 보충 블록에 특정 문자를 정의하기 위한 목적과 과정을 기록한다.

버전 최종코드 포인트[a] 카운트 L2 ID WG2 ID 문서
1.0.0 U+0080..009층 32 X3L2/95-002 PDAM No. 3 to ISO/IEC 10646-1 on coding of C1 controls, 1994-11-01
X3L2/95-028 N1148 Nine tables of replies to repeated/extended votes, 1995-02-22
N1203년 Umamaheswaran, V. S.; Ksar, Mike (1995-05-03), "5.3", Unconfirmed minutes of SC2/WG2 Meeting 27, Geneva
X3L2/95-061 DAM no.3 to ISO/IEC 10646-1 (Coding of C1 controls), 1995-06-01
N1307 Table of replies to JTC1 letter ballot on 10646 DAM 3, Coding of C1 Controls, (SC2 N 2666), 1996-01-15
N1309 Paterson, Bruce (1996-01-17), Report and Disposition of Comments on DAM 1, UTF 16 and DAM 2, UTF-8, DAM 3, Coding of C1 Controls, and DAM 4, Removal of Annex G: UTF1
N1312년 Paterson, Bruce (1996-01-17), Draft Final Text of 10646 AMD-3, Coding of C1 Controls
L2/99-048 Umamaheswaran, V. S. (1999-02-04), C1 controls in the code charts
L2/99-054r Aliprand, Joan (1999-06-21), "C1 Controls", Approved Minutes from the UTC/L2 meeting in Palo Alto, February 3-5, 1999
N3046 Suignard, Michel (2006-02-22), Improving formal definition for control characters
N3103(pdf, doc) Umamaheswaran, V. S. (2006-08-25), "M48.33", Unconfirmed minutes of WG 2 meeting 48, Mountain View, CA, USA; 2006-04-24/27
U+00A0..00FF 96 (확정)
X3L2/94-077 N994년 Davis, Mark (1994-03-03), ISO/IEC 10646-1 - Proposed Draft Corrigendum 1
X3L2/94-098 N1033(pdf, doc) Umamaheswaran, V. S.; Ksar, Mike (1994-06-01), "8.1.15", Unconfirmed Minutes of ISO/IEC JTC 1/SC 2/WG 2 Meeting 25, Falez Hotel, Antalya, Turkey, 1994-04-18--22
L2/11-016 Moore, Lisa (2011-02-15), "Correct mistakes in property assignments for super and subscripted letters (B.13.4) [U+00AA, U+00BA]", UTC #126 / L2 #223 Minutes
L2/11-116 Moore, Lisa (2011-05-17), "Consensus 127-C14", UTC #127 / L2 #224 Minutes, Change the general category of to U+00AA FEMININE ORDINAL INDICATOR and U+00BA MASCULINE ORDINAL INDICATOR "Lo" for Unicode 6.1.
L2/11-261R2 Moore, Lisa (2011-08-16), "Consensus 128-C6", UTC #128 / L2 #225 Minutes, Change the general category from "So" to "Po" ... [U+00A7 and U+00B6]
L2/15-050R[b][c] Davis, Mark; et al. (2015-01-29), Additional variation selectors for emoji
  1. ^ 제안된 코드 포인트 및 문자 이름은 최종 코드 포인트 및 이름과 다를 수 있음
  2. ^ L2/13-207, L2/14-054, L2/14-063, L2/15-051A, L2/15-051B를 참조하십시오.
  3. ^ 추가 이모티콘 관련 문서는 기타 기호 및 픽토그래프 블록의 기록 섹션을 참조하십시오.

참고 항목

참조

  1. ^ "Unicode character database". The Unicode Standard. Retrieved 2016-07-09.
  2. ^ "Enumerated Versions of The Unicode Standard". The Unicode Standard. Retrieved 2016-07-09.
  3. ^ The Unicode Standard Version 1.0, Volume 1. Addison-Wesley Publishing Company, Inc. 1991 [1990]. ISBN 0-201-56788-1.
  4. ^ "3.8: Block-by-Block Charts" (PDF). The Unicode Standard. version 1.0. Unicode Consortium.
  5. ^ a b c d e "Unicode 6.2 code charts" (PDF). The Unicode Standard. Retrieved 1 April 2013.
  6. ^ "UTR #51: Unicode Emoji". Unicode Consortium. 2020-02-11.
  7. ^ "UCD: Emoji Data for UTR #51". Unicode Consortium. 2021-08-26.
  8. ^ "UTS #51 Emoji Variation Sequences". The Unicode Consortium.