기본 라틴어(유니코드 블록)

Basic Latin (Unicode block)
C0 제어기본 라틴어
범위U+0000..U+007F
(암호 코드 포인트)
평면BMP
스크립트라틴어(52자)
공통(76자)
주요 문자영어
프랑스어
독일어
스페인어
베트남의
기호 집합아라비아 숫자
구두점
맡겨진128개 코드 포인트
33 제어 또는 형식
사용되지 않음예약된 코드 포인트 0개
소스 표준ISO/IEC 8859, ISO 646
유니코드 버전 기록
1.0.0 (1991)128 (+128)
참고:

기본 라틴어 또는 C0 제어기본 라틴 유니코드 블록유니코드 표준의 첫 번째 블록이며, UTF-8에서 1바이트로 인코딩되는 유일한 블록이다. 블록에는 ASCII 인코딩의 모든 문자제어 코드가 들어 있다. U+0000 ~ U+007F의 범위에는 128자의 문자가 포함되며, C0 컨트롤, ASCII 문장 부호 및 기호, ASCII 자릿수, 영문자 대문자소문자, 제어 문자를 포함한다.

기본 라틴어 블록은 문자 레퍼토리를 추가하거나 변경하지 않고 유니코드 표준 1.0.0 버전부터 현재 형태에 포함되었다.[3] 유니코드 1.0의 블록 이름은 ASCII였다.[4]

문자표

코드 결과 설명 약어
C0 컨트롤
U+0000 Null 문자 NUL
U+0001 제목 시작 SOH
U+0002 텍스트 시작 STX
U+0003 텍스트 끝 문자 ETX
U+0004 전송 종료 문자 EOT
U+0005 문의성격 ENQ
U+0006 확인 문자 ACK
U+0007 벨 문자
U+0008 백스페이스 BS
U+0009 수평 탭 HT
U+000A 라인피드 LF
U+000B 세로 탭 VT
U+000C 폼피드 FF
U+000D 캐리지 리턴 CR
U+000E Shift Out 그렇게
U+000F Shift In SI
U+0010 데이터 링크 이스케이프 DLE
U+0011 장치 제어 1 DC1
U+0012 장치 제어 2 DC2
U+0013 장치 제어 3 DC3
U+0014 장치 제어 4 DC4
U+0015 부정승인 문자 NAK
U+0016 동기식 유휴 상태 SYN
U+0017 변속기 블록 끝 ETB
U+0018 캐릭터 취소
U+0019 중간 끝 EM
U+001A 대체 문자 후보선수
U+001B 이스케이프 캐릭터 ESC
U+001C 파일 구분자 FS
U+001D 그룹 구분 기호 GS
U+001E 기록 구분 기호 RS
U+001F 단위 구분 기호 미국
ASCII 구두점 및 기호
U+0020 공간 SP
U+0021 ! 느낌표 EXC
U+0022 " 따옴표 현상
U+0023 # 번호 기호
U+0024 $ 달러 기호
U+0025 % 백분율 기호
U+0026 & 앰퍼샌드
U+0027 ' 아포스트로피
U+0028 ( 왼쪽 괄호
U+0029 ) 오른쪽 괄호
U+002A * 별표
U+002B + 플러스 부호
U+002C , 쉼표
U+002D - 하이픈-미너스
U+002E . 완전 정지 또는 주기
U+002F / 솔리더스 또는 슬래시
ASCII 숫자
U+0030 0 숫자 0
U+0031 1 디지트 원
U+0032 2 숫자 2
U+0033 3 숫자 3
U+0034 4 숫자 4
U+0035 5 디지트
U+0036 6 디지트 식스
U+0037 7 디지트 세븐
U+0038 8 디지트 8
U+0039 9 디지트 나인
ASCII 구두점 및 기호
U+003A : 결장
U+003B ; 세미콜론
U+003C < 보다 작음 부호
U+003D = 등호
U+003E > 큰 부호
U+003F ? 물음표
U+0040 @ at sign 또는 Commercial at
대문자 라틴 문자
U+0041 A 라틴 대문자 A
U+0042 B 라틴 대문자 B
U+0043 C 라틴 대문자 C
U+0044 D 라틴 대문자 D
U+0045 E 라틴 대문자 E
U+0046 F 라틴 대문자 F
U+0047 G 라틴 대문자 G
U+0048 H 라틴 대문자 H
U+0049 I 라틴 대문자 I
U+004A J 라틴 대문자 J
U+004B K 라틴 대문자 K
U+004C L 라틴 대문자 L
U+004D M 라틴 대문자 M
U+004E N 라틴 대문자 N
U+004F O 라틴 대문자 O
U+0050 P 라틴 대문자 P
U+0051 Q 라틴 대문자 Q
U+0052 R 라틴 대문자 R
U+0053 S 라틴 대문자 S
U+0054 T 라틴 대문자 T
U+0055 U 라틴 대문자 U
U+0056 V 라틴 대문자 5
U+0057 W 라틴 대문자 W
U+0058 X 라틴 대문자 X
U+0059 Y 라틴 대문자 Y
U+005A Z 라틴 대문자 Z
ASCII 구두점 및 기호
U+005B [ 왼쪽 정사각형 브래킷
U+005C \ 백슬래시 [A]
U+005D ] 오른쪽 정사각형 브래킷
U+005E ^ 원곡사투리
U+005F _ 로우 라인
U+0060 ` 그레이브 액센트
소문자 라틴 문자
U+0061 a 라틴어 작은 글자 A
U+0062 b 라틴어 작은 글자 B
U+0063 c 라틴어 작은 글자 C
U+0064 d 라틴어 작은 글자 D
U+0065 e 라틴어 작은 글자 E
U+0066 f 라틴 문자 F
U+0067 g 라틴어 작은 글자
U+0068 h 라틴어 작은 글자 H
U+0069 i 라틴어 작은 글자 I
U+006A j 라틴어 작은 글자 J
U+006B k 라틴어 작은 글자 K
U+006C l 라틴 작은 글자 L
U+006D m 라틴어 작은 글자 M
U+006E n 라틴어 작은 글자 N
U+006F o 라틴어 작은 글자
U+0070 p 라틴어 작은 글자 P
U+0071 q 라틴어 작은 글자 Q
U+0072 r 라틴어 작은 글자 R
U+0073 s 라틴어 작은 글자 S
U+0074 t 라틴 작은 글자 T
U+0075 u 라틴 스몰 레터 U
U+0076 v 라틴어 작은 글자
U+0077 w 라틴 작은 글자 W
U+0078 x 라틴어 작은 글자 X
U+0079 y 라틴 문자 Y
U+007A z 라틴어 작은 글자 Z
ASCII 구두점 및 기호
U+007B { 왼쪽 곱슬 브래킷
U+007C 세로 막대
U+007D } 오른쪽 컬리 브래킷
U+007E ~ 틸데
제어 문자
U+007F 삭제 DEL
A 일본/한국 글꼴에서 U+005C(\)가 엔(¥) 또는 원(元) 기호로 나타날 수 있으며, 유니코드(특히 UTF-8)를 이러한 기호로 대체한 레거시 문자 집합으로 오인할 수 있다.[5]

부제목

C0 Controls 및 Basic Latin 블록에는 6개의 하위 제목이 있다.[6]

C0 컨트롤

버전 1.0에서 C0 ASCII 제어 코드라고 하는 C0 Controls는 ASCII와 다른 7비트 및 8비트 인코딩 체계에서 상속된다. C0 제어에 대한 별칭 이름은 ISO/IEC 6429:1992 표준에서 따왔다.[6]

ASCII 구두점 및 기호

이 부제목은 표준 구두점 문자, 간단한 수학 연산자, 달러 기호, 백분율, 앰퍼샌드, 밑줄, 파이프와 같은 기호를 가리킨다.[6]

ASCII 숫자

ASCII 숫자 하위 표제는 표준 유럽 숫자 문자 1–9와 0을 포함한다.[6]

대문자 라틴 문자

대문자 라틴 알파벳 하위 표제에는 불가결한 문자에 표준 26자 비음향 라틴 문자가 포함되어 있다.[6]

소문자 라틴 문자

소문자 라틴 알파벳 하위 표제에는 표준 26자 미음향 라틴 알파벳이 빼곡히 들어 있다.[6]

제어 문자

제어 문자 하위 제목에는 "삭제" 문자가 포함되어 있다.[6]

기호, 문자 및 제어 코드 수

아래 표는 C0 Controls and Basic Latin 블록의 각 하위 제목에 있는 문자, 기호 및 제어 코드 수를 보여준다.

부제목 기호수 문자 범위
C0 컨트롤 32개의 제어 코드 U+0000 ~ U+001F
ASCII 구두점 및 기호 33 구두점 및 기호 U+0020에서 U+002F까지, U+003A ~ U+0040, U+005B ~ U+0060, U+007B ~ U+007E
ASCII 숫자 10자리 숫자 U+0030 ~ U+0039
대문자 라틴 문자 불가사의한 언어로 된 26개의 라틴어 문자. U+0041 ~ U+005A
소문자 라틴 문자 극소수에서 26개의 라틴어 문자로 된 미증강. U+0061 ~ U+007A
제어 문자 1 "삭제" 문자를 포함하는 제어 코드. U+007F

블록

C0 제어 및 기본 라틴어[1]
공식 유니코드 컨소시엄 코드 차트(PDF)
0 1 2 3 4 5 6 7 8 9 A B C D E F
U+000x NUL SOH STX ETX EOT ENQ ACK BS HT LF VT FF CR 그렇게 SI
U+001x DLE DC1 DC2 DC3 DC4 NAK SYN ETB EM 후보선수 ESC FS GS RS 미국
U+002x SP ! " # $ % & ' ( ) * + , - . /
U+003x 0 1 2 3 4 5 6 7 8 9 : ; < = > ?
U+004x @ A B C D E F G H I J K L M N O
U+005x P Q R S T U V W X Y Z [ \ ] ^ _
U+006x ` a b c d e f g h i j k l m n o
U+007x p q r s t u v w x y z { } ~ DEL
1.^ 유니코드 버전 14.0 기준

변형

몇몇 문자는 변형 표시기가 뒤따를 경우 표준화된 변형으로 렌더링하도록 정의된다.

변형은 짧은 대각선 스트로크를 가진 0에 대해 정의된다. U+0030 DIGE ZERO, U+FE00 VS1(0︀)[7][8]

12자(#, * 및 숫자) 뒤에 U+FE0E VS15 또는 U+FE0F VS16을 입력하여 이모지 변형을 만들 수 있다.[9][10][11][12] 를 들어, 키캡 기본 문자(U+0023 NUMBER SIGN U+FE0F VS16 U+20E3 COMBING KEYCAP)이다. VS15 버전은 "텍스트 프리젠테이션"이고 VS16 버전은 "에모지 스타일"[8]이다.

이모지변동순서
U+ 0023 002A 0030 0031 0032 0033 0034 0035 0036 0037 0038 0039
밑의 # * 0 1 2 3 4 5 6 7 8 9
base+VS15+keycap #︎⃣ *︎⃣ 0︎⃣ 1︎⃣ 2︎⃣ 3︎⃣ 4︎⃣ 5︎⃣ 6︎⃣ 7︎⃣ 8︎⃣ 9︎⃣
base+VS16+keycap #️⃣ *️⃣ 0️⃣ 1️⃣ 2️⃣ 3️⃣ 4️⃣ 5️⃣ 6️⃣ 7️⃣ 8️⃣ 9️⃣

역사

다음의 유니코드 관련 문서는 기본 라틴어 블록에 특정 문자를 정의하기 위한 목적과 과정을 기록한다.

버전 최종코드 포인트[a] 카운트 UTC ID L2 ID WG2 ID 문서
1.0.0 U+0000..007F 128 (확정)
UTC/1999-013 Karlsson, Kent (1999-05-27), Tildes and micro sign decompositions
L2/99-176R Moore, Lisa (1999-11-04), "Micro Sign Case Mappings", Minutes from the joint UTC/L2 meeting in Seattle, June 8-10, 1999
L2/04-145 Starner, David (2004-04-30), C with stroke character examples from BAE report 1884 (Dorsey)
L2/04-202 Anderson, Deborah (2004-06-07), Slashed C Feedback
N3046 Suignard, Michel (2006-02-22), Improving formal definition for control characters
N3103(pdf, doc) Umamaheswaran, V. S. (2006-08-25), "M48.33", Unconfirmed minutes of WG 2 meeting 48, Mountain View, CA, USA; 2006-04-24/27
L2/11-043 Freytag, Asmus; Karlsson, Kent (2011-02-02), Proposal to correct mistakes and inconsistencies in certain property assignments for super and subscripted letters
L2/11-160 PRI #181 Changing General Category of Twelve Characters, 2011-05-02
L2/11-261R2 Moore, Lisa (2011-08-16), "Consensus 128-C3", UTC #128 / L2 #225 Minutes, Accept Ken Whistler's recommendations in L2/11-281 on name aliases for control characters with the addition of the abbreviations BEL and NUL.
L2/11-438[b][c] N4182 Edberg, Peter (2011-12-22), Emoji Variation Sequences (Revision of L2/11-429)
L2/15-107 Moore, Lisa (2015-05-12), "Consensus 143-C5", UTC #143 Minutes, Add the 12 keycap sequences in emoji-data.txt as provisional named sequences in Unicode 8.0.
L2/15-268 Beeton, Barbara; Freytag, Asmus; Iancu, Laurențiu; Sargent, Murray (2015-10-30), Proposal to Represent the Slashed Zero Variant of Empty Set
L2/15-301[d][c] Pournader, Roozbeh (2015-11-01), A proposal for 278 standardized variation sequences for emoji
L2/15-254 Moore, Lisa (2015-11-16), "B.12.1.2 Proposal to Represent the Slashed Zero Variant of Empty Set", UTC #145 Minutes
L2/17-294 N4914년 Lunde, Ken (2017-08-14), Proposal to add standardized variation sequence for U+FF10 FULLWIDTH DIGIT ZERO
  1. ^ 제안된 코드 포인트 및 문자 이름은 최종 코드 포인트 및 이름과 다를 수 있음
  2. ^ L2/10-458, L2/11-414, L2/11-415L2/11-429를 참조하십시오.
  3. ^ a b 추가 이모티콘 관련 문서는 기타 기호 및 픽토그래프 블록의 기록 섹션을 참조하십시오.
  4. ^ L2/15-198L2/15-275를 참조하십시오.

참고 항목

참조

  1. ^ "Unicode character database". The Unicode Standard. Retrieved 2016-07-09.
  2. ^ "Enumerated Versions of The Unicode Standard". The Unicode Standard. Retrieved 2016-07-09.
  3. ^ The Unicode Standard Version 1.0, Volume 1. Addison-Wesley Publishing Company, Inc. 1990. ISBN 0-201-56788-1.
  4. ^ "3.8: Block-by-Block Charts" (PDF). The Unicode Standard. version 1.0. Unicode Consortium.
  5. ^ Michael S. Kaplan (2005-09-17). "When is a backslash not a backslash?". Sorting it all Out. Microsoft. Archived from the original on 2010-06-12. http://archives.miloush.net/michkap/archive/2005/09/17/469941.html에서도 이용 가능:
  6. ^ a b c d e f g "Unicode 6.2 code charts" (PDF). The Unicode Standard. Retrieved 1 April 2013.
  7. ^ Beeton, Barbara; Freytag, Asmus; Iancu, Laurențiu; Sargent, Murray (2015-10-30). "L2/15-268: Proposal to Represent the Slashed Zero Variant of Empty Set" (PDF).
  8. ^ a b "UTS #51 Emoji Variation Sequences". The Unicode Consortium.
  9. ^ Edberg, Peter (2011-12-22). "L2/11-438: Emoji Variation Sequences (Revision of L2/11-429)" (PDF).
  10. ^ Pournader, Roozbeh (2015-11-01). "L2/15-301: A proposal for 278 standardized variation sequences for emoji" (PDF).
  11. ^ "UTR #51: Unicode Emoji". Unicode Consortium. 2020-02-11.
  12. ^ "UCD: Emoji Data for UTR #51". Unicode Consortium. 2021-08-26.