기본 라틴어(유니코드 블록)

C0 제어 및 기본 라틴어
C0 제어 및 기본 라틴어
범위	U+0000..U+007F; (암호 코드 포인트)
평면	BMP
스크립트	라틴어(52자) ; 공통(76자)
주요 문자	영어; 프랑스어; 독일어; 스페인어; 베트남의
기호 집합	아라비아 숫자; 구두점
맡겨진	128개 코드 포인트 ; 33 제어 또는 형식
사용되지 않음	예약된 코드 포인트 0개
소스 표준	ISO/IEC 8859, ISO 646
유니코드 버전 기록
1.0.0 (1991)	128 (+128)
	참고:

기본 라틴어 또는 C0 제어 및 기본 라틴 유니코드 블록은 유니코드 표준의 첫 번째 블록이며, UTF-8에서 1바이트로 인코딩되는 유일한 블록이다. 블록에는 ASCII 인코딩의 모든 문자와 제어 코드가 들어 있다. U+0000 ~ U+007F의 범위에는 128자의 문자가 포함되며, C0 컨트롤, ASCII 문장 부호 및 기호, ASCII 자릿수, 영문자 대문자와 소문자, 제어 문자를 포함한다.

기본 라틴어 블록은 문자 레퍼토리를 추가하거나 변경하지 않고 유니코드 표준 1.0.0 버전부터 현재 형태에 포함되었다.^[3] 유니코드 1.0의 블록 이름은 ASCII였다.^[4]

문자표

코드	결과	설명	약어
C0 컨트롤
U+0000		Null 문자	NUL
U+0001		제목 시작	SOH
U+0002		텍스트 시작	STX
U+0003		텍스트 끝 문자	ETX
U+0004		전송 종료 문자	EOT
U+0005		문의성격	ENQ
U+0006		확인 문자	ACK
U+0007		벨 문자	벨
U+0008		백스페이스	BS
U+0009		수평 탭	HT
U+000A		라인피드	LF
U+000B		세로 탭	VT
U+000C		폼피드	FF
U+000D		캐리지 리턴	CR
U+000E		Shift Out	그렇게
U+000F		Shift In	SI
U+0010		데이터 링크 이스케이프	DLE
U+0011		장치 제어 1	DC1
U+0012		장치 제어 2	DC2
U+0013		장치 제어 3	DC3
U+0014		장치 제어 4	DC4
U+0015		부정승인 문자	NAK
U+0016		동기식 유휴 상태	SYN
U+0017		변속기 블록 끝	ETB
U+0018		캐릭터 취소	캔
U+0019		중간 끝	EM
U+001A		대체 문자	후보선수
U+001B		이스케이프 캐릭터	ESC
U+001C		파일 구분자	FS
U+001D		그룹 구분 기호	GS
U+001E		기록 구분 기호	RS
U+001F		단위 구분 기호	미국
ASCII 구두점 및 기호
U+0020		공간	SP
U+0021	!	느낌표	EXC
U+0022	"	따옴표	현상
U+0023	#	번호 기호
U+0024	$	달러 기호
U+0025	%	백분율 기호
U+0026	&	앰퍼샌드
U+0027	'	아포스트로피
U+0028	(	왼쪽 괄호
U+0029	)	오른쪽 괄호
U+002A	*	별표
U+002B	⁺	플러스 부호
U+002C	,	쉼표
U+002D	-	하이픈-미너스
U+002E	.	완전 정지 또는 주기
U+002F	/	솔리더스 또는 슬래시
ASCII 숫자
U+0030	0	숫자 0
U+0031	1	디지트 원
U+0032	2	숫자 2
U+0033	3	숫자 3
U+0034	4	숫자 4
U+0035	5	디지트
U+0036	6	디지트 식스
U+0037	7	디지트 세븐
U+0038	8	디지트 8
U+0039	9	디지트 나인
ASCII 구두점 및 기호
U+003A	:	결장
U+003B	;	세미콜론
U+003C	<	보다 작음 부호
U+003D	=	등호
U+003E	>	큰 부호
U+003F	?	물음표
U+0040	@	at sign 또는 Commercial at
대문자 라틴 문자
U+0041	A	라틴 대문자 A
U+0042	B	라틴 대문자 B
U+0043	C	라틴 대문자 C
U+0044	D	라틴 대문자 D
U+0045	E	라틴 대문자 E
U+0046	F	라틴 대문자 F
U+0047	G	라틴 대문자 G
U+0048	H	라틴 대문자 H
U+0049	I	라틴 대문자 I
U+004A	J	라틴 대문자 J
U+004B	K	라틴 대문자 K
U+004C	L	라틴 대문자 L
U+004D	M	라틴 대문자 M
U+004E	N	라틴 대문자 N
U+004F	O	라틴 대문자 O
U+0050	P	라틴 대문자 P
U+0051	Q	라틴 대문자 Q
U+0052	R	라틴 대문자 R
U+0053	S	라틴 대문자 S
U+0054	T	라틴 대문자 T
U+0055	U	라틴 대문자 U
U+0056	V	라틴 대문자 5
U+0057	W	라틴 대문자 W
U+0058	X	라틴 대문자 X
U+0059	Y	라틴 대문자 Y
U+005A	Z	라틴 대문자 Z
ASCII 구두점 및 기호
U+005B	[	왼쪽 정사각형 브래킷
U+005C	\	백슬래시 ^[A]
U+005D	]	오른쪽 정사각형 브래킷
U+005E	^	원곡사투리
U+005F	_	로우 라인
U+0060	`	그레이브 액센트
소문자 라틴 문자
U+0061	a	라틴어 작은 글자 A
U+0062	b	라틴어 작은 글자 B
U+0063	c	라틴어 작은 글자 C
U+0064	d	라틴어 작은 글자 D
U+0065	e	라틴어 작은 글자 E
U+0066	f	라틴 문자 F
U+0067	g	라틴어 작은 글자
U+0068	h	라틴어 작은 글자 H
U+0069	i	라틴어 작은 글자 I
U+006A	j	라틴어 작은 글자 J
U+006B	k	라틴어 작은 글자 K
U+006C	l	라틴 작은 글자 L
U+006D	m	라틴어 작은 글자 M
U+006E	n	라틴어 작은 글자 N
U+006F	o	라틴어 작은 글자
U+0070	p	라틴어 작은 글자 P
U+0071	q	라틴어 작은 글자 Q
U+0072	r	라틴어 작은 글자 R
U+0073	s	라틴어 작은 글자 S
U+0074	t	라틴 작은 글자 T
U+0075	u	라틴 스몰 레터 U
U+0076	v	라틴어 작은 글자
U+0077	w	라틴 작은 글자 W
U+0078	x	라틴어 작은 글자 X
U+0079	y	라틴 문자 Y
U+007A	z	라틴어 작은 글자 Z
ASCII 구두점 및 기호
U+007B	{	왼쪽 곱슬 브래킷
U+007C		세로 막대
U+007D	}	오른쪽 컬리 브래킷
U+007E	~	틸데
제어 문자
U+007F		삭제	DEL

^A 일본/한국 글꼴에서 U+005C(\)가 엔(¥) 또는 원(元) 기호로 나타날 수 있으며, 유니코드(특히 UTF-8)를 이러한 기호로 대체한 레거시 문자 집합으로 오인할 수 있다.^[5]

부제목

C0 Controls 및 Basic Latin 블록에는 6개의 하위 제목이 있다.^[6]

C0 컨트롤

버전 1.0에서 C0 ASCII 제어 코드라고 하는 C0 Controls는 ASCII와 다른 7비트 및 8비트 인코딩 체계에서 상속된다. C0 제어에 대한 별칭 이름은 ISO/IEC 6429:1992 표준에서 따왔다.^[6]

ASCII 구두점 및 기호

이 부제목은 표준 구두점 문자, 간단한 수학 연산자, 달러 기호, 백분율, 앰퍼샌드, 밑줄, 파이프와 같은 기호를 가리킨다.^[6]

ASCII 숫자

ASCII 숫자 하위 표제는 표준 유럽 숫자 문자 1–9와 0을 포함한다.^[6]

대문자 라틴 문자

대문자 라틴 알파벳 하위 표제에는 불가결한 문자에 표준 26자 비음향 라틴 문자가 포함되어 있다.^[6]

소문자 라틴 문자

소문자 라틴 알파벳 하위 표제에는 표준 26자 미음향 라틴 알파벳이 빼곡히 들어 있다.^[6]

제어 문자

제어 문자 하위 제목에는 "삭제" 문자가 포함되어 있다.^[6]

기호, 문자 및 제어 코드 수

아래 표는 C0 Controls and Basic Latin 블록의 각 하위 제목에 있는 문자, 기호 및 제어 코드 수를 보여준다.

부제목	기호수	문자 범위
C0 컨트롤	32개의 제어 코드	U+0000 ~ U+001F
ASCII 구두점 및 기호	33 구두점 및 기호	U+0020에서 U+002F까지, U+003A ~ U+0040, U+005B ~ U+0060, U+007B ~ U+007E
ASCII 숫자	10자리 숫자	U+0030 ~ U+0039
대문자 라틴 문자	불가사의한 언어로 된 26개의 라틴어 문자.	U+0041 ~ U+005A
소문자 라틴 문자	극소수에서 26개의 라틴어 문자로 된 미증강.	U+0061 ~ U+007A
제어 문자	1 "삭제" 문자를 포함하는 제어 코드.	U+007F

블록

C0 제어 및 기본 라틴어^[1] 공식 유니코드 컨소시엄 코드 차트(PDF)
	0	1	2	3	4	5	6	7	8	9	A	B	C	D	E	F
U+000x	NUL	SOH	STX	ETX	EOT	ENQ	ACK	벨	BS	HT	LF	VT	FF	CR	그렇게	SI
U+001x	DLE	DC1	DC2	DC3	DC4	NAK	SYN	ETB	캔	EM	후보선수	ESC	FS	GS	RS	미국
U+002x	SP	!	"	#	$	%	&	'	(	)	*	+	,	-	.	/
U+003x	0	1	2	3	4	5	6	7	8	9	:	;	<	=	>	?
U+004x	@	A	B	C	D	E	F	G	H	I	J	K	L	M	N	O
U+005x	P	Q	R	S	T	U	V	W	X	Y	Z	[	\	]	^	_
U+006x	`	a	b	c	d	e	f	g	h	i	j	k	l	m	n	o
U+007x	p	q	r	s	t	u	v	w	x	y	z	{		}	~	DEL
1.^ 유니코드 버전 14.0 기준

변형

몇몇 문자는 변형 표시기가 뒤따를 경우 표준화된 변형으로 렌더링하도록 정의된다.

변형은 짧은 대각선 스트로크를 가진 0에 대해 정의된다. U+0030 DIGE ZERO, U+FE00 VS1(0︀)^[7]^[8]

12자(#, * 및 숫자) 뒤에 U+FE0E VS15 또는 U+FE0F VS16을 입력하여 이모지 변형을 만들 수 있다.^[9]^[10]^[11]^[12] 예를 들어, 키캡 기본 문자(U+0023 NUMBER SIGN U+FE0F VS16 U+20E3 COMBING KEYCAP)이다. VS15 버전은 "텍스트 프리젠테이션"이고 VS16 버전은 "에모지 스타일"^[8]이다.

이모지변동순서
U+	0023	002A	0030	0031	0032	0033	0034	0035	0036	0037	0038	0039
밑의	#	*	0	1	2	3	4	5	6	7	8	9
base+VS15+keycap	#︎⃣	*︎⃣	0︎⃣	1︎⃣	2︎⃣	3︎⃣	4︎⃣	5︎⃣	6︎⃣	7︎⃣	8︎⃣	9︎⃣
base+VS16+keycap	#️⃣	*️⃣	0️⃣	1️⃣	2️⃣	3️⃣	4️⃣	5️⃣	6️⃣	7️⃣	8️⃣	9️⃣

역사

다음의 유니코드 관련 문서는 기본 라틴어 블록에 특정 문자를 정의하기 위한 목적과 과정을 기록한다.

버전	최종코드 포인트^[a]	카운트	UTC ID	L2 ID	WG2 ID	문서
1.0.0	U+0000..007F	128				(확정)
			UTC/1999-013			Karlsson, Kent (1999-05-27), Tildes and micro sign decompositions
				L2/99-176R		Moore, Lisa (1999-11-04), "Micro Sign Case Mappings", Minutes from the joint UTC/L2 meeting in Seattle, June 8-10, 1999
				L2/04-145		Starner, David (2004-04-30), C with stroke character examples from BAE report 1884 (Dorsey)
				L2/04-202		Anderson, Deborah (2004-06-07), Slashed C Feedback
					N3046	Suignard, Michel (2006-02-22), Improving formal definition for control characters
					N3103(pdf, doc)	Umamaheswaran, V. S. (2006-08-25), "M48.33", Unconfirmed minutes of WG 2 meeting 48, Mountain View, CA, USA; 2006-04-24/27
				L2/11-043		Freytag, Asmus; Karlsson, Kent (2011-02-02), Proposal to correct mistakes and inconsistencies in certain property assignments for super and subscripted letters
				L2/11-160		PRI #181 Changing General Category of Twelve Characters, 2011-05-02
				L2/11-261R2		Moore, Lisa (2011-08-16), "Consensus 128-C3", UTC #128 / L2 #225 Minutes, Accept Ken Whistler's recommendations in L2/11-281 on name aliases for control characters with the addition of the abbreviations BEL and NUL.
				L2/11-438^[b]^[c]	N4182	Edberg, Peter (2011-12-22), Emoji Variation Sequences (Revision of L2/11-429)
				L2/15-107		Moore, Lisa (2015-05-12), "Consensus 143-C5", UTC #143 Minutes, Add the 12 keycap sequences in emoji-data.txt as provisional named sequences in Unicode 8.0.
				L2/15-268		Beeton, Barbara; Freytag, Asmus; Iancu, Laurențiu; Sargent, Murray (2015-10-30), Proposal to Represent the Slashed Zero Variant of Empty Set
				L2/15-301^[d]^[c]		Pournader, Roozbeh (2015-11-01), A proposal for 278 standardized variation sequences for emoji
				L2/15-254		Moore, Lisa (2015-11-16), "B.12.1.2 Proposal to Represent the Slashed Zero Variant of Empty Set", UTC #145 Minutes
				L2/17-294	N4914년	Lunde, Ken (2017-08-14), Proposal to add standardized variation sequence for U+FF10 FULLWIDTH DIGIT ZERO
^ 제안된 코드 포인트 및 문자 이름은 최종 코드 포인트 및 이름과 다를 수 있음 ^ L2/10-458, L2/11-414, L2/11-415 및 L2/11-429를 참조하십시오. ^ ^a ^b 추가 이모티콘 관련 문서는 기타 기호 및 픽토그래프 블록의 기록 섹션을 참조하십시오. ^ L2/15-198 및 L2/15-275를 참조하십시오.

참고 항목

참조

^ "Unicode character database". The Unicode Standard. Retrieved 2016-07-09.
^ "Enumerated Versions of The Unicode Standard". The Unicode Standard. Retrieved 2016-07-09.
^ The Unicode Standard Version 1.0, Volume 1. Addison-Wesley Publishing Company, Inc. 1990. ISBN 0-201-56788-1.
^ "3.8: Block-by-Block Charts" (PDF). The Unicode Standard. version 1.0. Unicode Consortium.
^ Michael S. Kaplan (2005-09-17). "When is a backslash not a backslash?". Sorting it all Out. Microsoft. Archived from the original on 2010-06-12. http://archives.miloush.net/michkap/archive/2005/09/17/469941.html에서도 이용 가능:
^ ^a ^b ^c ^d ^e ^f ^g "Unicode 6.2 code charts" (PDF). The Unicode Standard. Retrieved 1 April 2013.
^ Beeton, Barbara; Freytag, Asmus; Iancu, Laurențiu; Sargent, Murray (2015-10-30). "L2/15-268: Proposal to Represent the Slashed Zero Variant of Empty Set" (PDF).
^ ^a ^b "UTS #51 Emoji Variation Sequences". The Unicode Consortium.
^ Edberg, Peter (2011-12-22). "L2/11-438: Emoji Variation Sequences (Revision of L2/11-429)" (PDF).
^ Pournader, Roozbeh (2015-11-01). "L2/15-301: A proposal for 278 standardized variation sequences for emoji" (PDF).
^ "UTR #51: Unicode Emoji". Unicode Consortium. 2020-02-11.
^ "UCD: Emoji Data for UTR #51". Unicode Consortium. 2021-08-26.

[final-13] 제안된 코드 포인트 및 문자 이름은 최종 코드 포인트 및 이름과 다를 수 있음

[also10458-14] L2/10-458, L2/11-414, L2/11-415 및 L2/11-429를 참조하십시오.

[emojidocs-15] 추가 이모티콘 관련 문서는 기타 기호 및 픽토그래프 블록의 기록 섹션을 참조하십시오.

[also15198-16] L2/15-198 및 L2/15-275를 참조하십시오.

[1] "Unicode character database". The Unicode Standard. Retrieved 2016-07-09.

[2] "Enumerated Versions of The Unicode Standard". The Unicode Standard. Retrieved 2016-07-09.

[Unicode1.0-3] The Unicode Standard Version 1.0, Volume 1. Addison-Wesley Publishing Company, Inc. 1990. ISBN 0-201-56788-1.

[4] "3.8: Block-by-Block Charts" (PDF). The Unicode Standard. version 1.0. Unicode Consortium.

[5] Michael S. Kaplan (2005-09-17). "When is a backslash not a backslash?". Sorting it all Out. Microsoft. Archived from the original on 2010-06-12. http://archives.miloush.net/michkap/archive/2005/09/17/469941.html에서도 이용 가능:

[charts-6] ^ ^a ^b ^c ^d ^e ^f ^g "Unicode 6.2 code charts" (PDF). The Unicode Standard. Retrieved 1 April 2013.

[7] Beeton, Barbara; Freytag, Asmus; Iancu, Laurențiu; Sargent, Murray (2015-10-30). "L2/15-268: Proposal to Represent the Slashed Zero Variant of Empty Set" (PDF).

[uts51-8] "UTS #51 Emoji Variation Sequences". The Unicode Consortium.

[9] Edberg, Peter (2011-12-22). "L2/11-438: Emoji Variation Sequences (Revision of L2/11-429)" (PDF).

[10] Pournader, Roozbeh (2015-11-01). "L2/15-301: A proposal for 278 standardized variation sequences for emoji" (PDF).

[UTR51-11] "UTR #51: Unicode Emoji". Unicode Consortium. 2020-02-11.

[EmojiData-12] "UCD: Emoji Data for UTR #51". Unicode Consortium. 2021-08-26.

[3]

[4]

[A]

[5]

[6]

[1]

[7]

[8]

[9]

[10]

[11]

[12]

[a]

[b]

[c]

[d]

Search