기본 라틴어(유니코드 블록)
Basic Latin (Unicode block)C0 제어 및 기본 라틴어 | |
---|---|
범위 | U+0000..U+007F (암호 코드 포인트) |
평면 | BMP |
스크립트 | 라틴어(52자) 공통(76자) |
주요 문자 | 영어 프랑스어 독일어 스페인어 베트남의 |
기호 집합 | 아라비아 숫자 구두점 |
맡겨진 | 128개 코드 포인트 33 제어 또는 형식 |
사용되지 않음 | 예약된 코드 포인트 0개 |
소스 표준 | ISO/IEC 8859, ISO 646 |
유니코드 버전 기록 | |
1.0.0 (1991) | 128 (+128) |
참고: |
기본 라틴어 또는 C0 제어 및 기본 라틴 유니코드 블록은 유니코드 표준의 첫 번째 블록이며, UTF-8에서 1바이트로 인코딩되는 유일한 블록이다. 블록에는 ASCII 인코딩의 모든 문자와 제어 코드가 들어 있다. U+0000 ~ U+007F의 범위에는 128자의 문자가 포함되며, C0 컨트롤, ASCII 문장 부호 및 기호, ASCII 자릿수, 영문자 대문자와 소문자, 제어 문자를 포함한다.
기본 라틴어 블록은 문자 레퍼토리를 추가하거나 변경하지 않고 유니코드 표준 1.0.0 버전부터 현재 형태에 포함되었다.[3] 유니코드 1.0의 블록 이름은 ASCII였다.[4]
문자표
코드 | 결과 | 설명 | 약어 |
---|---|---|---|
C0 컨트롤 | |||
U+0000 | Null 문자 | NUL | |
U+0001 | 제목 시작 | SOH | |
U+0002 | 텍스트 시작 | STX | |
U+0003 | 텍스트 끝 문자 | ETX | |
U+0004 | 전송 종료 문자 | EOT | |
U+0005 | 문의성격 | ENQ | |
U+0006 | 확인 문자 | ACK | |
U+0007 | 벨 문자 | 벨 | |
U+0008 | 백스페이스 | BS | |
U+0009 | 수평 탭 | HT | |
U+000A | 라인피드 | LF | |
U+000B | 세로 탭 | VT | |
U+000C | 폼피드 | FF | |
U+000D | 캐리지 리턴 | CR | |
U+000E | Shift Out | 그렇게 | |
U+000F | Shift In | SI | |
U+0010 | 데이터 링크 이스케이프 | DLE | |
U+0011 | 장치 제어 1 | DC1 | |
U+0012 | 장치 제어 2 | DC2 | |
U+0013 | 장치 제어 3 | DC3 | |
U+0014 | 장치 제어 4 | DC4 | |
U+0015 | 부정승인 문자 | NAK | |
U+0016 | 동기식 유휴 상태 | SYN | |
U+0017 | 변속기 블록 끝 | ETB | |
U+0018 | 캐릭터 취소 | 캔 | |
U+0019 | 중간 끝 | EM | |
U+001A | 대체 문자 | 후보선수 | |
U+001B | 이스케이프 캐릭터 | ESC | |
U+001C | 파일 구분자 | FS | |
U+001D | 그룹 구분 기호 | GS | |
U+001E | 기록 구분 기호 | RS | |
U+001F | 단위 구분 기호 | 미국 | |
ASCII 구두점 및 기호 | |||
U+0020 | 공간 | SP | |
U+0021 | ! | 느낌표 | EXC |
U+0022 | " | 따옴표 | 현상 |
U+0023 | # | 번호 기호 | |
U+0024 | $ | 달러 기호 | |
U+0025 | % | 백분율 기호 | |
U+0026 | & | 앰퍼샌드 | |
U+0027 | ' | 아포스트로피 | |
U+0028 | ( | 왼쪽 괄호 | |
U+0029 | ) | 오른쪽 괄호 | |
U+002A | * | 별표 | |
U+002B | + | 플러스 부호 | |
U+002C | , | 쉼표 | |
U+002D | - | 하이픈-미너스 | |
U+002E | . | 완전 정지 또는 주기 | |
U+002F | / | 솔리더스 또는 슬래시 | |
ASCII 숫자 | |||
U+0030 | 0 | 숫자 0 | |
U+0031 | 1 | 디지트 원 | |
U+0032 | 2 | 숫자 2 | |
U+0033 | 3 | 숫자 3 | |
U+0034 | 4 | 숫자 4 | |
U+0035 | 5 | 디지트 | |
U+0036 | 6 | 디지트 식스 | |
U+0037 | 7 | 디지트 세븐 | |
U+0038 | 8 | 디지트 8 | |
U+0039 | 9 | 디지트 나인 | |
ASCII 구두점 및 기호 | |||
U+003A | : | 결장 | |
U+003B | ; | 세미콜론 | |
U+003C | < | 보다 작음 부호 | |
U+003D | = | 등호 | |
U+003E | > | 큰 부호 | |
U+003F | ? | 물음표 | |
U+0040 | @ | at sign 또는 Commercial at | |
대문자 라틴 문자 | |||
U+0041 | A | 라틴 대문자 A | |
U+0042 | B | 라틴 대문자 B | |
U+0043 | C | 라틴 대문자 C | |
U+0044 | D | 라틴 대문자 D | |
U+0045 | E | 라틴 대문자 E | |
U+0046 | F | 라틴 대문자 F | |
U+0047 | G | 라틴 대문자 G | |
U+0048 | H | 라틴 대문자 H | |
U+0049 | I | 라틴 대문자 I | |
U+004A | J | 라틴 대문자 J | |
U+004B | K | 라틴 대문자 K | |
U+004C | L | 라틴 대문자 L | |
U+004D | M | 라틴 대문자 M | |
U+004E | N | 라틴 대문자 N | |
U+004F | O | 라틴 대문자 O | |
U+0050 | P | 라틴 대문자 P | |
U+0051 | Q | 라틴 대문자 Q | |
U+0052 | R | 라틴 대문자 R | |
U+0053 | S | 라틴 대문자 S | |
U+0054 | T | 라틴 대문자 T | |
U+0055 | U | 라틴 대문자 U | |
U+0056 | V | 라틴 대문자 5 | |
U+0057 | W | 라틴 대문자 W | |
U+0058 | X | 라틴 대문자 X | |
U+0059 | Y | 라틴 대문자 Y | |
U+005A | Z | 라틴 대문자 Z | |
ASCII 구두점 및 기호 | |||
U+005B | [ | 왼쪽 정사각형 브래킷 | |
U+005C | \ | 백슬래시 [A] | |
U+005D | ] | 오른쪽 정사각형 브래킷 | |
U+005E | ^ | 원곡사투리 | |
U+005F | _ | 로우 라인 | |
U+0060 | ` | 그레이브 액센트 | |
소문자 라틴 문자 | |||
U+0061 | a | 라틴어 작은 글자 A | |
U+0062 | b | 라틴어 작은 글자 B | |
U+0063 | c | 라틴어 작은 글자 C | |
U+0064 | d | 라틴어 작은 글자 D | |
U+0065 | e | 라틴어 작은 글자 E | |
U+0066 | f | 라틴 문자 F | |
U+0067 | g | 라틴어 작은 글자 | |
U+0068 | h | 라틴어 작은 글자 H | |
U+0069 | i | 라틴어 작은 글자 I | |
U+006A | j | 라틴어 작은 글자 J | |
U+006B | k | 라틴어 작은 글자 K | |
U+006C | l | 라틴 작은 글자 L | |
U+006D | m | 라틴어 작은 글자 M | |
U+006E | n | 라틴어 작은 글자 N | |
U+006F | o | 라틴어 작은 글자 | |
U+0070 | p | 라틴어 작은 글자 P | |
U+0071 | q | 라틴어 작은 글자 Q | |
U+0072 | r | 라틴어 작은 글자 R | |
U+0073 | s | 라틴어 작은 글자 S | |
U+0074 | t | 라틴 작은 글자 T | |
U+0075 | u | 라틴 스몰 레터 U | |
U+0076 | v | 라틴어 작은 글자 | |
U+0077 | w | 라틴 작은 글자 W | |
U+0078 | x | 라틴어 작은 글자 X | |
U+0079 | y | 라틴 문자 Y | |
U+007A | z | 라틴어 작은 글자 Z | |
ASCII 구두점 및 기호 | |||
U+007B | { | 왼쪽 곱슬 브래킷 | |
U+007C | 세로 막대 | ||
U+007D | } | 오른쪽 컬리 브래킷 | |
U+007E | ~ | 틸데 | |
제어 문자 | |||
U+007F | 삭제 | DEL |
- A 일본/한국 글꼴에서 U+005C(\)가 엔(¥) 또는 원(元) 기호로 나타날 수 있으며, 유니코드(특히 UTF-8)를 이러한 기호로 대체한 레거시 문자 집합으로 오인할 수 있다.[5]
부제목
C0 Controls 및 Basic Latin 블록에는 6개의 하위 제목이 있다.[6]
C0 컨트롤
버전 1.0에서 C0 ASCII 제어 코드라고 하는 C0 Controls는 ASCII와 다른 7비트 및 8비트 인코딩 체계에서 상속된다. C0 제어에 대한 별칭 이름은 ISO/IEC 6429:1992 표준에서 따왔다.[6]
ASCII 구두점 및 기호
이 부제목은 표준 구두점 문자, 간단한 수학 연산자, 달러 기호, 백분율, 앰퍼샌드, 밑줄, 파이프와 같은 기호를 가리킨다.[6]
ASCII 숫자
ASCII 숫자 하위 표제는 표준 유럽 숫자 문자 1–9와 0을 포함한다.[6]
대문자 라틴 문자
대문자 라틴 알파벳 하위 표제에는 불가결한 문자에 표준 26자 비음향 라틴 문자가 포함되어 있다.[6]
소문자 라틴 문자
소문자 라틴 알파벳 하위 표제에는 표준 26자 미음향 라틴 알파벳이 빼곡히 들어 있다.[6]
제어 문자
제어 문자 하위 제목에는 "삭제" 문자가 포함되어 있다.[6]
기호, 문자 및 제어 코드 수
아래 표는 C0 Controls and Basic Latin 블록의 각 하위 제목에 있는 문자, 기호 및 제어 코드 수를 보여준다.
부제목 | 기호수 | 문자 범위 |
---|---|---|
C0 컨트롤 | 32개의 제어 코드 | U+0000 ~ U+001F |
ASCII 구두점 및 기호 | 33 구두점 및 기호 | U+0020에서 U+002F까지, U+003A ~ U+0040, U+005B ~ U+0060, U+007B ~ U+007E |
ASCII 숫자 | 10자리 숫자 | U+0030 ~ U+0039 |
대문자 라틴 문자 | 불가사의한 언어로 된 26개의 라틴어 문자. | U+0041 ~ U+005A |
소문자 라틴 문자 | 극소수에서 26개의 라틴어 문자로 된 미증강. | U+0061 ~ U+007A |
제어 문자 | 1 "삭제" 문자를 포함하는 제어 코드. | U+007F |
블록
C0 제어 및 기본 라틴어[1] 공식 유니코드 컨소시엄 코드 차트(PDF) | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
U+000x | NUL | SOH | STX | ETX | EOT | ENQ | ACK | 벨 | BS | HT | LF | VT | FF | CR | 그렇게 | SI |
U+001x | DLE | DC1 | DC2 | DC3 | DC4 | NAK | SYN | ETB | 캔 | EM | 후보선수 | ESC | FS | GS | RS | 미국 |
U+002x | SP | ! | " | # | $ | % | & | ' | ( | ) | * | + | , | - | . | / |
U+003x | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | : | ; | < | = | > | ? |
U+004x | @ | A | B | C | D | E | F | G | H | I | J | K | L | M | N | O |
U+005x | P | Q | R | S | T | U | V | W | X | Y | Z | [ | \ | ] | ^ | _ |
U+006x | ` | a | b | c | d | e | f | g | h | i | j | k | l | m | n | o |
U+007x | p | q | r | s | t | u | v | w | x | y | z | { | } | ~ | DEL | |
1.^ 유니코드 버전 14.0 기준 |
변형
몇몇 문자는 변형 표시기가 뒤따를 경우 표준화된 변형으로 렌더링하도록 정의된다.
변형은 짧은 대각선 스트로크를 가진 0에 대해 정의된다. U+0030 DIGE ZERO, U+FE00 VS1(0︀)[7][8]
12자(#, * 및 숫자) 뒤에 U+FE0E VS15 또는 U+FE0F VS16을 입력하여 이모지 변형을 만들 수 있다.[9][10][11][12] 예를 들어, 키캡 기본 문자(U+0023 NUMBER SIGN U+FE0F VS16 U+20E3 COMBING KEYCAP)이다. VS15 버전은 "텍스트 프리젠테이션"이고 VS16 버전은 "에모지 스타일"[8]이다.
U+ | 0023 | 002A | 0030 | 0031 | 0032 | 0033 | 0034 | 0035 | 0036 | 0037 | 0038 | 0039 |
밑의 | # | * | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 |
base+VS15+keycap | #︎⃣ | *︎⃣ | 0︎⃣ | 1︎⃣ | 2︎⃣ | 3︎⃣ | 4︎⃣ | 5︎⃣ | 6︎⃣ | 7︎⃣ | 8︎⃣ | 9︎⃣ |
base+VS16+keycap | #️⃣ | *️⃣ | 0️⃣ | 1️⃣ | 2️⃣ | 3️⃣ | 4️⃣ | 5️⃣ | 6️⃣ | 7️⃣ | 8️⃣ | 9️⃣ |
역사
다음의 유니코드 관련 문서는 기본 라틴어 블록에 특정 문자를 정의하기 위한 목적과 과정을 기록한다.
버전 | 최종코드 포인트[a] | 카운트 | UTC ID | L2 ID | WG2 ID | 문서 |
---|---|---|---|---|---|---|
1.0.0 | U+0000..007F | 128 | (확정) | |||
UTC/1999-013 | Karlsson, Kent (1999-05-27), Tildes and micro sign decompositions | |||||
L2/99-176R | Moore, Lisa (1999-11-04), "Micro Sign Case Mappings", Minutes from the joint UTC/L2 meeting in Seattle, June 8-10, 1999 | |||||
L2/04-145 | Starner, David (2004-04-30), C with stroke character examples from BAE report 1884 (Dorsey) | |||||
L2/04-202 | Anderson, Deborah (2004-06-07), Slashed C Feedback | |||||
N3046 | Suignard, Michel (2006-02-22), Improving formal definition for control characters | |||||
N3103(pdf, doc) | Umamaheswaran, V. S. (2006-08-25), "M48.33", Unconfirmed minutes of WG 2 meeting 48, Mountain View, CA, USA; 2006-04-24/27 | |||||
L2/11-043 | Freytag, Asmus; Karlsson, Kent (2011-02-02), Proposal to correct mistakes and inconsistencies in certain property assignments for super and subscripted letters | |||||
L2/11-160 | PRI #181 Changing General Category of Twelve Characters, 2011-05-02 | |||||
L2/11-261R2 | Moore, Lisa (2011-08-16), "Consensus 128-C3", UTC #128 / L2 #225 Minutes, Accept Ken Whistler's recommendations in L2/11-281 on name aliases for control characters with the addition of the abbreviations BEL and NUL. | |||||
L2/11-438[b][c] | N4182 | Edberg, Peter (2011-12-22), Emoji Variation Sequences (Revision of L2/11-429) | ||||
L2/15-107 | Moore, Lisa (2015-05-12), "Consensus 143-C5", UTC #143 Minutes, Add the 12 keycap sequences in emoji-data.txt as provisional named sequences in Unicode 8.0. | |||||
L2/15-268 | Beeton, Barbara; Freytag, Asmus; Iancu, Laurențiu; Sargent, Murray (2015-10-30), Proposal to Represent the Slashed Zero Variant of Empty Set | |||||
L2/15-301[d][c] | Pournader, Roozbeh (2015-11-01), A proposal for 278 standardized variation sequences for emoji | |||||
L2/15-254 | Moore, Lisa (2015-11-16), "B.12.1.2 Proposal to Represent the Slashed Zero Variant of Empty Set", UTC #145 Minutes | |||||
L2/17-294 | N4914년 | Lunde, Ken (2017-08-14), Proposal to add standardized variation sequence for U+FF10 FULLWIDTH DIGIT ZERO | ||||
참고 항목
참조
- ^ "Unicode character database". The Unicode Standard. Retrieved 2016-07-09.
- ^ "Enumerated Versions of The Unicode Standard". The Unicode Standard. Retrieved 2016-07-09.
- ^ The Unicode Standard Version 1.0, Volume 1. Addison-Wesley Publishing Company, Inc. 1990. ISBN 0-201-56788-1.
- ^ "3.8: Block-by-Block Charts" (PDF). The Unicode Standard. version 1.0. Unicode Consortium.
- ^ Michael S. Kaplan (2005-09-17). "When is a backslash not a backslash?". Sorting it all Out. Microsoft. Archived from the original on 2010-06-12. http://archives.miloush.net/michkap/archive/2005/09/17/469941.html에서도 이용 가능:
- ^ a b c d e f g "Unicode 6.2 code charts" (PDF). The Unicode Standard. Retrieved 1 April 2013.
- ^ Beeton, Barbara; Freytag, Asmus; Iancu, Laurențiu; Sargent, Murray (2015-10-30). "L2/15-268: Proposal to Represent the Slashed Zero Variant of Empty Set" (PDF).
- ^ a b "UTS #51 Emoji Variation Sequences". The Unicode Consortium.
- ^ Edberg, Peter (2011-12-22). "L2/11-438: Emoji Variation Sequences (Revision of L2/11-429)" (PDF).
- ^ Pournader, Roozbeh (2015-11-01). "L2/15-301: A proposal for 278 standardized variation sequences for emoji" (PDF).
- ^ "UTR #51: Unicode Emoji". Unicode Consortium. 2020-02-11.
- ^ "UCD: Emoji Data for UTR #51". Unicode Consortium. 2021-08-26.