유니코드 별칭 이름 및 약어

Unicode alias names and abbreviations

유니코드에서 문자는 고유한 이름을 가질 수 있다. 또한 문자는 하나 이상의 별칭 이름을 가질 수 있다. 별칭 이름은 약어, C0 또는 C1 제어 이름, 수정, 대체 이름 또는 그림일 수 있다. 별칭도 모든 이름과 별칭에 대해 고유하므로 식별한다.

배경

형식적이고 기본 유니코드 이름은 모든 이름에 걸쳐 고유하며 특정 문자 및 형식만 사용하며 절대 변경되지 않도록 보장된다. 정식 명칭은 문자 A-Z(상단), 0–9, " (공간), "-(하이픈)로 구성된다. 이 이름 옆에 문자는 하나 이상의 형식(일반) 별칭 이름을 가질 수 있다. 이러한 별칭 명칭은 또한 사용된 문자(A-Z, -, 0-9, <공간>)와 사용되지 않은 문자(a-z, %, $ 등)의 명칭 규칙을 따른다. 또한 별칭 이름은 전체 이름 집합에서 고유하다(즉, 모든 이름과 별칭 이름은 결합된 집합에서 모두 고유하다). 별칭 이름은 유니코드 표준에 공식적으로 설명되어 있다.[1][2]

이런 의미에서 약칭도 명칭으로 간주된다.

유니코드 표준은 또한 공식적이지 않고 규범에 나열되지 않은 "alias name"을 사용한다[where?]. NameAliases.txt 파일. 이러한 이름은 고유하지 않을 수 있으며 이름에 잘못된 문자를 사용할 수 있다.[citation needed]

별칭을 추가해야 하는 이유

코드 포인트에 별칭 이름을 할당해야 하는 5가지 가능한 이유가 있다.[1] 문자는 여러 개의 별칭을 가질 수 있다: 예를 들어 U+0008 <control-0008>에는 제어 별칭이 있다. 백스페이스 및 약어 별칭 BS.

1.약칭
제어 코드, 형식 문자, 공백 및 변동 선택기에 대해 일반적으로 발생하는 약어(또는 두문자어)
이러한 별칭은 변종 선택기에 대한 256개의 별칭을 포함하여 353개가 있다(VS-1 ...). VS-256).
예를 들어 U+00A0 NO-BREak SPACE에는 별칭 NBSP가 있다.
프레젠테이션: 코드 차트에서 약어는 점선 상자에 표시됨:
NBSP
.
2. 통제
C0 및 C1 제어 기능에 대한 ISO 6429 이름 및 유사하게 흔히 발생하는 이름을 문자에 대한 별칭으로 추가한다.
그런 가명이 84개나 된다.
예를 들어 U+0008 <control-0008>에는 백스페이스라는 별칭이 있다.
프레젠테이션: 컨트롤 문자는 기본 이름이 없으며, <control-0008>과 같이 레이블이 붙어 있다. 백스페이스와 같은 별칭 이름은 차트 설명서에서 사용되지만 기본 이름으로 사용되지 않는다. 이는 실제 제어 문자에 의해 의도하지 않은(자동화된) 교체를 방지하여 제어 기능을 방해한다. 예를 들어, 줄에 BEL이라는 별명을 사용하는 것은 U+0007 <control-0007>로 대체되어 벨소리를 발생시킨다.
3. 정정
이것은 주 문자 이름에 "심각한 문제"에 대한 보정이며, 대개 오류다.
그런 가명 29개가 있다.
예를 들어 U+2118 SCRIPATION CAPTIVAL P는 실제로는 소문자 p이고, 따라서 가명 ※ WEIERTRASS 타원 함수: "이것은 이름에도 불구하고 소문자 p의 형태를 가지고 있으며, 가명을 통해 정확한 철자가 추가된다."
프레젠테이션: 수정된 이름 앞에 기호 ※(참조 표시)가 붙는다.
4. 교대
형식 문자에 대해 널리 사용되는 몇 개의 대체 이름.
그런 가명이 하나 있다.
예: U+FEFF 0폭 No-break Space에는 대체 바이트 순서 표시가 있다.
프리젠테이션: 문자 차트 설명에 나열됨.
5. 계화
어떤 표준에서도 실제로 승인되지 않은 C1 제어 코드 포인트에 대한 문서화된 여러 라벨(그림 = 허구)
그런 가명이 3개 있다.
예를 들어, U+0099 <control-0099>에는 그림 별칭인 SING GRAPIC SECTION SENSER가 있다. 이 명칭은 ISO/IEC 10646-1 초안부터 건축적 개념이지만, 결코 승인되고 표준화되지 않았다.
프레젠테이션: 이러한 제품 약어는 표준에 발표되지 않는다. 차트는 각 비공식적으로 "XXX"를 표시한다. 즉, 고유하거나 식별 가능한 약어가 아니다.

형식별칭

U+ html
십진법의
이름
또는 <<label>>.
별칭 이유 차트 참고
압브르 이름
0000 &#0; <컨트롤-0000>
NUL
NULL 컨트롤 C0 제어 및 기본 라틴어(pdf)
0001 &#1; <통제-0001>
SOH
제목 시작 컨트롤 C0 제어 및 기본 라틴어(pdf)
0002 &#2; <컨트롤-0002>
STX
텍스트 시작 컨트롤 C0 제어 및 기본 라틴어(pdf)
0003 &#3; <통제-0003>
ETX
텍스트 끝 컨트롤 C0 제어 및 기본 라틴어(pdf)
0004 &#4; <컨트롤-0004>
EOT
전송의 끝. 컨트롤 C0 제어 및 기본 라틴어(pdf)
0005 &#5; <컨트롤-0005>
ENQ
문의 컨트롤 C0 제어 및 기본 라틴어(pdf)
0006 &#6; <통제-0006>
ACK
인정 컨트롤 C0 제어 및 기본 라틴어(pdf)
0007 &#7; <통제-0007>
경보 컨트롤 C0 제어 및 기본 라틴어(pdf)
0008 &#8; <컨트롤-0008>
BS
백스페이스 컨트롤 C0 제어 및 기본 라틴어(pdf)
0009 &Tab;
&#9;
<통제-0009>
문자표 컨트롤 C0 제어 및 기본 라틴어(pdf)
HT
수평 표 계산 컨트롤
000A &#10; <컨트롤-000>A>
LF
라인 피드 컨트롤 C0 제어 및 기본 라틴어(pdf)
NL
새 라인 컨트롤
EOL
줄의 끝. 컨트롤
000B &#11; <컨트롤-000B> 라인 표 계산 컨트롤 C0 제어 및 기본 라틴어(pdf)
VT
수직 표 계산 컨트롤
000C &#12; <컨트롤-000C>
FF
폼 피드 컨트롤 C0 제어 및 기본 라틴어(pdf)
000D &#13; <컨트롤-000D>
CR
캐리지 리턴 컨트롤 C0 제어 및 기본 라틴어(pdf)
000E &#14; <컨트롤-000E>
그렇게
시프트 아웃 컨트롤 C0 제어 및 기본 라틴어(pdf)
잠금-시프트 1 컨트롤
000F &#15; <컨트롤-000>F>
SI
시프트 인 컨트롤 C0 제어 및 기본 라틴어(pdf)
잠금-시프트 0 컨트롤
0010 &#16; <컨트롤-0010>
DLE
데이터 링크 이스케이프 컨트롤 C0 제어 및 기본 라틴어(pdf)
0011 &#17; <컨트롤-0011>
DC1
장치 제어 원 컨트롤 C0 제어 및 기본 라틴어(pdf)
0012 &#18; <컨트롤-0012>
DC2
장치 제어 2 컨트롤 C0 제어 및 기본 라틴어(pdf)
0013 &#19; <컨트롤-0013>
DC3
장치 제어 3 컨트롤 C0 제어 및 기본 라틴어(pdf)
0014 &#20; <제어-0014>
DC4
장치 제어 4 컨트롤 C0 제어 및 기본 라틴어(pdf)
0015 &#21; <제어-0015>
NAK
부정 확인 컨트롤 C0 제어 및 기본 라틴어(pdf)
0016 &#22; <컨트롤-0016>
SYN
동기식 유휴 상태 컨트롤 C0 제어 및 기본 라틴어(pdf)
0017 &#23; <컨트롤-0017>
ETB
변속기 블록 끝 컨트롤 C0 제어 및 기본 라틴어(pdf)
0018 &#24; <관제-0018>
취소 컨트롤 C0 제어 및 기본 라틴어(pdf)
0019 &#25; <통제-0019>
중간 끝 컨트롤 C0 제어 및 기본 라틴어(pdf)
001A &#26; <컨트롤-001>A>
후보선수
대체 컨트롤 C0 제어 및 기본 라틴어(pdf)
001B &#27; <컨트롤-001B>
ESC
탈출 컨트롤 C0 제어 및 기본 라틴어(pdf)
001C &#28; <컨트롤-001C> 정보 구분 기호 4 컨트롤 C0 제어 및 기본 라틴어(pdf)
FS
파일 구분 기호 컨트롤
001D &#29; <컨트롤-001D> 정보 구분 기호 3 컨트롤 C0 제어 및 기본 라틴어(pdf)
GS
그룹 구분 기호 컨트롤
001E &#30; <컨트롤-001E> 정보 분리기 2 컨트롤 C0 제어 및 기본 라틴어(pdf)
RS
기록 구분 기호 컨트롤
001F &#31; <컨트롤-001F> 정보 구분 기호 1 컨트롤 C0 제어 및 기본 라틴어(pdf)
미국
단위 분리기 컨트롤
0020 &#32; 스페이스
SP
약어 C0 제어 및 기본 라틴어(pdf)
007F &#127; <컨트롤-007>F>
DEL
삭제 컨트롤 C0 제어 및 기본 라틴어(pdf)
0080 &#128; <컨트롤-0080>
패드
패딩 문자 분화 C1 제어 및 라틴-1 보충판(pdf) 별칭은 유니코드에 의해 널리 게시되지 않으며, 차트에 고유하지 않은 XXX가 표시됨
0081 &#129; <관제-0081>
깡충깡
하이 옥텟 사전 설정 분화 C1 제어 및 라틴-1 보충판(pdf) 별칭은 유니코드에 의해 널리 게시되지 않으며, 차트에 고유하지 않은 XXX가 표시됨
0082 &#130; <통제기-0082>
BPH
여기서 중단 허용 컨트롤 C1 제어 및 라틴-1 보충판(pdf)
0083 &#131; <통제기-0083>
NBH
여기서 끊지 마십시오. 컨트롤 C1 제어 및 라틴-1 보충판(pdf)
0084 &#132; <관제-0084>
인디아
색인 컨트롤 C1 제어 및 라틴-1 보충판(pdf)
0085 &#133; <통제기-0085>
다음 라인 컨트롤 C1 제어 및 라틴-1 보충판(pdf)
0086 &#134; <컨트롤-0086>
SSA
선택한 영역의 시작 컨트롤 C1 제어 및 라틴-1 보충판(pdf)
0087 &#135; <통제기-0087>
ESA
선택한 영역의 끝 컨트롤 C1 제어 및 라틴-1 보충판(pdf)
0088 &#136; <컨트롤-0088> 문자표 집합 컨트롤 C1 제어 및 라틴-1 보충판(pdf)
HTS
수평 표 집합 컨트롤
0089 &#137; <통제기-0089> 맞춤이 있는 문자표 컨트롤 C1 제어 및 라틴-1 보충판(pdf)
HTJ
맞춤이 있는 수평 표 계산 컨트롤
008A &#138; <컨트롤-008>A> 라인 표 집합 컨트롤 C1 제어 및 라틴-1 보충판(pdf)
VTS
수직 테이블링 세트 컨트롤
008B &#139; <컨트롤-008B> 부분 선 앞쪽 컨트롤 C1 제어 및 라틴-1 보충판(pdf)
PLD
부분 라인 다운 컨트롤
008C &#140; <컨트롤-008C> 부분 선 뒤쪽으로 컨트롤 C1 제어 및 라틴-1 보충판(pdf)
PLU
부분 라인 업 컨트롤
008D &#141; <컨트롤-008D> 리버스 라인 피드 컨트롤 C1 제어 및 라틴-1 보충판(pdf)
RI
역지수 컨트롤
008E &#142; <컨트롤-008E> 싱글 시프트 2 컨트롤 C1 제어 및 라틴-1 보충판(pdf)
SS2
단일 시프트-2 컨트롤
008F &#143; <컨트롤-008F> 단일 시프트 3 컨트롤 C1 제어 및 라틴-1 보충판(pdf)
SS3
단일 시프트-3 컨트롤
0090 &#144; <컨트롤-0090>
DCS
장치 제어 문자열 컨트롤 C1 제어 및 라틴-1 보충판(pdf)
0091 &#145; <제어-0091> 개인용도원 컨트롤 C1 제어 및 라틴-1 보충판(pdf)
PU1
개인용도-1 컨트롤
0092 &#146; <제어-0092> 개인 용도 2 컨트롤 C1 제어 및 라틴-1 보충판(pdf)
PU2
개인 용도-2 컨트롤
0093 &#147; <통제기-0093>
STS
전송 상태 설정 컨트롤 C1 제어 및 라틴-1 보충판(pdf)
0094 &#148; <컨트롤-0094>
CCH
캐릭터 취소 컨트롤 C1 제어 및 라틴-1 보충판(pdf)
0095 &#149; <컨트롤-0095>
MW
메시지 대기 중 컨트롤 C1 제어 및 라틴-1 보충판(pdf)
0096 &#150; <컨트롤-0096> 경계 구역의 시작 컨트롤 C1 제어 및 라틴-1 보충판(pdf)
SPA
보호구역 시작 컨트롤
0097 &#151; <통제기-0097> 경계 구역 끝 컨트롤 C1 제어 및 라틴-1 보충판(pdf)
EPA
보호구역의 끝 컨트롤
0098 &#152; <통제기-0098>
SOS
문자열 시작 컨트롤 C1 제어 및 라틴-1 보충판(pdf)
0099 &#153; <관제-0099>
SGC
단일 그래픽 캐릭터 소개기 분화 C1 제어 및 라틴-1 보충판(pdf) 별칭은 유니코드에 의해 널리 게시되지 않으며, 차트에 고유하지 않은 XXX가 표시됨
009A &#154; <컨트롤-009>A>
SCI
싱글 캐릭터 소개서 컨트롤 C1 제어 및 라틴-1 보충판(pdf)
009B &#155; <컨트롤-009B>
CSI
제어 시퀀스 소개기 컨트롤 C1 제어 및 라틴-1 보충판(pdf)
009C &#156; <컨트롤-009C>
세인트
문자열 터미네이터 컨트롤 C1 제어 및 라틴-1 보충판(pdf)
009D &#157; <컨트롤-009D>
OSC
운영 체제 명령 컨트롤 C1 제어 및 라틴-1 보충판(pdf)
009E &#158; <컨트롤-009>E>
PM
개인 정보 메시지 컨트롤 C1 제어 및 라틴-1 보충판(pdf)
009층 &#159; <컨트롤-009>F>
APC
응용 프로그램 명령 컨트롤 C1 제어 및 라틴-1 보충판(pdf)
00A0 &nbsp; &NonBreakingSpace;
&#160;
깨지지 않는 공간
NBSP
약어 C1 제어 및 라틴-1 보충판(pdf)
00AD &shy;
&#173;
소프트 하이픈
샤이
약어 C1 제어 및 라틴-1 보충판(pdf)
01A2 &#418; 라틴 대문자 OI 라틴 대문자 GHA ※ 정정 라틴 확장-B(pdf)
01A3 &#419; 라틴 문자 작은 문자 OI 라틴 문자 GHA ※ 정정 라틴 확장-B(pdf)
034F &#847; Graphheme 결합기
CGJ
약어 분음 부호 결합(pdf) 이 문자의 이름은 오해의 소지가 있어, 실제로 제자에는 들어가지 않는다.
061C &#1564; 아랍 문자 표시
알엠
약어 아랍어(pdf) RLM 참조
0709 &#1801; SYRIAC 부선형 콜론 오른쪽으로 치우침 SYRIAC 서브선형 콜론 왼쪽 편향 ※ 정정 Syriac(pdf)
0CDE &#3294; 카나다 레터 FA 칸나다 레터 릴라 ※ 정정 칸나다(pdf)
0E9D &#3741; 라오 레터 포 TAM 라오 레터 포퐁 ※ 정정 라오(pdf)
0E9F &#3743; 라오 레터 포 성 라오 레터 FO FAY ※ 정정 라오(pdf)
0EA3 &#3747; 라오 레터 로링 라오 레터 로 ※ 정정 라오(pdf)
0EA5 &#3749; 라오스 문자 약탈 라오 레터 LO ※ 정정 라오(pdf)
0FD0 &#4048; 티베트어 마크 BSKA-쇼그 GI MGO RGO RGYAN 티베트어 마크 BKA-쇼그 GI MGO RGO RGYAN ※ 정정 티베트어(pdf)
11EC &#4588; 한글 종성 이어웅기역 한글 종성 예성기옥 ※ 정정 한글 자모(pdf)
11ED &#4589; 한글 종성 이어웅-쌍기옥 한글 종성 예성-쌍기옥 ※ 정정 한글 자모(pdf)
11EE &#4590; 한글 종성 쌍이웅 한글 종성 쌍계승 ※ 정정 한글 자모(pdf)
11EF &#4591; 한글 종성 이어웅-기욱 한글 종성 예성-기욱 ※ 정정 한글 자모(pdf)
180B &#6155; 몽골 자유 변형 선택기 1
FVS1
약어 몽골어(pdf)
180C &#6156; 몽골 자유 변형 선택기 2
FVS2
약어 몽골어(pdf)
180D &#6157; 몽골 자유 변형 선택기 3
FVS3
약어 몽골어(pdf)
180E &#6158; 몽골모음 구분 기호
MVS
약어 몽골어(pdf)
180F &#6159; 몽골 자유 변형 선택기 4
FVS4
약어 몽골어(pdf)
200B &NegativeMediumSpace; &NegativeThickSpace; &NegativeThinSpace; &NegativeVeryThinSpace; &ZeroWidthSpace;
&#8203;
제로 폭 공간
ZWSP
약어 일반 구두점(pdf)
200C &zwnj;
&#8204;
비조인자 제로 폭
ZWNJ
약어 일반 구두점(pdf)
200D &zwj;
&#8205;
제로 폭 조이너
ZWJ
약어 일반 구두점(pdf)
200E &lrm;
&#8206;
왼쪽에서 오른쪽으로 표시
LRM
약어 일반 구두점(pdf)
200F &rlm;
&#8207;
오른쪽에서 왼쪽 표시
RLM
약어 일반 구두점(pdf)
202A &#8234; 왼쪽에서 오른쪽으로 삽입
LRE
약어 일반 구두점(pdf)
202B &#8235; 오른쪽에서 왼쪽으로 삽입
RLE
약어 일반 구두점(pdf)
202C &#8236; 팝 방향 포맷
PDF
약어 일반 구두점(pdf)
202D &#8237; 왼쪽에서 오른쪽으로 오버라이드
LRO
약어 일반 구두점(pdf)
202E &#8238; 오른쪽에서 왼쪽으로 오버라이드
RLO
약어 일반 구두점(pdf)
202F &#8239; 좁은 깨지지 않는 공간
NNBSP
약어 일반 구두점(pdf)
화씨 205도 &MediumSpace;
&#8287;
중간수학공간
MMSP
약어 일반 구두점(pdf)
2060 &NoBreak;
&#8288;
워드 조이너
WJ
약어 일반 구두점(pdf)
2066 &#8294; 왼쪽에서 오른쪽으로 분리
LRI
약어 일반 구두점(pdf)
2067 &#8295; 오른쪽에서 왼쪽으로 격리
RLI
약어 일반 구두점(pdf)
2068 &#8296; 최초의 강력한 격리
FSI
약어 일반 구두점(pdf)
2069 &#8297; 팝 방향 격리
PDI
약어 일반 구두점(pdf)
2118 &weierp; &wp;
&#8472;
스크립트 캐피털 P 바이어스트라스 타원 함수 ※ 정정 문자 같은 기호(pdf)
2448 &#9288; OCR DASH MICR ON US 기호 ※ 정정 광학 문자 인식(pdf)
2449 &#9289; OCR 고객 계정 번호 MICR 대시 기호 ※ 정정 광학 문자 인식(pdf)
2B7A &#11130; 이중 수평 스트로크가 있는 왼쪽 삼각형-머리 화살표 이중 수직 스트로크가 있는 왼쪽 삼각형-머리 화살표 ※ 정정 기타 기호 및 화살표(pdf)
2B7C &#11132; 이중 수평 스트로크가 있는 오른쪽 삼각형-머리 화살표 이중 수직 스트로크가 있는 오른쪽 삼각형-머리 화살표 ※ 정정 기타 기호 및 화살표(pdf)
A015 &#40981; 이음절 우 이음절 반복 마크 ※ 정정 이음절(pdf)
AA6E &#43630; 미얀마 문자 KHAMTI HHA 미얀마 문자 KHAMTI LLA ※ 정정 미얀마 확장-A(pdf)
FE00
...
FE0F
&#65024;
...
&#65039;
변형 선택기-1
...
변형 선택기-16
VS1
...
VS16
약어 변동 선택기(pdf)
(16개 코드 포인트)
약어
FE18 &#65048; 수직 오른쪽 백색 렌즈 브라켓 표시 양식 오른쪽 흰색 수직 렌티콘 브라켓 표시 양식 ※ 정정 수직 양식(pdf)
FEFF &#65279; 제로 폭 브레이크 없는 공간
BOM
바이트 순서 표시 번갈아 아랍어 프리젠테이션 양식-B(pdf)
ZWNBSP
약어
122D4 &#74452; 쿠네폼 부호 셜 테뉴 쿠네폼 부호 NU11 TENU ※ 정정 쿠네폼(pdf)
122D5 &#74453; 시어 버 위쪽의 쿠네폼 부호 SHIRLD OF SHER BUR BUR BUR 쿠네폼 싸인 NU11 오버 NU11 BUR Over BUR BUR ※ 정정 쿠네폼(pdf)
16E56 &#93782; 메데파이드린 대문자 HP 메데파이드린 대문자 H ※ 정정 메데페이드린(pdf)
16E57 &#93783; 메데파이드린 대문자 NY 메데파이드린 대문자 NG ※ 정정 메데페이드린(pdf)
16E76 &#93814; 메데파이드린 작은 편지 HP 메데파이드린 작은 편지 H ※ 정정 메데페이드린(pdf)
16E77 &#93815; 메데파이드린 작은 편지 NY 메데파이드린 작은 편지 NG ※ 정정 메데페이드린(pdf)
1B001 &#110593; 히라가나 문자 구식 예 헤네타이가나 레터 E-1 ※ 정정 가나 보충판(pdf)
1D0C5 &#118981; 비잔틴 음악 기호 FHTORA SKLICON CHOMA VASIS 비잔틴 음악 기호 FTHORA SKLICON CHOMA VASIS ※ 정정 비잔틴 음악 기호(pdf)
E0100
...
E01EF
&#917760;
...
&#917999;
변형 선택기-17
...
변형 선택기-1256
VS17
...
VS256
약어 가변 선택기 보충판(pdf)
(240 코드 포인트)
약어


참고 항목

참조

  1. ^ a b "NameAliases-14.0.0.txt". The Unicode Consortium. 2020-10-21. Retrieved 2021-09-14.
  2. ^ The Unicode Standard (PDF). 14.0.0. The Unicode Consortium. 2021. ISBN 978-1-936213-29-0.