개인 사용 영역
Private Use Areas유니코드에서 PUA(Private Use Area)는 유니코드 컨소시엄에 [1]의해 문자가 할당되지 않는 코드 포인트 범위입니다.기본 다국어 평면에 한 개의 개인 사용 영역이 정의됩니다.U+E000–U+F8FF), 평면 15 및 16(U+F0000)에 각각 1개씩, 거의 커버링 가능–U+FFFD, U+100000–U+10FFFD).이 영역의 코드 포인트는 유니코드 자체에서 표준화된 문자로 간주할 수 없습니다.유니코드 컨소시엄 할당과 충돌하지 않고 제3자가 자신의 문자를 정의할 수 있도록 이러한 문자는 의도적으로 정의되지 않은 상태로 유지됩니다.유니코드 안정성 [2]정책에 따라 개인 사용 영역은 향후 모든 유니코드 버전에서 해당 용도로 할당된 상태로 유지됩니다.
개인 용도 지역 문자에 대한 할당은 조직 내부의 엄격한 의미에서 개인적인 것일 필요는 없습니다. 여러 조직에서 여러 할당 계획을 발표했습니다.이러한 출판물에는 정의(글리프 표시)를 지원하는 글꼴과 개인용 문자(예: "인쇄 문서" 기능을 위한 그래픽 문자)를 사용하는 소프트웨어가 포함될 수 있습니다.정의에 따라 여러 개인 사용자가 동일한 코드 포인트에 다른 문자를 할당할 수 있으며, 따라서 사용자는 다른 문자를 의도한 설치된 글꼴에서 하나의 개인 문자를 볼 수 있습니다.
정의.
유니코드 정의에 따라 개인 사용 영역의 코드 포인트는 할당된 문자로, 비문자, 예약 또는 할당되지 않은 문자가 아닙니다.그들의 카테고리는 "Other, private use (Co)
", 문자 이름은 지정되지 않습니다.대표적인 글리프는 제공되지 않으며, 문자 의미론은 사적인 합의에 맡깁니다.
개인용 문자에는 이 표준에 의해 해석이 지정되지 않은 유니코드 코드 포인트가 할당되며, 이 코드 포인트의 사용은 협력 사용자 간의 개인적인 합의에 의해 결정될 수 있습니다.이러한 문자는 사적인 용도로 지정되었으며 사적인 동의를 제외하고는 정의되고 해석 가능한 의미를 갖지 않습니다.
...
개인용 문자에 대해서는 차트가 제공되지 않습니다. 이러한 문자는 특성상 이 [3]표준의 컨텍스트 밖에서만 정의되기 때문입니다.
과제
기본 다국어 평면(평면 0)에서 개인 사용 영역이라는 제목의 블록에는 6400개의 코드 포인트가 있습니다.
15번과 16번 비행기는[note 1] 거의 전적으로 두 개의 추가적인 사적 용도 지역, 즉 보충 사적 용도 지역-A번과 보충 사적 용도 지역-B번에 할당됩니다.UTF-16에서 높은 대용치(U+DB80..U+DBFF)는 이들 비행기와 이 비행기에만 사용되며, 높은 사적 사용 대용치라고 불립니다.
유니코드: 개인 사용 영역 | ||||
---|---|---|---|---|
문자 속성에 의한 정의 : 일반 카테고리=Co | ||||
범위 | 비행기 | 블록명 | 코드 포인트 수 | 메모 |
U+E000..U+F8FF | BMP (0) | 전용면적 | 6,400 | |
U+F0000..U+FFFD[c] | PUP (15)[d] | 보조전용면적-A | 65,534 | UTF-16은 U+DB80..(U+DB80..) 블록의 코드 포인트를 사용하여 U+DB80..BMP에서 U+DBFF). |
U+100000..U+10FFFD[c] | PUP (16)[d] | 부가적 전용면적-B | 65,534 | |
메모들 |
유니코드 PUA 블록
유니코드에는 [3]3개의 PUA 블록이 있습니다.
전용면적 | |
---|---|
범위 | U+E000..U+F8FF (6,400 코드 포인트) |
비행기 | BMP |
스크립트 | 알 수 없는 |
맡겨진 | 코드 포인트 6,400개 |
미사용 | 예약 코드 포인트 0개 |
유니코드 버전 기록 | |
1.0.0(1991) | 5,632 (+5,632) |
1.0.1 (1992) | 6,400 (+768) |
유니코드 설명서 | |
코드 차트 ∣ 웹 페이지 | |
참고: 버전 1.0.1은 개인 사용 영역 블록(이전 버전 1.0.[4][5][6]0의 U+E800-U+FDFF에 있음)을 이동 및 확장했습니다. |
보조전용면적-A | |
---|---|
범위 | U+F0000..U+FFFFFF (65,536 코드 포인트) |
비행기 | SPUA-A |
스크립트 | 알 수 없는 |
맡겨진 | 65,534개의 코드 포인트 |
미사용 | 예약 코드 포인트 0개 비문자 2개 |
유니코드 버전 기록 | |
2.0 (1996) | 65,534 (+65,534) |
차트 | |
코드 차트 | |
참고: |
부가적 전용면적-B | |
---|---|
범위 | U+100000..U+10FFFF (65,536 코드 포인트) |
비행기 | SPUA-B |
스크립트 | 알 수 없는 |
맡겨진 | 65,534개의 코드 포인트 |
미사용 | 예약 코드 포인트 0개 비문자 2개 |
유니코드 버전 기록 | |
2.0 (1996) | 65,534 (+65,534) |
차트 | |
코드 차트 | |
참고: |
역사
유니코드 1.0.0에서 개인 사용 영역은 U+E800에서 U+FDFF로 확장되었습니다(즉, U+E000을 포함하지 않았습니다).E7FF, 하지만 추가로 U+F900도 포함되어 있습니다.현재 CJK 호환성 표식, 알파벳 표현 양식 및 아랍어 표현 양식이 [7]차지하고 있는 FDFF 범위.U+E000으로 변경되었습니다.유니코드 1.0.[4]1에서는 F8FF를, 유니코드 1.1에서는 [8]F8FF를 그대로 사용하였습니다.오해와 달리 U+D800 범위는..DFFF(Unicode 2.0 이후 UTF-16 대용품을 위해 예약됨)는 Unicode 1.x 버전의 개인 사용 범위에 포함되지 않았습니다.
역사적으로, 범용 부호화 문자 집합(즉, U+E00000~U+FFFFFF 및 U+600000~U+7FFFFFF)의 E0(224)부터 FF(255)까지의 평면 및 60(96)부터 7F(127)까지의 그룹 또한 사적 용도로 지정되었습니다.UCS가 UTF-16에서 [9]도달할 수 있는 17개의 비행기로 제한될 때 이러한 범위는 지정된 개인용 범위에서 제거되었습니다.
사용.
표준화 이니셔티브 사용
많은 사람들과 기관들이 PUA를 위한 캐릭터 컬렉션을 만들었습니다.이러한 사적 사용 계약 중 일부는 공개되므로 다른 PUA 구현자는 중복을 방지하기 위해 사용되지 않거나 덜 사용된 코드 포인트를 목표로 할 수 있습니다.개인 사용 계약에서 이전에 인코딩된 여러 문자와 스크립트는 실제로 완전히 유니코드로 인코딩되었으며, 따라서 PUA에서 다른 유니코드 코드 포인트로의 매핑이 필요합니다.
더 잘 알려지고 광범위하게 구현된 PUA 협약 중 하나는 ConScript Unicode Registry(CSUR)에 의해 유지됩니다.CSUR는 공식적으로 승인되거나 유니코드 컨소시엄과 관련이 없는 Klingon pIqaD 및 Ferengi 스크립트(Star Trek), Tengwar 및 Cirth(J.R.R.Tolkien의 필기체 및 룬 문자), Alexander Melville Bell의 Visible Speech 및 On Beyond Zebra의 Dr. Suss 알파벳과 같은 구성된 스크립트에 대한 매핑을 제공합니다.CSUR는 이전에 암호화되지 않은 파이스토스 문자와 샤비아 문자와 데세레트 문자를 인코딩했으며, 이 문자들은 모두 유니코드의 공식 인코딩으로 승인되었습니다.
또 다른 일반적인 PUA 협정은 MUFI(Median Unicode Font Initiative)에 의해 유지됩니다.이 프로젝트는 라틴 알파벳으로 쓰여진 중세 텍스트에서 발견되는 모든 필경 축약어, 연결문자, 미리 작곡된 문자, 기호 및 대체 문자 형태를 지원하려고 시도하고 있습니다.MUFI의 명시적인 목적은 이러한 텍스트를 표현하기 위해 어떤 문자가 필요한지 실험적으로 결정하고 해당 문자가 유니코드로 공식적으로 인코딩되도록 하는 것입니다.유니코드 버전 5.1 현재 152개의 MUFI 문자가 공식 유니코드 [needs update]인코딩으로 통합되었습니다.
일부 합의된 PUA 문자 모음은 유니코드 컨소시엄이 서둘러 인코딩하지 않기 때문에 부분적으로 또는 전체적으로 존재합니다.표현되지 않은 언어와 같은 일부 언어는 미래에 결국 인코딩될 가능성이 높습니다.가상 언어와 같은 일부 특이한 경우는 유니코드의 일반적인 범위를 벗어나지만 유니코드 원칙에 의해 명시적으로 배제되지 않으며, 결국 (스타 트렉 및 톨킨 문자 시스템과 같은) 나타날 수 있습니다.다른 경우에는 제안된 인코딩이 하나 이상의 유니코드 원칙을 위반하기 때문에 유니코드에서 공식적으로 인식되지 않을 가능성이 높습니다. 대부분 사용자가 대체 형태, 연결체 또는 기본 문자+대음 부호 조합(TUNE 방식 등)을 직접 인코딩하려는 곳입니다.
출판사 | 주제 | PUA 영역 사용 | 글꼴 |
---|---|---|---|
CSUR | 인공 및 일부 고대/중세 대본 | PUA(BMP) 및 평면 15 | 코드2000 |
MUFI | 중세 대본 | PUA(BMP) | 여러명 |
SIL | 음성학과 언어 | PUA(BMP) | 샤리스실 |
티투스 | 고대 및 중세의 대본 | PUA(BMP) | TITUS 사이버비트 베이직 |
- 이모지는 일본의 무선 메시지와 웹 페이지에서 사용되는 그림 문자나 이모티콘을 위한 인코딩입니다.Unicode 6.0 이상에서는 이러한 것들 중 많은 것들이 Miscious Symbols And Pictographs 블록과 SMP의 다른 곳에서 인코딩되었습니다.
- GB/T 20542-2006("티베트 부호화 문자 집합 확장자 A") 및 GB/T 22238-2008("티베트 부호화 문자 집합 확장자 B")은 PUA를 사용하여 사전 구성된 티베트 문자 집합을 인코딩하는 중국 국가 표준입니다.
- GB 18030 및 GBK는 PUA를 사용하여 발행 당시 유니코드 표준에 없는 문자를 임시로 인코딩합니다.
- 에스토니아어 연구소는 PUA를 사용하여 유니코드 인코딩이 없는 라틴어와 키릴 문자를[10] 인코딩합니다.
- Free Tengwar Font Project는 주로 Michael Everson의 2001-03-07 Tengwar 토론 논문을 따르는 Conscript Unicode Registry와는 다른 매핑을 사용하지만 일부 세부 사항에서 차이가 있습니다.
- MARC 21 표준은 PUA를 사용하여 유니코드 인코딩이 없는 MARC-8에[11] 존재하는 동아시아 문자를 인코딩합니다.
- SIL Corporate PUA는 PUA를 사용하여 아직 승인되지 않은 소수 언어에 사용되는 문자를 유니코드로 인코딩합니다.
- STIX 글꼴 프로젝트는 PUA를 사용하여 수학 기호 및 알파벳으로 구성된 포괄적인 글꼴 세트를 제공합니다. 이러한 글꼴 세트의 대부분은 현재 SMP(수학 영숫자 기호) 블록에서도 사용할 수 있습니다.
- 타밀 유니코드 신규 인코딩(TUNE)[12]은 현재 유니코드 인코딩에서 인식된 결함을 극복하기 위해 제안된 타밀어 인코딩 방식입니다.
벤더사용
비공식적으로 U+F000 ~ U+F8FF 범위는 기업 사용 영역으로 알려져 있습니다.이는 U+E000에서 위쪽으로 확장되는 "최종 사용자 영역"과 U+F8FF에서 아래쪽으로 확장되는 "기업 사용 영역"을 정의한 초기 버전의 유니코드에서 비롯되었으며, 둘 사이의 경계는 [8]정의되지 않았습니다.
- 어도비 글리프 목록은 일부 [13]글리프에 PUA를 사용하곤 했습니다.
- Apple은 개발자[14] 문서에 U+F400–U+F8FF부터 Apple이 사용할 수 있는 범위의 1,280자를 나열합니다.이 중 U+F700–U+F8FF(NeXTSTEP 및 OPENSTEP)와 Apple(Mac OS X AppKit)[15] 범위에서 311개만 사용됩니다.
- 그 중 하나가 애플 로고인 U+F8FF인데, 일반적으로 애플의 8비트 세트에서 지원됩니다.
- WGL4는 PUA(U+F001 및 U+F002)를 사용하여 fl(U+FB01) fi(U+FB02)의 중복을 인코딩합니다.
- 마이크로소프트의 사라진 서비스 포 매킨토시 기능은 HFS에서는 허용되지만 NTFS에서는 금지되는 특수 문자의 대체로 U+F001부터 U+F029까지, 애플 [17][18]로고에서는 U+F02A를 사용했습니다.
- 이전 버전의 RichEdit 구성 요소에서 Microsoft는 PUA 내의 U+F020–U+F0FF를 기호 글꼴에 매핑했습니다.이 범위의 모든 문자에 대해 RichEdit은 EUDC([19][20]최종 사용자 정의 문자) 대신 기호 글꼴의 문자를 표시합니다.
- AutoCAD는[clarification needed] U+F8FC–U+F8FE를 각각 θ(지름 부호), ±(+-마이너스 부호), °(도 부호)에 사용합니다.
- 일부 글꼴은 Windows 로고 키를 다음 위치에 둡니다.
U+F000
. - 번호
U+F000
는 Agar.io 와 같은 일부 비디오 게임에서 13 또는 18에 시작하는 숫자 연속입니다. - Ubuntu에서는,
U+E0FF
Circle Of Friends 로고로[21] 표시되며,U+F200
우분투 서체에 "Circle Of Friends"(서클 오브 프렌즈)라는 위첨자가 붙어있는 "ubuntu"입니다.U+F0FF
).[22] - 3270 글꼴에는 데비안 로고가 포함되어 있습니다.
U+F100
- Linux Libertine 글꼴에서,
U+E000
리눅스의 마스코트 턱스를 전시합니다. - Font Awesome 아이콘 글꼴은 PUA를 사용하여 다양한 글리프를 표시합니다.
- Vim의 상태 라인 플러그인인인 Powerline은 U+E0A0를 사용합니다.U+E0A2 및 U+E0B0 –추가 상자 그리기 [23][24][25]캐릭터를 위한 U+E0B3.
- Firefox OS에서 사용되는 Fira Sans 서체에서,
U+E003
는 Mozilla 로고(공룡 헤드)로 표시됩니다. - Lotus/IB에서 내부적으로 사용하는 인코딩 및 문자 집합인 LMBCS(Lotus Multi-Byte Character Set)MLotus 1-2-3, Symphony, SmartSuite, Notes, Domino는 물론 Microsoft Works와 같은 여러 타사 제품에서도 일부 문자를 사용합니다.
U+F862
-U+F89F
그리고.U+F8FB
-U+F8FE
유니코드에 정의되지 않은 기호에 대한 개인 사용 영역에서 선택합니다.이 중에서.U+F8FB
는 크라운 통화 기호("Kr")를 위해 예약된 것으로 알려져 있으며,U+F8FC
그리고.U+F8FD
나중에 에 매핑되었습니다.U+FB02
(해적) 및U+FB01
각(fi)또한, UTF-16 코드가 LMBCS에 내장되어 있는 경우, UTF-16 코드는 다음과 같습니다.U+F601
통해.U+F6FF
LMBCS는 내장된 null [26][27]바이트를 포함하지 않도록 설계되었기 때문에 null 바이트를 포함하는 UTF-16 코드로 대체됩니다. - IBM은 PUA 코드 페이지를 위한 몇 가지 코드 페이지 ID를 예약했습니다: 일반 평면 15에 대한 코드 페이지 1446, 일반 평면 16에 대한 코드 페이지 1447, 일반 BMP PUA에 대한 코드 페이지 1448, U+FF00–[28][29]U+FFFD에 IBM이 할당된 평면 15에 대한 코드 페이지 1445(IBM AFP PUA No. 1),U+F83D–[30][31]U+F8FF에서 IBM 할당이 있는 BMP PUA에 대한 코드 페이지 1449(IBM 기본 PUA).
- Windows에서 찾을 수 있는 파일 시스템은
U+F000
로.U+F0FF
특수 문자를 피하려면 차단해야 합니다. - NetApp은 유닉스에서는 허용되지만 SMB 클라이언트에서는 유효하지 않은 파일 이름의 문자를 PUA [32]문자로 변환합니다.
- 트위터의 처프 글꼴은 다음과 같은 추가 아이콘을 제공합니다.
U+E000
왼쪽 아래쪽 화살표에 해당합니다U+EA00
트위터 새에 해당하는 것이고,U+F8FF
Apple [33]글꼴과의 호환성을 위해 Apple 로고에 해당합니다.
다른 문자 집합의 개인 사용 문자
Private Use를 위해 특정 코드 포인트를 예약하는 개념은 다른 문자 집합에서의 이전의 유사한 사용법을 기반으로 합니다.특히 동아시아 스크립트에서 오래되지 않은 많은 문자들이 특정 이름이나 다른 상황에서 계속 사용되고 있기 때문에 일부 문자 집합은 개인용 문자(예: CNS 11643의 사용자 정의 평면 또는 특정 일본어 인코딩의 가이지)를 허용했습니다.유니코드 표준은 이러한 [3]용도를 EUCD(End User Character Definition)라는 이름으로 참조합니다.
또한, C1 제어 블록은 ECMA-48에 의해 사적인 용도로 "제어 기능"을 위한 두 가지 코드를 포함합니다: 0x91개인 사용 1(PU1)과 0x92 개인 사용 2(PU2).[34][35]유니코드는 U+0091 <control-0091> 및 U+0092 <control-0092>에 이러한 내용을 포함하지만 컨트롤 문자(카테고리)로 정의합니다.Cc
), 개인용 문자가 아님(category)Co
).[5][36]
ISO/IEC 8859 및 Shift JIS와 같이 전용 영역이 없지만 사용되지 않는 영역이 더 많거나 적은 인코딩은 이러한 인코딩의 제어되지 않는 변형을 [37]확인할 수 있었습니다.유니코드의 경우, 소프트웨어 회사는 원하는 추가 사항에 대해 개인 사용 영역을 사용할 수 있습니다.
메모들
참고문헌
- ^ "Glossary of Unicode Terms: "Private Use Area (PUA)"". Unicode Consortium.
- ^ "Unicode Character Encoding Stability Policy". 2021-11-10. Retrieved 2022-03-03.
- ^ a b c "Chapter 23 Special Areas and Format Characters" (PDF). The Unicode Standard Version 14.0 - Core Specification. Private Use characters.
- ^ a b "Unicode 1.0.1" (PDF). The Unicode Standard. 1992-11-03. Archived (PDF) from the original on 2016-07-02. Retrieved 2016-07-09.
- ^ a b c d "Unicode character database". The Unicode Standard. Retrieved 2023-07-26.
- ^ a b c "Enumerated Versions of The Unicode Standard". The Unicode Standard. Retrieved 2023-07-26.
- ^ "3.5: Private Use Area" (PDF). The Unicode Standard, Version 1.0, Volume 1. Unicode Consortium. 1991. pp. 118–119. ISBN 0-201-56788-1. Archived (PDF) from the original on 2021-10-21. Retrieved 2021-10-11.
- ^ a b "2.0: Changes in Unicode 1.0" (PDF). The Unicode Standard, Version 1.1. Unicode Consortium. pp. 3–4. UTR #4. Archived (PDF) from the original on 2021-11-20. Retrieved 2021-10-11.
- ^ Whistler, Ken (2000). "Necessary changes for ISO/IEC 10646 regarding the PUA". UTC/00-015. Archived from the original on 2021-06-23. Retrieved 2021-01-30.
- ^ "Letter Database". Eki.ee. Archived from the original on 2018-05-21. Retrieved 2013-04-11.
- ^ "Character Sets: East Asian Characters: Alternative Unicode Mappings for MARC 21 Characters Assigned to the Private Use Area (PUA): MARC 21 Specifications for Record Structure, Character Sets, and Exchange Media (Library of Congress)". Loc.gov. 2004-09-02. Archived from the original on 2013-08-19. Retrieved 2013-04-11.
- ^ "tunerfc.tn.nic.in". tunerfc.tn.nic.in. Archived from the original on 2010-07-29. Retrieved 2013-04-11.
- ^ "Unicode Corporate Use Subarea as used by Adobe Systems". October 22, 1998. Archived from the original on October 9, 2002. Retrieved May 12, 2021.
- ^ "NSOpenStepUnicodeReservedBase - Apple Developer Documentation". Apple Inc. Archived from the original on 2020-11-06. Retrieved 2020-10-16.
- ^ Apple Computer, Inc. (2005) [1994]. "CORPCHAR.TXT - Registry (external version) of Apple use of Unicode corporate-zone characters". c03. Unicode Inc. Archived from the original on 2020-10-30. Retrieved 2020-10-16.
- ^ "WGL4 Unicode Range U+2013 through U+FB02". Microsoft. Archived from the original on 2014-07-17.
- ^ "SFM Converts Macintosh HFS Filenames to NTFS Unicode". Microsoft Support. February 24, 2014. Archived from the original on May 27, 2016.
- ^ "ntfs.util.c". 2008. Archived from the original on 2018-08-07. Retrieved 2018-08-07.
Invalid NTFS filename characters are encodeded [sic] using the SFM (Services for Macintosh) private use Unicode characters.
- ^ "The range of characters between U+F020 and U+F0FF in the Private Use Area of Unicode is mapped to symbol fonts in Richedit 4.1". Microsoft Knowledge Base. Archived from the original on 2012-10-22.
- ^ "Handling of PUA Characters in Microsoft Software". SIL International. 2003-04-25. Archived from the original on 2015-05-11. Retrieved 2014-03-04.
- ^ "Comment #8 : Bug #651606 (circle-of-friends) : Bugs : Ubuntu Font Family". Launchpad. 5 October 2010. Archived from the original on 2020-10-17. Retrieved 2020-10-17.
- ^ "Comment #2 : Bug #853855 : Bugs : Ubuntu Font Family". Launchpad. 26 September 2011. Archived from the original on 2020-10-17. Retrieved 2020-10-17.
- ^ "Powerline status line plugin question on Stack Exchange mentioning private use area characters". Archived from the original on 2015-03-12. Retrieved 2015-03-22.
- ^ "Pictures showing private use area characters in Powerline patched fonts". Archived from the original on 2015-05-11. Retrieved 2015-03-22.
- ^ Li, Renzhi (2019-08-23). "Proposal to add additional characters into the Graphics for Legacy Computing block of the UCS" (PDF). Retrieved 2023-07-31.
- ^ "lmb-excp.ucm". GitHub. 2000-02-10. Archived from the original on 2022-01-25. Retrieved 2020-04-23.
- ^ "Anhang 2. Der Lotus Multibyte Zeichensatz (LMBCS)" [Appendix 2. The Lotus Multibyte Character Set (LMBCS)]. Lotus 1-2-3 Version 3.1 Referenzhandbuch [Lotus 1-2-3 Version 3.1 Reference Manual] (in German) (1 ed.). Cambridge, Massachusetts, US: Lotus Development Corporation. 1989. pp. A2–1 – A2–13. 302168.
- ^ "CPGID 01445 (chart)" (PDF). REGISTRY: Graphic Character Sets and Code Pages. 2012 [2011]. C-H 3-3220-050.
The area shown in the chart above represents only 254 bytes of row FF in plane 0F.
- ^ "CPGID 01445: IBM AFP PUA No. 1". REGISTRY: Graphic Character Sets and Code Pages. 2012 [2011]. C-H 3-3220-050.
The area shown in the chart above represents only 254 bytes of row FF in plane 0F.
- ^ "CPGID 01449: IBM default PUA". IBM Globalization: Code page identifiers. IBM. Archived from the original on 2015-09-16.
IBM has designated 195 positions from U+F83D to U+F8FF for use as IBM Corporate-zone and intends to use them consistently within IBM whenever there is a need to maintain the round-trip integrity of IBM characters.
- ^ IBM (1997). unicode.nam: Allow the Unicode characters to be specified using either the IBM or PostScript like names. (에 포함)
- ^ "Configure character mapping for SMB file name translation on volumes". 9 December 2021. Retrieved 2022-10-14.
- ^ "Twitter Chirp Font". Copy Paste Dump. Retrieved 2022-02-08.
- ^ "Standard ECMA-48, Fifth Edition - June 1991" (PDF). §8.2.14 Miscellaneous control functions, §8.3.100, §8.3.101.
- ^ ISO/TC97/SC2 (1983-10-01). C1 Control Character Set of ISO 6429 (PDF). ITSCJ/IPSJ. ISO-IR-77.
- ^ "Chapter 4 Character Properties" (PDF). The Unicode Standard Version 14.0 - Core Specification. Table 4-4.
- ^ "Map (external version) from Mac OS Japanese encoding to Unicode 2.1 and later". Archived from the original on 2021-08-31. Retrieved 2021-10-08.