유니코드 숫자
Numerals in Unicode숫자(유니코드에서는 숫자라고도 함)는 숫자를 나타내는 문자다. 십진법은 전 세계의 다양한 문자 체계에서 널리 사용되고 있으나 십진수를 나타내는 문자는 크게 다르기 때문에 유니코드는 십진수를 나타내는 22개의 다른 문자 집합과 다양한 십진수, 수천 개의 구분자, 음성 기호 등을 포함하고 있다. 유니코드는 또한 에게 숫자, 로마 숫자, 카운팅 로드 숫자, 쿠네폼 숫자, 고대 그리스 숫자와 같은 십진수가 아닌 숫자들을 포함하고 있다. 또한 ² 또는 ②와 같은 이전의 문자 집합과 호환성을 위해 제공되는 서양 아라비아 숫자와 ½과 같은 복합 문자의 인쇄적 변화도 많다.
숫자 속성별 숫자
텍스트에서 사용되는 숫자 속성에 따라 그룹화된 유니코드는 숫자 유형에 대한 4개의 값을 가진다. 첫째, "숫자가 아니다" 유형이 있다. 그 다음 서양식 십진법(plain 0–9)에서 흔히 쓰이는 십진법(십진법) 숫자들이 있고, 로마자 번호와 같은 십진법의 일부가 아닌 숫자들이 있으며, 동그라미처럼 타이포그래픽 맥락에서 십진법 숫자들이 있다. "A. B. C"와 같은 번호부호는 언급되지 않았다.
[a][b] (유니코드 문자 속성) | 숫자 유형||||
---|---|---|---|---|
숫자형 | 코드 | 숫자 값 포함 | 예 | 언급 |
숫자 아님 | None | 아니요. |
| 숫자 값="NaN" |
십진법 | De | 네 |
| 직선 자릿수(십진수-라디ix). 일반 카테고리=Nd와[a] 양방향 모두 일치 |
숫자 | Di | 네 |
| 십진수, 그러나 타이포그래픽 컨텍스트의 경우 |
숫자 | Nu | 네 |
| 숫자 값(십진수는 아님) |
a ^ "Section 4.6: Numeric Value" (PDF). The Unicode Standard. Unicode Consortium. September 2021. | ||||
b. ^ "Unicode 14.0 Derived Numeric Types". Unicode Character Database. Unicode Consortium. 2021-03-08. |
16진수 자리수
유니코드의 16진수는 별도의 문자가 아니다; 기존의 문자와 숫자가 사용된다. 이 문자는 문자 속성을 표시함 Hex_digit=Yes
그리고 ASCII_Hex_digit=Yes
적절한 때에
유니코드의 문자 표시 Hex_Digit=Yes [a] | |||
---|---|---|---|
0123456789ABCDEF | 기본 라틴어, 대문자 | 또한 ASCII_Hex_Digit=Yes | |
0123456789abcdef | 기본 라틴어, 작은 글자 | 또한 ASCII_Hex_Digit=Yes | |
0123456789ABCDEF | 전체 너비 양식, 대문자 | ||
0123456789abcdef | 전체 너비 양식, 작은 문자 | ||
a. ^ "Unicode 14.0 UCD: PropList.txt". 2021-08-12. Retrieved 2020-03-12. |
대본별 숫자
힌두-아랍 숫자
힌두-아랍 숫자 체계에는 0~9를 나타내는 10자리 숫자가 포함되어 있다. 유니코드는 기본 라틴어(또는 ASCII 파생) 블록에 서양의 아라비아 숫자를 포함한다. The digits are repeated in several other scripts: Eastern Arabic, Balinese, Bengali, Devanagari, Ethiopic, Gujarati, Gurmukhi, Telugu, Khmer, Lao, Limbu, Malayalam, Mongolian, Myanmar, New Tai Lue, Nko, Oriya, Telugu, Thai, Tibetan, Osmanya. 유니코드는 데이터 정렬 및 기타 텍스트 처리 작업을 지원하기 위해 각 자릿수에 대한 숫자 값 속성을 포함한다. 그러나 관련된 다양한 숫자 사이에는 매핑이 없다.
아랍어는 오른쪽에서 왼쪽으로 쓰이지만, 영어는 왼쪽에서 오른쪽으로 쓰이지만, 두 언어의 숫자는 왼쪽에서 가장 유의미한 숫자와 오른쪽에서 가장 유의미한 숫자로 쓰이고 있다.
분수
분수 슬래시 문자(U+2044)는 유니코드를 사용하는 저자가 십진수와 함께 임의의 분수를 구성할 수 있도록 한다. 이는 폰트렌더링을 지시하여 주변 숫자를 작게 하고 왼쪽을 올리고 오른쪽을 낮추도록 하기 위한 것이었으나, 이는 거의 실행되지 않는다. (해결 방법은 아래에 설명된 슈퍼/서브스크립트 문자를 사용하는 것이지만 아라비아 숫자만 사용할 수 있다.) 유니코드는 또한 호환성 문자로 저속한 분수를 몇 개 포함하지만 사용을 금지한다.
소수분수
유니코드의 여러 문자는 로케일에 따라 소수 구분자 역할을 할 수 있다. 소수점 분수는 소수점 구분 기호를 사용하여 소수점 숫자 순서에서 소수점 부분과 소수점 부분을 구분하는 순서로 텍스트로 표현된다. 예를 들어 ¼의 소수점은 0점 2-5("0.25")로 표현된다. 유니코드는 전용 일반 소수 구분 기호가 없지만 다른 구두점 문자와 십진 구분 기호를 통일한다. 그래서 "0.25"에서 사용된 "."는 문장을 끝낼 때 사용한 같은 기간 문자(U+002E)이다. 그러나 소수 구분자에 사용되는 글립자나 그래핀에는 문화가 다양하다. 따라서 일부 로케일에서 쉼표(U+002C)를 대신 사용할 수 있다: "0,25". 여전히 다른 로케인은 "0 25"를 위한 공간(또는 비파괴 공간)을 사용한다. 아라비아 문자 체계에는 쉼표 "٫" (U+066B)와 많이 닮은 소수 구분 문자 전용 문자가 포함되어 있는데, 이 문자를 아라비아 숫자와 결합하여 1/4을 표현할 때 다음과 같이 나타난다.
수학 상수에 대한 문자
현재 세 개의 유니코드 문자는 의미론적으로 수학 상수를 나타낸다. U+210E ℎ PlanCK CONSTANT, U+210F ℏ PlanCK CONSTANT Over Two PI, U+2107 ℇ 오일러 CONSTANT. 기타 수학 상수는 여러 개의 의미론적 용도가 있는 문자를 사용하여 나타낼 수 있다. 예를 들어 유니코드가 자연지수의 문자 ℯ(U+212F)를 포함하지만 UCS 표준 명칭은 글리프: U+212F ℯ SCRIP SLIGH E에서 유래하며, 수학 상수 π 3.141592는 U+03C0 π GRIS SLATE PI로 표현된다.
리치 텍스트 및 기타 호환성 숫자
또한 서양의 아라비아 숫자들은 호환 문자들 사이에 굵은 글씨, 이중 띠, 모노스페이스, 산세리프, 산세리프 굵은 글씨를 포함한 풍부한 문자 변형 형태와 함께 기존의 수직 문자 지원을 위한 전체 폭의 변형 형태로 나타난다.
괄호화된 풍부한 텍스트, 동그라미 및 기타 변종도 "CJK 문자 및 월", "첨자 및 첨자", "숫자 형식" 및 "딩뱃" 블록에 포함된다.
쑤저우(hu州/Suzhou mǎzi) 숫자
화음계(간체 중국어: 码;; 전통 중국어: 碼))/수조우 mǎzi(간체 중국어: 苏州码子; 전통 중국어: 蘇州碼字) 체계는 로드 번호 체계의 변형이다. 로드 숫자는 카운팅 로드와 주판과 밀접한 관련이 있으며, 이것이 화음계 1, 2, 3, 6, 7, 8의 숫자 기호가 주판과 비슷한 방식으로 표현되는 이유다. 오늘날, 화엄제도는 중국 시장이나 전통적인 친필 송장에 가격을 표시하는 데만 사용된다.
쑤저우 숫자의 숫자는 U+3021 - U+3029, U+3007, U+5341, U+5344, U+5345의 CJK 기호 및 구두점 블록에 있다. 유니코드 3.0에서는 이러한 문자를 항저우식 숫자라고 잘못 부른다. 유니코드 4.0에서는 다음과 같은 에라타(eratum)가 추가되었다.[1]
쑤저우 숫자(중국식 su1zhou1ma3zi)는 무역업자들이 상품 가격을 표시하기 위해 사용하는 특별한 숫자 형식이다. 이름에서 "HANGZU"를 사용하는 것은 잘못된 말이다.
유니코드 표준의 "항저우"에 대한 언급은 유니코드 안정화 정책에 따라 한번 할당되면 변경할 수 없는 문자 이름 자체를 제외하고 모두 "수저우"로 수정되었다.[2] (이 정책은 소프트웨어가 이름을 고유 식별자로 사용할 수 있도록 한다.)
일본어 및 한국어 숫자
고대 그리스 숫자
유니코드는 U+10140에서 U+1018F까지 보충 다국어 평면에 할당된 여러 가지 그리스 숫자에 대한 지원을 제공한다.[3]
다락방 숫자는 기원전 7세기부터 고대 그리스인들이 사용했을 가능성이 있다. 그것들은 헤로디안이 2세기 원고에 처음 기술했기 때문에 헤로디안 숫자로도 알려져 있었다. 그것들은 또한 곡물 숫자로 알려져 있는데, 그 기호들이 나타내는 첫 글자, 즉 '1', '5', '10', '100', '천', '만'에서 유래되었기 때문이다. 그리스 숫자와 곡식을 보라.
십진법 | 기호 | 그리스 숫자 |
---|---|---|
1 | Ι | ἴος 또는 ἰός (ios) |
5 | Π | πέντε (뱀) |
10 | Δ | Δέκα(데카) |
100 | Η | ἑκατόν (헤카톤) |
1000 | Χ | χίλιοι (khilioi) |
10000 | Μ | μύριοι (myrioi) |
고대 그리스 숫자[1][2] 공식 유니코드 컨소시엄 코드 차트(PDF) | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
U+1014x | 𐅀 | 𐅁 | 𐅂 | 𐅃 | 𐅄 | 𐅅 | 𐅆 | 𐅇 | 𐅈 | 𐅉 | 𐅊 | 𐅋 | 𐅌 | 𐅍 | 𐅎 | 𐅏 |
U+1015x | 𐅐 | 𐅑 | 𐅒 | 𐅓 | 𐅔 | 𐅕 | 𐅖 | 𐅗 | 𐅘 | 𐅙 | 𐅚 | 𐅛 | 𐅜 | 𐅝 | 𐅞 | 𐅟 |
U+1016x | 𐅠 | 𐅡 | 𐅢 | 𐅣 | 𐅤 | 𐅥 | 𐅦 | 𐅧 | 𐅨 | 𐅩 | 𐅪 | 𐅫 | 𐅬 | 𐅭 | 𐅮 | 𐅯 |
U+1017x | 𐅰 | 𐅱 | 𐅲 | 𐅳 | 𐅴 | 𐅵 | 𐅶 | 𐅷 | 𐅸 | 𐅹 | 𐅺 | 𐅻 | 𐅼 | 𐅽 | 𐅾 | 𐅿 |
U+1018x | 𐆀 | 𐆁 | 𐆂 | 𐆃 | 𐆄 | 𐆅 | 𐆆 | 𐆇 | 𐆈 | 𐆉 | 𐆊 | 𐆋 | 𐆌 | 𐆍 | 𐆎 | |
메모들 |
로마 숫자
로마 숫자들은 고대 로마에서 유래되었고, 에트루스카나 숫자로 각색되었다. 고전 고대에 사용된 시스템은 오늘날 우리가 사용하는 시스템을 생산하기 위해 중세시대에 약간 변형되었다. 이것은 숫자로 주어진 특정 글자에 기초한다.
로마 숫자들은 오늘날 일반적으로 번호가 매겨진 목록(개략형식), 시계태그, 책의 본문 앞의 페이지, 음악 분석의 화음 3종류(로마 숫자 분석), 영화와 비디오 게임 속편의 번호 매기기, 책 출판 날짜, 같은 이름을 가진 연속적인 정치 지도자나 어린이, 그리고 일부 sp의 번호 매기기 등에 사용된다.올림픽 경기나 슈퍼볼과 같은 오르트 경기들
유니코드는 U+21160에서 U+2188까지의 숫자 양식[4] 범위의 일부로 로마 숫자로 특별히 지정된 여러 문자를 가지고 있다. 이 범위에는 대문자와 소문자 모두 포함되며, 최대 12개의 숫자(XII 또는 XII)에 대한 사전 결합 문자를 포함한다. 사전 조합된 숫자의 존재 이유 중 하나는 아시아 수직 텍스트의 단일 수평선에 다중 문자 숫자(VIII 등)의 설정을 용이하게 하기 위함이다. 그러나 유니코드 표준은 "[f]또는 대부분의 경우 적절한 라틴어 문자의 시퀀스에서 로마 숫자를 구성하는 것이 바람직하다"[5]고 명시하면서 호환성을 위한 특별한 로마 숫자 코드 포인트를 포함한다.
또한 고대[4] 형태인 1000, 5000, 1만, 큰 반전 C( (), 후반 6( (, 그리스 오명: ϛ과 유사), 초기 50(ↆ, 아래 화살표 ↓⊥[6]과 유사), 5만, 10만 등에 문자가 존재한다. 작은 반전 c, ↄ은 로마 숫자로 쓰려는 것이 아니라 소문자 클라우디안 문자 Ⅱ로 쓰려는 것이다.
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
가치[7] | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 50 | 100 | 500 | 1,000 |
U+216x | Ⅰ | Ⅱ | Ⅲ | Ⅳ | Ⅴ | Ⅵ | Ⅶ | Ⅷ | Ⅸ | Ⅹ | Ⅺ | Ⅻ | Ⅼ | Ⅽ | Ⅾ | Ⅿ |
U+217x | ⅰ | ⅱ | ⅲ | ⅳ | ⅴ | ⅵ | ⅶ | ⅷ | ⅸ | ⅹ | ⅺ | ⅻ | ⅼ | ⅽ | ⅾ | ⅿ |
가치 | 1000 | 5000 | 10,000 | 100 | 100 | 6 | 50 | 50,000 | 100,000 | |||||||
U+218x | ↀ | ↁ | ↂ | Ↄ | ↄ | ↅ | ↆ | ↇ | ↈ |
블랙글자나 스크립트 활자를 사용할 경우 로마숫자는 로마자로 설정된다. 이러한 서체는 유니코드 범위 U+2160–217F의 서체 스타일과 일치하는 로마 숫자를 포함할 수 있다. 만약 그것들이 존재하지 않는다면, 로마 숫자에 일치하는 고대 서체를 사용한다.
유니코드는 고대 기호[8] 블록에서 로마 분수에 대한 문자를 가지고 있다: 육분의 문자, 운차, 세문시아 문자, 디미디아 육분의 문자, 규카 문자, 그리고 as.
카운팅 로드 숫자
카운팅 로드 숫자는 유니코드 5.0의 보충 다국어 평면(SMP)에서 자체 블록에 포함된다. "수평" 자릿수(U+1D360 ~ U+1D368)와 "수직" 자릿수(U+1D369 ~ U+1D371)가 있으며, 수평 자릿수는 10의 홀수 파워에, 수직 자릿수는 짝수 파워에 사용된다. 0은 U+3007(숫자, 문자 숫자 0)으로 표시되어야 하며, 음의 부호는 U+20E5(역방향 솔리더스 오버레이를 조합함)로 표시되어야 한다.[9] 이 블록은 또한 5의 잘 알려진 집계표와 같은 다른 계산 로드와 같은 기호를 포함하고 있다. 이것들은 최근에 문자 집합에 추가되었고 BMP에 있지 않기 때문에 글꼴 지원은 여전히 제한적일 수 있다.
로드 숫자 계산[1][2] 공식 유니코드 컨소시엄 코드 차트(PDF) | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
U+1D36x | 𝍠 | 𝍡 | 𝍢 | 𝍣 | 𝍤 | 𝍥 | 𝍦 | 𝍧 | 𝍨 | 𝍩 | 𝍪 | 𝍫 | 𝍬 | 𝍭 | 𝍮 | 𝍯 |
U+1D37x | 𝍰 | 𝍱 | 𝍲 | 𝍳 | 𝍴 | 𝍵 | 𝍶 | 𝍷 | 𝍸 | |||||||
메모들 |
참고 항목
- 번호 양식(유니코드 블록)
참조
- ^ Freytag, Asmus; Rick McGowan; Ken Whistler (2006-05-08). "UTN #27: Known anomalies in Unicode Character Names". Technical Notes. Unicode Consortium. Retrieved 2008-06-13.
- ^ "Name Stability". Unicode Character Encoding Stability Policy. Unicode Consortium. 2008-02-28. Retrieved 2008-06-13.
- ^ 유니코드 차트: 고대 그리스 숫자
- ^ a b 유니코드 번호 양식
- ^ The Unicode Standard, Version 6.0 – Electronic edition (PDF), Unicode, Inc., 2011, p. 486
- ^ David J. Perry: UCS에 고대 로마자 추가 제안
- ^ 처음 두 행에 대해
- ^ 유니코드 고대 기호
- ^ The Unicode Standard, Version 5.0 – Electronic edition (PDF), Unicode, Inc., 2006, pp. 499–500