ARIB STD B24 문자 세트

ARIB STD B24 character set
ARIB STB-B24 부호화
표준.ARIB STB-B24 제1권
분류ISO 2022 프로파일/확장
변환/인코딩ARIB STB-B24 한자, 가나, 모자이크 세트,
JIS X 0201
ARIB STB-B24 한자 세트
ARIB Extended Font (Weather Symbols) ja.svg
날씨 기호: 일부 확장 기호 포함.
언어일본어, 영어, 러시아어
부분 지원: 그리스어, 중국어
표준.ARIB STB-B24 제1권
분류ISO-2022 구조 CJK DBCS
확장JIS X 0208
인코딩 형식
  • ARIB STB-B24 인코딩(ISO 2022 기반)
  • Shift JIS(ARIB [1]배리언트)

ARIB(Association of Radio Industries and Business) STD-B24 Broadcast Markup[2] Language 규격의 제1권에는 일본어 방송에 사용하는 문자 부호화가 특히 명기되어 있다.1999-10-26년[2]도입되었습니다.최신 버전은 2016-07-06 현재 버전 6.3입니다.

기본 표준(JIS X 0208 JIS X 0201)에는 없는 다수의 ARIB 확장 문자(ARIB 「」, ARIB GAIJI)가 포함되어 있습니다.기타 기호, 동봉된 영숫자 보충동봉된 표의문자 보충 [3]블록을 포함하여 유니코드에 추가된 많은 기호 문자의 소스 표준이었습니다.그 기고문은 유니코드 이모티콘과 부분적으로 중복되지만 1년 전에 유니코드 5.[4]2에 추가되었다.

2014년에 출판된 ARIB STD-B62 규격의 패시클 1에서는 B24 확장 문자(JIS X 0213에서 복제한 문자 제외)와 몇 개의 확장 한자에 [5]대해 유니코드 매핑을 정의하고 있습니다., BMP의 프라이빗 유스 영역에의 Basic Multilingualling Plane은 BMP Private Use Area 。

세트 및 코드

ARIB STD B24 규격에서는 여러 문자 집합과 그 문자 집합 간의 전환 방식을 정의하고 있습니다.한자 세트(JIS X 0208의 확장자), 영숫자 세트, 히라가나 세트, 2개의 다른 레이아웃의 가타카나 세트, 4개의 모자이크 [6]세트 등입니다.세트는 94세트에 대해 ISO 2022 메커니즘을 사용하여 선택되며, 다음 코드를 사용합니다(비례 세트는 해당하는 비비례 세트와 동일한 레이아웃을 사용합니다).[7]

세트 유형 코드(열/줄) 코드(16진수) 코드(ASCII 문자) 평.
한자 2바이트 4/2 42 B 이스케이프 코드BARIB 한자 세트에[7] 사용되는 것은 ISO-2022-JP의 [8][9]1983년판 JIS C6226(JIS X 0208, ARIB 한자 세트가 확장판)에서 사용됩니다.
영숫자 1바이트 4/10 4A J JIS_C6220-ro(ISO646-JP, JIS X 0201 Roman 세트).ASCII와 비슷하지만 두 가지 할당이 다릅니다.이스케이프 코드J는 ISO-2022-JP에서의 [9]사용방법과 일치합니다.
비례 영숫자 1바이트 3/6 36 6
히라가나 1바이트 3/0 30 0 히라가나 자체는 JIS X 0208의 4행과 같은 레이아웃이지만 리드 바이트는 없습니다.구두점을 위한 몇 가지 할당도 추가합니다.
비례 히라가나 1바이트 3/7 37 7
가타카나 1바이트 3/1 31 1 가타카나 자체는 JIS X 0208의 5행과 같은 레이아웃이지만 리드 바이트는 없습니다.구두점을 위한 몇 가지 할당도 추가합니다.
비례 가타카나 1바이트 3/8 38 8
JIS X 0201 가타카나 1바이트 4/9 49 I JIS_C6220-jp(JIS X 0201 가나 세트).이스케이프 코드는 ISO-2022-JP-3의 사용방법과 일치합니다.
모자이크 A 1바이트 3/2 32 2 유사 그래픽스
모자이크 B 1바이트 3/3 33 3
모자이크 C 1바이트 3/4 34 4 스페이싱이 없는 의사 그래픽스
모자이크 D 1바이트 3/5 35 5

코드 차트

한자(더블바이트) 세트

이것은 JIS X 0208을 확장한 더블바이트 문자 세트입니다.

리드 바이트

부호화 바이트는 행 또는 셀 번호에 0x20을 더한 값 또는 32를 더한 값입니다(아래 참조).따라서 0x21로 시작하는 코드 세트는 행 번호 1을 가지며, 셀 1은 0x21(또는 33)의 연속 바이트를 가진다.대부분의 코드는 JIS X 0208에 대응하고 있습니다.

ARIB STD-B24 한자(더블바이트) 세트(리드바이트)
0 1 2 3 4 5 6 7 8 9 A B C D E F
2배 SP 1-_ 2-_ 3-_ 4-_ 5-_ 6-_ 7-_ 8-_ 9-_ 10-_ 11-_ 12-_ 13-_ 14-_ 15-_
3배 16-_ 17-_ 18-_ 19-_ 20-_ 21-_ 22-_ 23-_ 24-_ 25-_ 26-_ 27-_ 28-_ 29-_ 30-_ 31-_
4배 32-_ 33-_ 34-_ 35-_ 36-_ 37-_ 38-_ 39-_ 40-_ 41-_ 42-_ 43-_ 44-_ 45-_ 46-_ 47-_
5배 48-_ 49-_ 50-_ 51-_ 52-_ 53-_ 54-_ 55-_ 56-_ 57-_ 58-_ 59-_ 60-_ 61-_ 62-_ 63-_
6배 64-_ 65-_ 66-_ 67-_ 68-_ 69-_ 70-_ 71-_ 72-_ 73-_ 74-_ 75-_ 76-_ 77-_ 78-_ 79-_
7배 80-_ 81-_ 82-_ 83-_ 84-_ 85-_ 86-_ 87-_ 88-_ 89-_ 90-_ 91-_ 92-_ 93-_ 94-_
미사용 리드 바이트
리드 바이트
JIS X 0208과의 차이점

문자 집합 0x21~0x74(행 번호 1~84: 구두점, 알파벳, 숫자, 가나, 한자)

문자 집합 0x7A(행 번호 90, 교통 기호)

90-45 ~90-63 및 90-66 ~90-84(아래에 음영 처리된 문자)는 B24 표준에 표 7-10(내선번호 문자 목록)에만 기재되어 있습니다.또, 90 ~91 행에서 유일하게 트랜스포트 관련 기호가 아닌 문자이기도 합니다.이것은 표 7-10의 [10]B24 표준에 기재되어 있습니다.나머지 확장자는 표 7-4(이중 바이트 코드 차트)와 표 7-10에 [10]모두 나열되어 있습니다.

ARIB STD-B24 한자(더블바이트) 세트(0x7A로 [5][11]프리픽스)
0 1 2 3 4 5 6 7 8 9 A B C D E F
2배
26CC

26CD
❗︎
2757

26CF

26D0

26D1

26D2

26D5

26D3
⛔︎
26D4
3배 🅿
1F17F 1층
🆊
F18A

26D6

26D7

26D8

26D9

26DA

26DB

26 DC

26DD

26DE

26DF

26E0

26E1
4배 ⭕︎
2B55

3248

3249

324A

324B

324C

324D

324E

324F

2491

2492

2493
5배 🅊
F14A 1층
🅌
F14C 1층
🄿
지하 13층
🅆
1F146
🅋
1F14B
🈐
1F210
🈑
F211
🈒
F212
🈓
F213
🅂
F142
🈔
F214
🈕
F215
🈖
F216
🅍
F14D 1층
🄱
F131
🄽
F13D
6배 ⬛︎
20B1B

2B24
🈗
F217
🈘
F218
🈙
F219
🈚︎
F21A
🈛
F21B

26 BF
🈜
F21C 1층
🈝
F21D
🈞
F21E
🈟
F21F
🈠
1F220
🈡
F221
🈢
F222
🈣
F223
7배 🈤
F224
🈥
F225
🅎
F14E 1층

3299
🈀
1F200
표 7-4에 없는 표 7-10의 추가.

문자 집합 0x7B(행 번호 91, 지도 기호)

ARIB STD-B62에서 유지되지 않았던 ARIB STD-B24로부터의 문자는 음영 처리된다.

ARIB STD-B24 한자(더블바이트) 세트(0x7B로 [5][11][12]프리픽스)
0 1 2 3 4 5 6 7 8 9 A B C D E F
2배
26E3

2B56

2B57

2B58

2B59

2613

328B

3012

26E8

3246

3245

26E9
[a]
0FD6
⛪︎
26EA

26EB
3배
26EC

2668

26ED

26EE

26EF
⚓︎
2693

2708

26층

26F1호
⛲︎
화씨 26도
⛳︎
F3 26층

F4 26층
⛵︎
F5 26층
🅗
F157

24B9

24C8
4배
F6 26층
🅟
지하 1층
🆋
1F18B
🆍
F18D
🆌
1F18C
🅹
F179

화씨 26도

F8 26층

화씨 26도
⛺︎
화씨 26도
🅻
1F17B

260E

26FB

26FC
⛽︎
화씨 26도

26FE
5배 🅼
1F17C

26FF
6배
7배
ARIB STD-B62에는 없음

문자 집합 0x7C(행 번호 92, 단위, 동봉된 형식, 목록 마커, 화살표)

ARIB STD-B62에서 유지되지 않았던 ARIB STD-B24로부터의 문자는 음영 처리된다.

ARIB STD-B24 한자(더블바이트) 세트(0x7C로 프리픽스)[5][11][12]
0 1 2 3 4 5 6 7 8 9 A B C D E F
2배
27A1

2B05

2B06

2B07

지하 2층

2B2E

5E74

6708

65E5

5186

33A1

33A5

339D

33A0

33A4
3배 🄀
1F100

2488

2489

248A

248B

248C

248D

248E

248F

2490
[b] [b] [b] [b] [b] [b]
4배 🄁
1F101
🄂
1F102
🄃
F103
🄄
1F104
🄅
F105
🄆
F106
🄇
F107
🄈
1F108
🄉
F109
🄊
1F10A

3233

3236

3232

3231

3239

3244
5배
25B6

25C0

3016

3017

27D0
²
00B2
³
00B3
🄭
1F12D
(vn)[c] (ob)[c] (cb)[c] (ce)[c] mb)[c] (hp)[c] (br)[c] (p)[c]
6배 (s)[c] (ms)[c] (t)[c] (bs)[c] (b)[c] (tb)[c] (tp)[c] (ds)[c] (ag)[c] (예)[c] (vo)[c] (fl)[c] (키[c] y)[c] (sa)[c] x)[c]
7배 (시[c] n)[c] (또는[c] g)[c] (pe)[c] r)[c] 🄬
1F12C
🄫
1F12B

3247
🆐
1F190
🈦
F226

213B
ARIB STD-B62에는 없음

문자 집합 0x7D(93행, 게임 및 날씨 기호, 분수, 단위, 동봉된 형식)

ARIB STD-B62에서 유지되지 않았던 ARIB STD-B24로부터의 문자는 음영 처리된다.

ARIB STD-B24 한자(더블바이트) 세트(0x7D로 [5][11][12]프리픽스)
0 1 2 3 4 5 6 7 8 9 A B C D E F
2배
322A

322B

322C

322D

322E

322F

3230

3237

337E

337D

337C

337B

2116

2121

3036
3배 ⚾︎
26 BE
🉀
1F240
🉁
F241
🉂
F242
🉃
1F243
🉄
1F244
🉅
F245
🉆
1F246
🉇
1F247
🉈
1F248
🄪
1F12A
🈧
F227
🈨
F228
🈩
F229
🈔
F214
🈪
F22A
4배 🈫
F22B
🈬
F22C 1층
🈭
F22D
🈮
F22E 1층
🈯︎
1F22F
🈰
1F230
🈱
F231

2113

338F

3390

33CA

339E

33A2

3371
5배 ½
00BD

2189

2153

2154
¼
00BC
¾
00BE

2155

2156

2157

2158

2159

215A

2150

215B

2151

2152
6배
2600

2601

2602
⛄︎
26C4

2616

2617

26C9

26CA

2666

2665

2663

2660

26CB

2A00

203C

2049
7배 ⛅︎
26C5
☔︎
2614

26C6

2603

26C7
⚡︎
26A1

26C8

269E

269F

266C

260E
ARIB STD-B62에는 없음

문자 집합 0x7E(행 번호 94, 목록 마커)

ARIB STD-B62에서 유지되지 않았던 ARIB STD-B24로부터의 문자는 음영 처리된다.

ARIB STD-B24 한자(더블바이트) 세트(0x7E로 [5][11][12]프리픽스)
0 1 2 3 4 5 6 7 8 9 A B C D E F
2배
2160

2161

2162

2163

2164

2165

2166

2167

2168

2169

216A

216B

2470

2471

2472
3배
2473

2474

2475

2476

2477

2478

2479

247A

247B

247C

247D

247E

247F

3251

3252

3253
4배
3254
🄐
F110
🄑
F111
🄒
F112
🄓
F113
🄔
F114
🄕
F115
🄖
F116
🄗
F117
🄘
F118
🄙
F119
🄚
F11A 1층
🄛
1F11B
🄜
F11C 1층
🄝
F11D
🄞
F11E 1층
5배 🄟
지하 11층
🄠
F120
🄡
F121
🄢
1F122
🄣
1F123
🄤
F124
🄥
1F125
🄦
1F126
🄧
1F127
🄨
F128
🄩
F129

3255

3256

3257

3258

3259
6배
325A

2460

2461

2462

2463

2464

2465

2466

2467

2468

2469

246A

246B

246C

246D

246E
7배
246F

2776

2777

2778

2779

277A

277B

277C

277D

277E

277F

24EB

24EC

325B
ARIB STD-B62에는 없음

싱글 바이트 세트

영숫자 세트

ARIB STD-B24 영숫자 세트[14]
0 1 2 3 4 5 6 7 8 9 A B C D E F
2배 !
0021
"
0022
#
0023
$
0024
%
0025
&
0026
'
0027
(
0028
)
0029
*
002A
+
002B
,
002C
-
002D
.
002E
/
002F
3배 0
0030
1
0031
2
0032
3
0033
4
0034
5
0035
6
0036
7
0037
8
0038
9
0039
:
003A
;
003B
< >
003C
=
003D
>
003E
?
003F
4배 @
0040
A
0041
B
0042
C
0043
D
0044
E
0045
F
0046
G
0047
H
0048
I
0049
J
004A
K
004B
L
004C
M
004D
N
004E
O
004F
5배 P
0050
Q
0051
R
0052
S
0053
T
0054
U
0055
V
0056
W
0057
X
0058
Y
0059
Z
005A
[
005B
¥
00A5
]
005D
^
005E
_
005F
6배 `
0060
a
0061
b
0062
c
0063
d
0064
e
0065
f
0066
g
0067
h
0068
i
0069
j
006A
k
006B
l
006C
m
006D
n
006E
o
006F
7배 p
0070
q
0071
r
0072
s
0073
t
0074
u
0075
v
0076
w
0077
x
0078
y
0079
z
007A
{
007B

007C
}
007D

203E
US-ASCII와의 차이점

히라가나 세트

ARIB STD-B24 히라가나 세트[15]
0 1 2 3 4 5 6 7 8 9 A B C D E F
2배
3041

3042

3043

3044

3045

3046

3047

3048

3049

304A

304B

304C

304D

304E

304F
3배
3050

3051

3052

3053

3054

3055

3056

3057

3058

3059

305A

305B

305C

305D

305E

305F
4배
3060

3061

3062

3063

3064

3065

3066

3067

3068

3069

306A

306B

306C

306D

306E

306F
5배
3070

3071

3072

3073

3074

3075

3076

3077

3078

3079

307A

307B

307C

307D

307E

307F
6배
3080

3081

3082

3083

3084

3085

3086

3087

3088

3089

308A

308B

308C

308D

308E

308F
7배
3090

3091

3092

3093

309D

309E

30FC

3002

300C

300D

3001

30FB
JIS X 0208의 4행 뒤에 없는 문자 할당

가타카나 세트

ARIB STD-B24 가타카나[16] 세트
0 1 2 3 4 5 6 7 8 9 A B C D E F
2배
30A1

30A2

30A3

30A4

30A5

30A6

30A7

30A8

30A9

30AA

30AB

30AC

서기 30년

30AE

30 AF
3배
30B0

30B1

30B2

30B3

30B4

30B5

30B6

30B7

30B8

30B9

30BA

30BB

30BC

30 BD

30 BE

30 BF
4배
30C0

30C1

30C2

30C3

30C4

30C5

30C6

30C7

30C8

30C9

30CA

30CB

30CC

30CD

30CE

30CF
5배
30D0

30D1

30D2

30D3

30D4

30D5

30D6

30D7

30D8

30D9

30DA

30DB

30DC

30DD

30DE

30DF
6배
30E0

30E1

30E2

30E3

30E4

30E5

30E6

30E7

30E8

30E9

30EA

30EB

30EC

30ED

30EE

30EF
7배
30층

30F1

30F2

30층

30F4

30F5

30F6

화씨 30도

30FE

30FC

3002

300C

300D

3001

30FB
JIS X 0208의 5행 뒤에 없는 문자 할당

JIS X 0201 가타카나 세트

ARIB STD-B24 JIS X 0201 가타카나[17] 세트
0 1 2 3 4 5 6 7 8 9 A B C D E F
2배
FF61

FF62

FF63

FF64

FF65

FF66

FF67

FF68

FF69

FF6A

FF6B

FF6C

FF6D

FF6E

FF6F
3배
FF70

FF71

FF72

FF73

FF74

FF75

FF76

FF77

FF78

FF79

FF7A

FF7B

FF7C

FF7D

FF7E
ソ
FF7F
4배
FF80

FF81

FF82

FF83

FF84

FF85

FF86

FF87

FF88

FF89

FF8A

FF8B

FF8C

FF8D

FF8E

FF8F
5배
FF90

FF91

FF92

FF93

FF94

FF95

FF96

FF97

FF98

FF99

FF9A

FF9B

FF9C

FF9D

FF9E

FF9F
6배
7배

모자이크 집합

Shift_JIS 바리안트

변경된 ISO 2022 부호화 외에 B24 규격은 JIS X 0208:1997에 이은 Shift JIS 부호화도 규정하지만 한자 세트에 [1]확장 문자를 추가한다.

첫 번째 바이트
0 1 2 3 4 5 6 7 8 9 A B C D E F
0
1
2 ! " # $ % & ' ( ) * + , - . /
3 0 1 2 3 4 5 6 7 8 9 : ; < > = > ?
4 @ A B C D E F G H I J K L M N O
5 P Q R S T U V W X Y Z [ ¥ ] ^ _
6 ` a b c d e f g h i j k l m n o
7 p q r s t u v w x y z { }
8
9
A
B ソ
C
D
E
F
두 번째 바이트
0 1 2 3 4 5 6 7 8 9 A B C D E F
0
1
2
3
4
5
6
7
8
9
A
B
C
D
E
F
인쇄할 수 없는 ASCII 문자
변경되지 않은 ASCII 문자
ASCII 문자 수정
싱글바이트 반각 가타카나
JIS X 0208에서 사용되는 더블바이트 문자의 첫 번째 바이트
ARIB 확장문자의 첫 번째 바이트
JIS X 0208에서 첫 번째 바이트로 사용되지 않음, 할당되지 않은 공간
첫 번째 바이트로 사용되지 않음
JIS 시퀀스의 전반부가 홀수인 더블바이트 문자의 두 번째 바이트
JIS 시퀀스의 전반부가 짝수인 더블바이트 문자의 두 번째 바이트
더블바이트 문자의 두 번째 바이트로 사용되지 않음


「 」를 참조해 주세요.

각주

  1. ^ B24 표 7-10(확장 문자 목록)에 "템플"(: 사찰)로 광택 처리됨.
  2. ^ a b c d e f 한자의 스몰 폼(코드 차트/표 7-10당 70% 크기)여기에 시뮬레이션이 표시되어 있습니다.표시된 개인 사용 영역 코드 포인트는 니시키테키 [13]글꼴에서 사용되는 코드입니다.
  3. ^ a b c d e f g h i j k l m n o p q r s t u v w x y z aa ab ac ad Unicode에는 없는 음악 약어(또는 그 절반)로, 여기서 여러 문자로 시뮬레이트됩니다.표시된 개인 사용 영역 코드 포인트는 니시키테키 글꼴에서 사용되는 코드입니다.

레퍼런스

  1. ^ a b ARIB (2008), 페이지 105, 파트 2, 섹션 7.3
  2. ^ a b ARIB(2008)
  3. ^ Suignard, Michel (2008-03-11). "ISO/IEC JTC1/SC2/WG2 N 3397: Japanese TV Symbols" (PDF).
  4. ^ "Unicode 5.2 Emoji List". Emojipedia.
  5. ^ a b c d e f ARIB (2014), 33-50페이지, 2부, 표 5-2
  6. ^ ARIB(2008), 페이지 48-52
  7. ^ a b ARIB (2008), 페이지 39, 파트 2, 표 7-3
  8. ^ Japanese National Committee on ISO/TC97/SC2 (1984-07-01). Japanese Graphic Character Set for Information Interchange (PDF). ITSCJ/IPSJ. ISO-IR-87.
  9. ^ a b RFC 1468 (IETF)
  10. ^ a b ARIB (2008), 페이지 72
  11. ^ a b c d e ARIB (2008), 페이지 54-72, 파트 2, 표 7-10
  12. ^ a b c d ARIB (2008), 페이지 46-47, 파트 2, 표 7-4
  13. ^ "Nishiki-teki Version 3.82b (2021-07-23) - 6,416 characters in the Private Use Areas" (PDF).
  14. ^ ARIB (2008), 페이지 48, 파트 2, 표 7-5
  15. ^ ARIB (2008), 페이지 50, 파트 2, 표 7-7
  16. ^ ARIB (2008), 페이지 49, 파트 2, 표 7-6
  17. ^ ARIB (2008), 페이지 52, 파트 2, 표 7-9

추가 정보

외부 링크