EBCD의 일본어IC
Japanese language in EBCDHitachi, Fujitsu, IBM 등이 정의한 변형을 포함하여 컴퓨터에서 일본어를 나타내기 위해 상호 호환되지 않는 여러 버전의 EBCDIC(Extended Binary Coded Decimal Interchange Code)가 사용되어 왔다.어떤 것은 가변 폭 인코딩으로, 싱글바이트와 더블바이트 모드 사이를 전환하기 위해 잠금 시프트 코드를 사용한다.[1]다른 EBCDIC 로케일과 달리 소문자 기본 라틴어는 보통 위치에 보존되지 않는 경우가 많다.[2]
IBM이 EBCDIC와 함께 사용하는 더블바이트 일본어 코드에서 발견되지만 JIS X 0208 초판에서는 발견되지 않는 문자는 IBM 코드 페이지 932("DBCS-PC") 및 Windows 코드 페이지 932와 같은 일부 비 EBCDIC 인코딩에서 발견된 벤더 확장에도 영향을 미쳤다.[3]
싱글바이트 코드
JIS X 0201(시프트 JIS에 편입된 그것 자체)과 마찬가지로 일본 EBCDIC 인코딩에는 종종 1바이트 카타카나 세트가 포함된다.일본 로케일에서 다른 벤더에 의해 여러 다른 변종의 단일 바이트 EBCDIC 코드가 사용된다. 주어진 벤더는 또한 두 개의 다른 단일 바이트 코드를 정의할 수 있다. 하나는 절반 너비의 가타카나를 선호하고 다른 하나는 라틴 문자를 선호한다.가타카나에 사용하기 위해 특정 벤더가 선호하는 EBCDIC의 변형을 EBCDIK라고 부르기도 하며, 이는 확장 바이너리 코드 십진 교환 카나 코드를 의미한다.[1][4]
반폭 카나를 포함하는 코드 페이지는 IBM의 EBCDIC 불변성 문자 집합에 대한 예외로, 일반적으로 모든 EBCDIC 코드 페이지에서 동일하게 인코딩되는 문자 집합을 지정한다.가장 주목할 만한 것은, 코드 포인트에 있는 가타카나 문자를 포함하는데, 이 문자는 불변성 집합에서 기본 라틴 알파벳의 소문자에 사용된다.[2]해당 위치에 가타카나 문자가 포함될 때 소문자를 인코딩하고, 소문자를 통상적인 위치에 보관할 때 가타카나 문자를 인코딩하는 것은 아래와 같이 벤더마다 다를 수 있다.
Microsoft Windows에서는 코드 페이지 번호가 IBM의 코드 페이지 번호보다 20000 높은 두 개의 일본 단일 바이트 EBCDIC 버전을 코드 페이지 20290(문서화)으로 구현한다.IBM290
, "IBM EBCDIC 일본 가타카나 확장")[5] 및 21027("확장/확장 알파 소문자").Windows에서 구현된 코드 페이지 21027은 불완전한 구현으로, 여러 문자와 카나에 대한 양방향 매핑이 결여되어 있으며,[6] 현재 사용되지 않고 있다.[5]
IBM의 코드 페이지는 나중에 0xE1의 유로 부호를 포함하도록 업데이트되었고, 원래의 CPGID 번호는 유지했지만 새로운 CCSID 번호가 할당되었다.따라서 CCSID 290은 코드 페이지 290의 원본 버전을 가리키는 반면, 유로 부호가 있는 코드 페이지 290의 버전은 CCSID 8482로도 알려져 있다.[7]마찬가지로, CCSID 1027은 코드 페이지 1027의 원본 버전을 참조하는 반면, 유로 부호가 있는 CPGID 1027의 버전은 CCSID 5123이 주어진다.[8]
더블바이트 컴포넌트로 IBM의 더블바이트 일본 DBCS-호스트 코드 페이지(CPGID 300, CCSID 300 또는 16684) 버전과 함께 IBM 코드 페이지 290은 멀티바이트 코드 페이지 IBM-930[9][10] 및 (유로업데이트 CCSID 8482) 업데이트 버전 IBM-1390의 싱글바이트 컴포넌트로 사용된다.[11][12]IBM 코드 페이지 1027은 멀티바이트 코드 페이지 IBM-939[13][14] 및 (유로 업데이트 CCSID 5123) 업데이트 버전의 IBM-1399의 단일 바이트 구성요소로 사용된다.[15][16]
다음 표에서 불변 집합에 대한 적합성은 녹색으로 표시되고 불변 집합과의 충돌은 빨간색으로 표시된다.
16진법 | 불변 위치의 소문자, 카나 부재 또는 이동 | 소문자 없음 또는 카나에 의해 대체됨 | ||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|
후지쓰 EBCDIC[17] | 히타치 EBCDIC[18] | HP EBCDIK[19] | IBM 298[20] | IBM 1027 [13][15][21][22] | IBM 1031[23] | 후지쯔 EBCDIK[17] | 히타치 EBCDIK[18] IBM 1136[24] | NEC EBCDIC[4] | IBM 290 [9][11][25][26] | IBM 887[27] | IBM 1030[28] | |
0x40 | SP | SP | SP | SP | SP | SP | SP | SP | SP | SP | SP | SP |
0x41 | 。 | 。 | 。 | 。 | 。 | 。 | ||||||
0x42 | 。 | 。 | 。 | 。 | 。 | 「 | 「 | 「 | 「 | 「 | 「 | |
0x43 | 「 | 「 | 「 | 「 | 「 | 」 | 」 | 」 | 」 | 」 | 」 | |
0x44 | 」 | 」 | 」 | 」 | 」 | 、 | 、 | 、 | 、 | 、 | 、 | |
0x45 | 、 | 、 | 、 | 、 | 、 | ・ | ・ | ・ | ・ | ・ | ・ | |
0x46 | ・ | ・ | ・ | ・ | ・ | ヲ | ヲ | ヲ | ヲ | ヲ | ヲ | |
0x47 | ヲ | ヲ | ヲ | ヲ | ヲ | ァ | ァ | ァ | ァ | ァ | ァ | |
0x48 | ァ | ァ | ァ | ァ | ァ | ィ | ィ | ィ | ィ | ィ | ィ | |
0x49 | ィ | ィ | ィ | ィ | ィ | ゥ | ゥ | ゥ | ゥ | ゥ | ゥ | |
0x4A | £ | [ | ¢ | ¢ | ¢ | £ | [ | [ | £ | £ | £ | |
0x4B | . | . | . | . | . | . | . | . | . | . | . | . |
0x4C | < | < | ) | < | < | < | < | < | < | < | < | < |
0x4D | ( | ( | [ | ( | ( | ( | ( | ( | ( | ( | ( | ( |
0x4E | + | + | < | + | + | + | + | + | + | + | + | + |
0x4F | ! | ! | ! | |||||||||
0x50 | & | & | + | & | & | & | & | & | & | & | & | & |
0x51 | ゥ | ゥ | ゥ | ゥ | ゥ | ェ | ェ | ェ | ェ | ェ | ェ | |
0x52 | ェ | ェ | ェ | ェ | ェ | ォ | ォ | ォ | ォ | ォ | ォ | |
0x53 | ォ | ォ | ォ | ォ | ォ | ャ | ャ | ャ | ャ | ャ | ャ | |
0x54 | ャ | ャ | ャ | ャ | ャ | ュ | ュ | ュ | ュ | ュ | ュ | |
0x55 | ュ | ュ | ュ | ュ | ュ | ョ | ョ | ョ | ョ | ョ | ョ | |
0x56 | ョ | ョ | ョ | ョ | ョ | ッ | ッ | ッ | ッ | ッ | ッ | |
0x57 | ッ | ッ | ッ | ッ | ッ | a | ||||||
0x58 | ー | ー | ー | ー | ー | ー | ー | ー | ー | ー | ー | |
0x59 | ア | ア | ア | ア | ア | a | b | |||||
0x5A | ! | ] | ! | ! | ! | ! | ] | ] | ! | ! | ! | |
0x5B | \ | ¥ | $ | $ | $ | $ | \ | ¥ | ¥ | ¥ | ¥ | ¥ |
0x5C | * | * | * | * | * | * | * | * | * | * | * | * |
0x5D | ) | ) | ] | ) | ) | ) | ) | ) | ) | ) | ) | ) |
0x5E | ; | ; | ; | ; | ; | ; | ; | ; | ; | ; | ; | ; |
0x5F | ¬ | ^ | ¬ | ¬ | ¬ | ¬ | ^ | ¬ | ¬ | ¬ | ¬ | |
0x60 | - | - | - | - | - | - | - | - | - | - | - | - |
0x61 | / | / | / | / | / | / | / | / | / | / | / | / |
0x62 | イ | イ | イ | イ | イ | b | c | a | a | |||
0x63 | ウ | ウ | ウ | ウ | ウ | c | d | b | b | |||
0x64 | エ | エ | エ | エ | エ | d | e | c | c | |||
0x65 | オ | オ | オ | オ | オ | e | f | d | d | |||
0x66 | カ | カ | カ | カ | カ | f | g | e | e | |||
0x67 | キ | キ | キ | キ | キ | g | h | f | f | |||
0x68 | ク | ク | ク | ク | ク | h | i | g | g | |||
0x69 | ケ | ケ | ケ | ケ | ケ | i | j | h | h | |||
0x6A | ¦ | ¦ | ^ | |||||||||
0x6B | , | , | , | , | , | , | , | , | , | , | , | , |
0x6C | % | % | ( | % | % | % | % | % | % | % | % | |
0x6D | _ | _ | _ | _ | _ | _ | _ | _ | % | _ | _ | _ |
0x6E | > | > | ¥ | > | > | > | > | > | > | > | > | > |
0x6F | ? | ? | ? | ? | ? | ? | ? | ? | ? | ? | ? | |
0x70 | コ | コ | コ | コ | コ | j | k | [ | [ | |||
0x71 | サ | サ | サ | サ | サ | k | l | i | i | |||
0x72 | シ | シ | シ | シ | シ | l | m | j | j | |||
0x73 | ス | ス | ス | ス | ス | m | n | k | k | |||
0x74 | セ | セ | セ | セ | セ | n | o | l | l | |||
0x75 | ソ | ソ | ソ | ソ | ソ | o | p | m | m | |||
0x76 | タ | タ | タ | タ | タ | p | q | n | n | |||
0x77 | チ | チ | チ | チ | チ | q | r | o | o | |||
0x78 | ツ | ツ | ツ | ツ | ツ | r | s | p | p | |||
0x79 | ` | ` | ` | ` | ` | ` | ` | ` | ` | ` | ` | |
0x7A | : | : | : | : | : | : | : | : | : | : | : | |
0x7B | # | # | = | # | # | # | # | # | # | # | # | # |
0x7C | @ | @ | ' | @ | @ | @ | @ | @ | @ | @ | @ | @ |
0x7D | ' | ' | : | ' | ' | ' | ' | ' | ' | ' | ' | ' |
0x7E | = | = | > | = | = | = | = | = | = | = | = | = |
0x7F | " | " | " | " | " | " | " | " | " | " | " | " |
0x80 | テ | テ | テ | s | t | ] | ] | |||||
0x81 | a | a | a | a | a | a | ア | ア | ア | ア | ア | ア |
0x82 | b | b | b | b | b | b | イ | イ | イ | イ | イ | イ |
0x83 | c | c | c | c | c | c | ウ | ウ | ウ | ウ | ウ | ウ |
0x84 | d | d | d | d | d | d | エ | エ | エ | エ | エ | エ |
0x85 | e | e | e | e | e | e | オ | オ | オ | オ | オ | オ |
0x86 | f | f | f | f | f | f | カ | カ | カ | カ | カ | カ |
0x87 | g | g | g | g | g | g | キ | キ | キ | キ | キ | キ |
0x88 | h | h | h | h | h | h | ク | ク | ク | ク | ク | ク |
0x89 | i | i | i | i | i | i | ケ | ケ | ケ | ケ | ケ | ケ |
0x8A | ト | ト | ト | テ | テ | コ | コ | コ | コ | コ | コ | |
0x8B | ナ | ナ | ナ | ト | ト | t | u | q | q | |||
0x8C | ニ | ニ | ニ | ナ | ナ | サ | サ | サ | サ | サ | サ | |
0x8D | ヌ | ヌ | ヌ | ニ | ニ | シ | シ | シ | シ | シ | シ | |
0x8E | ネ | ネ | ネ | ヌ | ヌ | ス | ス | ス | ス | ス | ス | |
0x8F | ノ | ノ | ノ | ネ | ネ | セ | セ | セ | セ | セ | セ | |
0x90 | ハ | ハ | ハ | ソ | ソ | ソ | ソ | ソ | ソ | |||
0x91 | j | j | j | j | j | j | タ | タ | タ | タ | タ | タ |
0x92 | k | k | k | k | k | k | チ | チ | チ | チ | チ | チ |
0x93 | l | l | l | l | l | l | ツ | ツ | ツ | ツ | ツ | ツ |
0x94 | m | m | m | m | m | m | テ | テ | テ | テ | テ | テ |
0x95 | n | n | n | n | n | n | ト | ト | ト | ト | ト | ト |
0x96 | o | o | o | o | o | o | ナ | ナ | ナ | ナ | ナ | ナ |
0x97 | p | p | p | p | p | p | ニ | ニ | ニ | ニ | ニ | ニ |
0x98 | q | q | q | q | q | q | ヌ | ヌ | ヌ | ヌ | ヌ | ヌ |
0x99 | r | r | r | r | r | r | ネ | ネ | ネ | ネ | ネ | ネ |
0x9A | ヒ | ヒ | ヒ | ノ | ノ | ノ | ノ | ノ | ノ | ノ | ノ | |
0x9B | フ | フ | フ | ハ | ハ | u | v | r | r | |||
0x9C | ヘ | ヘ | ヘ | ヒ | ヒ | v | w | |||||
0x9D | ホ | ホ | ホ | フ | フ | ハ | ハ | ハ | ハ | ハ | ハ | |
0x9E | マ | マ | マ | ヘ | ヘ | ヒ | ヒ | ヒ | ヒ | ヒ | ヒ | |
0x9F | ミ | ミ | ミ | ホ | ホ | フ | フ | フ | フ | フ | フ | |
0xA0 | ム | ム | ム | ¯ | ¯ | w | x | ~ | ~ | |||
0xA1 | ~ | ~ | ¯ | ~ | ~ | ~ | ~ | ~ | ~ | ¯ | ¯ | ¯ |
0xA2 | s | s | s | s | s | s | ヘ | ヘ | ヘ | ヘ | ヘ | ヘ |
0xA3 | t | t | t | t | t | t | ホ | ホ | ホ | ホ | ホ | ホ |
0xA4 | u | u | u | u | u | u | マ | マ | マ | マ | マ | マ |
0xA5 | v | v | v | v | v | v | ミ | ミ | ミ | ミ | ミ | ミ |
0xA6 | w | w | w | w | w | w | ム | ム | ム | ム | ム | ム |
0xA7 | x | x | x | x | x | x | メ | メ | メ | メ | メ | メ |
0xA8 | y | y | y | y | y | y | モ | モ | モ | モ | モ | モ |
0xA9 | z | z | z | z | z | z | ヤ | ヤ | ヤ | ヤ | ヤ | ヤ |
0xAA | メ | メ | メ | マ | マ | ユ | ユ | ユ | ユ | ユ | ユ | |
0xAB | モ | モ | モ | ミ | ミ | x | y | s | s | |||
0xAC | ヤ | ヤ | ヤ | ム | ム | ヨ | ヨ | ヨ | ヨ | ヨ | ヨ | |
0xAD | ユ | ユ | ユ | [ | [ | ラ | ラ | ラ | ラ | ラ | ラ | |
0xAE | ヨ | ヨ | ヨ | メ | メ | リ | リ | リ | リ | リ | リ | |
0xAF | ラ | ラ | ラ | モ | モ | ル | ル | ル | ル | ル | ル | |
0xB0 | リ | リ | リ | ^ | ^ | y | z | ^ | ^ | |||
0xB1 | ル | ル | ル | £ | £ | z | ¢ | ¢ | ||||
0xB2 | レ | レ | レ | ¥ | ¥ | \ | \ | |||||
0xB3 | ロ | ロ | ロ | ヤ | ヤ | t | t | |||||
0xB4 | ワ | ワ | ワ | ユ | ユ | u | u | |||||
0xB5 | ン | ン | ン | ヨ | ヨ | v | v | |||||
0xB6 | ゙ | ゙ | ゙ | ラ | ラ | w | w | |||||
0xB7 | ゚ | ゚ | ゚ | リ | リ | x | x | |||||
0xB8 | ル | ル | y | y | ||||||||
0xB9 | レ | レ | z | z | ||||||||
0xBA | ロ | ロ | レ | レ | レ | レ | レ | レ | ||||
0xBB | ワ | ワ | ロ | ロ | ロ | ロ | ロ | ロ | ||||
0xBC | ン | ン | ワ | ワ | ワ | ワ | ワ | ワ | ||||
0xBD | ] | ] | ン | ン | ン | ン | ン | ン | ||||
0xBE | ゙ | ゙ | ゙ | ゙ | ゙ | ゙ | ゙ | ゙ | ||||
0xBF | ゚ | ゚ | ゚ | ゚ | ゚ | ゚ | ゚ | ゚ | ||||
0xC0 | { | { | ? | { | { | { | { | { | { | { | { | |
0xC1 | A | A | A | A | A | A | A | A | A | A | A | A |
0xC2 | B | B | B | B | B | B | B | B | B | B | B | B |
0xC3 | C | C | C | C | C | C | C | C | C | C | C | C |
0xC4 | D | D | D | D | D | D | D | D | D | D | D | D |
0xC5 | E | E | E | E | E | E | E | E | E | E | E | E |
0xC6 | F | F | F | F | F | F | F | F | F | F | F | F |
0xC7 | G | G | G | G | G | G | G | G | G | G | G | G |
0xC8 | H | H | H | H | H | H | H | H | H | H | H | H |
0xC9 | I | I | I | I | I | I | I | I | I | I | I | I |
0xCA | ┼ | ┼ | ||||||||||
0xCB | ┴ | ┴ | ||||||||||
0xCC | ┬ | ┬ | ||||||||||
0xCD | └ | ℄ | └ | |||||||||
0xCE | ┌ | ┌ | ||||||||||
0xCF | ┘ | ┘ | ||||||||||
0xD0 | } | } | ! | } | } | } | } | } | } | } | } | |
0xD1 | J | J | J | J | J | J | J | J | J | J | J | J |
0xD2 | K | K | K | K | K | K | K | K | K | K | K | K |
0xD3 | L | L | L | L | L | L | L | L | L | L | L | L |
0xD4 | M | M | M | M | M | M | M | M | M | M | M | M |
0xD5 | N | N | N | N | N | N | N | N | N | N | N | N |
0xD6 | O | O | O | O | O | O | O | O | O | O | O | O |
0xD7 | P | P | P | P | P | P | P | P | P | P | P | P |
0xD8 | Q | Q | Q | Q | Q | Q | Q | Q | Q | Q | Q | Q |
0xD9 | R | R | R | R | R | R | R | R | R | R | R | R |
0xDA | ┐ | ┐ | ||||||||||
0xDB | ─ | ° | ─ | |||||||||
0xDC | ± | |||||||||||
0xDD | ||||||||||||
0xDE | ⌴ | |||||||||||
0xDF | ↧ | |||||||||||
0xE0 | $ | $ | ¥ | \ | \ | $ | $ | $ | $ | $ | $ | |
0xE1 | € | € | ||||||||||
0xE2 | S | S | S | S | S | S | S | S | S | S | S | S |
0xE3 | T | T | T | T | T | T | T | T | T | T | T | T |
0xE4 | U | U | U | U | U | U | U | U | U | U | U | U |
0xE5 | V | V | V | V | V | V | V | V | V | V | V | V |
0xE6 | W | W | W | W | W | W | W | W | W | W | W | W |
0xE7 | X | X | X | X | X | X | X | X | X | X | X | X |
0xE8 | Y | Y | Y | Y | Y | Y | Y | Y | Y | Y | Y | Y |
0xE9 | Z | Z | Z | Z | Z | Z | Z | Z | Z | Z | Z | Z |
0xEA | ||||||||||||
0xEB | ├ | ⌀ | ├ | |||||||||
0xEC | ┤ | ┤ | ||||||||||
0xED | ≤ | |||||||||||
0xEE | ≥ | |||||||||||
0xEF | Ω | |||||||||||
0xF0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
0xF1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 |
0xF2 | 2 | 2 | 2 | 2 | 2 | 2 | 2 | 2 | 2 | 2 | 2 | 2 |
0xF3 | 3 | 3 | 3 | 3 | 3 | 3 | 3 | 3 | 3 | 3 | 3 | 3 |
0xF4 | 4 | 4 | 4 | 4 | 4 | 4 | 4 | 4 | 4 | 4 | 4 | 4 |
0xF5 | 5 | 5 | 5 | 5 | 5 | 5 | 5 | 5 | 5 | 5 | 5 | 5 |
0xF6 | 6 | 6 | 6 | 6 | 6 | 6 | 6 | 6 | 6 | 6 | 6 | 6 |
0xF7 | 7 | 7 | 7 | 7 | 7 | 7 | 7 | 7 | 7 | 7 | 7 | 7 |
0xF8 | 8 | 8 | 8 | 8 | 8 | 8 | 8 | 8 | 8 | 8 | 8 | 8 |
0xF9 | 9 | 9 | 9 | 9 | 9 | 9 | 9 | 9 | 9 | 9 | 9 | 9 |
0xFA | │ | │ | ||||||||||
0xFB | ||||||||||||
0xFC | ⌵ | |||||||||||
0xFD | µ | |||||||||||
0xFE | ⋅ |
더블바이트 코드
EBCD가 있는 일본어에는 3개의 더블바이트 문자 코드가 사용된다.IC:[29][30][3] IBM의 IBM 코드 페이지 300(IBM Kanji 또는 IBM 일본 DBCS-Host라고도 함),[17] [31]Hitachi의 KEIS,[29] Fujitsu의 JEF.이는 DBCS-호스트 인코딩으로, 단일 바이트 EBCDIC와 더블바이트 모드 간에 전환하기 위해 서로 다른 시프트 코드를 사용한다.[1]코드 0x41 ~ 0xFE(EBCDIC의 그래픽 문자에 사용되는 문자)는 190×190 그리드의 문자를 나타내기 위해 쌍으로 사용되며, 코드 0x40(EBCDIC의 공간)은 문자 공간으로서 두 배로 사용되지만 다른 더블바이트 코드의 일부로 사용되지는 않는다.[1][31]
IBM 버전의 DBCS-Host 코드에서 코드0x0F
단일 바이트 모드 및 코드로 전환0x0E
한국어용 EBCDIC 버전 조하브와 같은 [1]다른 CJK 언어의 경우 IBM 더블바이트 EBCDIC 코드와 공통적으로 더블바이트 모드로 전환한다.[1][9][13][11][15][32]KEIS나 JEF와는 대조적으로 IBM 코드 페이지 300의 레이아웃은 JIS X 0208과는 무관하며, 둘 사이의 변환은 테이블을 통해 이루어져야 하지만,[29] JIS X 0208의 레퍼토리의 상위 집합으로 남을 수 있도록 JIS X 0208의 연이은 개정으로 캐릭터 레퍼토리를 최신 상태로 유지하고 있다.[3]납 바이트 0x41 ~ 0x44는 비 간지 문자에, 납 바이트 0x45 ~ 0x68은 간지 문자에, 납 바이트 0x69 ~ 0x89는 UDC(사용자 정의 문자)에 사용된다.[31]
IBM의 일본 DBCS-호스트 코드의 존재는 EBCD를 넘어 영향을 미쳤다.IC systems, since IBM also defined variants of Shift JIS ("DBCS-PC", defined in the pure double-byte Code page 301 and used in the variable width Code page 932 and Code page 942) and of EUC-JP which encode the entire repertoire of IBM code page 300, including 28 non-Kanji and 360 Kanji additional to those originally included in JIS X 0208 (although부호 ∵과 부호 ¬에 의한 비간지는 1983년 JIS X 0208에 추가되었다.이러한 문자를 "IBM 선택" 문자라고 하며 Windows 코드 페이지 932에 확장자로 포함시킨다.[3]
IBM-300 코드 페이지의 일부 새로운 개정판은 리드 바이트가 0xB8 ~ 0xD5인 칸지와 리드 바이트가 0xD6 ~ 0xE9인 비칸지를 추가한다.[31]이 개정안은 유로 부호를 포함한 JIS X 0213에 대한 세트를 업데이트하였고 CPGID 300을 유지하면서 새로운 CCSID 16684가 할당되었다.[33]코드 페이지 IBM-930(코드 페이지 290을 단일 바이트 세트로 함)[9]과 IBM-939(코드 페이지 1027을 단일 바이트 세트로 함)[13]는 이러한 추가사항을 제외하며,[11] IBM-1390(코드 페이지 290 / CCSID 8482의 유로 사인 버전 포함)과 IBM-1399(코드 페이지 1027 / CCSID 5123)는 이러한 추가사항을 포함한다.[15]
Hitachi KEIS[29](Kanji-processing Extended Information System)에서는 시퀀스0x0A 0x41
단일 바이트 모드 및 시퀀스로 전환0x0A 0x42
더블바이트 모드로 전환한다.[a]JIS X 0208 문자는 EUC-JP에서 인코딩하는 데 사용된 것과 동일한 바이트 시퀀스를 사용하여 인코딩된다. 즉, 두 바이트 모두 0xA1과 0xFE 사이에 있다.이로 인해 DBCS-호스트 코드 구조당 0x4040 및 EUC-JP와 같이 0xA1A1의 IDographic 공간에 대한 인코딩이 중복된다.그러나 리드 바이트 범위는 다시 0x59까지 확장되며, 이 중 리드 바이트 0x81–A0은 사용자 정의 문자용으로 지정되며,[1] 나머지는 칸지 및 비칸지 모두를 포함한 기업 정의 문자용으로 사용된다.[3]
Fujitsu JEF[17](일본식 처리 확장 기능)에서는,0x29
단일 바이트 모드로 전환0x28
더블바이트 모드로 전환한다.KEIS와 유사하게, JIS X 0208 코드는 EUC-JP와 동일하게 표현된다. KEIS와 달리, 이 JEF 존에서 사용되는 JIS X 0208판은 원래 JIS C 6226:1978이다.[1][29][17]리드 바이트 범위는 0x41로 다시 확장되며, 사용자 정의를 위해 0x80–A0이 지정된다. 리드 바이트 0x41–7F는 162행(리드 바이트 0x7E)이 사용되지 않지만, 쿠텐 목적을 위해 101 ~ 163행 번호가 할당된다.[1][3]101열부터 148열까지는 확장간지, 149열부터 163열까지는 확장간지를 사용한다.[3]
각주
참조
- ^ a b c d e f g h i j Lunde, Ken (2009). "Appendix F: Vendor Encoding Methods" (PDF). CJKV Information Processing: Chinese, Japanese, Korean & Vietnamese Computing (2nd ed.). Sebastopol, CA: O'Reilly. ISBN 978-0-596-51447-1.
- ^ a b "Invariant character set". IBM i 7.1 Documentation. IBM. 14 August 2018.
- ^ a b c d e f g Lunde, Ken (2009). "Appendix E: Vendor Character Set Standards" (PDF). CJKV Information Processing: Chinese, Japanese, Korean & Vietnamese Computing (2nd ed.). Sebastopol, CA: O'Reilly. ISBN 978-0-596-51447-1.
- ^ a b "EBCDIK: Extended Binary Coded Decimal Interchange Kana Code". 通信用語の基礎知識.
- ^ a b "Code Page Identifiers". Windows Dev Center. Microsoft.
- ^ Steele, Shawn. "Code Page 21027 "Extended/Ext Alpha Lowercase"". Microsoft.
- ^ "CCSID 8482". Coded character set identifiers. IBM. Archived from the original on 2014-11-29.
- ^ "CCSID 5123". Coded character set identifiers. IBM. Archived from the original on 2014-11-29.
- ^ a b c d "ibm-930_P120-1999". International Components for Unicode. Unicode Consortium.
- ^ "CCSID 930". Coded character set identifiers. IBM. Archived from the original on 2014-12-01.
- ^ a b c d "ibm-1390_P110-2003". International Components for Unicode. Unicode Consortium.
- ^ "CCSID 1390". Coded character set identifiers. IBM. Archived from the original on 2014-11-29.
- ^ a b c d "ibm-939_P120-1999". International Components for Unicode. Unicode Consortium.
- ^ "CCSID 939". Coded character set identifiers. IBM. Archived from the original on 2014-12-01.
- ^ a b c d "ibm-1399_P110-2003". International Components for Unicode. Unicode Consortium.
- ^ "CCSID 1399". Coded character set identifiers. IBM. Archived from the original on 2014-11-29.
- ^ a b c d e Izuno, Hidekatsu (20 October 2021). "jef4j: JEF charset support for Java". GitHub.
- ^ a b "EBCDIC/EBCDIKのコード表". Hitachi.
- ^ "JIS/EBCDIK Conversion Table". FCOPY Reference Manual. Hewlett-Packard. [1] 참고: 소스 맵의 표: 모든 입력 바이트, 때로는 JIS X 0201에 실제로 정의되지 않았지만 비대칭이며 항상 왕복은 아니다.여기에 표시된 문자는 JIS X 0201에서 실제로 정의한 코드에 대한 소스 왕복 지도 문자의 표에 있는 문자들이다.
- ^ "Code Page 00298" (PDF). IBM. Archived from the original (PDF) on 2015-07-08.
- ^ "Code Page 01027" (PDF). REGISTRY: Graphic Character Sets and Code Pages. IBM. 1999.
- ^ "Code Page 01027" (PDF). IBM. Archived from the original (PDF) on 2015-07-08.
- ^ "Code Page 01031" (PDF). IBM. Archived from the original (PDF) on 2015-07-08.
- ^ "Code Page 01136" (PDF). IBM. Archived from the original (PDF) on 2015-07-08.
- ^ "Code Page 00290" (PDF). REGISTRY: Graphic Character Sets and Code Pages. IBM. 1999.
- ^ "Code Page 00290" (PDF). IBM. Archived from the original (PDF) on 2015-07-08.
- ^ "Code Page 00887" (PDF). IBM. Archived from the original (PDF) on 2015-07-08.
- ^ "Code Page 01030" (PDF). IBM. Archived from the original (PDF) on 2015-07-08.
- ^ a b c d e "付録K.3 文字コード変換". Hitachi.
- ^ "2 Codesets and Codeset Conversion". DIGITAL UNIX Technical Reference for Using Japanese Features. Compaq.
- ^ a b c d "IBM Japanese Graphic Character Set, Kanji" (PDF). IBM. 1999. IBM Corporate Specification C-H 3-3220-024.
- ^ "ibm-1364_P110-2007". International Components for Unicode. Unicode Consortium.
- ^ "CCSID 16684". Coded character set identifiers. IBM. Archived from the original on 2014-11-29.