코드 페이지 37
Code page 37MIME / IANA | IBM037 |
---|---|
에일리어스 | cp037, ebcdic-cp-us, ebcdic-cp-ca, ebcdic-cp-wt, ebcdic-cp-nl, csIBM037[1] |
분류 | EBCDIC |
변환/인코딩 | ISO/IEC 8859-1 |
기타 관련 부호화 | EBCDIC 37-2, 500, 924, 1047, 1140 |
코드 페이지 37(CCSID 37, 라벨)IBM037
USA/Canada - CECP로 알려진)는 IBM 메인프레임에서 사용되는 EBCDIC 코드 페이지입니다.[1]ISO/IEC 8859-1 그래픽 문자의 레퍼토리를 인코딩합니다.
코드 페이지 37은 가장 많이 사용되고 가장 잘 지원되는 EBCDIC 코드 페이지 중 하나입니다.이 페이지는 미국 및 기타 영어권 [2]국가에서 기본 z/OS 코드 페이지로 사용됩니다.이 페이지는 [3]미국에서는 "필수" EBCDIC 코드 페이지로 간주되며 호주, 뉴질랜드, 네덜란드, 포르투갈 및 브라질 및 캐나다의 [4]ESA/390 시스템에서도 사용됩니다.단, 코드 페이지 500을 [5]대신 사용하는 캐나다 AS/400 시스템에서는 사용되지 않습니다.마이크로소프트가 유니코드 컨소시엄에 매핑 [6]데이터를 제공하는 4개의 EBCDIC 코드 페이지(500, 875 및 1026과 함께) 중 하나이며 파이썬이 [7]표준으로 지원하는 7개 페이지 중 하나(273, 424, 500, 875, 1026 및 1140과 함께)입니다.
문자 집합
코드 페이지[8][9] 37 | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
0x | 없음 | SOH | STX | ETX | 셀 | HT | RNL | 델 | GE | SPS | RPT | VT | FF | CR | 그렇게 | SI |
1배 | DLE | DC1 | DC2 | DC3 | RES / ENP | NL | BS | POC | 할 수 있다 | 전자파 | UBS | 1원 | IFS | IGS | IRS | IUS/ ITB |
2배 | DS | SOS | FS | 쯔 | BYP/ INP | LF | ETB | ESC | SA | SFE | SM/ 소프트웨어 | CSP | MFA | ENQ | ACK | 벨 |
3배 | 동기 | 적외선 | PP | TRN | NBS | 전원 | SBS | IT부문 | RFF | 3원 | DC4 | NAK | 후보선수 | |||
4배 | SP | NBSP | ★ 00E2 | ä 00E4 | 아 00E0 | 아 00E1 | ã 00E3 | å 00E5 | 츠 00E7 | ñ 00F1 | ¢ 00A2 | . 002E | < > 003C | ( 0028 | + 002B | 007C |
5배 | & 0026 | 에 00E9 | ê 00EA | ë 00EB | è 00E8 | ii 00ED | î 00EE | ï 00EF | ì 00EC | ß 00DF | ! 0021 | $ 0024 | * 002A | ) 0029 | ; 003B | ¬ 00AC |
6배 | - 002D | / 002F | 」 00C2 | ä 00C4 | à 00C0 | 아아 00C1 | ã 00C3 | å 00C5 | 츠 00C7 | ñ 00D1 | ¦ 00A6 | , 002C | % 0025 | _ 005F | > 003E | ? 003F |
7배 | ø 00F8 | 에 00C9 | ê 00CA | ë 00CB | è 00C8 | Ⅱ 00CD | Î 00CE | Ï 00CF | ì 00CC | ` 0060 | : 003A | # 0023 | @ 0040 | ' 0027 | = 003D | " 0022 |
8배 | ø 00D8 | a 0061 | b 0062 | c 0063 | d 0064 | e 0065 | f 0066 | g 0067 | h 0068 | i 0069 | « 00AB | » 00BB | ð 00F0 | ý 00FD | þ 00FE | ± 00B1 |
9배 | ° 00B0 | j 006A | k 006B | l 006C | m 006D | n 006E | o 006F | p 0070 | q 0071 | r 0072 | ª 00AA | º 00BA | æ 00E6 | ¸ 00B8 | ᄋ 00C6 | ¤ 00A4 |
도끼 | µ 00B5 | ~ 007E | s 0073 | t 0074 | u 0075 | v 0076 | w 0077 | x 0078 | y 0079 | z 007A | ¡ 00A1 | ¿ 00BF | ð 00D0 | Ý 00DD | Þ 00DE | ® 00AE |
Bx | ^ 005E | £ 00A3 | ¥ 00A5 | · 00B7 | © 00A9 | § 00A7 | 00B6 | ¼ 00BC | ½ 00BD | ¾ 00BE | [ 005B | ] 005D | ¯ 00AF | ¨ 00A8 | ´ 00B4 | × 00D7 |
Cx | { 007B | A 0041 | B 0042 | C 0043 | D 0044 | E 0045 | F 0046 | G 0047 | H 0048 | I 0049 | 부끄럽다 | o 00F4 | ö 00F6 | ò 00F2 | o 00F3 | õ 00F5 |
Dx | } 007D | J 004A | K 004B | L 004C | M 004D | N 004E | O 004F | P 0050 | Q 0051 | R 0052 | ¹ 00B9 | û 00FB | ü 00FC | ù 00F9 | u 00FA | ÿ 00FF |
예 | \ 005C | ÷ 00F7 | S 0053 | T 0054 | U 0055 | V 0056 | W 0057 | X 0058 | Y 0059 | Z 005A | ² 00B2 | o 00D4 | 외 00D6 | Ò 00D2 | ó 00D3 | Õ 00D5 |
Fx | 0 0030 | 1 0031 | 2 0032 | 3 0033 | 4 0034 | 5 0035 | 6 0036 | 7 0037 | 8 0038 | 9 0039 | ³ 00B3 | Û 00DB | ü 00DC | Ù 00D9 | u 00DA | EO |
코드 페이지 번역
CP 037에는 표준 라틴어-1 문자가 모두 포함되어 있기 때문에 CP 037 문자 집합에서 ISO 8859-1 문자 코드로 문자 코드를 변환할 수 있습니다.따라서 CP 037 문자 집합으로의 변환은 정확한 값을 유지하는 라운드 트립 변환입니다.마찬가지로 제어 문자 코드의 절반은 정확한 ASCII 대응 문자로 변환할 수 있습니다.나머지 EBCDIC 전용 제어문자가 나머지 미사용 ASCII 코드 포인트(16~9F)로도 (임의로) 변환되면 결과 변환은 256자 코드 포인트 모두를 커버합니다.이러한 변환 테이블을 다음에 나타냅니다.
CP 037 → ISO 8859-1 _0 _1 _2 _3 _4 _5 _6 _7 _8 _9 _A _B _C _D _E _F 0_ 00 01 02 03 9C 09 86 7층 97 8D 8E 0B 0C 0D 0E 0F 1_ 10 11 12 13 9D 85 08 87 18 19 92 8층 1C 1차원 1E 1층 2_ 80 81 82 83 84 0A 17 1B 88 89 8A 8B 8도 05 06 07 3_ 90 91 16 93 94 95 96 04 98 99 9A 9B 14 15 9E 1A 4_ 20 A0 E2 E4 E0 E1 E3 E5 E7 F1 A2 2E 3C 28 2B 7C 5_ 26 E9 EA 이비 E8 ED EE EF EC DF 21 24 2A 29 3B AC 6_ 이차원 2층 C2 C4 C0 C1 C3 C5 C7 D1 A6 2C 25 5층 3E 3층 7_ F8 C9 CA CB C8 CD CE CF 참조 60 3A 23 40 27 3D 22 8_ D8 61 62 63 64 65 66 67 68 69 AB BB F0 FD FE 지하 1층 9_ B0 6A 6B 6C 6D 6E 6층 70 71 72 AA BA E6 B8 C6 A4 A_ B5 7E 73 74 75 76 77 78 79 7A A1 BF D0 DD DE AE B_ 5E A3 답 5 B7 A9 A7 B6 BC BD 있다 5B 5D AF A8 B4 D7 C_ 7B 41 42 43 44 45 46 47 48 49 AD F4 F6 F2 F3 F5 D_ 7D 4A 4B 4C 4D 4E 4층 50 51 52 B9 FB FC F9 FA FF E_ 5C F7 53 54 55 56 57 58 59 5A B2 D4 D6 D2 D3 D5 F_ 30 31 32 33 34 35 36 37 38 39 B3 DB 직류 D9 DA 9층
다른 코드 페이지와의 관계 및 종류
몇 개의 다른 코드 페이지가 있으며, 이는 몇 개의 문자가 교환된 코드 페이지 37에 해당합니다.특히 코드 페이지 37은 하드브래킷을 부호화한다.[]
)는 BAhex 및 BB에서 사용되며hex, 다른 베리안트에서는 하드브래킷에 다른 인코딩을 사용합니다.예를 들어 코드 페이지 1047은 MVS Open Systems [10]컴파일러에서 사용되는 변형입니다.코드 페이지 37과는 6개의 위치가 다릅니다.Ý
그리고.[
장소를 바꿉니다.¨
그리고.]
하드 브래킷을 AD 및 BD에hex 배치합니다hex.carlet 및 not sign 스위치도[11][12] 이 브래킷의 부호화는 3270 디스플레이 [13]시스템에서 상속되었습니다.IBM은 코드 페이지 1047을 코드 페이지 37 및 [3]500을 대체하는 것이 아니라 특정 요구 사항을 충족하는 데만 사용할 계획이지만, ASCII 레퍼토리를 인코딩하는 코드 페이지 1047의 하위 집합은 UTF-EBCDIC의 [10]단일 바이트 그래픽 코드에 사용되었습니다.
3279 시스템에서 코드 페이지 310과 함께 사용되는 코드 페이지 37 및 1047의 하이브리드는 SHARE에 의해 승인되었지만 IBM에 의해 공식적으로 코드 페이지로 지정되지 않았으며,[13] 트랜스코딩 소프트웨어에 의해 코드 페이지 37-2로 불리기도 한다.대부분 코드 페이지 1047과 일치하지만 캐럿과 not 부호는 코드 페이지 [13][14]37과 일치하도록 반전됩니다.
코드 페이지 500은 ISO/IEC 8859-1 레퍼토리의 다른 주요 EBCDIC 인코딩입니다.이 코드 페이지 500은 "International EBCDIC",[5] "International Latin-1" 또는 "International Number 5"[13]입니다.벨기에, 스위스 및 캐나다의 [5]AS/400 시스템에서 사용됩니다.코드 페이지 37에 관련지어져 있어 레퍼토리는 같지만, 7개의 위치가 다릅니다.특히 코드 페이지 37은[
그리고.]
각각 4A와hex 5A로hex, 센트 기호(cent sign)에 사용된다.¢
및 느낌표(!
코드 페이지 37에 기재되어 있습니다.캐럿(^
)도 코드 페이지 37-2 및 1047과 마찬가지로 5F로hex 인코딩됩니다.그¢
B0으로hex 부호화되어 있습니다.¬
BA에서는hex!
4Fhex 및 파이프 특성(
)[15][16]을hex(를) 참조해 주세요.코드 페이지 500은, DRV8과 ISO/IEC 8859-1의 차이에 대응해 복수의 문자 페어를 스왑 하는 독일어 코드 페이지 273과 관련지어, 하드 브래킷을 63과hex [17]FC에hex 배치한다.
유로 기호가 있는 코드 페이지 37의 변형입니다.€
9Fhex 위치에 범용 통화 기호( )를 대체하기 위해 문자가 추가되었습니다.¤
코드 페이지 1140 입니다.[18][19]마찬가지로 코드 페이지 1148은 코드 페이지 500을,[20][21] 코드 페이지 1141은 코드 페이지 273을 동일하게 [22]변경한다.
ISO/IEC 8859-15 레퍼토리를 가진 EBCDIC 코드 페이지는 코드 페이지 924입니다.이것은 코드 페이지 1047과 관련되지만 ISO/IEC 8859-1 문자는 ISO/IEC 8859-15로 대체되어 각각 BA0과hex BA0에hex 있는 코드 페이지 위치 500으로 이동됩니다.
「 」를 참조해 주세요.
레퍼런스
- ^ a b IANA Character Sets
- ^ Stephens, David (2011), "Lost in Translation 1 - EBCDIC Code Pages", LongEx Mainframe Quarterly, Longpela Expertise
- ^ a b "Code page identifiers—CPGID 1047". IBM. Archived from the original on 2015-06-07.
This code page is meant for limited use to meet specific requirements. It is not intended as a replacement for Code Page 00037 which is the required code page for the United States and several other countries or Code Page 00500
- ^ "Coded character set identifiers—CCSID 37". IBM. Archived from the original on 2014-11-29.
- ^ a b c "Coded character set identifiers—CCSID 500". IBM. Archived from the original on 2014-12-01.
- ^ "Mappings Vendors Microsoft EBCDIC". Unicode Consortium.
- ^ "codecs — Codec registry and base classes § Standard Encodings". Python Documentation. Python Software Foundation.
- ^ Code Page CPGID 00037 (pdf) (PDF), IBM
- ^ Code Page CPGID 00037 (txt), IBM
- ^ a b Umamaheswaran, V.S. (2002-04-16). "UTF-EBCDIC". Unicode Consortium. Unicode Technical Report #16.
The map preserves the invariance for a set of 82 graphic characters (including SPACE) (known as the IBM Syntactic Graphic Character set), and maintains consistency with the IBM MVS Open Systems Code page (CPGID 1047) for the variant characters from within the ASCII repertoire.
- ^ "ibm-1047". International Components for Unicode. Converter Explorer. Unicode Consortium.
- ^ "Code page 1047" (PDF). IBM. Archived (PDF) from the original on 2015-07-08. Retrieved 2021-06-09.
- ^ a b c d xlate - Transliterate Contents of Records, IBM Corporation, 2010 [1986], archived from the original on 2019-06-16, retrieved 2016-10-18
- ^ "x3270 Character Set". x3270 Documentation. Archived from the original on 2018-11-10.
- ^ "ibm-500". International Components for Unicode. Converter Explorer. Unicode Consortium.
- ^ "Code page 500" (PDF). IBM. Archived (PDF) from the original on 2015-07-08. Retrieved 2021-06-09.
- ^ "ibm-273". International Components for Unicode. Converter Explorer. Unicode Consortium.
- ^ "ibm-1140". International Components for Unicode. Converter Explorer. Unicode Consortium.
- ^ "Code page 1140" (PDF). IBM. Archived (PDF) from the original on 2015-07-08. Retrieved 2021-06-09.
- ^ "ibm-1140". International Components for Unicode. Converter Explorer. Unicode Consortium.
- ^ "Code page 1148" (PDF). IBM. Archived (PDF) from the original on 2015-07-08. Retrieved 2021-06-09.
- ^ "ibm-1141". International Components for Unicode. Converter Explorer. Unicode Consortium.
- ^ "Code page 924" (PDF). IBM. Archived (PDF) from the original on 2015-07-08. Retrieved 2021-06-09.