ISO 기본 라틴 문자
ISO basic Latin alphabetISO 기본 라틴어 알파벳은 26글자의 2세트(대문자와 소문자)로 구성되며 다양한 국가 및 국제 표준으로 체계화되어[1] 국제 통신에서 널리 사용되는 라틴 스크립트 알파벳의 국제 표준(ISO/IEC 646으로 시작)입니다.그것들은 현재의 영어 알파벳을 구성하는 것과 같은 글자입니다.중세 이후, 그것들은 또한 현대 라틴 알파벳과 같은 문자이다.알파벳 순서로 단어를 정렬하는 데도 순서가 중요합니다.
2개의 세트에는 각각 [1]다음 26개의 문자가 포함되어 있습니다.
대문자 집합 | A | B | C | D | E | F | G | H | I | J | K | L | M | N | O | P | Q | R | S | T | U | V | W | X | Y | Z |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
소문자 세트 | a | b | c | d | e | f | g | h | i | j | k | l | m | n | o | p | q | r | s | t | u | v | w | x | y | z |
역사
1960년대에 이르러 제1세계의 컴퓨터와 통신업계에 문자를 인코딩하는 비독점적인 방법이 필요하다는 것이 명백해졌다.ISO(International Organization for Standardization)는 라틴어 스크립트를 ISO/IEC 646) 7비트 문자 인코딩 표준에 캡슐화했습니다.널리 받아들여지기 위해서, 이 캡슐화는 일반적인 사용법에 근거하고 있습니다.이 표준은 ASCII로 더 잘 알려진 이미 발표된 정보 교환을 위한 미국 표준 코드를 기반으로 하며, 영어 알파벳의 26 × 2 문자에 포함되어 있습니다.ISO/IEC 8859(8비트 문자 인코딩) 및 ISO/IEC 10646(유니코드 라틴)과 같은 ISO에 의해 발표된 이후 표준에서는 영어 알파벳의 26 × 2 문자를 다른 [1]언어의 다른 문자를 처리하기 위한 확장자를 가진 기본 라틴 문자로 계속 정의되고 있습니다.
용어.
알파벳을 포함하는 유니코드 블록을 "C0 컨트롤 및 기본 라틴어"라고 합니다.다음 두 개의 부제목이 [2]있습니다.
- "Latin 알파벳 대문자": 문자는 U+0041로 시작하며 설명에 LATIN 대문자를 포함합니다.
- "Latin 알파벳 소문자": 문자는 U+0061로 시작하며 설명에 LATIN SHOL LETTER 문자열이 포함되어 있습니다.
Halfwidth 및 Fullwidth Forms [3]블록에는 다음 두 가지 세트도 있습니다.
- 대문자: 문자는 U+FF21로 시작하여 설명에 문자열 FULLWIDE LATIN 대문자를 포함합니다.
- 소문자: 문자는 U+FF41로 시작하며 설명에 문자열 FULLWIDE LATIN SHOL LETTER가 포함되어 있습니다.
인코딩 표준 타임라인
- 1865년 파리에서 열린 국제 전신 회의에서 국제 모스 부호가 표준화되었고, 후에 국제 전기 통신 연합(ITU)에 의해 표준이 되었다.
- ICAO의[4] 1950년대 무선전화 스펠링 알파벳
알파벳을 지원하는 널리 사용되는 컴퓨터 코드 연대표
- 1963년 : ASCII (미국표준협회의 7비트 문자 부호화 표준, 1969년 ANSI가 됨)
- 1963/1964: EBCDIC(IBM에 의해 개발되었으며 ASCII와 동일한 영문자를 지원하지만 코드 값은 다릅니다)
- 1965-04-30: ECMA의 기술위원회 TC1이 1960년 [5]12월 이후 수행한 작업에 기초하여 ECMA-6으로[5] ECA에 의해 비준되었습니다.
- 1972: ISO 646 (ISO 7비트 문자 부호화 표준, ASCII와 동일한 영문자 코드 값을 사용, ISO 646:1983 및 ISO/IEC 646:1991에서 ISO/IEC 공동 표준으로 개정)
- 1983: ITU-T Rec. T.51 ISO/IEC 6937 (ASCII의 멀티바이트 확장자)
- 1987: ISO/IEC 8859-1:1987(8비트 문자 부호화)
- 그 후 ISO/IEC 8859의 다른 버전 및 부품이 공개되었습니다.
- 1980년대 중후반: Microsoft Windows에서 사용되는 Windows-1250, Windows-1252 및 기타 인코딩(일부 ISO/IEC 8859-1과 거의 유사)
- 1990: Unicode 1.0(Unicode [6][7]Consortium에 의해 개발됨), ASCII 및 ISO/IEC 646과 동일한 알파벳 코드 값을 사용하여 블록 "C0 Controls and Basic Latin"에 포함됨
- 그 후 Unicode의 다른 버전이 발표되어 나중에 ISO/IEC의 공동 표준이 되었습니다.
- 1993: ISO/IEC 10646-1:1993, 유니코드 1.1 문자용 ISO/IEC 표준
- 그 후 ISO/IEC 10646-1 및 ISO/IEC 10646-2의 다른 버전이 공개되었습니다.2003년 이후 표준은 두 부분으로 분리되지 않고 "ISO/IEC 10646"이라는 이름으로 발표되었습니다.
- 1997년: Windows 글리프 목록 4
표현
ASCII에서 문자는 인쇄 가능한 문자에 속하며, Unicode 버전 1.0부터는 "C0 컨트롤 및 기본 라틴어" 블록에 속합니다.두 경우 모두 ISO/IEC 646, ISO/IEC 8859 및 ISO/IEC 10646에서는 대문자 41 ~ 5A, 소문자 61 ~7A의 16진 표기가 사용됩니다.
대소문자를 구분하지 않는 모든 문자는 ICAO 철자 알파벳의 코드 워드를 가지며 Morse 코드로 나타낼 수 있습니다.
사용.
모든 소문자는 국제음성문자(IPA)에서 사용된다.X-SAMPA 및 SAMPA에서는 이러한 문자는 IPA와 같은 사운드 값을 가집니다.
동일한 문자 집합을 포함하는 알파벳
다음 목록에 포함되지 않은 알파벳만 포함되어 있습니다.
이러한 규칙 때문에 눈에 띄는 누락 사항으로는 스페인어, 에스페란토, 필리핀어, 독일어가 있습니다.독일어 알파벳은 전통에 따라 26자( (, ,, ü는 변형으로 간주되고 cons는 묶음으로 간주됨)만을 포함하는 것으로 간주되기도 하지만, 현재의 독일어 맞춤법 규칙에는 Z 뒤에 배치되는 알파벳에 ,, ü, in가 포함되어 있다. 그러나 이 순서는 일반적으로 조합에 사용되지 않는다: 보통 ,, u, uor로 조합된다.ae, oe, ue), θ를 ss로 한다.
알파벳 | 분음 문자 | 멀티그래프(구분문자를 구성하지 않음) | 연결 |
---|---|---|---|
아프리칸스 문자 | ,, ,, ,, ,, ,, ,, ,, ,, ,, ,, ,, ,, , | 디그래프: "aa", "ai", "ch", "ee", "ei", "eu", "gh", "ie", "nj", "ng", "oo", "ou", "sj", "tui", Trigraphs: ⟨aai⟩, ⟨eeu⟩, ⟨oei⟩, ⟨ooi⟩ | § (N-apostrophe) |
아라곤어 알파벳 (아카데미 데 라라고네스 맞춤법) | ,, ,, ,, ,, ,, ü, lll | "ch", "gu", "ll", "ny", "qu", "rr", "tz" | |
카탈로니아 문자 | ,, ,, ,, ,, ,, ,, ,, ,, ,, ,, lll | 'gu', 'ig', 'ix', 'll', 'ny', 'qu', 'rr', 'ss' | |
네덜란드어 알파벳 | ,, ,, ,, ,, ,, ü | 2글자 ij는 별개의 문자로 간주될 수 있습니다.이 경우 보통 "y"로 대체되거나 "y"와 혼재됩니다.기타 디그래프: 'aa', 'ae', 'ai', 'au', 'ch', 'ee', 'e', 'e', 'e', 'oe', 'oo', 'oo', 'ou', 'ui', 'uu' | |
영어 알파벳 | 외래어로만 사용(1아래 참조) | 'sh', 'ch', 'ea', 'ou', 'th', 'ph', 'ng' | ,, ( (둘 다 구식) |
프랑스어 알파벳 | ,, ,, ,, ,, ,, ,, ,, ,, ,, ,, ,, , | ⟩⟩ 、 、 ⟩⟩ 、 ⟩⟩ 、 ⟩⟩ 、 ou 、 au 、 ⟩ 、 ⟩ 、 ⟩ 、 ⟩ 、 ⟩ 、 ⟩ 、 ⟩ 、 ⟩ 、 ⟩ 、 ⟩ 、 ⟩ 、 、 、 、 、 、 、 、 、 、 、 、 、 、 、 、 、 、 、 、 、 、 、 、 、 、 、 、 、 、 、 、 、 、 、 、 、 、 | ᄋ(표준), ((표준) |
이탈리아어 알파벳(확장)[a] | ,, ,, ,, ,, ,, ù | 'ch', 'ci', 'gh', 'gl', 'gli', 'gn', 'sc', 'gn' | |
Ido 알파벳* | 없음. | "qu", "ch", "sh" | |
인도네시아 문자 | 학습 자료에서만 사용 가능(3아래 참조) | 【kh】【ng】【ng】【ny】【sy】【diphongs】【ai】【au】【ei】【i】【oi】 | |
인터링구아 알파벳* | 제한되지 않은 외래어로만 사용(2아래 참조) | "ch", "ph", "qu", "rh", 'sh' | |
자바어 라틴 문자 | 에, 에 | dh, kh, ng, ny, sy, th | |
룩셈부르크어 알파벳 | ,, é, ë | 'aa', 'ch', 'ck', 'ee', 'ei', 'i', 'ng', 'oo', 'ou', 'qu', 'ue', 'uu', 'sch' | |
말레이 문자 | 학습 자료에서만 사용 가능(3아래 참조) | 'gh', 'kh', 'ng', 'ny | |
포르투갈어 알파벳[b] | ,, ,, ,, ,, ,, ,, ,, ,, ,, ,, ,, ,, , | "ch", "nh", "rr", "ss", "am", "em", "im", "om", "um", "e", "e", "ao", "e" | |
순다어 라틴 문자 | 에 | [eu], [ng], [ng], [ny] |
* 생성 언어
- 영어는 모국어에 발음이 필요 없는 몇 안 되는 현대 유럽 언어 중 하나입니다(다이어리시스는 일부 미국 출판사에 의해 "coöperation"[c][8]과 같은 단어로 사용된다).
- 인터링구아(Interlingua)라는 합성어는 생략되지 않은 외래어를 제외하고는 분음 부호를 사용하지 않는다.그러나 모음 수정에 사용하지 않는 경우(예: 카페, 프랑스어:[9] 카페) 제거할 수 있습니다.
- 말레이어와 인도네시아어(말레이어 기준)는 유럽 이외의 언어 중 유일하게 모든 라틴 알파벳을 사용하며 분음 기호나 [d]연호가 필요하지 않습니다.인도네시아의 700개 이상의 언어 중 상당수는 인도네시아어 알파벳을 사용하여 언어를 쓰고 있으며, 일부는 자바어처럼 분음 부호 e와 ,를 추가하고 일부는 q, x, z를 생략하고 있다.
컬럼 번호부여
로마자(라틴어) 알파벳은 일반적으로 표 또는 차트에서 열 번호 지정에 사용됩니다.이렇게 하면 아라비아 숫자를 사용하는 행 번호와의 혼동을 피할 수 있습니다.예를 들어, 3x3 테이블에는 행 1, 2, 3에 대해 설정된 열 A, B 및 C가 포함됩니다.Z(일반적으로 알파벳의 마지막 문자)를 넘어 더 많은 열이 필요한 경우, Z 바로 뒤에 있는 열은 AA이고 그 뒤에 AB 등이 있습니다(bijectionive base-26 system 참조).이것은 Microsoft Excel이나 LibreOffice Calc 등의 스프레드시트 프로그램에서 오른쪽으로 스크롤하면 알 수 있습니다.
10~99가 두 자리 숫자인 것과 마찬가지로 테이블 열의 두 자리 숫자 "문자"입니다.그리스 알파벳은 필요에 따라 두 자리 문자를 사용하는 유사한 확장 형식을 가지고 있지만, 표의 열과 반대로 사교 모임의 지부에 사용됩니다.
이러한 두 자리 글자는 테이블 열에 대해 위에서 설명한 숫자와 같은 자리 값 체계와 달리 AA, BB, CC 등입니다.
「 」를 참조해 주세요.
- 히브리 문자
- 그리스 문자
- 라틴 문자
- 소리 대응을 위한 라틴 문자
- 라틴어 알파벳 목록
- 초기 키릴 문자, 키릴 문자
- Windows 코드 페이지
메모들
- ^ 이탈리아 알파벳은 전통적으로 j, k, w, x, y를 제외한 21개의 문자만을 가지고 있는 것으로 여겨진다.그러나 실제로는 이러한 문자는 많은 외래어로 나타난다.J는 또한 일부 이탈리아 고유 이름에서 반음절 i 표기의 변형으로 나타난다.
- ^ 포르투갈어 주: k와 y(w는 아니지만)는 20세기 동안 몇 번의 철자 개혁이 있기 전까지 알파벳의 일부였는데, 그 목적은 포르투갈어 어원을 좀 더 쉬운 발음 철자로 바꾸는 것이었다.이 글자들은 같은 소리를 가진 다른 글자로 대체되었다: 그래서 심리학은 psicologia, 키오스케는 키오스크, 순교자는 martir 등이 되었다.오늘날 k, w, y는 외래어와 그 파생어 및 과학적 약어(예: km, byronismo)에서만 발견된다.이 글자들은 브라질에서 2009년 1월 1일 발효된 1990년 포르투갈어 맞춤법 협정 이후 다시 알파벳의 일부로 간주됩니다.포르투갈어 맞춤법 개혁을 참조하십시오.
- ^ "coöperate"의 디아레시스와 "facades"의 세딜라, "crépe"의 곡절과 같은 영어 차용어에 대한 악센트를 포함하는 기사의 예로서, 다음을 참조하십시오.Grafton, Anthony (October 23, 2006). "Books: The Nutty Professors, The history of academic charisma". The New Yorker.
- ^ 단, 말레이어 및 인도네시아어 학습 교재는 문자 E의 발음을 명확히 하기 위해 【e】(급성이 있는 E)를 사용할 수 있다.이 경우, 【e】는 ///, 【e】는 /e/, 【e】는 ///로 발음한다.
레퍼런스
- ^ a b c "Internationalisation standardization of 7-bit codes, ISO 646". Trans-European Research and Education Networking Association (TERENA). Retrieved October 3, 2010.
- ^ "C0 Controls and Basic Latin" (PDF). Unicode.org. Retrieved August 8, 2016.
- ^ "Halfwidth and Fullwidth Forms" (PDF). Unicode.org. Retrieved August 8, 2016.
- ^ "The Postal History of ICAO". www.icao.int. Retrieved February 17, 2019.
- ^ a b Standard ECMA-6: 7-Bit Coded Character Set (PDF) (5th ed.). Geneva, Switzerland: European Computer Manufacturers Association (Ecma). March 1985. Archived (PDF) from the original on May 29, 2016. Retrieved May 29, 2016.
The Technical Committee TC1 of ECMA met for the first time in December 1960 to prepare standard codes for Input/Output purposes. On April 30, 1965, Standard ECMA-6 was adopted by the General Assembly of ECMA.
- ^ "Unicode character database". The Unicode Standard. Retrieved March 22, 2013.
- ^ The Unicode Standard Version 1.0, Volume 1. Addison-Wesley Publishing Company, Inc. 1990. ISBN 0-201-56788-1.
- ^ "The New Yorker's odd mark — the diaeresis". December 16, 2010. Archived from the original on December 16, 2010.
- ^ "Introduction al IED (in anglese)". www.interlingua.com. Retrieved September 21, 2020.