ISO 639

ISO 639

ISO 639는 언어 및 언어 그룹이름 표현에 관한 국제 표준화 기구의 표준 세트입니다.

1967년(ISO 639/R)[1]에 승인되어 [2]2002년에 폐지된 원래 표준의 명칭이기도 하다.ISO 639 세트는 5개의 부분으로 구성됩니다.

ISO 639 코드 사용

ISO 639의 여러 섹션에 정의된 언어 코드는 서지학 목적과 컴퓨팅 및 인터넷 환경에서 로케일 데이터의 핵심 요소로 사용됩니다.또한 이 코드는 Wikipedia URL과 같은 다양한 응용 프로그램에서 사용할 수 있습니다.

표준의 현재 및 과거 부분

표준. 이름(언어 이름 표시 코드...) 등록 기관 초판 현재의 리스트 내 번호 (2021년 2월 18일 기준)
ISO 639-1 파트 1: Alpha-2 코드 인포텀 1967년(ISO 639) 2002 184
ISO 639-2 파트 2: Alpha-3 코드 미국 의회 도서관 1998 1998 482 + 20 B 전용 + 4 스페셜 + 520 (현지 사용)[3][4]
ISO 639-3 파트 3: 언어를 포괄적으로 커버하기 위한 Alpha-3 SIL 인터내셔널 2007 2007 7,893 + 4 스페셜 + 520 (현지용)[5]
ISO 639-4 제4부: 언어 코딩 구현 지침 및 일반 원칙 ISO/TC 37/SC 2 2010-07-16 2010-07-16 (목록이 아님)
ISO 639-5 파트 5: 어족 및 그룹용 Alpha-3 코드 미국 의회 도서관 2008-05-15 2013년[6] 2월 11일 115(나머지 36개 +[7] ISO 632-2의 29개 정규 그룹 포함)
ISO 639-6 파트 6: 언어 변형의 포괄적인 적용범위에 대한 알파-4 표현(그림 참조) 거랑 2009-11-17 철수했다 21,000+

표준의 각 부분은 유지관리 기관이 유지하며, 이 기관은 코드를 추가하고 필요에 따라 코드 상태를 변경합니다.ISO 639-6은 [8]2014년에 철회되었다.

개별 코드의 특성

범위:

  • 개별 언어
  • 마크로랭귀지 (제3부)
  • 언어 모음(1, 2, 5부)파트 1에는 컬렉션이1개만 포함되어 있습니다(bh일부 컬렉션은 이미 파트 2에 있었고, 다른 컬렉션은 파트 5에만 추가되었다.
    • 나머지 그룹: Part 2와 Part 5의 36개의 컬렉션은 이러한 종류(Part 1에서 코드화된 컬렉션 포함)입니다.Part 5가 아직 공개되지 않은 경우 Part 2와의 호환성을 위해 나머지 그룹에는 Part 2에서 코드화된 언어 및 컬렉션이 포함되어 있지 않습니다(단, Part 5와 호환되는 새로운 애플리케이션은 이러한 gr을 취급할 수 있습니다).ops(포괄적으로 포함)는 Part 5에서 발표한 격납 계층 구조를 존중하고 언어를 그룹화할 때 가장 구체적인 컬렉션을 사용하는 경우이다.)
    • 일반 그룹: 파트 2와 파트5의 29개의 컬렉션은 이러한 종류입니다.파트 2와의 호환성을 위해 다른 그룹은 포함할 수 없습니다.
    • 패밀리: Part 5에서만 코드화된 50개의 새로운 컬렉션(Part 2에서 이미 코드화된 정규 그룹을 포함하는 컬렉션 포함) - Part 2와의 호환성을 위해 나머지 그룹을 제외한 다른 컬렉션을 포함할 수 있습니다.
  • 방언: 그것들은 Part 6에서 다루려고 의도되었다(제안되었으나 현재는 철회되었다).
  • 특별한 상황 (제2, 제3)
  • 로컬 사용을 위해 예약됨(2, 3부).파트 1과 파트 2의 표준 코드와 같은 알파-2 코드가 필요한 애플리케이션에서도 사용됩니다(특수 코드가 있는 경우).mis적합하지 않음) 또는 파트 5의 표준 코드와 같은 수집에 대한 알파-3 코드.

유형(개별 언어):

  • 살아있는 언어 (제2, 제3) (모든 언어 마크로랭귀지는 살아있는 [9]언어입니다)
  • 멸종된 언어(제2부, 제3) (608부,[10] 제5부는 제2부:chb,chg,cop,lui,sam파트 1)에 기재되어 있지 않다.
  • 고대 언어(1, 2, 3)(124,[11] 19개)는 제2부에 있으며, 그 중 5개는 제2부에 있다.ave,chu,lat,pli그리고.san파트 1에도 코드가 있습니다.ae,cu,la,pi,sa)
  • 이력 언어 (제2, 제3) (83,[12] 제16부는 제2부에 있고, 제1부에 없다)
  • 구성 언어(파트 1, 2, 3) (파트 2의 23,[13] 9):afh,epo,ido,ile,ina,jbo,tlh,vol,zbl; 파트 1에서 5개:eo,ia,ie,io,vo)

파트 2의 두 개의 다른 알파-3 코드를 가진 개별 언어 및 매크로 언어:

  • 서지학(그 중 일부는 폐지되었고, 파트 3에서는 정의되지 않았다): 이것들은 레거시 코드(영어에서의 언어 이름에 근거한다)이다.
  • 용어집(제3부에서도 정의): 이것들은 바람직한 코드입니다(필요에 따라서 로마자 표기).
  • 기타 모든 언어 모음 및 특수/예약 코드 포함에는 두 가지 용도로 모두 하나의 알파-3 코드만 있습니다.

부품 간의 관계

ISO 639의 다른 부분은 서로 연동되도록 설계되어 있으며, 어떤 코드도 한 부분과 다른 부분을 의미하지 않습니다.그러나 모든 언어가 모든 부분에 있는 것은 아니며, 특정 언어와 다른 요소들이 다른 부분에서 취급되는 다양한 방법이 있습니다.예를 들어 Part 1 또는 Part 2에 언어가 기재되어 있는지, Part 2에 별도의 B/T 코드가 있는지, Part 3에서 매크로 언어로 분류되어 있는지에 따라 달라집니다.

이러한 다양한 치료법이 다음 표에 자세히 설명되어 있습니다.행의 각 그룹(ISO 639-3의 각 범위에 대해 1개)에서 마지막 4개 열은 ISO 639의 각 부분 간의 특정 관계 유형을 예시하는 대표 언어에 대한 코드를 포함하고, 두 번째 열은 관계를 설명하고, 첫 번째 열은 그러한 유형의 관계를 갖는 요소의 수를 나타낸다.p. 예를 들어 Part 1에 코드가 있고, B/T 코드가 있으며, Part 3에서 매크로 언어로서 분류되는 4가지 요소가 있다.이 네 가지 요소 중 하나는 "페르시아"입니다.fa/per/fas.

범위 건수 묘사 일치 코드 예시
ISO 639-1 ISO 639-2 ISO 639-3 ISO 639-5
개별 언어
('나')
128 각 파트 1, 2, 3에 코드가 있는 매크로 언어의 일부가 아닌 개별 언어(파트 2에 코드가 1개만 있음).
파트 1에는 개별 언어, 매크로 언어 또는 그룹에 184개의 코드가 할당되어 있습니다.아래 행에서 카운트된 코드를 빼면 184 - (2 "I (이전 B/T)" ( (3+11 "I") ( (3+2 "B/T") ‒ ( 28+4+1 "M") ‒ (1 "C") (
en 동작하다
2 각 파트 1, 2, 3에 코드가 있는 개별 언어는 파트 2에 별도의 B/T 코드가 있지만, B 코드가 철회(2008-06-28 이후) 모든 용도로 T 코드를 유지한다.다음과 같습니다.hr/(scr)/hrv,그리고.sr/(ser)/srp.
둘 다 같은 매크로 언어의 일부입니다.hbs파트 3에 추가되어 다른 새로 인코딩된 개별 언어도 포함되지만 코드sh또한 파트 1에서 철회되었으며 파트 2에서 정의된 코드가 없습니다.
시간 (scr)/hrv (B/T) 시간
3 제3부에서 매크로 언어에 속하는 개별 언어, 제2부에서 단일 코드를 사용하고 제1부에서 코드를 가진 언어.다음과 같습니다.bs/bos(대언어 일부)hbs),nb/nob그리고.nn/non(양쪽 매크로 언어)no/nor). nb 노브
11 파트 2에서 개별 B/T 코드를 사용하는 개별 언어. 단, 후속 행에서는 특별한 경우가 없습니다.
파트 2에서 개별 언어 또는 매크로 언어에는 20쌍의 개별 B/T 코드가 할당되어 있습니다.아래의 특수한 경우를 빼면 20 20(3+2 "M") ‒(4 "C") = 11쌍의 코드가 할당됩니다.
ger/deu(B/T) 데우
3 파트 2의 개별 B/T 코드가 있지만 파트 1 코드의 문자는 파트 2 T 코드의 첫 번째 두 글자가 아닙니다.다음과 같습니다.cs/cze/ces,mi/mao/mri,그리고.sk/slo/slk. cs cze/ces (B/T) ces
3 파트 2와 파트 3의 개별 언어(대언어에는 속하지 않음)는 파트 1에서 다루어졌지만 파트 2에 상당하는 코드가 집합체이다.다음과 같습니다.bho,mai,그리고.mag. (표준) 보우
많지 않은 파트 2 및 파트 3의 기타 개별 언어, 파트 1의 코드 없음. 아스트
1 파트 1과 파트 2에서는 코드 없이 파트 3에서 추가된 개별 언어이지만 파트 2와 파트 3에서는 매크로 언어도 파트 1에서 인코딩되었다. (ar) (아라) arb.
1 파트 3의 개별 언어는 파트 2의 코드가 없지만 파트 2에 상당하는 코드가 파트 1에서 다루어졌다(이 그룹에 대해서는 아래의 항목을 참조). (표준) (bih) 스쿠
7,000 이상 파트 1과 파트 2에 코드가 없는 파트 3의 다른 모든 개별 언어(파트 2에서 다음과 같은 집합 코드로 설명될 수 있음)nic"Niger-Kodofanian(기타)"은 나머지 그룹입니다. (nic)
마크로랑구아게스
('M')
28 파트 1과 파트 2에도 코드가 있는 파트 3의 매크로 언어.
Macrolanguage에는 파트 3에 62개의 코드가 할당되어 있습니다.아래에 특별한 경우가 있는 코드를 빼면 62µ(4 "B/T") 1 1µ(25+1+3 "파트 1에 없음") = 28개의 코드가 할당됩니다.
ar 아라
4 파트 3의 매크로 언어, 파트 2의 별도의 B/T 코드.다음과 같습니다.fa/per/fas,ms/may/msa,sq/alb/sqi,그리고.zh/chi/zho. fa 프레임 단위(B/T) 고속으로
1 파트 3의 매크로 언어 파트 1의 코드를 가진 언어를 포함합니다.한정:no/nor(내용:nb/nob,그리고.nn/non). 아니요. 도 아니다
25 파트 2와 3에서는 매크로 언어이지만 파트 1에서는 코드가 없습니다. 밧줄기
1 파트 3의 매크로 언어, 파트 2의 코드가 없고 파트 1의 코드가 폐지된다. (sh) hbs
3 파트 3의 매크로 언어, 파트 1 또는 2의 코드 없음.다음과 같습니다.bnc,kln,그리고.luy. BNC
패밀리 및 그룹(집단)
('C')
1 Bihari는 집합으로 표시되며 ISO 639-2 코드를 가지고 있으며 ISO 639-1 코드를 가지고 있는 유일한 언어 그룹입니다(다른 모든 코드는 개별 언어이거나 예약되어 있습니다).그 이유는 세 개의 개별 Bihari 언어(ISO 639-3에서는 동일한 매크로 언어를 형성할 수 없을 정도로 충분히 다른 언어)가 고유한 ISO 639-2 코드를 받았기 때문입니다.bho,mai,magISO 639-2(이들 3개 언어를 제외한 그룹의 언어 포함)의 목적을 위해 Bihari를 나머지 그룹으로 만들었다. bh bih bih
35 파트 2의 나머지 그룹, 즉 코드는 같지만 언어는 다릅니다.파트 2에서는afa는 파트 2에서 개개의 언어 ID가 없는 아프로아시아 언어를 말하며, 나머지 3개의 그룹에 속하지 않습니다.ber"버버(기타)",cus"쿠시타이트(기타)" 또는sem"Semitic (Other)"는 모두 아프로아시아어족입니다. afa afa
29 파트 2의 정규 그룹, 파트 5의 언어 패밀리와 동일, 파트 1의 코드는 없습니다.그 중에서 정규 그룹은ypk파트 2는 파트 2에서 코드화되지 않은 파트 5의 다른 새로운 정규 그룹의 일부로 파트 5에서 부호화된 유일한 그룹이다(아래 참조). 오스 오스
50 파트 5에만 추가된 정규 그룹이며 파트 1, 2, 3에서는 이전에 코드화되지 않았습니다.이러한 새로운 정규 그룹의 대부분은 Part 2의 다른 집합 코드에 의해 나머지 그룹의 일부로 표현되었을 수 있습니다(예를 들어 나머지 그룹).ine새로운 정규 그룹을 위해sqj), 그 중 7개를 제외합니다.aav,esx,euq,hmx,jpx,urj,게다가syd(새로운 정규 그룹의 일부)urj) 정규 그룹ypk(새로운 정규 그룹의 일부)esx그러나 파트 2에서는 이미 코드화되어 있었다.ISO 639-5 코드 목록의 언어 그룹 계층을 참조하십시오. 평방
특수 코드
('S')
1 개별 언어 코드가 필요하지만 언어 자체에는 표준 코드가 없는 단일 언어 컨텍스트에서 사용할 수 있습니다.보다 정밀한 대안은 ISO 639-2의 나머지 그룹이나 ISO 639-5의 언어 패밀리 코드를 사용하는 것일 수 있다. 단, 그러한 그룹의 다른 언어가 제외되어야 하거나(자체 코드로 분리됨) 표준 집합 코드가 적합하지 않은 경우이다.일부 응용 프로그램에서는 로컬용으로 예약된 코드 내에서 보다 구체적인 코드를 사용하는 것을 선호할 수 있습니다. 잘못하다
1 다국어 콘텐츠(분할 가능한 부분에 2개 이상의 언어 포함)전체 콘텐츠에 대해 단일 언어 코드가 필요할 때 사용됩니다.컨텐츠의 각 부분에 대한 개별 언어 또는 매크로 언어들은 아직 인코딩되지 않았을 수 있습니다.mis또는 집합 코드로 더 정확하게 표현합니다.) 멀티
1 미확정(콘텐츠에는 0, 1개 또는 여러 언어가 임의 조합으로 포함되어 있습니다). 언드
1 언어 정보는 전혀 없습니다(2006-01-11 추가).컨텐츠(예를 들어, 인간의 언어로 된 텍스트를 포함하지 않는 그래픽, 사진, 오디오/비디오 레코드, 기술 메타데이터 및 대부분의 프로그래밍 소스 코드)는 어떠한 언어에서도 사용할 수 있으며 번역할 수 없습니다(단, 개별 컨텐츠 또는 컨텐츠의 중요하지 않은 단편과 관련된 설명은 제외). zxx
로컬용으로 예약되어 있습니다.
('R')
20 파트 1의 알파2 코드, 범위 내qa..qt이러한 코드는 권장되지 않지만 파트 1에서는 할당되지 않은 상태로 유지됩니다. qa
520 파트 2와 파트 3의 알파3 코드, 범위 내qaa...qtz이러한 코드는 집합 언어(또는 기타 특수한 경우)에도 사용할 수 있지만 파트 5에서는 표준 언어 패밀리와 그룹에 할당되지 않습니다.

이러한 차이는 다음과 같은 요인에 의해 발생합니다.

ISO 639-2에서는 22개의 개별 언어에 두 개의 구별된 코드, 즉 서지 코드와 용어 코드(B/T 코드)[14]가 할당되었다.B코드는 과거에 널리 사용되었던 서지 시스템이 영어 이름에 기초한 언어 코드를 사용했기 때문에 역사적 이유로 포함되었습니다.이와는 대조적으로 ISO 639-1 코드는 언어의 네이티브 이름을 기반으로 하며, ISO 639-1의 대응하는 2자 코드와 유사한 639-2 코드(T 코드)를 갖기를 강력히 원했습니다.

  • 예를 들어 독일어(Part 1:de)의 파트 2에는 2개의 코드가 있습니다.ger(B코드) 및deu(T코드) 파트2에는 1개의 코드만 있습니다.eng, 영어의 경우.
  • 이전의 B 코드 2개가 철회되어 오늘 20쌍의 B/T 코드만 남았습니다.

파트 2의 각 언어에는 항상 파트 3에 코드가 있습니다(파트 2 용어 코드만 재사용됩니다). 단, 다음 예시와 같이 파트 1에 코드가 있을 수도 있고 없을 수도 있습니다.

  • 파트 3eng파트 2에 대응합니다.eng및 파트 1en
  • 파트 3ast파트 2에 대응합니다.ast파트 1에 코드가 없습니다.

파트 3의 일부 코드(62)는 매크로 언어이다.이러한 그룹은 상호 이해가 양호하고 일반적으로 혼합되거나 혼동되는 여러 개별 언어를 포함하는 그룹입니다.일부 매크로 언어에서는 개별 언어 중 하나에 기본 표준 형식이 개발되었습니다(예를 들어 중국어 매크로 언어에는 기본적으로 만다린이 포함되며, 필요에 따라 다른 개별 언어를 구분할 수 있지만 특정 코드).cmn중국어는 거의 사용되지 않습니다.)

  • 1개의 매크로 언어에는 파트 2 코드와 파트 1 코드가 있으며, 멤버의 개별 언어에는 파트 1과 파트 2의 코드도 있습니다.nor/no포함하다non/nn,nob/nb또는
  • 4개의 매크로 언어에는 2개의 파트2 코드(B/T)와 파트1 코드가 있습니다.per/fas/fa,may/msa/ms,alb/sqi/sq,그리고.chi/zho/zh;
  • 28개의 마크로랭귀지에는 파트 2 코드가 있지만 파트 1 코드는 없습니다.
  • 29개의 다른 매크로 언어에는 파트 3의 코드만 있습니다.

파트 2의 집합 코드는 파트 5의 코드를 가진다.aus파트 2와 파트 5는 호주 언어를 나타냅니다.

  • 파트 2의 1개의 집합 코드도 파트 1의 코드를 가지고 있습니다.bih/bh.
  • 일부 코드는 파트 5에 추가되었지만 파트 2에는 코드가 없었다.sqj

파트 2 및 3에는 예약 범위와 4개의 특수 코드도 있습니다.

  • 코드qaa통해.qtz로컬용으로 예약되어 있습니다.
  • 4가지 특별한 코드가 있습니다.mis코드가 아직 할당되지 않은 언어의 경우mul"외국어",und"timeout"을 위해, 그리고zxx"언어 콘텐츠 없음, 해당 없음"에 대해 설명합니다.

코드 스페이스

알파-2 코드 공간

ISO 639-1에서는 "Alpha-2" 코드(ISO 기본 라틴 알파벳의 두 글자로 구성된 코드용)가 사용됩니다.더 넓은 범위의 언어를 위한 코드가 필요한 경우, 2개 이상의 문자 조합이 포함될 수 있습니다(최대 262 = 676). ISO 639-2는 Alpha-3 코드를 사용하여 개발되었습니다.(단, 후자가 먼저 정식으로 출판되었습니다.)[15][16]

알파-3 코드 공간

ISO 639-2, ISO 639-3ISO 639-5에서 "Alpha-3" 코드(ISO 기본 라틴 알파벳의 3글자로 구성된 코드)가 사용됩니다.나타낼 수 있는 언어 및 언어 그룹의 수는 263 = 17,576개입니다.

ISO 639의 세 부분에서 Alpha-3 코드를 공통적으로 사용하려면 더 큰 시스템 내에서 어느 정도 조정이 필요하다.

파트 2는 4개의 특수 코드를 정의합니다.mis,mul,und,zxx, 예약된 범위qaa-qtz(20 × 26 = 520 코드) 및 20개의 이중 엔트리(B/T 코드)와 사용되지 않는 B 코드가 있는 2개의 엔트리가 있습니다.이는 파트 3에서 언어를 나타내는 데 또는 파트 5에서 언어 패밀리 또는 그룹을 나타내는 데 사용할 수 없는 총 520 + 22 + 4 = 546 코드입니다.나머지는 17,576 – 546 = 17,030입니다.

오늘날 [17]지구에는 약 6, 7,000개의 언어가 있다.따라서 17,030개의 코드는 각 언어에 고유한 코드를 할당하기에 충분합니다.다만, 그 언어의 전통적인 이름과는 전혀 다른 임의의 코드로 끝나는 언어도 있습니다.

Alpha-4 코드 공간(그린 상태)

ISO 639-6에서는 "Alpha-4" 코드(ISO 기본 라틴 알파벳의 4글자로 구성된 코드)가 사용되도록 제안되었고, 이는 철회되었다.표현할 수 있는 언어와 방언의 수 상한은 264 = 456,976이다.

「 」를 참조해 주세요.

주 및 참고 자료

  1. ^ "ISO/R 639:1967". Iso.org. 1988-03-01. Retrieved 2012-08-05.
  2. ^ "ISO 639:1988". Iso.org. Retrieved 2012-08-05.
  3. ^ "Codes arranged alphabetically by alpha-3/ISO 639-2 Code". Library of Congress. 2013-07-25. Retrieved 2019-01-10.
  4. ^ "ISO-639-2 Codes". Library of Congress. Retrieved 2019-01-10.
  5. ^ "ISO 639 code tables". Sil.org. Retrieved 2021-04-07.
  6. ^ "ISO 639-5 Change Notice". Network Development & MARC Standards Office. Library of Congress. Retrieved December 12, 2018.
  7. ^ "ISO 639-5 codes ordered by Identifier". Network Development & MARC Standards Office. Library of Congress. Retrieved December 12, 2018.
  8. ^ ISO 639-6:2009, ISO.
  9. ^ "ISO 639 code tables: macrolanguages". Sil.org. Retrieved 2012-08-05.
  10. ^ "ISO 639 code tables: extinct". Sil.org. Retrieved 2012-08-05.
  11. ^ "ISO 639 code tables: ancient". Sil.org. Retrieved 2019-01-10.
  12. ^ "ISO 639 code tables: historical". Sil.org. Retrieved 2012-08-05.
  13. ^ "ISO 639 code tables: constructed". Sil.org. Retrieved 2022-02-07.
  14. ^ "ISO 639-2 – Frequently Asked Questions". loc.gov. 2014-05-05. Retrieved 2014-12-12.
  15. ^ "Codes for the representation of names of languages -- Part 2: Alpha-3 code". International Organization for Standards. ISO. Retrieved 10 January 2019. Publication date : 1998-10
  16. ^ "Codes for the representation of names of languages -- Part 1: Alpha-2 code". International Organization for Standards. ISO. Retrieved 15 February 2018. Publication date : 2002-07
  17. ^ "Statistical Summaries". Ethnologue. Retrieved 2012-08-05.

외부 링크