ISO 639-3

ISO 639-3

ISO 639-3:2007, 언어명 표기 코드Part 3: 언어의 포괄적적용범위를 위한 Alpha-3 코드는 ISO 639 시리즈언어 코드 국제 표준입니다.언어 식별을 위한 3글자 코드를 정의합니다.이 표준은 2007년 [1]2월 1일 국제표준화기구(ISO)에 의해 공표되었습니다.

ISO 639-3은 ISO 639-2 alpha-3 코드를 확장하여 알려진 모든 자연 언어를 대상으로 합니다.확장된 언어 범위는 주로 현재 ISO 639-3의 [2]등록 기관인 SIL International이 발행Etnologue(10-14권)에 사용된 언어 코드를 기반으로 했다.그것은 살아있는 것과 멸종된 것, 고대와 건설된 것, 장자와 소자, 문자와 [1]불문자를 포함한 가능한 한 완전한 언어들의 목록을 제공한다.그러나 인도유럽조어[3]같은 재구성된 언어는 포함되지 않습니다.

ISO 639-3은 다양한 애플리케이션에서 메타데이터 코드로 사용하기 위한 것입니다.이것은 많은 언어를 지원해야 하는 인터넷과 같은 컴퓨터 및 정보 시스템에서 널리 사용됩니다.아카이브 및 기타 정보 저장소에서는 리소스를 어떤 언어로 구성했는지 나타내는 시스템 카탈로그 작성에 사용됩니다.이 코드들은 언어학 문헌이나 다른 곳에서 언어 이름이 모호하거나 모호할 수 있다는 사실을 보완하기 위해 자주 사용된다.

언어 검색
ISO 639-3 코드를 입력하여 해당 언어 문서를 찾습니다.

언어 코드

ISO 639-3에는 ISO 639-1의 모든 언어 및 ISO 639-2의 모든 개별 언어가 포함됩니다.ISO 639-1과 ISO 639-2는 주요 언어에 초점을 맞췄으며, 세계 문헌의 총체에 가장 자주 나타난다.ISO 639-2는 언어 모음도 포함하지만 파트 3은 포함하지 않으므로 ISO 639-3은 ISO 639-2의 슈퍼셋이 아닙니다.ISO 639-2에 B 및 T 코드가 존재하는 경우 ISO 639-3은 T 코드를 사용합니다.

ISO 언어 코드의 예
언어 639-1 639-2 (B/T) 639-3 타입 639-3 코드
영어 en 동작하다 개인의 동작하다
독일의 ger/deu 개인의 데우
아랍어 ar 아라 매크로 아라
표준 아랍어 개인의 arb.
이집트 아랍어 개인의 arz
중국인 zh 키/조[4][5] 매크로 zho
표준 중국어 개인의 cmn
광둥어 개인의 yue
남민 개인의 나노

2021년 2월 18일 기준에는 7,893개의 항목이 포함되어 있다.[6]언어 목록은 639-2에 포함된 개별 언어, 민족학자현대 언어, 역사 [7]품종, 고대 언어 및 인공 언어, 연간 공개 논평 기간 내에 권장되는 언어를 포함한 많은 출처를 기반으로 한다.

기계 판독 가능한 데이터 파일은 등록 기관에 [6]의해 제공됩니다.ISO 639-1 또는 ISO 639-2에서 ISO 639-3으로의 매핑은 이러한 데이터 파일을 사용하여 수행할 수 있습니다.

ISO 639-3은 완전히 [8]객관적이지 않은 기준에 기초한 구별을 가정하기 위한 것이다.이는 방언이나 기타 하위 언어의 [9]변형을 문서화하거나 식별자를 제공하기 위한 것이 아닙니다.그럼에도 불구하고, 언어 간의 구별에 관한 판단은 주관적일 수 있으며, 특히 문학적 전통이 확립되지 않은 언어 다양성, 교육 또는 미디어에서의 사용, 또는 언어의 관습화에 기여하는 다른 요소들의 경우에는 더욱 주관적일 수 있다.따라서, 이 표준은 (어떤 경우에는 상당한 의견 불일치가 있을 수 있는) 세계에 존재하는 다른 언어에 대한 권위 있는 진술로 간주되지 않고, 다른 언어 품종을 정확하게 식별하기 위한 하나의 유용한 방법으로 간주되어야 한다.

코드 스페이스

코드는 3글자 알파벳이므로 표현 가능한 언어 수에 대한 1개의 상한은 26 × 26 × 26 = 17,576입니다.ISO 639-2는 특수 코드(4), 예약된 범위(520) 및 B 전용 코드(22)를 정의하므로 파트 3에서는 546 코드를 사용할 수 없습니다.따라서 더 엄격한 상한은 17,576 - 546 = 17,030입니다.

639-2에서 정의된 언어 집합과 ISO 639-5에서 정의되지 않은 언어 집합을 빼면 상한이 더욱 엄격해집니다.

마크로랑구아게스

ISO 639-2에는 ISO 639-3의 [10]"매크로랭귀지"로 간주되는 58개의 언어가 있다.

이러한 언어 중 일부는 ISO 639-2의 코드 집합에서 ISO 639-3에 정의된 개별 언어가 없었다(예: '아라'(일반 아랍어)).'nor'(노르웨이어)와 같은 다른 언어들은 ISO 639-2에 이미 두 개의 개별 부분('nno'(Nynorsk), 'nob'(Bokmöl)이 있었다.

즉, ISO 639-2에 의해 하나의 언어('아라')의 방언으로 간주되었던 일부 언어(예: 'arb', 표준 아랍어)가 현재 ISO 639-3에 개별 언어 자체로 간주되는 특정 컨텍스트에서 존재한다.

이는 언어적으로는 서로 다를 수 있지만 화자에 의해 같은 언어의 두 가지 형태로 취급되는 품종을 다루기 위한 시도입니다(예: 디글로스시아).

예를 들어 다음과 같습니다.

  • https://iso639-3.sil.org/code/ara (일반 아랍어, 639–2)
  • https://iso639-3.sil.org/code/arb (표준 아랍어, 639 – 3)

완전한[11] 리스트에 대해서는, 을 참조해 주세요.

집합 언어

집합 언어 코드 요소는 사용 컨텍스트에서 [12]하나의 언어로 간주되지 않는 개별 언어 그룹을 나타내는 식별자입니다.이러한 코드는 특정 언어 또는 매크로 언어를 정확하게 나타내지 않습니다.

ISO 639-2는 집합 언어에 대한 3글자 식별자를 포함하지만, 이러한 코드는 ISO 639-3에서 제외됩니다.따라서 ISO 639-3은 ISO 639-2의 슈퍼셋이 아닙니다.

ISO 639-5는 ISO 639-2의 집합 언어 코드를 포함하여 언어 패밀리 및 그룹에 대한 3글자 집합 코드를 정의합니다.

특수 코드

ISO 639-2 및 ISO 639-3에는 적절한 코드가 없는 경우를 위해 4개의 코드가 준비되어 있습니다.이는 주로 ISO 코드가 존재하는지 여부에 관계없이 필요한 데이터베이스와 같은 애플리케이션을 위한 것입니다.

  • mis(코드화되지 않은 언어, 원래 '기타'의 약어)는 ISO 표준에 포함되지 않은 언어를 대상으로 합니다.
  • mul(복수 언어)는 데이터에 여러 언어가 포함되어 있고 (예를 들어) 데이터베이스에 단일 ISO 코드가 필요한 경우를 대상으로 합니다.
  • und(미정)은 데이터의 언어가 식별되지 않은 경우(예: 라벨이 잘못 부착되었거나 라벨이 부착되지 않은 경우)를 대상으로 한다.트로이 목마처럼 테스트되지 않은 언어에 이름이 지정된 경우를 대상으로 하지 않습니다.
  • zxx(언어 콘텐츠 없음/해당되지 않음)은 동물 [13]울음소리 등 언어가 전혀 아닌 데이터를 대상으로 합니다.

또한 범위 내 520개의 코드qaaqtz'로컬용'입니다.예를 들어, Rebecca Bettencourt는 생성된 언어에 코드를 할당하고 요청에 [14]따라 새로운 할당이 이루어집니다.Languistist List는 그것들을 멸종된 언어에 사용합니다.Languageist List는 다음 중 하나의 범용 값을 할당했습니다.qnp, 이름 없는 프로토 언어.패밀리 트리에서 이름이 없는 제안된 중간 노드에 사용됩니다.

유지보수 프로세스

ISO 639-3의 코드 테이블은 변경될 수 있습니다.기존 사용의 안정성을 보호하기 위해 허용되는 변경은 [15]다음과 같이 제한됩니다.

  • 엔트리에 대한 참조 정보 수정(유형 및 범위에 대한 이름 또는 분류 포함),
  • 신규 엔트리 추가,
  • 중복되거나 가짜인 엔트리의 폐지,
  • 하나 이상의 엔트리를 다른 엔트리에 병합합니다.
  • 기존 언어 엔트리를 여러 새로운 언어 엔트리로 분할합니다.

언어에 할당된 코드는 [16]표현에 변화가 없는 한 변경되지 않습니다.

변경은 연간 주기로 이루어집니다.모든 요청에는 공개 검토를 위해 최소 3개월의 기간이 주어집니다.

ISO 639-3 웹 사이트에는 [17]"표현의 범위"(언어 유형) [18]및 언어 유형을 설명하는 페이지가 있으며, 인코딩의 범위에 포함되는 개념과 충족해야 하는 특정 기준을 설명합니다.예를 들어, 구성된 언어는 인코딩될 수 있지만, 인간의 의사소통을 위해 설계되고 문학의 본체가 있는 경우에만 인코딩될 수 있으며, 독특한 발명에 대한 요청을 방지할 수 있습니다.

등록 기관은 웹사이트에서 코드 테이블의 [19]유지관리 방법에 대해 ISO 639-3 표준의 텍스트로 작성된 지침을 문서화합니다.또한 변경 [20]요청을 수신 및 처리하는 데 사용되는 프로세스를 문서화합니다.

변경요구서가 제공되며 제안된 추가사항에 대한 정보를 수집하기 위한 두 번째 양식이 있다.모든 당사자가 변경 요청을 제출할 수 있습니다.요청이 제출되면 등록 기관은 처음에 완료 여부를 검토한다.

완전히 문서화된 요청을 수신하면 게시된 변경 요청 색인에 추가됩니다.또한 Languist List의 일반 LINGUIST 토론 목록 및 등록 기관이 관련성이 있다고 간주할 수 있는 기타 목록으로 공지가 발송되며, 요청하신 변경에 대한 공개 검토와 의견을 구합니다.목록 소유자 또는 개인은 특정 지역 또는 언어 패밀리에 대한 변경 요청 통지를 요청할 수 있습니다.수신된 코멘트는 다른 당사자가 검토할 수 있도록 게시됩니다.접수된 의견의 합의에 따라 변경 요청을 철회하거나 "후보 상태"로 승격할 수 있습니다.

연간 리뷰 사이클 종료 3개월 전(보통 9월)에는 LINGUIST 토론 목록 및 후보 상태 변경 요청에 관한 기타 목록이 발표됩니다.모든 요청은 연간 검토 사이클이 끝날 때까지 검토 및 코멘트를 위해 열려 있습니다.

결정은 연차 리뷰 사이클의 마지막에 발표됩니다(일반적으로 1월).이 때 요청은 전부 또는 일부를 채택하거나 수정하여 다음 검토 주기로 이월하거나 거부할 수 있다.거절에는 종종 재제출을 위한 제안서를 수정하는 방법에 대한 제안이 포함됩니다.모든 변경 요청의 공개 아카이브는 결정된 사항 및 [21]결정의 근거와 함께 유지됩니다.

비판

언어학자 Morey, Post 및 Friedman은 ISO 639, 특히 ISO 639-3에 [16]대해 다양한 비판을 제기합니다.

  • 3글자 코드 자체는 문제가 있는데, 공식적으로는 임의의 기술 라벨이지만 언어 이름의 니모닉 줄임말에서 파생되는 경우가 많기 때문입니다.이 중 일부는 경멸적이다.예를 들어, Yemsa에는 코드가 할당되어 있습니다.jnj경멸적인 "Janejero"에서 따왔다.따라서 이러한 코드는 원어민에게는 불쾌하게 여겨질 수 있습니다.단, SIL 홈페이지에 요청서 제출 후 코드 변경이 가능합니다.
  • SIL은 불충분한 투명성과 책임감을 가진 선교 단체이기 때문에 표준의 관리가 문제가 있습니다.언어로서 부호화할 가치가 있는 것에 대한 결정은 내부에서 이루어집니다.외부의 입력은 환영받을 수도 있고 환영받지 못할 수도 있지만, 결정 자체는 불투명하며, 많은 언어학자들은 표준을 개선하려는 노력을 포기했습니다.
  • 언어를 영구적으로 식별하는 것은 언어 변경과 호환되지 않습니다.
  • 언어와 방언은 종종 엄격하게 구분할 수 없고, 방언의 연속어는 여러 가지 방법으로 세분될 수 있지만, 표준적인 특권은 한 가지 선택이다.그러한 구별은 종종 사회적, 정치적 요인에 기초한다.
  • ISO 639-3은 사람들의 정체성과 언어에 대한 결정을 내리는 당국에 의해 오해되고 오용될 수 있으며, 화자의 언어 다양성을 식별하거나 식별할 수 있는 권리를 폐지한다.SIL은 이러한 문제에 민감하지만, 이 문제는 ISO 및 SIL이 의도하지 않는 방식으로 사용(또는 잘못 사용)될 수 있는 확립된 표준의 본질에 내재되어 있습니다.

Martin Haspelmath는 이 점들 중 네 가지에는 동의하지만, 언어의 [22]변화에 대한 요점은 동의하지 않는다.그는 동의하지 않는다. 왜냐하면 언어의 어떤 설명도 그것을 식별해야 하고 우리는 언어의 다른 단계를 쉽게 식별할 수 있기 때문이다.그는 언어학자들이 언어학자들에게 언어, 방언, 긴밀한 어족 중 어느 것에 대해 말하는지는 거의 중요하지 않기 때문에 언어학자들이 언어 수준에서 만들어진 코드화를 사용하는 것을 선호할 수 있다고 제안한다.그는 또 ISO가 산업 조직이기 때문에 언어 식별을 위한 ISO 표준이 적절한지에 대해서도 의문을 제기하는 한편 언어 문서화와 명명법을 과학적 노력으로 보고 있다.그는 표준화된 언어 식별자에 대한 본래의 필요성을 "번역 및 소프트웨어 현지화의 경제적 의미"로 언급하고 있으며, 이를 위해 ISO 639-1 및 639-2 표준이 제정되었습니다.그러나 그는 ISO 639-3이 제공하는 포괄적인 적용범위에 대한 업계의 요구에 대해 의문을 제기하고 있는데, 그 중에는 "문자에 전혀 또는 거의 사용되지 않고 종종 멸종 위기에 처한 소규모 커뮤니티의 거의 알려지지 않은 언어"도 포함되어 있다.

사용.

  • 민족학
  • 언어학자 리스트
  • OLAC: 오픈 언어 아카이브[23] 커뮤니티
  • Microsoft Windows 8:[24] 릴리스 시 ISO 639-3의 모든 코드를 지원합니다.
  • Wikimedia 기반:새로운 언어 기반 프로젝트(예: 새로운 언어의 위키백과)는 ISO 639-1, -2 또는 [25]-3의 식별자를 가져야 합니다.
  • ISO 639-3에 의존하는 기타 표준:
    • Internet Engineering Task Force(IETF; 인터넷 기술 특별 조사위원회)에 의해 정의된 언어 태그는 다음과 같습니다.
      • BCP 47: 현재 베스트 프랙티스 47,[26] 다음을 포함합니다.RFC 5646
      • RFC 5646은 RFC 4646을 대체하고 RFC 3066을 대체했습니다.(따라서 이들 3가지 IETF 표준 중 하나에 의존하는 모든 표준은 ISO 639-3을 사용합니다.)
    • 언어[27] 메타데이터의 ePub 3.0 표준은 Dublin Core Metadata 요소를 사용합니다.ePubs의 이러한 언어 메타데이터 요소에는 언어에 [27]대한 유효한 RFC 5646 코드가 포함되어 있어야 합니다.RFC5646에서는 IANA 코드가 짧은 언어에 대해서는 ISO 639-3을 참조하고 있습니다.
    • Dublin Core Metadata Initiative: IETF의 RFC 4646(현재는 RFC 5646으로 대체됨)에 의한 언어의 DCMI 메타데이터[28] 용어.
    • Internet Assigned Numbers Authority(IANA; 인터넷 할당 번호 기관) W3C의 국제화 작업에서는 [29]IANA Language Subtag Registry를 사용하여 언어 코드를 선택할 것을 권장합니다.IANA Language Subtag[30] Registry는 ISO 639 표준의 다른 부분에 코드가 없었던 언어의 경우 ISO 639-3 코드에 의존합니다.
    • HTML5:[31] IETF의 BCP 47 경유.
    • MARC 라이브러리 코드
    • MODS 라이브러리 [32]코드:IETF의 RFC 3066(현재는 RFC 5646으로 대체됨)을 통합합니다.
    • Text Encoding Initiative(TEI;[33] 텍스트 부호화 이니셔티브): IETF의 BCP 47 경유.
    • Lexical Markup Framework: 기계 판독 가능한 사전을 나타내는 ISO 규격.
    • 유니코드공통 로케일 데이터 저장소:ISO 639-2에 포함되지 않은 ISO 639-3의 수백 개의 코드를 사용합니다.

레퍼런스

  1. ^ a b "ISO 639-3 status and abstract". iso.org. 2010-07-20. Retrieved 2012-06-14.
  2. ^ "Maintenance agencies and registration authorities". ISO.
  3. ^ "Types of individual languages – Ancient languages". sil.org. Retrieved 2018-06-11.
  4. ^ ISO 639 코드 민족학 보고서: zho Archived 2014-09-12 at the Wayback Machine ethnologue.com
  5. ^ SIL.org 상의 ISO639-3
  6. ^ a b "ISO 639-3 Code Set". Sil.org. 2021-02-18. Retrieved 2021-04-07.
  7. ^ "ISO 639-3". sil.org.
  8. ^ "Scope of Denotation: Individual Languages". sil.org.
  9. ^ "Scope of Denotation: Dialects". sil.org.
  10. ^ "Scope of denotation: Macrolanguages". sil.org. Retrieved 2012-06-14.
  11. ^ "Macrolanguage Mappings". sil.org. Retrieved 2021-11-02.
  12. ^ "Scope of denotation: Collective languages". sil.org. Retrieved 2012-06-14.
  13. ^ 버벳 몽키 콜의 현장 녹음.Language Data Consortium 카탈로그에 기재되어 있습니다.2012-09-04 취득.
  14. ^ Bettencourt, Rebecca. "ConLang Code Registry". KreativeKorp. Retrieved 2021-03-12.
  15. ^ "Submitting ISO 639-3 Change Requests: Types of Changes". sil.org.
  16. ^ a b Morey, Stephen; Post, Mark W.; Friedman, Victor A. (2013). The language codes of ISO 639: A premature, ultimately unobtainable, and possibly damaging standardization. PARADISEC RRR Conference. Archived from the original on 2016-02-23. Retrieved 2015-11-03.
  17. ^ "Scope of Denotation for Language Identifiers". sil.org.
  18. ^ "Types of Languages". sil.org.
  19. ^ "ISO 639-3 Change Management". sil.org.
  20. ^ "Submitting ISO 639-3 Change Requests". sil.org.
  21. ^ "ISO 639-3 Change Request Index". sil.org.
  22. ^ 마틴 해스펠매스, "언어 정체성이 표준화 될 수 있을까? ISO 639-3"에 대한 Morey 등비판에 대해 Diversity Languageistics Comment, 2013/12/04
  23. ^ "OLAC Language Extension". language-archives.org. Retrieved 3 August 2015.
  24. ^ "Over 7,000 languages, just 1 Windows". Microsoft. 2014-02-05.
  25. ^ "Language proposal policy". wikimedia.org. Retrieved 3 August 2015.
  26. ^ "BCP 47 – Tags for Identifying Languages". ietf.org. Retrieved 3 August 2015.
  27. ^ a b "EPUB Publications 3.0". idpf.org. Retrieved 3 August 2015.
  28. ^ "DCMI Metadata Terms". purl.org. Retrieved 3 August 2015.
  29. ^ "Two-letter or three-letter ISO language codes". w3.org. Retrieved 3 August 2015.
  30. ^ "Language Registry". Iana.org. Retrieved 2015-08-12.
  31. ^ "3 Semantics, structure, and APIs of HTML documents — HTML5". w3.org. Retrieved 3 August 2015.
  32. ^ "Elements – MODS User Guidelines: Metadata Object Description Schema: MODS (Library of Congress)". loc.gov. Retrieved 3 August 2015.
  33. ^ "TEI element language". tei-c.org. Retrieved 3 August 2015.

추가 정보

외부 링크