국제화된 리소스 식별자

Internationalized Resource Identifier
국제화된 리소스 식별자
국제화된 리소스 식별자
약어IRI
상태제안 표준
년도시작2002년 4월 22일 (2002-04-22)
초간출판2002년 4월 22일 (2002-04-22)
최신 버전2020년 1월 21일(2020-01-21)
조직IETF
작가들
  • 마르틴 뒤스트
  • 미셸 수이나르
기준 표준
도메인문자 부호화
웹사이트RFC 3987

IRI(Internationalized Resource Identifier, IRI)는 허용된 문자 집합을 크게 확장하여 통일 자원 식별자(URI) 프로토콜을 기반으로 하는 인터넷 프로토콜 표준이다.[1][2][3] 2005년 RFC 3987에서 IETF(Internet Engineering Task Force)에 의해 정의되었다. 반면에 URI를 US-ASCII문자의 하위 집합(세트 밖에서 문자 일부 지정되지 않은 문자 인코딩에 따라 수가, 그 다음에 percent-encoded 반드시 위치되어야 하)제시하는 제한된다, IRIs 추가로 보편적 문자 세트(Unicode/ISO 10646)[4][5]에서 중국어, 일본어, 한국어, 키릴 자모 c를 포함한 대부분의 문자가 포함될 수 있harac터벅터벅 걷다

구문

IRI는 URI가 ASCII로 제한되었던 범용 문자 집합을 사용하여 URI를 확장하며 문자 수는 훨씬 적다. IRI는 8진법의 순서에 의해 표현될 수 있지만, IRI는 손으로 말하거나 쓸 수 있기 때문에, 정의에 의해 문자 순서에 의해 정의된다.[6]

호환성.

IRI는 새로운 형식을 지원하지 않는 시스템과의 역호환성을 유지하기 위해 URI에 매핑된다.[6]

IRIs의 직접 소비를 허용하지 않는 애플리케이션과 프로토콜의 경우, 먼저 유니코드 형식은 아니더라도 표준 컴포지션 정규화(NFC)를 사용하여 IRI를 유니코드로 변환해야 한다.

모든 비 ASCIRI의 II 코드 포인트는 다음에 UTF-8로 인코딩되어야 하며, 그 결과 바이트 수는 인코딩되어 유효한 URI를 생성해야 한다.

예: IRI https://en.wiktionary.org/wiki/는 URI https://en.wiktionary.org/wiki/%E1%BF%AC%CF%8C%CE%B4%CE%BF%CF%82이 된다.

잘못된 URI 문자인 ASCII 코드 포인트는 구현에 따라 동일한 방식으로 인코딩될 수 있다.[6]

이러한 변환은 쉽게 되돌릴 수 있다. 정의상 IRI를 URI로 변환했다가 다시 변환하면 정확한 표현은 다를 수 있지만 원래 IRI와 의미론적으로 동등한 IRI를 산출하게 된다.[7]

일부 프로토콜은 추가 변환을 부과할 수 있다(예: DNS 레이블에 대한 포니코드.

이점

다른 언어로 표시되는 URI를 보는 데는 이유가 있다. 대부분 라틴어(A-Z) 알파벳에 익숙하지 않은 사용자가 쉽게 볼 수 있도록 한다. 누구든 자신의 키보드에 임의 유니코드를 복제하는 것이 그리 어렵지 않다고 가정하면, 이것은 URI 시스템의 접근성을 높일 수 있다.[8]

단점들

IRIs와 ASCIIURIs를 혼합하면 누군가를 속여서 자신이 진짜 다른 사이트에 있다고 믿게 하는 피싱 공격을 훨씬 쉽게 실행할 수 있다. 예를 들어, 다음에서 ASCII "a"를 대체할 수 있다. www.myfictionalbank.com 유니코드 외관상 "α"를 사용하여 www.myfictionαlbank.com IRI가 악의적인 사이트를 가리키도록 하십시오. 이것은 IDN 호모그래프 공격이라고 알려져 있다.

URI는 사람들에게 자체 알파벳을 사용하여 웹 자원을 지정할 수 있는 방법을 제공하지 않지만 IRI는 필수 국제화 문자를 생성할 수 없는 키보드로 웹 자원에 접근할 수 있는 방법을 명확히 하지 않는다. 이것은 IRI가 이제 다양한 언어로 된 텍스트를 다룰 때 비키보드 입력 방법을 사용해야 할 수 있는 많은 다른 소프트웨어와 매우 유사한 방식으로 처리되고 있다는 것을 의미한다.

참고 항목

참조

  1. ^ Gangemi, Aldo; Presutti, Valentina (2006). "The bourne identity of a web resource" (PDF). Proceedings of Identity Reference and the Web Workshop (IRW). Laboratory for Applied Ontology: 3. Notice that IRIs (Internationalized Resource Identifier) [11] are supposed to replace URIs in next future.
  2. ^ Suignard, Michel. "Internationalized Resource Identifiers (IRIs)". tools.ietf.org. Retrieved 2018-06-09. This document defines a new protocol element, the Internationalized Resource Identifier (IRI), as a complement to the Uniform Resource Identifier (URI). An IRI is a sequence of characters from the Universal Character Set (Unicode/ISO 10646). A mapping from IRIs to URIs is defined, which means that IRIs can be used instead of URIs, where appropriate, to identify resources. The approach of defining a new protocol element was chosen instead of extending or changing the definition of URIs.
  3. ^ Suignard, Michel. "Internationalized Resource Identifiers (IRIs)". tools.ietf.org. Retrieved 2018-06-09. This document defines a new protocol element called Internationalized Resource Identifier (IRI) by extending the syntax of URIs to a much wider repertoire of characters. It also defines "internationalized" versions corresponding to other constructs from [RFC3986], such as URI references. The syntax of IRIs is defined in section 2, and the relationship between IRIs and URIs in section 3.
  4. ^ Suignard, Michel. "Internationalized Resource Identifiers (IRIs)". tools.ietf.org. Retrieved 2018-06-09.
  5. ^ Suignard, Michel. "Internationalized Resource Identifiers (IRIs)". tools.ietf.org. Retrieved 2018-06-09.
  6. ^ a b c Duerst, M. (2005). "RFC 3987". Network Working Group. Standards Track. Retrieved 12 October 2014.
  7. ^ Hendler, Hrsg. Dieter Fensel; Hrsg. John Domingue; Hrsg. James A. (2010). Handbook of Semantic Web Technologies (1. Aufl. ed.). Berlin: Springer-Verlag GmbH. ISBN 978-3-540-92912-3. Retrieved 12 October 2014.
  8. ^ Clark, Kendall (2003-05-07). "Internationalizing the URI". O’Reilly Media, Inc. Retrieved 12 October 2014.

외부 링크