알파벳 순서

Alphabetical order

알파벳 순서는 기존의 알파벳 순서에서 문자의 위치에 따라 문자열을 순서대로 배치하는 시스템이다.이것은 대조 방법 중 하나입니다.수학에서 사전적 순서는 알파벳 순서를 숫자의 순서나 다른 순서의 수학적 개체와 같은 다른 데이터 유형으로 일반화하는 것입니다.

알파벳 문자 외에 숫자, 숫자 또는 더 정교한 유형의 요소를 포함할 수 있는 문자열이나 시퀀스에 적용되는 경우, 알파벳 순서는 일반적으로 사전적 순서라고 불립니다.

알파벳 순서로 배열할 때 두 문자열 중 어떤 문자열이 먼저 오는지 판단하기 위해 첫 글자를 비교합니다.두 문자가 다를 경우 알파벳의 첫 번째 문자가 앞에 오는 문자열이 다른 문자열보다 앞에 옵니다.첫 번째 글자가 같은 경우 두 번째 글자가 비교되고 계속 비교됩니다.한 문자열에 비교할 문자가 더 이상 없는 위치에 도달하면 첫 번째(짧은) 문자열은 알파벳 순서로 첫 번째(짧은) 문자열로 간주됩니다.

대문자(대문자)는 알파벳 순서로 정렬하기 위해 일반적으로 대응하는 소문자와 동일한 것으로 간주되지만, 두 문자열이 대문자로만 다른 상황을 처리하기 위해 규약을 채택할 수 있습니다.공백, 수정된 문자(분음 부호 포함 등) 및 구두점 마크와 같은 문자가 아닌 문자를 포함하는 문자열의 처리에는 다양한 규칙도 있습니다.

단어 또는 문자열 세트를 알파벳 순서로 배치하면 동일한 문자로 시작하는 모든 문자열이 함께 그룹화됩니다. 이 그룹 내에서 동일한 2글자 시퀀스로 시작하는 모든 단어가 그룹화됩니다.따라서 시스템은 인접한 단어 간에 공통적인 첫 글자의 수를 최대화하는 경향이 있습니다.

역사

알파벳 순서는 기원전 1천년에 북서쪽 셈족의 낙서자들이 압자드 [1]체계를 사용하여 처음 사용되었다.하지만,[2] 지리적, 연대기적, 계층적, 범주별로 자료를 분류하고 정렬하는 다양한 방법들이 수세기 동안 알파벳 순서보다 선호되었다.

성경은 기원전 6-7세기로 거슬러 올라간다.예레미야에서 예언자는 알파벳 순서에 따라 아트바쉬 치환 암호를 사용한다.마찬가지로, 성경 작가들은 히브리어 [3]알파벳에 기초한 삼행시를 사용했다.

학자들 사이에서 알파벳 순서가 처음으로 효과적으로 사용된 것은 기원전 300년경에 설립된 알렉산드리아 [4]대도서관의 고대 알렉산드리아였을 것이다.그곳에서 일했던 시인이자 학자인 칼리마쿠스는 세계 최초의 도서 목록인 피나케스를 만든 것으로 알려져 있으며, 이 목록에는 작가 이름의 [2]첫 글자의 알파벳 순으로 보관되어 있다.

기원전 1세기에, 로마 작가 바로는 작가들과 [5]작위들의 알파벳 목록을 만들었다.서기 2세기에, Sextus Pompeius Festus는 알파벳 순서로 [6]기재된 Verrius Flaccus, De verborum significantu의 작품의 백과사전을 썼다.서기 3세기에 하포크라티션은 모든 [7]문자로 알파벳으로 된 호메로스 어휘를 썼다.10세기에 스다의 저자는 알파벳 순서를 음운의 변형과 함께 사용했다.

상담의 보조 수단으로서의 알파벳 순서는 설교자들이 성경 어휘를 분석하는 것을 돕기 위해 알파벳 도구가 개발된 12세기 후반부터 서유럽 지적 생활의 주류로 들어오기 시작했다.이것은 13세기 파리도미니카 수도사들의한 성경의 알파벳 일치의 편찬으로 이어졌다.St.같은 오래된 레퍼런스 저작물. 제롬의 히브리어 이름 해석은 협의하기 쉽도록 알파벳 순으로 배열되었다.알파벳 순서의 사용은 처음에 학자들에 의해 거부되었는데, 그들은 학생들이 자신의 합리적 구조에 따라 그들의 연구 영역을 정복하기를 기대했다; 그 성공은 로버트 킬워드비의 색인 같은 도구에 의해 세인트루이스의 작품에 추진되었다. 오거스틴은 12세기 스콜라 철학에서 두드러졌던 발췌문 편집에 의존하지 않고 원문 전체를 독자들이 접할 수 있도록 도왔다.알파벳 순서의 채택은 기억의 우위에서 쓰여진 [8]작품으로의 전환의 일부였다.정보를 알파벳 순서로 정렬한다는 생각은 또한 독실한 교회 신자였던 12, 13세기 백과사전 편집자들의 반대에 부딪혔다.그들은 그들의 물질을 신학적으로 구성하는 것을 선호했습니다 – 신이 창조한 순서대로 – Deus (신을 [2]의미)부터 시작합니다.

1604년 로버트 커드레이는 최초의 단일 언어 영어 사전인 표 알파벳에서 "만약 당신이 찾고자 하는 단어가 (a)로 시작된다면 이 표의 선두에서 찾되,[9] 만약 (v)로 끝부분을 찾으세요"라고 설명해야 했다.1803년 사무엘 테일러 콜리지는 "첫 [10]글자의 우연에 의해 결정된 배열"이라고 백과사전을 비난했지만, 오늘날 많은 목록이 이 원칙에 기초하고 있다.

필요한 [2]것을 찾기 위해 광범위한 사전 지식이 필요하지 않기 때문에 알파벳 순으로 배열하는 것은 정보에 대한 접근을 민주화하기 위한 힘이라고 볼 수 있다.

라틴어 스크립트로 주문

기본 순서 및 예시

현대 ISO 기본 라틴 알파벳의 표준 순서는 다음과 같습니다.

A-B-C-D-F-G-I-J-L-M-N-O-P-R-S-T-U-V-X-Y-Z

알파벳 순서의 간단한 예를 다음에 나타냅니다.

  • As; Aster; Astrolabe; 천문학; 천체물리학; At; At; At; Atan; Attack; Baa

또 다른 예는 다음과 같습니다.

  • Barnacle, Be, Be, Ben, Benefit, Bent

위의 단어들은 알파벳 순으로 배열되어 있다.Aster 앞에는 같은 글자로 시작하고 As 뒤에는 더 이상 문자가 없는 반면 Aster 에는 더 이상 문자가 없습니다.다음 세 단어는 알파벳에서 네 번째 문자(첫 번째 문자)가 e(아스터의 네 번째 문자) 에 오는 r이기 때문에 Aster 에 옵니다.이러한 단어 자체는 6번째 문자(각각 l, n p)에 따라 정렬됩니다.다음으로 At가 나옵니다.이것은 두 번째 글자의 앞의 단어(t는 s 뒤에 옵니다)와는 다릅니다.Ataman은 Astar가 As를 따라왔을 와 같은 이유로 At따라다닌다. 번째 글자를 비교한 아타만에게 공격이 뒤따르고, 첫 번째 글자가 다르기 때문에 다른 모든 글자를 뒤쫓아오는 Baa.

복수 단어 문자열 처리

정렬되는 문자열 중 일부가 여러 단어로 구성되어 있는 경우, 즉 공백이나 하이픈 등의 다른 구분자를 포함하는 경우, 두 가지 기본적인 방법을 사용할 수 있습니다.첫 번째 접근법에서는 모든 문자열이 첫 번째 단어에 따라 첫 번째 순서로 정렬됩니다.순서는 다음과 같습니다.

  • 오크, 오크 힐, 오크리지, 오크리 파크, 오크리 리버
    여기서 Oak은 알파벳 순서로 Oakley보다 앞에 있기 때문Oakley로 시작하는 모든 문자열은 Oakley보다 앞에 있습니다.

두 번째 접근법에서는 문자열이 공백이 없는 것처럼 알파벳 순으로 배열되어 시퀀스가 표시됩니다.

  • 오크, 오크 힐, 오크리 파크, 오크리 강, 오크 리지
    '오크릿지'라고 쓰인 처럼 '오크릿지'는 '오크릿지' 뒤에 붙는다.

두 번째 접근법은 보통 사전에서[citation needed] 채택되는 접근법이며, 따라서 출판업자들에 의해 사전 순서라고 종종 불린다.각 출판사는 전통적으로 어떤 접근방식을 사용할지에 대한 자체 표준을 설정했지만, 첫 번째 접근방식은 종종 도서 색인에 사용되어 왔다. 1975년 이전에는 도서 색인에 대한 ISO 표준(ISO 999)이 없었다.

특수한 경우

수정 문자

프랑스어에서는 수정 문자(분음 부호 포함 문자 등)는 알파벳 순서의 경우 기본 문자와 동일하게 취급됩니다.를 들어, 로엘은 마치 역할이 쓰여진 처럼 록과 로즈 사이에 있다.그러나 이러한 문자를 체계적으로 사용하는 언어에는 일반적으로 고유한 순서 규칙이 있습니다.아래 언어별 표기법을 참조하십시오.

성별로 주문

이름이 붙여진 후에 성을 쓰는 대부분의 문화권에서는 여전히 이름 목록을 먼저 성별로 정렬하는 것이 바람직하다.이 경우 이름을 올바르게 정렬하려면 순서를 변경해야 합니다.예를 들어 후안 에르난데스와 브라이언 오리어리는 이런 식으로 표기되지 않더라도 "Hernandes, Juan"과 "O'Leary, Brian"으로 분류되어야 한다.컴퓨터 대조 알고리즘에서 이 규칙을 캡처하는 것은 복잡하며 간단한 시도는 실패합니다.예를 들어, 알고리즘이 광범위한 가족 이름 목록을 가지고 있지 않는 한, "길리안 루실 반 데르 발"이 "반 데 발", "길리안 루실 반 데르 발", "길리안 루실 반 데르 발"인지 또는 심지어 "루실 반 데르 발, 길리안"인지 결정할 방법이 없습니다.

성순으로 정렬하는 것은 학술적인 맥락에서 자주 볼 수 있습니다.단일 다저자 논문 내에서 저자를 역서열이나 주관적인 논문 기여도 등 다른 방법이 아닌 알파벳 순으로 나열하는 것은 "동일한 기고문을 인정한다"거나 "협력 그룹에서 [11]부조화를 피한다"는 방법으로 보여진다.참고문헌에서 인용을 저자의 성별로 정렬하는 특정 분야의 관행은 알파벳에 일찍 나타나는 성을 가진 저자를 선호하는 편견을 만드는 것으로 밝혀졌지만, 이 효과는 [12]참고문헌이 연대순으로 정렬되는 분야에서는 나타나지 않는다.

기타 일반적인 단어

문구가 매우 일반적인 단어(문법에서는 "the", "a" 또는 "an"과 같이)로 시작하는 경우 해당 단어는 무시되거나 문구의 끝으로 이동되기도 하지만 항상 그렇지는 않습니다.예를 들어, "The Shinning"은 "Shinning" 또는 "Shinning, The"로 취급될 수 있으며, 따라서 "Summer of Sam"이라는 책 제목 앞에는 "Shinning, The"로 취급될 수 있습니다.하지만, 그것은 단순히 "The Shinning"과 "Summer of Sam" 이후로도 취급될 수 있다.마찬가지로 "시간의 주름"은 "시간의 주름", "시간의 주름, A" 또는 "시간의 주름"으로 처리될 수 있습니다.이 세 가지 알파벳 표기법은 모두 알고리즘으로 작성하기가 상당히 쉽지만, 많은 프로그램들은 단순한 사전 배열에 의존합니다.

Mac 프리픽스

아일랜드와 스코틀랜드 성에서 접두사 M과 Mc는 Mac의 줄임말이며 철자가 Mac인 것처럼 알파벳으로 분류되기도 합니다.따라서 맥킨리는 맥킨토시 에 나열될 수 있다('맥킨리'로 표기된 것처럼).컴퓨터 정렬 목록이 등장한 이후, 이러한 유형의 알파벳 표기는 영국 전화번호부에서는 여전히 사용되고 있지만, 덜 자주 볼 수 있습니다.

St 프리픽스

접두사 St 또는 St.는 "Saint"의 약자로, 전통적으로 철자가 Saint인 처럼 알파벳으로 분류됩니다.따라서 요한 성당은 (마치 '성 요한 성당'으로 표기된 것처럼) 살렘 앞에 게재될 수도 있다.컴퓨터 정렬 목록이 등장한 이후 이러한 유형의 알파벳 순서는 자주 사용되지 않지만 여전히 종종 사용됩니다.

연결

영어의 AE와 δ같이 구별되는 문자로 간주되지 않는 결합자(하나의 기호로 병합된 두 개 이상의 문자)는 일반적으로 문자가 분리된 것처럼 조합된다. 즉, "ether"와 "ether"는 다른 모든 단어에 대해 동일한 순서가 지정된다.차용어나 브랜드명 등 순수하게 스타일리시하지 않은 경우에도 마찬가지입니다.

두 글자가 결합되어 있는지 여부에 따라 달라지는 문자열을 정렬하려면 특별한 규칙을 적용해야 할 수 있습니다.

숫자의 취급

일부 문자열에 숫자(또는 기타 문자 이외의 문자)가 포함되어 있는 경우 다양한 접근법이 가능합니다.때때로 그러한 문자는 알파벳의 모든 문자 앞이나 뒤에 온 것처럼 취급된다.또 다른 방법은 숫자를 알파벳 순으로 정렬하는 것입니다. 를 들어 1776은 "7676"으로 표기된 것처럼 정렬되고 24는 "빙트-쿼트"로 표기된 것처럼 du Mans로 분류됩니다." (프랑스어로 '24'라는 뜻)숫자 또는 기타 기호를 특수 그래픽 형태의 문자로 사용할 경우, 리트 또는 영화 세븐(Seven으로 양식화됨)의 1337과 같이 해당 문자인 것처럼 정렬할 수 있습니다.자연 정렬 순서는 문자열을 알파벳 순으로 정렬합니다.단, 복수 자리 숫자는 단일 문자로 처리되며 숫자로 인코딩된 숫자 값에 따라 정렬됩니다.

군주와 교황경우, 비록 숫자는 로마 숫자로 되어 있고 문자와 비슷하지만, 보통 숫자 순서로 배열된다: 그래서, V가 I 다음에 오더라도, 덴마크 왕 크리스티안 9세는 그의 전임자인 크리스티안 8세 다음에 온다.

언어 고유의 표기법

확장된 라틴 알파벳을 사용하는 언어들은 일반적으로 여분의 글자를 다루기 위한 그들만의 규칙을 가지고 있다.또한 일부 언어에서는 특정 디그래프가 대조 목적으로 단일 문자로 취급됩니다.예를 들어 스페인어의 29자 알파벳은 n 오는 기본 문자로 처리하며, 이전에는 각각 c와 l 뒤에 오는 기본 문자로 처리했다.ch와 ll은 여전히 문자로 간주되지만, 현재는 두 글자의 조합으로 알파벳 순으로 분류됩니다.(새로운 알파벳 표기 규칙은 1994년 스페인 왕립 아카데미에 의해 발표되었습니다.)한편, digraph rr은 예상대로 rqu에 이어 1994년 알파벳화 규칙 이전에도 계속됩니다.

Kiowa와 같이 알파벳 순서가 완전히 바뀐 경우도 있습니다.

다양한 언어로 적용되는 알파벳 표기 규칙을 다음에 나타냅니다.

  • 아제르바이잔어에서는 표준 라틴어 알파벳에 8개의 문자가 추가되어 있습니다.그 중 5개는 모음이다: i, ,, ü, ü, and, are, ,, ,알파벳은 터키어 알파벳과 동일하며, 터키어에는 존재하지 않는 소리를 나타내는 q, x, for의 세 글자를 제외하고 같은 소리를 같은 문자로 표기한다."터키 문자"는 모두 터키어처럼 "정상" 알파벳 순서로 조합되지만, 세 개의 추가 문자는 소리가 다가온 문자 뒤에 임의로 조합됩니다.따라서 k, x(독일어 ch처럼 발음)는 h 직후에, pron(영어 약어 a처럼 발음)는 e 직후에 조합한다.
  • 브르타뉴어에는 "c", "q", "x"는 없지만 "b"와 "d" 사이에 조합된 "ch"와 "c'h"는 있다.예를 들면, 「부즈겐」, 「추그」, 「코어」, 「대라우엔」(지렁이, 주스, 자매, 눈물방울).
  • 체코어와 슬로바키아에서 악센트 모음은 2차 대조 가중치를 가진다. 다른 문자와 비교하여 악센트 없는 형태로 취급된다(체코어, A-A, E-E-I, O-O, U-U-I, Y-I, 슬로바키아어, A-A, A-A).a, bá, bab, bab, bac, bác, bach, bá[체코어] 및 baa, ba, b b, b,, b,, b,, b,, b,b, b,b, b,, bc, bč, bčc, b slovakc, b slovakc [체코어] 슬로바키아어: ba, bä, bä, bä, bä, bä, bä, bä, bä, bä, bä, bä, bä, bä, bä, bä, bä, bä, bä, bä악센트 자음은 1차 대조 중량을 가지며, 다시 2차 가중치를 갖는 ď, ň, ť, ľ, ť, ť, ť, ť(슬로바키아)를 제외하고, 그 직후에 대조된다.CH는 별개의 문자로 간주되며 H와 I 사이에 들어갑니다.슬로바키아어에서는 DZDJ도 별개의 문자로 간주되며 δ와 E 사이에 위치한다.
  • 덴마크어와 노르웨이어 알파벳에서도 스웨덴어와 동일한 추가 모음(아래 참조)이 존재하지만 순서가 다르고 문자(... X, Y, Z, E, æ, ø)가 다르다.또한 "Aa"는 "O"와 동등하게 조합됩니다.덴마크어 알파벳은 전통적으로 "W"를 "V"의 변형으로 봐왔지만, 오늘날 "W"는 별개의 문자로 여겨진다.
  • 네덜란드어에서는 IJ 조합(δ를 나타냄)은 이전에는 Y(또는 때로는 별도의 문자로)로 대조되었다.Y < IJ < Z > 단, 현재는 대부분 2글자(II < IJ < IK)로 조합되어 있습니다.전화번호부는 예외입니다.많은 네덜란드 성씨에서 Y는 현대 철자가 IJ를 필요로 하는 곳에 사용되기 때문에 IJ는 항상 Y로 대조됩니다.대문자 I로 시작하는 ij로 시작하는 단어도 대문자 J로 표기됩니다(예: 마을 IJmuiden, 강 IJsel, 국가 IJsland(아이슬란드)).
  • 에스페란토에서는 곡절 악센트의 자음(,, ,, ,, with, with, with, with, with, with, with, d, e, f, g, ,, h, ,, i, ,, ,, ,, ,, ,, c, z)과 함께 별도의 문자로 계산된다.
  • 에스토니아어 ,, and, ü는 별도의 문자로 간주되며 w 에 정렬한다.문자 ,, zž는 외래어 및 외래 고유명에서만 나타나고 에스토니아어 알파벳의 문자 s 에 표시되며, 그 이외의 문자는 기본 라틴 문자와 다르지 않다.
  • 페로어 알파벳에는 덴마크어, 노르웨이어, 스웨덴어 추가 문자, EE와 ö도 있습니다.게다가 페로어 알파벳은 D 에 이어지는 아이슬란드 문자를 사용한다.6개의 모음 A, I, O, U, Y 중 5개는 악센트를 얻을 수 있으며 그 이후에는 별도의 문자로 간주됩니다.자음 C, Q, X, W, Z를 찾을 수 없습니다.따라서 첫 번째 5글자A, A, B, D 및 ð이고 마지막 5글자는 V, Y, ý, ,, therefore입니다.
  • 필리핀어(타갈로그어) 및 기타 필리핀어에서는 문자 Ng는 별도의 문자로 취급됩니다.그것은 sing, ping-pong 등으로 발음된다.그 자체로는 낭이라고 발음하지만, 일반적으로 필리핀 철자법에서는 두 개의 분리된 문자(n과 g)인 것처럼 철자를 쓴다.또한 문자 파생상품(예: ñ)은 기본 문자 뒤에 바로 표시됩니다.필리핀어도 분음 부호로 쓰이지만, 사용하는 경우는 매우 드물다(칠데를 제외).(필리핀 철자법에는 철자법도 포함되어 있습니다.
  • 핀란드어 알파벳과 대조 규칙은 스웨덴어와 같다.
  • 프랑스어에서는 주어진 단어의 마지막 악센트가 [13]순서를 결정합니다.예를 들어 프랑스어에서는 cote < cotte < cotte < cotte < cotté > cotté의 4개의 단어가 다음과 같이 정렬됩니다.
  • umlaut(l, with, ü)이 포함된 독일어 문자의 경우 일반적으로 umlaut가 아닌 버전과 동일하게 취급된다. is는 항상 ss로 분류된다.알파벳 순서는 Arbit, Arg, Argerlich, Arg, Arg, Arm, Assistant, Alarlar, Assoziation입니다.전화번호부 및 이와 유사한 이름 리스트의 경우, 다수의 독일어 성이 umlaut와 함께 나타나며, umlaut는 umlaut와 함께 나타나기 때문에 umlaut는 문자 조합 "ae", "oe", "ue"와 같이 조합됩니다.이는 알파벳 순서 Udet, Ubelacker, Uell, Ulle, Ueve, üxkül, Uffenbach를 만든다.
  • 헝가리의 모음은 악센트, 엄라우트, 이중 악센트가 있고, 자음은 단음, 이중음 또는 삼중음 문자로 쓰여진다.대조에서 악센트가 있는 모음은 악센트가 없는 모음과 동등하며 이중 및 삼중 문자는 단일 원본을 따릅니다.헝가리의 알파벳 순서는 다음과 같습니다.A=A, B, C, Cs, D, Dz, Dz, Dz, Dzs, E=E, F, G, Gy, H, I=II, J, K, L, Ly, M, Ny, O=O, O=O, O=O, O=O, O, O, O, O, O, O, O, O, O, D, D, D, D, D, D, D, D, D, D, D, D, D, D, D, D, D, D, D, D, D, D, D, D, D, D, D, D,즉, 대조에서는 c가 cs보다 우선하기 때문에 (보통 s가 u보다 이더라도) nádcsomo보다 앞이 되어야 합니다.모음 길이의 차이는 두 단어가 다른 방법으로 동일한 경우에만 고려되어야 한다(예: ér, éger).구문 내의 공백과 하이픈은 대조에서 무시됩니다.ch는 어떤 단어에서는 이면체로 나타나지만 대조에서는 그 자체로 글자로 간주되지 않는다.
    헝가리 조합의 특별한 특징은 (gy + gyggy 또는 dz + dzddzs와 같은) 축약된 형태의 이중 다이아 및 삼각문자(di- 또는 삼각문자)가 완전히 작성된 것처럼 조합되어야 한다는 것이다(수축 사실과 독립적으로).를 들어 kassza의 네 번째 문자 z는 보통 알파벳의 s 뒤에 오지만 kassza의 네 번째 문자 z는 i 뒤에 오는번째 sz(sz + sz로 분해)로 간주되기 때문에 kaszinokassza 앞에 와야 한다.
  • 아이슬란드어에서는 δ가 추가되고 D 뒤에 δD가 붙는다.각 모음(A, E, I, O, U, Y) 뒤에는 급성 A, E, ,, ,, ,, ,, ,가 뒤따른다.Z가 없기 때문에 알파벳이 끝납니다.X, Y, þ, ,, ,, ,, ,
    • 두 글자 모두 /w/를 나타내기 위해 Runic 문자 Wynn을 사용하기도 했던 앵글로 색슨 서사들에 의해 사용되었다.
    • þ(가시, 소문자 ))도 Runic 문자입니다.
    • eth(소문자 ð)는 스트로크가 추가된 문자 D입니다.
  • Kiowa는 역사적 라틴어 순서가 아니라 브라흐미 문자 같은 발음 원리에 따라 정렬됩니다.모음이 먼저 오고, 그 다음에 자음이 입의 앞부분에서 뒷부분으로, 음에서 양의 음성으로, 파찰음, 마찰음, 액체, 비음이 차례로 나옵니다.
A, AU, E, I, O, U, B, F, P, V, D, J, T, TH, G, C, K, Q, CH, X, S, Z, L, Y, W, H, M, N
  • 리투아니아어에서는 특히 리투아니아 문자는 라틴어 원문 뒤에 온다.또 다른 변화는 Y가 J: ... G, H, I, δ, Y, J, K 바로 에 오는 이다.
  • 폴란드어에서는 특히 라틴 알파벳에서 파생된 폴란드 문자는 원본 A, ą, B, C, ć, D, E, ę, ..., ..., L, ł, M, N, ń, O, ó, P, ..., S, a의 뒤에 대조된다.대조용 디그래프는 두 개의 독립된 문자로 취급됩니다.
  • 포르투갈어의 대조 순서는 영어 A, B, C, D, E, F, G, H, I, J, K, L, M, N, O, P, Q, R, S, T, U, V, X, Z와 같습니다.알파벳에는 분음 부호가 있는 디그래프 및 문자는 포함되지 않습니다.
  • 루마니아어에서는, 라틴 문자로부터 파생된 특수 문자는, 원래의 문자 A, A, A, A, ..., I, î, ..., S, ș, T, ț, ..., Z 뒤에 조합됩니다.
  • 세르보크로아티아어 및 기타 관련된 남슬라브어에서는 악센트 문자 5개와 결합된 문자 3개가 원본에 따라 정렬됩니다. ..., C, CH, ć, ć, D, DJ, DJ, DJ, DJ, E, ..., L, LJ, M, N, NJ, O, ..., S, ..., š, in, in, in.
  • 스페인어는 1994년까지 "CH"와 "LL"을 단일 문자로 취급하여 cinco, credo, chispalomo, luz, lama 순서를 부여했습니다.이것은 1994년에 RAE가 보다 일반적인 용법을 채택한 이후 더 이상 사실이 아닙니다.이제 LL은 LK와 LM, CH는 CG와 CI 사이에서 대조됩니다.분음 부호 A, E, II, OO, OU, Uü의 6개 문자는 원본 문자 A, E, I, O, U(예: radio, rafaga, rapido, rastrillo)로 취급됩니다.스페인어 특유의 대조 질문은 N 뒤에 대조된 다른 문자로서 ñ(ee)이다.
  • 스웨덴어 알파벳에는 덴마크어 및 노르웨이어 알파벳과 비슷하지만 알파벳 끝에는 세 의 모음(... X, Y, Z, ,, ö, ...,)이 추가되어 있다.문자 "W"는 "V"의 변형으로 취급되어 왔지만, 스벤스카 아카데미엔스 오드리스타 (2006) 제13판에서는 "W"가 별개의 문자로 간주되었다.
  • 터키어 알파벳에는 ,, ,, ,, ,, ,, (, ü(q, w, x는 없지만 q, w, x는 포함되지 않는다.이들은 c 이후 c, g 이후 after, i 이전 before, o 이후 o, s 이후 s 및 u 이후 ü와 대조된다.원래 1928년에 알파벳이 도입되었을 때, ı는 i 뒤에 조합되었지만, 나중에 순서가 바뀌어 점, 세딜, 또는 다른 장식 마크가 들어간 모양이 있는 글자는 항상 대응하는 맨 모양을 가진 글자를 따르게 되었다.터키어 철자법에서 I는 점 없는 dot의 대문자인데 반해 I the는 점 있는 dotted의 대문자이다.
  • 많은 튀르크어 언어(아제리어 또는 타타르어의 자알리프 철자)에는 G와 H 사이에 Ga( ()가 있었다.그것은 지금은 사용되지 않는다.
  • 베트남어에는 7개의 문자가 더 있다: ă, ,, ,, ,, while, f, j, w, z는 아직 사용되고 있지만(인터넷 주소, 외국 차용어 등) f, j, w, z는 존재하지 않는다."f"는 "ph" 조합으로 대체됩니다.w는 qu와 같다.
  • Volapük ,에서 and와 ü는 별도의 문자로 계산되며, q[14]w가 없는 동안 별도로 대조된다(a, o, b ... o, u, p ... u, ü, v).
  • 웨일스어에서는 디그래프 CH, DD, FF, NG, LL, PH, RH 및 TH를 단일 문자로 취급하고, 각각 A, B, C, C, CH, D, DD, E, F, F, G, G, NG의 첫 번째 문자 뒤에 나열된다(G 뒤에 나열되는 NG 제외).그러나 때때로 합성된 단어가 두 글자를 형성하지 않는 두 글자를 병치하는 결과를 초래할 수 있다.예를 들어 LLONGYFARCH(LON + GYFARCH에서 구성됨)라는 단어가 있습니다.그 결과, 예를 들어 LORR, LWCUS, LLONG, LLOM, LLONGYFARCH(NG는 LLONG에서는 디그래프이지만 LLONGYFARCH에서는 디그래프입니다).문자 조합 R+H(이문자 RH와 구별됨)는 화합물 내 병렬 배치에 의해 유사하게 발생할 수 있지만, 이는 오식별이 순서에 영향을 미칠 수 있는 쌍을 생성하지 않는 경향이 있다.D+D와 L+L 등 혼동을 일으킬 가능성이 있는 기타 문자 조합의 경우 하이픈이 철자(AD-DAL, CHWIL-LY 등)에 사용됩니다.

자동화

정렬 알고리즘과 조합하여 정렬 알고리즘을 사용하여 문자열을 알파벳 순서로 배열합니다.표준 예로는 Unicode Collation Algorithm이 있습니다.이 알고리즘은 Unicode 기호를 포함하는 문자열을 알파벳 [13]순서로 배열하는 데 사용할 수 있습니다.디폴트 대조 테이블을 커스터마이즈하는 것으로, 상기의 대부분의 언어 고유의 표기법에 준거하도록 할 수 있습니다.이러한 커스터마이징은 Common Locale Data Repository에 수집됩니다.

같은 순서

알파벳 순서의 원칙은 엄밀하게 알파벳을 사용하지 않는 언어에서도 여전히 적용될 수 있다. 예를 들어, 사용된 기호가 정해진 순서를 가지고 있다면, 알파벳 순서는 음절 문자나 아부기다를 사용하여 작성될 수 있다.

한자한자와 같은 기록체계의 경우 기호 순서를 정의하는 방법으로서 근· 구분법이 자주 사용된다.일본인은 발음순을 사용하는 경우가 있는데, 가장 일반적인 은 고조원순이지만 오래된 이로하순도 있습니다.

수학에서 사전적 순서는 알파벳 [15]순서를 만드는 데 사용되는 것과 유사한 방식으로 시퀀스를 정렬하는 수단이다.

일부 컴퓨터 응용 프로그램에서는 문자 ASCII 또는 Unicode 코드만을 기반으로 매우 간단한 알고리즘을 사용하여 얻을 수 있는 알파벳 순서 버전을 사용합니다.이는 모든 대문자를 소문자 앞에 배치하는 것과 같은 비표준적인 효과를 가져올 수 있습니다.ASCII 기본 순서를 참조해 주세요.

운율 사전은 단어의 마지막 문자부터 첫 글자까지 알파벳 순서로 단어를 정렬하는 것에 기초하고 있다.

「 」를 참조해 주세요.

레퍼런스

  1. ^ 라인하르트 G.27-30-22-26알파벳이 몇 글자 필요합니까?셈어의 경우"에서, 집필의 개념: 국경을 넘나드는 글, Alex de Voogt와 Joachim Friedrich Quack에 의해 편집, Leiden: Bril 2012, 페이지 11-52.
  2. ^ a b c d Street, Julie (10 June 2020). "From A to Z - the surprising history of alphabetical order" (text and audio). ABC News (ABC Radio National). Australian Broadcasting Corporation. Retrieved 6 July 2020.
  3. ^ 예: 히브리 성경의 시편 25, 34, 37, 111, 112, 119 및 145
  4. ^ 달리, 로이드고대와 중세의 알파벳 표기 역사에 대한 공헌.브뤼셀, 1967년, 페이지 25
  5. ^ O'Hara, James (1989). "Messapus, Cycnus, and the Alphabetical Order of Vergil's Catalogue of Italian Heroes". Phoenix. 43 (1): 35–38. doi:10.2307/1088539. JSTOR 1088539.
  6. ^ LIVRE XI – texte latin – traduction + commentaires.
  7. ^ Gibson, Craig (2002). Interpreting a classic: Demosthenes and his ancient commentators.
  8. ^ Rouse, Mary A.; Rouse, Richard M. (1991), "Statim invenire: Schools, Preachers and New Attitudes to the Page", Authentic Witnesses: Approaches to Medieval Texts and Manuscripts, University of Notre Dame Press, pp. 201–219, ISBN 0-268-00622-9
  9. ^ Cawdrey, Robert (1604). A Table Alphabeticall. London. p. [A4]v.
  10. ^ Coleridge's Letters, No.507.
  11. ^ Tscharntke, Teja; Hochberg, Michael E; Rand, Tatyana A; Resh, Vincent H; Krauss, Jochen (January 2007). "Author Sequence and Credit for Contributions in Multiauthored Publications". PLOS Biol. 5 (1): e18. doi:10.1371/journal.bio.0050018. PMC 1769438. PMID 17227141.
  12. ^ Stevens, Jeffrey R.; Duque, Juan F. (2018). "Order Matters: Alphabetizing In-Text Citations Biases Citation Rates" (PDF). Psychonomic Bulletin & Review. 26 (3): 1020–1026. doi:10.3758/s13423-018-1532-8. PMID 30288671. S2CID 52922399.
    • 요약 배치 위치:
  13. ^ a b "Unicode Technical Standard #10: Unicode collation algorithm". Unicode, Inc. (unicode.org). 20 March 2008. Retrieved 27 August 2008.
  14. ^ Midgley, Ralph. "Volapük to English dictionary" (PDF). Archived from the original (PDF) on 1 September 2012. Retrieved 24 September 2019.
  15. ^ Franz Baader; Tobias Nipkow (1999). Term Rewriting and All That. Cambridge University Press. pp. 18–19. ISBN 978-0-521-77920-3.

추가 정보