비율 확장 정렬

비율 확장 정렬
클래스	정렬 알고리즘
데이터 구조	배열
최악의 경우 공연	O(n log n)
베스트 케이스 공연	O(n log n)
평균 공연	O(n log n)
최악의 경우 공간 복잡성	O(log n) 보조

비율 확장 정렬(약칭 PESort)은 성능, 특히 최악의 경우 성능 향상을 시도하는 퀵소트의 내부 비교 기반 정렬 알고리즘이다.

퀵소트의 기본 분할 연산은 선형 접근 패턴을 가지고 있어 현대 메모리 계층 구조에서 매우 효율적이지만 알고리즘의 성능은 피벗 값의 선택에 따라 결정적으로 좌우된다.좋은 피벗은 데이터를 거의 동일한 절반으로 나눌 것이다.선택이 잘 안되면 한 부분이 거의 원래의 문제만큼 크게 $남아서$ O $(n 2)$ 성능을 유발하는 엄청나게 편중된 분할이 초래될 것이다.

비율 확장 정렬은 k $요소$ 의 정렬된 접두사로 시작한 다음 해당 표본의 중위수를 사용하여 다음 $pk$ 요소를 분할한다.표본과 분할되는 데이터 사이의 크기 비율 $p$ (즉, 정렬된 접두사가 확장되는 비율)를 제한하여 불균형을 제한한다.이 점에서, 그것은 견본과 약간의 유사성을 가지고 있다.^[1]

역사

비례 확장 분류는 Chung-Chao Chen에 의해 2001년에^[2] 그의 초기 비율 분할 분류 설계의 개선으로 출판되었다.^[3]원본 논문에서만 실험적으로 측정했던 평균 사례 성능은 2004년^[4] 리처드 콜과 데이비드 C. 칸다틸, 2006년 첸이 분석했으며 평균적으로 $logn 2$ + $O (n)$ 비교가 필요한 것으로 나타났다.^[5]약간 정제된 변종인 대칭 분할 분류는 2007년에 출판되었다.^[6]

알고리즘.

알고리즘은 정렬되지 않은 부분 $U$ 에 인접한 정렬된 부분 $S$ 로 분할된 배열로 시작한다. (정렬되지 않은 부분보다 정렬된 부분이 항상 앞에 있고 대칭 변형이 어느 한 순서를 허용한다.)정렬된 부분(단일 요소는 항상 정렬됨)으로 첫 번째 요소부터 시작하거나, 간단한 삽입 정렬을 사용하여 적은 수의 요소를 정렬할 수 있다.또한 사전에 정렬된 데이터의 경우 성능을 향상시키기 위해 배열 전체에서 초기 정렬된 요소를 가져올 수 있다.

다음으로, 그리고 가장 비판적으로, 정렬되지 않은 부분 $U$ 의 길이는 정렬된 부분 $S$ 의 길이의 복수 $p$ 로 제한된다. 특히, $U$ > $p 2$ S, 그 다음에 반복적으로 $S$ 와 인접한 $U$ 의 p $S$ 요소를 정렬하여 결과( $p$ ^[a] $+1배$ 더 길다)를 새로운 $S$ 로 만들고, 조건이 충족될 때까지 반복한다.

변형되지 않은 부분( $p =$ csv)에 제한이 없다면 알고리즘은 퀵소트(quicksort)에 해당한다.정렬되지 않은 부분이 길이 1( $p =0$ , 거의)인 경우 알고리즘은 이진 삽입 정렬과 동일하다. $p \approx16$ 주변의 값은 퀵소트(quicksort)와 경쟁적으로 최상의 평균 사례 성능을 제공하는 반면,^[6]^{: 764} 작은 값은 최악의 경우 성능을 향상시킨다.^[b]

Eliezer Albacea는 1995년에 Leapfroging samplesort라는 유사한 알고리즘을 발표했는데, 크기가 제한되어 $U$ ≤ $S +1$ 로 나중에 $(2-1 k)(S +$ 1)로 일반화되었다 $. [7] [1]$ ^[8]

배열의 정렬된 부분은 (중앙값에서) 반으로 나누어져 있고, 절반은 (변형되지 않은 요소와 교환하여) 배열의 맨 끝으로 이동하기 때문에 초기 부분분할된 $LUR$ 형식의 배열이 있는데, 여기서 $L$ 은 정렬된 부분의 왼쪽 반이고, $U$ 는 경계 길이 미변형 부분이고, $R$ 은 정렬된 파의 오른쪽 반이다.t

그런 다음 $U$ 에서 표준 퀵소트 분할 단계를 수행하여 $U$ 와_L $U$ 로_R_L $나누며 R$ (제자리에) 정렬하지 않지만 $U$ 의_L 모든 요소가 중위수 이하 또는 같으며 $U$ 의_R 모든 요소가 더 크거나 같다.^[c]최종 결과 $LUR$ 는_L_R 필요한 형태의 두 배열(변형되지 않은 부품에 인접한 정렬된 부품)으로 구성되며 반복적으로 정렬된다.

Leapfrogging samplesort고 원본 비율은 정렬된 부분인 침은 항상 정리되지 않은 부분, R이사 가기 전에 U분할로 달성하 LRULUR게 되었고, 그때 UL의 끝을 만지작거리더니 LULRUR의 결과 R를 교환하는 선행이 뻗어 있다.반면 대칭 버전은 비트 trickier, 그것은 L그리고 R부분 감시인으로 행동하는 장점이 있다. $U$ 의 한계에 도달했는지 여부를 테스트할 필요 없이 분할 루프에 대한 값.^[1]

주로 편향된 입력을 검출하고 효율적으로 처리하는 기법을 포함해 퀵소트에 사용되는 구현 개선의 대부분을 적용할 수 있다.^[9]^[6]특히 특정 크기 임계값 미만의 하위 정렬은 보통 간단한 삽입 정렬을 사용하여 구현된다.

퀵소트(quicksort)와 마찬가지로 작은 서브소트(sub-sort)를 먼저 하고 큰 것을 테일콜(tail call)로 구현하면 재귀적 $레벨$ 의₂ 수를 logn(로그인)으로 제한할 수 있다.퀵소트와 달리 레벨 수는 이렇게 하지 않아도 $O (log$ $n)$ 로 경계를 이룬다.^[9]^{: 781}

메모들

^ $소스$ 마다 p에 대해 서로 다른 규약을 사용한다는 점에 유의하십시오. Chen은 정렬된 부분에 대해 정렬되지 않은 부분의 비율을 사용하므로 $p$ > $0$ 은 이치에 맞는 반면, 다른 사람들은 정렬된 부품에 대한 전체 크기의 비율로 이 비율을 $사용$ 하므로 p $>1만$ 이 이치에 맞는다는 것을 알 수 있다.
^ 알고리즘은 최대 1/ $log 2 (1$ + 1 $/(2p 2 +2p-1$ ) $n$ $로그 2$ n $비교$ 를 요구한다. $p$ ≤ $16$ 의 경우 이 상수는 약 1 $.37p 2 +1.63p-0.5가$ 될 수 있다.
^ 이것은 오름차순을 가정한다.내림차순은 명확한 조정이 필요하다.

참조

^ ^a ^b Albacea, Eliezer A. (January 2012). "Average-case analysis of Leapfrogging samplesort" (PDF). Philippine Science Letters. 5 (1).
^ Chen, Jing-Chao (July 2001). "Proportion extend sort". SIAM Journal on Computing. 31 (1): 323–330. doi:10.1137/S0097539798342903.
^ Chen, Jing-Chao (Fall 1996). "Proportion split sort". Nordic Journal of Computing. 3 (3): 271–279. doi:10.1137/S0097539798342903.
^ Cole, Richard; Kandathil, David C. (14–17 September 2004). The Average Case Analysis of Partition Sorts (PDF). Algorithms—ESA 2004: 12th Annual European Symposium. Bergen. pp. 240–251. doi:10.1007/978-3-540-30140-0_23. ISBN 3-540-23025-4.
^ Chen, Jing-Chao (15 December 2006). "Efﬁcient sample sort and the average case analysis of PEsort". Theoretical Computer Science. 369 (1–3): 44–66. doi:10.1016/j.tcs.2006.07.017.
^ ^a ^b ^c Chen, Jing-Chao (11 September 2007). "Symmetry Partition Sort". Software: Practice and Experience. 38 (7): 761–773. arXiv:0706.0046. doi:10.1002/spe.851. S2CID 844616.
^ Albacea, Eliezer A. (1995). Leapfrogging samplesort. Asian Computing Science Conference. doi:10.1007/3-540-60688-2_30.
^ Albacea, Eliezer A. (29 January 2018). "Generalized Leapfrogging Samplesort: A Class of O(n log²2 n) Worst-Case Complexity and O(n log n) Average-Case Complexity Sorting Algorithms". arXiv:1801.09431 [cs.DS].
^ ^a ^b Chen, Jing-Chao (10 July 2004). "Building a new sort function for a C library". Software: Practice and Experience. 34 (8): 777–795. doi:10.1002/spe.593. S2CID 8193225.

외부 링크

https://github.com/jingchaochen/Symmetry-Partition-Sort 예 코드

[7] $소스$ 마다 p에 대해 서로 다른 규약을 사용한다는 점에 유의하십시오. Chen은 정렬된 부분에 대해 정렬되지 않은 부분의 비율을 사용하므로 $p$ > $0$ 은 이치에 맞는 반면, 다른 사람들은 정렬된 부품에 대한 전체 크기의 비율로 이 비율을 $사용$ 하므로 p $>1만$ 이 이치에 맞는다는 것을 알 수 있다.

[8] 알고리즘은 최대 1/ $log 2 (1$ + 1 $/(2p 2 +2p-1$ ) $n$ $로그 2$ n $비교$ 를 요구한다. $p$ ≤ $16$ 의 경우 이 상수는 약 1 $.37p 2 +1.63p-0.5가$ 될 수 있다.

[11] 이것은 오름차순을 가정한다.내림차순은 명확한 조정이 필요하다.

[Albacea12-1] Albacea, Eliezer A. (January 2012). "Average-case analysis of Leapfrogging samplesort" (PDF). Philippine Science Letters. 5 (1).

[Chen01-2] Chen, Jing-Chao (July 2001). "Proportion extend sort". SIAM Journal on Computing. 31 (1): 323–330. doi:10.1137/S0097539798342903.

[Chen96-3] Chen, Jing-Chao (Fall 1996). "Proportion split sort". Nordic Journal of Computing. 3 (3): 271–279. doi:10.1137/S0097539798342903.

[Cole04-4] Cole, Richard; Kandathil, David C. (14–17 September 2004). The Average Case Analysis of Partition Sorts (PDF). Algorithms—ESA 2004: 12th Annual European Symposium. Bergen. pp. 240–251. doi:10.1007/978-3-540-30140-0_23. ISBN 3-540-23025-4.

[Chen06-5] Chen, Jing-Chao (15 December 2006). "Efﬁcient sample sort and the average case analysis of PEsort". Theoretical Computer Science. 369 (1–3): 44–66. doi:10.1016/j.tcs.2006.07.017.

[Chen07-6] Chen, Jing-Chao (11 September 2007). "Symmetry Partition Sort". Software: Practice and Experience. 38 (7): 761–773. arXiv:0706.0046. doi:10.1002/spe.851. S2CID 844616.

[Albacea95-9] Albacea, Eliezer A. (1995). Leapfrogging samplesort. Asian Computing Science Conference. doi:10.1007/3-540-60688-2_30.

[Albacea18-10] Albacea, Eliezer A. (29 January 2018). "Generalized Leapfrogging Samplesort: A Class of O(n log²2 n) Worst-Case Complexity and O(n log n) Average-Case Complexity Sorting Algorithms". arXiv:1801.09431 [cs.DS].

[Chen04-12] Chen, Jing-Chao (10 July 2004). "Building a new sort function for a C library". Software: Practice and Experience. 34 (8): 777–795. doi:10.1002/spe.593. S2CID 8193225.

[1]

[2]

[3]

[4]

[5]

[6]

[a]

[b]

[7]

[8]

[c]

[1]

[9]

v t 정렬 알고리즘
이론	계산 복잡성 이론 빅 O 표기법 총순번 목록 배치 안정성 비교 정렬 적응 정렬 정렬 네트워크 정수 정렬 X + Y 정렬 트랜스디코토머스 모형 양자 분류
Exchange sort	버블 정렬 칵테일 셰이커 분류 홀수-짝수 정렬 콤 정렬 Gnome sort 비율 확장 정렬 퀵소트 슬로우토트 스투지 분류 보고소트
선택 정렬	선택 정렬 힙스포트 스무스소트 데카르트 트리 정렬 토너먼트 정렬 사이클 정렬 약한 heap 분류
삽입 정렬	삽입 정렬 조개류 스플레이소트 트리 정렬 라이브러리 정렬 인내 정렬
정렬 병합	병합 정렬 계단식 병합 정렬 병합 정렬 진동 다상 병합 정렬
분포 정렬	미국 국기 종류 비드 정렬 버킷 정렬 버스토트 카운팅 정렬 보간 정렬 비둘기홀 정렬 프록시맵 정렬 라딕스 분류 플래시소트
동시 정렬	비토닉 정렬기 배처 홀수-짝수 병합 쌍방향 정렬 네트워크 샘플포트
잡종류	병합 정렬 차단 커크패트릭-레이시 분류 팀소트 인트로소트 스프레스포트 병합 삽입 정렬
기타	위상 분류 위상전순서 팬케이크 분류 스파게티 종류

Search

비율 확장 정렬

네임스페이스

더

목차

역사

알고리즘.

메모들

참조

외부 링크