퀵 정렬은 n개의 데이터를 정렬할 때, 최악의 경우에는 O(n2)번의 비교를 수행하고, 평균적으로 O(nlogn)번의 비교를 수행한다.
퀵 정렬의 내부 루프는 대부분의 컴퓨터 아키텍처에서 효율적으로 작동하도록 설계되어 있고(그 이유는 메모리 참조가 지역화되어 있기 때문에 CPU 캐시의 히트율이 높아지기 때문이다.), 대부분의 실질적인 데이터를 정렬할 때 제곱 시간이 걸릴 확률이 거의 없도록 알고리즘을 설계하는 것이 가능하다. 또한 매 단계에서 적어도 1개의 원소가 자기 자리를 찾게 되므로 이후 정렬할 개수가 줄어든다. 때문에 일반적인 경우 퀵 정렬은 다른 O(n log n) 알고리즘에 비해 훨씬 빠르게 동작한다. 이러한 이유로 퀵소트(빠른정렬)라는 이름의 기원이 되었다.
그리고 퀵 정렬은 정렬을 위해 평균적으로 O(log n)만큼의 memory를 필요로한다. 이는 재귀적 호출로 발생하는 것이며, 최악의 경우 O(n)의 공간복잡도를 보인다.
원소들 중에 같은 값이 있는 경우 같은 값들의 정렬 이후 순서가 초기 순서와 달라질 수 있어 불안정 정렬에 속한다.
이러한 경우의 C코드 예: 51, 52, 3, 2, 1를 정렬하면 1, 2, 3, 52, 51 이 된다.
퀵 정렬 알고리즘은 분할과 정복의 두 단계를 거치므로 정확성도 그 두 단계를 각각 증명한다. 여기서는 분할이 정확함을 보인다. 분할이 정확하다는 뜻을 풀어서 설명하면 다음과 같다.
"임의의 수 x와 배열 형태의 n개의 자료가 주어졌다고 하자. 그 자료에서 x 이상의 값을 가지는 것들 중 최솟값의 자료 이후로 오직 x 이상의 값을 가지는 자료들만을 몰아서 놓을 수 있다."
여기서 참고로, 'x 이상의 값을 가지는 것들'은 수학에서 x의 상계라 하고 'x 이상의 값을 가지는 것들 중 최솟값'은 x의 상한이라고 한다. 그리고 x는 n개의 자료의 값 가운데 있을 필요는 없다. x를 임의의 수로 놓는 이유는 퀵정렬 알고리즘들이 피봇이라는 수를 다양한 방식으로 고를 수 있기 때문이다. 증명 방법은 수학적 강귀납법이다.
임의의 수 x와 1개의 자료가 주어지면 그 유일한 자료의 값이 x 미만이거나 이상이다. 미만일 경우는 x 이상의 값을 가지는 것들 자체가 없다는 뜻이므로 주어진 명제는 참이다. 이상일 경우는 x 이상의 값을 가지는 것들이 x뿐이므로 x 이후에 그런 자료들이 놓여 있다.
k개 이하의 자료가 주어져도 주어진 명제가 성립한다고 가정한다.
k+1개의 자료가 주어지면 가장 처음 자료의 값이 x 미만이거나 이상이다.
미만일 경우, 퀵정렬 알고리즘은 왼쪽 끝 첨수(index)를 1 증가시켜 분할할 자료의 수를 k개로 만든다. 이 k개의 자료는 2번 가정으로 x 이상의 값을 가지는 것들 중 최솟값의 자료 이후로 오직 x 이상의 값을 가지는 자료들만 놓일 것이다. 전체 k+1개 자료 역시 마찬가지다.
이상일 경우, 퀵정렬 알고리즘은 자료의 마지막부터 x 미만의 값을 가지는 최초의 자료를 찾아 x 이상인 가장 처음 자료와 자리를 바꾼다. 그래서 분할할 자료는 k-2개 이하로 줄어든다. 2번 가정에 의해 남은 k-2개의 자료는 x 이상인 것과 미만인 것으로 분할되고 전체 k+1개의 자료도 마찬가지다. 만약 마지막부터 x 미만의 값을 가지는 자료가 없다면 이것은 이미 전체 자료가 가장 처음 자료만 x 미만, 그 다음 자료부터는 x 이상으로 분할됐다는 것이다.
자료의 배열이 가지는 원소의 수가 유한하므로 x가 자료 중 하나의 값일 경우, x 이상의 값을 가지는 것들 중 최솟값의 자료는 항상 찾을 수 있다. 퀵 정렬 알고리즘은 분할의 결과로 x 이상의 값을 가지는 것들 중 최솟값의 자료의 배열 상 위치를 함께 표시하여 정렬의 대상에서 제외한다. 그러므로 알고리즘이 무한히 반복되지 않음을 보장한다. 분할한 부분 배열이 정렬되므로 전체 배열이 정렬된다는 것도 수학적 귀납법으로 쉽게 보일 수 있다.
의사 코드와 세부 설명
// 의사 코드임.functionquicksort(q)varlistless,pivotList,greateriflength(q)≤1thenreturnqselectapivotvaluepivotfromqforeachxinqexceptthepivotelementifx<pivotthenaddxtolessifx≥pivotthenaddxtogreateraddpivottopivotListreturnconcatenate(quicksort(less),pivotList,quicksort(greater))
그러나 위 코드는 두 개의 작은 리스트를 저장하기 위해 Ω(n) 크기의 저장공간이 따로 필요하다는 단점이 있다. 실제 구현에서 임시 메모리는 캐시 성능과 속도에 심각한 저하를 가져올 수 있다. 아래와 같이 추가 메모리 없이 배열 내부에서 분할 작업을 구현하면 좀 더 복잡하지만 추가 메모리를 사용하지 않고 구현할 수 있다.
functionpartition(arr,left,right,pivot_index)pivot_value:=arr[pivot_index]swap(arr[pivot_index],arr[right])// 피벗을 끝으로 옮겨 놓는다.stored_index:=leftforiinrange(left,right)// left에서부터 (right-1)까지ifarr[i]≤pivot_valuethenswap(arr[stored_index],arr[i])stored_index:=stored_index+1swap(arr[right],arr[stored_index])// 피벗을 두 리스트 사이에 위치시킨다.returnstored_index
이것은 내부 분할 알고리즘이다. 이 알고리즘은 주어진 배열에서 pivot_index에 위치한 값보다 작은 값들을 리스트의 앞쪽에, 큰 값들을 리스트의 맨 뒤에 몰아넣음으로써 left와 right 위치 사이의 원소들을 두 개로 분할한다. 그리고 그렇게 분할된 두 리스트 사이에 피벗을 위치시키면 피벗의 위치가 정해진다. 또한 피벗 값은 임시로 리스트의 맨 뒤에 저장해놓기 때문에 중간에 피벗의 위치가 바뀌거나 하지 않는다.
Pascal과 C와 같은 명령형 언어에서는 대부분 이와 같은 내부 분할을 이용해 구현한다.
개선된 피벗 선택
퀵 정렬에서 피벗 위치를 결정하는 방법에는 여러 가지 방법이 있다. 기초적인 방법으로는 난수 분할이 사용되는데, 안정성이 떨어진다. 많은 라이브러리에서는 세 값(좌측 끝, 중앙, 우측 끝)의 중위법을 이용하여 분할한다. 이 방법을 사용하면 중앙에서 분할될 가능성이 높아 전체적으로 정렬의 성능이 좋아진다.
복잡도
의 리스트를 정렬하는데 걸리는 시간을 , 는 임의의 상수라 하고, 리스트가 두 개의 거의같은 부분집합으로 나뉜다고 가정하여 얻은 평균 시간 복잡도는 다음과 같다.
voidquickSort(intarr[],intleft,intright){inti=left,j=right;intpivot=arr[(left+right)/2];inttemp;while(i<=j){while(arr[i]<pivot)i++;// arr[i] ≥ pivot 일 때까지, left에서 오른쪽 방향으로 탐색while(arr[j]>pivot)j--;// arr[j] ≤ pivot 일 때까지, right에서 왼쪽 방향으로 탐색if(i<=j)// 큰 값이 작은 값보다 왼쪽에 있으면{// SWAP(arr[i], arr[j])temp=arr[i];arr[i]=arr[j];arr[j]=temp;i++;j--;}}/* 재귀(recursion) */if(left<j)quickSort(arr,left,j);if(i<right)quickSort(arr,i,right);}
publicvoidquickSort(int[]arr,intleft,intright){// base conditionif(left>=right){return;}intpivot=arr[right];intsortedIndex=left;for(inti=left;i<right;i++){if(arr[i]<=pivot){swap(arr,i,sortedIndex);sortedIndex++;}}swap(arr,sortedIndex,right);quickSort(arr,left,sortedIndex-1);quickSort(arr,sortedIndex+1,right);}privatevoidswap(int[]arr,inti,intj){inttmp=arr[i];arr[i]=arr[j];arr[j]=tmp;}
/** * 퀵 정렬 * 시간 복잡도: 최악 - O(n2), 최선 - O(nlogn), 평균 - O(nlogn) * 공간 복잡도: O(1) * @param {Array} arr * @param {int} left * @param {int} right * @code var arr = [ 4, 5, 1, 2, 11, 8, 3, 1, 2, 5 ]; quicksort(arr, 0, arr.length-1); */varquicksort=function(arr,left,right){if(left<right){//기준점을 찾고 기준점을 중심으로 더 작은수, 더 큰수 분류vari=position(arr,left,right);//기준점 기준 좌측 정렬quicksort(arr,left,i-1);//기준점 기준 우측 정렬quicksort(arr,i+1,right);}returnarr;};varposition=function(arr,left,right){vari=left;varj=right;varpivot=arr[left];//제자리 더 큰수/더 작은 수 좌우 배치.while(i<j){while(arr[j]>pivot)j--;while(i<j&&arr[i]<=pivot)i++;tmp=arr[i];arr[i]=arr[j];arr[j]=tmp;}arr[left]=arr[j];arr[j]=pivot;returnj;}