## 대표적인 정렬5 : 퀵 정렬 (Quick Sort) 

### 1. 퀵 정렬 (quick sort) 과정

* <font color='#BF360C'>정렬 알고리즘의 꽃</font>
* 분할 정복 알고리즘 사용
<br><br>

* **기준점(pivot)** 정하기
* 기준점보다 작은 데이터는 왼쪽(left), 큰 데이터는 오른쪽(right)으로 **분리**
* 각 왼쪽(left), 오른쪽(right)은 **재귀용법**을 사용해서 다시 동일 함수를 호출하여 위 작업을 반복

### 2. 알고리즘 구현 (방법 1. 정통적 방법 - swap 사용하기)

* pivot 정하기  

* low를 오른쪽으로 이동하며, pivot 보다 큰 값 찾기
* high를 왼쪽으로 이동하며, pivot 보다 작은 값 찾기 
* low와 high 가 교차되지 않은 상태라면, 각각의 인덱스에 해당하는 값 **swap** (분리 단계) 

* low와 high 가 교차되면, pivot과 high 가리키는 값 swap -> **parition_point** 설정됨  
* parition_point를 기준으로 왼쪽 부분, 오른쪽 부분 나누어 재귀적으로 위 과정 반복  

In [3]:
# 두 부분으로 나누기 위한 pivot 값 찾기 함수 
def partition(list, start, end):
    
    # pivot 위치는 가장 왼쪽으로 설정 
    pivot = list[start]
    low = start + 1
    high = end
    
    # low와 high 가 교차되지 않을 때까지 반복 
    while low <= high:
        
        # pivot 보다 큰 값 찾을 때까지 low 이동
        while low <= end and pivot >= list[low]:
            low += 1
        # pivot 보다 작은 값 찾을 때까지 high 이동   
        while high >= (start+1) and pivot <= list[high]:
            high -= 1
            
        # 교차되지 않은 상태라면, low와 high 가 가리키는 것 swap 
        if low <= high:
            list[low], list[high] = list[high], list[low]    
    
    # 위 과정 후, low와 high는 교차된 상태 
    # start(pivot 가리키고 있음)와 high가 가리키는 대상 swap 
    list[start], list[high] = list[high], list[start]
    
    # 두 부분으로 나눌 기준 설정 
    partition_point = high
    
    return partition_point


def quick_sort(list, start, end):
    
    # sublist가 1개일 때까지 실행 
    # len(list) 대신 start, end 로 sublist 표현 
    if start <= end:
        
        pivot = partition(list, start, end)
        
        quick_sort(list, start, pivot-1)
        quick_sort(list, pivot+1, end)
        
    return list

In [4]:
import random
data_list = random.sample(range(100), 10)

print(data_list)
print(sorted(data_list))
print(quick_sort(data_list, 0, len(data_list)-1))

[9, 99, 60, 16, 64, 80, 14, 42, 61, 15]
[9, 14, 15, 16, 42, 60, 61, 64, 80, 99]
[9, 14, 15, 16, 42, 60, 61, 64, 80, 99]


### 2. 알고리즘 구현 (방법2. python  style)

- 기준점(pivot) 정하기
- **left, right 리스트 변수 만들기**
- 데이터를 기준점과 비교하며 분리
- 왼쪽(left) + 기준점(pivot) + 오른쪽(right) 을 리턴함

In [5]:
def qsort(data):
    if len(data) <= 1:
        return data
    
    # pivot 설정 
    pivot = data[0]
    
    # pivot을 중심으로 두 부분 나누기 
    left, right = list(), list()
    
    for i in range(1, len(data)):
        if pivot > data[i]:
            left.append(data[i])
        else:
            right.append(data[i])
    
    # 리스트로 만들어서 리턴
    return qsort(left) + [pivot] + qsort(right)

In [7]:
import random
data_list = random.sample(range(100), 10)

print(data_list)
print(sorted(data_list))
print(qsort(data_list))

[79, 13, 82, 42, 0, 14, 46, 99, 83, 58]
[0, 13, 14, 42, 46, 58, 79, 82, 83, 99]
[0, 13, 14, 42, 46, 58, 79, 82, 83, 99]


<div class="alert alert-block alert-warning">
<strong><font color="blue" size="4em">프로그래밍 연습</font></strong><br>
위 코드를 파이썬 list comprehension을 사용해서 더 깔끔하게 작성해보기<br>
</div>

In [8]:
def qsort2(data):
    if len(data) <= 1:
        return data
    
    pivot = data[0]

    left = [ item for item in data[1:] if pivot > item ]
    right = [ item for item in data[1:] if pivot <= item ]
    
    return qsort(left) + [pivot] + qsort(right)

In [9]:
import random
data_list = random.sample(range(100), 10)

print(data_list)
print(sorted(data_list))
print(qsort2(data_list))

[74, 12, 90, 96, 54, 44, 27, 25, 2, 32]
[2, 12, 25, 27, 32, 44, 54, 74, 90, 96]
[2, 12, 25, 27, 32, 44, 54, 74, 90, 96]


### 3. 알고리즘 분석

* 시간 복잡도 : O(n log n)
    * worst: O($n^2$)
        - pivot 에 따라 시간 복잡도 편차가 큼 
        - pivot이 가장 크거나, 가장 작으면 모든 데이터를 비교하는 상황이 나옴
        - 이미 정렬된 데이터에 대해서 성능이 좋지 못함 

* 특징 
    - 병합 정렬 : 다 쪼개 놓고 합칠 때 정렬 
    - 퀵 정렬: 쪼깰 때 정렬함
    <br><br>
    
    - 방법 1: swap 사용으로 Unstable
    - 방법 2: 추가적인 메모리를 사용하지만, Stable