# **퀵 정렬(Quick Sort) 성능 비교 분석 보고서**

## **1. 서론**

본 보고서는 정렬 알고리즘인 **퀵 정렬(Quick Sort)**을 심도 있게 분석하는 것을 목표로 합니다. 퀵 정렬은 '분할 정복(Divide and Conquer)' 패러다임에 기반한 효율적인 알고리즘이지만, 구현 방식과 피벗(Pivot) 선택 전략에 따라 성능이 크게 달라질 수 있습니다.

본 보고서에서는 다음과 같은 내용을 다룹니다.
1.  **다양한 구현 방식**: 대표적인 In-place 방식인 **호어(Hoare)**와 **로무토(Lomuto)** 파티션을 구현하고 성능을 비교합니다.
2.  **성능 최적화 기법**: 실제 환경에서 퀵 정렬의 성능을 극대화하기 위한 **3-Median 피벗 선택**, **3분할(3-Way Partitioning)**, **듀얼 피벗(Dual-Pivot)** 기법을 분석합니다.
3.  **이론적 배경**: 모든 비교 기반 정렬 알고리즘이 가질 수밖에 없는 시간 복잡도의 하한($\Omega(n \log n)$)을 정보 이론적 관점에서 증명하여 퀵 정렬의 평균 성능이 얼마나 최적에 가까운지 확인합니다.

실험은 Google Colab 환경에서 Python으로 진행하며, 각 알고리즘의 동작 원리, 코드 구현, 그리고 성능 측정 결과를 시각화하여 직관적인 이해를 돕고자 합니다.

---

## **2. 비교 기반 정렬의 이론적 하한 분석**

### 2.1. 개요

비교 기반 정렬 알고리즘은 원소들 간의 크기 비교 연산($<, >, =$)만을 통해 정렬을 수행합니다. 이러한 알고리즘이 **최소 몇 번의 비교로 정렬을 완료할 수 있는지**, 즉 **이론적인 성능의 하한**을 정보 이론적 관점에서 분석합니다.

### 2.2. 정보 이론적 접근

- $n$개의 서로 다른 원소를 정렬하는 문제는, 가능한 모든 순서의 경우의 수($n!$) 중에서 유일하게 정렬된 순열 하나를 찾아내는 문제입니다.
- 각 비교 연산(예: $a_i < a_j$)의 결과는 '참' 또는 '거짓' 중 하나이므로, 한 번의 비교는 **1비트의 정보**를 제공합니다.
- 따라서 $k$번의 비교 연산으로 구분할 수 있는 최대 경우의 수는 $2^k$개입니다. 모든 순열($n!$개)을 구분하기 위해서는 다음 조건을 반드시 만족해야 합니다.

$$
2^k \geq n! \quad \Rightarrow \quad k \geq \log_2(n!)
$$

- 이는 곧, 비교 기반 정렬 알고리즘이 최악의 경우에도 정렬을 보장하기 위해 수행해야 할 **최소 비교 횟수의 하한**이 $\log_2(n!)$임을 의미합니다.

### 2.3. 시간 복잡도 분석 ($\log_2(n!)$)

$\log_2(n!)$의 점근적 복잡도를 분석하여 비교 기반 정렬의 시간 복잡도 하한을 계산합니다.

#### 3.1 상한 (Upper Bound)
$n!$은 1부터 $n$까지의 곱이므로, 각 항은 $n$보다 작거나 같습니다.
$$
n! = 1 \cdot 2 \cdot \dots \cdot n \leq n \cdot n \cdot \dots \cdot n = n^n
$$
양변에 로그를 취하면 다음과 같습니다.
$$
\log_2(n!) \leq \log_2(n^n) = n \log_2 n
$$
따라서 $\log_2(n!)$은 $O(n \log n)$ 입니다.

#### 3.2 하한 (Lower Bound)
$n!$에서 앞쪽 절반 항($1, \dots, n/2$)을 모두 $n/2$보다 작은 값으로 무시하고, 뒤쪽 절반 항($n/2+1, \dots, n$)을 $n/2$로 근사하면 다음과 같은 부등식이 성립합니다.
$$
n! > \left(\frac{n}{2}\right) \cdot \left(\frac{n}{2}\right) \cdot \dots \cdot \left(\frac{n}{2}\right) \quad (\text{총 } n/2 \text{개}) = \left(\frac{n}{2}\right)^{n/2}
$$
양변에 로그를 취하면 다음과 같습니다.
$$
\log_2(n!) > \log_2\left(\left(\frac{n}{2}\right)^{n/2}\right) = \frac{n}{2} \log_2\left(\frac{n}{2}\right) = \frac{n}{2}(\log_2 n - \log_2 2) = \frac{n}{2}\log_2 n - \frac{n}{2}
$$
가장 높은 차수의 항은 $n \log n$이므로, $\log_2(n!)$은 $\Omega(n \log n)$ 입니다.

### 2.4. 결론

상한과 하한 분석을 통해 $\log_2(n!)$은 점근적으로 $n \log n$과 동일한 증가율을 가짐을 알 수 있습니다.
$$
\log_2(n!) = \Theta(n \log n)
$$
따라서, **모든 비교 기반 정렬 알고리즘의 최악 시간 복잡도 하한은** 다음과 같습니다.
$$
\boxed{\Omega(n \log n)}
$$
이는 퀵 정렬의 평균 시간 복잡도인 $O(n \log n)$이 이론적으로 도달할 수 있는 가장 효율적인 성능임을 의미합니다.

---

## **3. 퀵 정렬의 기본 원리**

퀵 정렬은 다음의 '분할 정복' 절차를 재귀적으로 반복합니다.

1.  **분할(Divide)**: 배열에서 원소 하나를 **피벗(Pivot)**으로 선택합니다. 피벗을 기준으로 피벗보다 작은 값들은 왼쪽, 큰 값들은 오른쪽으로 분할(Partition)합니다.
2.  **정복(Conquer)**: 분할된 왼쪽 부분 배열과 오른쪽 부분 배열에 대해 재귀적으로 퀵 정렬을 수행합니다.
3.  **결합(Combine)**: 분할 과정에서 이미 위치가 결정되므로 별도의 결합 과정은 필요 없습니다.

### 3.1. 퀵 정렬 재귀 구조 및 시간 복잡도

```python
# 퀵 정렬의 일반적인 재귀 구조
def quick_sort(arr, start, end, partition_func):
    # 재귀 탈출 조건: 부분 배열의 원소가 1개 이하일 경우
    if start >= end:
        return

    # 1. 분할(Partition)
    pivot_index = partition_func(arr, start, end)

    # 2. 정복(Conquer)
    # 왼쪽 부분 배열 정렬
    quick_sort(arr, start, pivot_index - 1, partition_func)
    # 오른쪽 부분 배열 정렬
    quick_sort(arr, pivot_index + 1, partition_func)
```

-   **최선의 경우 (Best Case: $O(n \log n)$)**
    -   피벗이 항상 배열의 중앙값을 선택하여 배열을 정확히 절반($n/2$)으로 나누는 경우입니다.
    -   재귀의 깊이: $\log_2 n$
    -   각 깊이에서 수행되는 비교 연산의 총합: 약 $n$ 번
    -   총 시간 복잡도: **$O(n \log n)$**

-   **최악의 경우 (Worst Case: $O(n^2)$)**
    -   피벗이 항상 가장 작거나 가장 큰 값을 선택하여 배열이 $(0, n-1)$ 또는 $(n-1, 0)$으로 분할되는 경우입니다. (예: 이미 정렬된 배열에서 항상 첫 번째 원소를 피벗으로 선택)
    -   재귀의 깊이: $n$
    -   각 단계의 비교 연산 수: $n, n-1, \dots, 1$
    -   총 비교 횟수: $n + (n-1) + \dots + 1 = \frac{n(n+1)}{2} = O(n^2)$

결론적으로 퀵 정렬의 성능은 **어떻게 피벗을 선택하고 분할(Partition)하느냐**에 따라 결정됩니다.

**$O(n \log n) \leq T(n) \leq O(n^2)$**

---

## **4. 퀵 정렬 구현: 파티션 방식 비교**

### 4.1. In-place 방식

별도의 추가 메모리 없이 배열 내부의 원소 교환(swap)만으로 분할을 수행하는 방식입니다.

#### **A. 호어(Hoare) 파티션**

C. A. R. Hoare가 제안한 최초의 파티션 방식으로, 배열의 양 끝에서 포인터(`left`, `right`)가 서로를 향해 이동하며 값을 교환합니다.

-   **동작 원리**:
    1.  피벗을 정합니다 (보통 첫 번째 원소).
    2.  `left` 포인터는 왼쪽에서 오른쪽으로 이동하며 피벗보다 크거나 같은 값을 찾습니다.
    3.  `right` 포인터는 오른쪽에서 왼쪽으로 이동하며 피벗보다 작거나 같은 값을 찾습니다.
    4.  두 포인터가 교차하기 전까지 `left`와 `right`가 가리키는 원소를 교환합니다.
    5.  포인터가 교차하면 분할이 완료되며, `right` 포인터 위치를 반환합니다. **(주의: 반환된 위치에 피벗이 있다는 보장은 없음)**

```python
# 배열과 swap 함수는 전역적으로 사용한다고 가정
def swap(arr, i, j):
    arr[i], arr[j] = arr[j], arr[i]

def hoare_partition(arr, start, end):
    pivot = arr[start]
    left = start + 1
    right = end

    while True:
        while left <= right and arr[left] <= pivot:
            left += 1
        while left <= right and arr[right] >= pivot:
            right -= 1

        if left > right:
            break
        swap(arr, left, right)

    # 피벗과 right 포인터가 가리키는 값을 교환
    swap(arr, start, right)
    return right
```

#### **B. 로무토(Lomuto) 파티션**

Nico Lomuto가 제안한 방식으로, 호어 방식보다 구현이 직관적입니다.

-   **동작 원리**:
    1.  피벗을 정합니다 (보통 마지막 원소).
    2.  포인터 `i`는 피벗보다 작은 원소들의 경계를 나타냅니다.
    3.  다른 포인터 `j`가 배열을 순회하며 피벗보다 작은 값을 만나면, `i`를 1 증가시키고 `arr[i]`와 `arr[j]`를 교환합니다.
    4.  순회가 끝나면 `i+1` 위치에 피벗을 옮겨 분할을 완료합니다. **(반환된 위치에 피벗이 존재함)**

```python
def lomuto_partition(arr, start, end):
    pivot = arr[end]
    i = start - 1

    for j in range(start, end):
        if arr[j] <= pivot:
            i += 1
            swap(arr, i, j)

    # 피벗을 올바른 위치로 이동
    swap(arr, i + 1, end)
    return i + 1
```

### 4.2. Not-in-place 방식

구현이 매우 간단하지만, 분할 과정에서 새로운 리스트를 생성하므로 추가적인 메모리($O(n)$)를 사용합니다.

-   **동작 원리**:
    1.  피벗을 선택합니다.
    2.  피벗보다 작은 원소, 같은 원소, 큰 원소를 각각 다른 리스트에 담습니다.
    3.  각 리스트에 대해 재귀적으로 정렬한 후, 세 리스트를 합칩니다.

```python
def not_in_place_quicksort(arr):
    if len(arr) <= 1:
        return arr

    pivot = arr[len(arr) // 2]
    less = [x for x in arr if x < pivot]
    equal = [x for x in arr if x == pivot]
    greater = [x for x in arr if x > pivot]

    return not_in_place_quicksort(less) + equal + not_in_place_quicksort(greater)
```
이 방식은 코드가 간결하고 이해하기 쉽지만, 공간 복잡도가 $O(n)$에 달해 대용량 데이터 처리에는 부적합합니다.

---

## **5. Hoare vs. Lomuto 성능 실험**

일반적으로 호어 파티션이 로무토 파티션보다 교환(swap) 횟수가 적어 더 효율적인 것으로 알려져 있습니다. 이를 실제 실험을 통해 확인해 보겠습니다.

### 5.1. 실험 설계

-   **환경**: Google Colab (Python)
-   **데이터**: `random` 모듈을 이용해 생성한 무작위 정수 배열
-   **측정 변수**: 배열 크기를 `1000`부터 `16000`까지 2배씩 늘려가며 각 파티션 방식의 실행 시간 측정
-   **신뢰도 확보**: 각 배열 크기마다 10회 반복 실행하여 평균 시간을 계산하고, 어느 알고리즘이 더 많이 이겼는지("Win Count") 기록합니다.

### 5.2. 실험 코드

```python
import time
import random
import sys
import matplotlib.pyplot as plt

# 재귀 깊이 제한 해제
sys.setrecursionlimit(100000)

# swap, hoare_partition, lomuto_partition 함수 (위에 정의된 코드 사용)

# 퀵소트 실행 함수
def quick_sort(arr, start, end, partition_func):
    if start >= end:
        return
    # 파티션 함수를 호출하여 피벗 위치 찾기
    if partition_func == hoare_partition:
        pivot_index = partition_func(arr, start, end)
        quick_sort(arr, start, pivot_index - 1, partition_func)
        quick_sort(arr, pivot_index + 1, end, partition_func)
    else: # Lomuto
        pivot_index = partition_func(arr, start, end)
        quick_sort(arr, start, pivot_index - 1, partition_func)
        quick_sort(arr, pivot_index + 1, end, partition_func)


# 실험 파라미터
sizes = [1000, 2000, 4000, 8000, 16000]
num_runs = 10
results = { "hoare": [], "lomuto": [] }
win_counts = { "hoare": 0, "lomuto": 0 }

for size in sizes:
    hoare_times = []
    lomuto_times = []
    
    # 각 사이즈별 10회 실행
    for _ in range(num_runs):
        # 동일한 랜덤 데이터로 테스트하기 위해 복사해서 사용
        original_array = [random.randint(0, size) for _ in range(size)]
        
        # Hoare
        arr_hoare = original_array[:]
        start_time = time.perf_counter()
        quick_sort(arr_hoare, 0, len(arr_hoare) - 1, hoare_partition)
        end_time = time.perf_counter()
        hoare_times.append(end_time - start_time)
        
        # Lomuto
        arr_lomuto = original_array[:]
        start_time = time.perf_counter()
        quick_sort(arr_lomuto, 0, len(arr_lomuto) - 1, lomuto_partition)
        end_time = time.perf_counter()
        lomuto_times.append(end_time - start_time)

    avg_hoare_time = sum(hoare_times) / num_runs
    avg_lomuto_time = sum(lomuto_times) / num_runs
    
    results["hoare"].append(avg_hoare_time)
    results["lomuto"].append(avg_lomuto_time)
    
    # 승리 횟수 카운트
    if avg_hoare_time < avg_lomuto_time:
        win_counts["hoare"] += 1
    else:
        win_counts["lomuto"] += 1
        
    print(f"Size: {size}")
    print(f"  Hoare Avg Time: {avg_hoare_time:.6f}s")
    print(f"  Lomuto Avg Time: {avg_lomuto_time:.6f}s")
    print("-" * 20)

print("Final Win Counts:", win_counts)

# 시각화
plt.style.use('seaborn-v0_8-whitegrid')
plt.figure(figsize=(10, 6))
plt.plot(sizes, results["hoare"], 'o-', label="Hoare Partition")
plt.plot(sizes, results["lomuto"], 's-', label="Lomuto Partition")
plt.xlabel("Array Size")
plt.ylabel("Execution Time (seconds)")
plt.title("Hoare vs. Lomuto Partition Performance")
plt.legend()
plt.xscale('log')
plt.yscale('log')
plt.xticks(sizes, labels=sizes)
plt.show()
```

### 5.3. 실험 결과 및 분석

![partition](../image/partition.png) 

**실행 시간 출력**
![avg](../image/avg.png) 


-   **결과 분석**: 실험 결과, 모든 배열 크기에서 **호어 파티션이 로무토 파티션보다 평균적으로 더 빠른 성능**을 보였습니다. 이는 호어 방식이 로무토 방식에 비해 평균적으로 원소 교환(swap) 연산을 더 적게 수행하기 때문입니다. 특히 로무토는 피벗과 동일한 값들을 처리할 때 비효율이 발생할 수 있지만, 호어는 양방향에서 접근하며 이러한 문제를 완화합니다.
-   **결론**: 안정성과 예측 가능성(피벗의 최종 위치 확정) 측면에서는 로무토가 더 직관적일 수 있으나, 순수 성능 측면에서는 **호어 파티션이 더 우수하다**고 결론 내릴 수 있습니다.

---

## **6. 퀵 정렬 성능 향상 기법**

최악의 경우($O(n^2)$)를 방지하고 평균 성능을 더욱 향상시키기 위한 기법들을 알아봅니다.

### 6.1. 3-Median 피벗 선택 (Median-of-Three Pivot Selection)

-   **문제점**: 이미 정렬된 배열이나 역순으로 정렬된 배열에서 항상 첫 번째/마지막 원소를 피벗으로 선택하면 최악의 성능($O(n^2)$)이 발생합니다.
-   **해결책**: 배열의 **첫 번째, 중간, 마지막** 세 원소 중에서 **중앙값(median)**을 찾아 피벗으로 사용합니다.
-   **기대 효과**: 극단적인 값(최소, 최대)이 피벗으로 선택될 확률을 크게 낮춰, 분할이 한쪽으로 치우치는 것을 방지합니다. 이를 통해 $O(n^2)$의 시간 복잡도를 피하고 $O(n \log n)$에 가까운 성능을 안정적으로 유지할 수 있습니다.

```python
def median_of_three(arr, start, end):
    mid = (start + end) // 2
    # 세 값을 정렬하여 중앙값을 start 위치에, 가장 작은 값을 mid에, 가장 큰 값을 end에 둠
    if arr[start] > arr[mid]: swap(arr, start, mid)
    if arr[start] > arr[end]: swap(arr, start, end)
    if arr[mid] > arr[end]: swap(arr, mid, end)
    
    # 중앙값인 arr[mid]를 피벗으로 사용하기 위해 맨 앞(start) 바로 다음 위치로 옮김
    swap(arr, mid, start + 1)
    return arr[start + 1] # 피벗 값 반환

# 퀵소트에서 사용 예시
def quick_sort_with_median3(arr, start, end):
    if start >= end:
        return
    
    # Median-of-Three로 피벗 선택
    pivot = median_of_three(arr, start, end)
    
    # 이후 파티션 로직 수행...
    # (일반적으로 Hoare 파티션과 함께 사용)
```

### 6.2. 3분할 퀵 정렬 (3-Way Quick Sort)

-   **문제점**: 배열에 **중복된 값이 많은 경우**, 표준 퀵 정렬은 피벗과 동일한 값들을 한쪽 파티션으로 몰아넣어 비효율적인 분할을 초래합니다.
-   **해결책**: 네덜란드 국기 문제(Dutch National Flag Problem) 해결법으로 유명한 **Dijkstra의 3분할 방식**을 사용합니다. 배열을 세 부분으로 분할합니다.
    1.  피벗보다 **작은** 부분 (`lt`)
    2.  피벗과 **같은** 부분 (`i`)
    3.  피벗보다 **큰** 부분 (`gt`)
-   **기대 효과**: 피벗과 동일한 값들은 정렬 과정에서 제외하고, '작은' 부분과 '큰' 부분에 대해서만 재귀 호출을 수행합니다. 중복된 값이 많을수록 재귀 호출의 대상이 되는 배열 크기가 급격히 줄어들어 성능이 크게 향상됩니다.

```python
# Dijkstra's 3-Way Partitioning
def three_way_quicksort(arr, start, end):
    if start >= end:
        return
    
    lt, i, gt = start, start + 1, end
    pivot = arr[start]
    
    while i <= gt:
        if arr[i] < pivot:
            swap(arr, lt, i)
            lt += 1
            i += 1
        elif arr[i] > pivot:
            swap(arr, i, gt)
            gt -= 1
        else: # arr[i] == pivot
            i += 1
            
    # 재귀 호출
    three_way_quicksort(arr, start, lt - 1)
    three_way_quicksort(arr, gt + 1, end)

# 예시 실행
data_with_duplicates = [4, 2, 5, 2, 6, 2, 7, 4, 4, 8, 2, 4]
three_way_quicksort(data_with_duplicates, 0, len(data_with_duplicates) - 1)
print("3-Way Quicksort Result:", data_with_duplicates)
# 결과: [2, 2, 2, 2, 4, 4, 4, 4, 5, 6, 7, 8]
```

### 6.3. 듀얼 피벗 퀵 정렬 (Dual-Pivot Quick Sort)

-   **개념**: 피벗을 1개가 아닌 **2개** 사용하여 배열을 **3개의 구역**으로 분할하는 방식입니다.
    -   `[피벗1보다 작은 구역]`, `[피벗1과 피벗2 사이 구역]`, `[피벗2보다 큰 구역]`
-   **동작**: 2개의 피벗(p1, p2)을 선택하고 (보통 p1 < p2), 배열을 순회하며 원소들을 세 구역으로 재배치합니다. 이후 3개의 부분 배열에 대해 재귀적으로 정렬을 수행합니다.
-   **시간 복잡도 분석**:
    -   이상적으로 배열이 1/3씩 분할된다고 가정하면, 재귀식은 $T(n) = 3T(n/3) + O(n)$이 됩니다.
    -   마스터 정리(Master Theorem)에 따르면, 이 경우 시간 복잡도는 $O(n \log_3 n)$이 됩니다.
    -   표준 퀵 정렬의 $O(n \log_2 n)$과 비교할 때, 로그의 밑이 2에서 3으로 바뀌었습니다.
        $$ \log_3 n = \frac{\log_2 n}{\log_2 3} \approx \frac{\log_2 n}{1.585} $$
    -   이는 재귀 깊이를 줄여주므로, 이론적으로 더 적은 비교 횟수를 가집니다. 파티션 과정이 더 복잡해져 상수(constant factor)가 커지지만, Vladimir Yaroslavskiy의 연구에 따르면 현대 CPU 아키텍처에서는 이 방식이 더 효율적임이 입증되었습니다.
    -   이러한 성능 우위 덕분에 **Java 7 이후의 `Arrays.sort()`** (기본 타입 배열)와 **Python의 Timsort** 일부에서 내부적으로 듀얼 피벗 퀵 정렬을 채택하고 있습니다.

---

## **7. 최종 결론**

본 보고서를 통해 퀵 정렬의 다양한 측면을 분석하고 다음과 같은 결론을 도출했습니다.

1.  **퀵 정렬은 이론적으로 최적의 평균 성능($O(n \log n)$)을 가진다**: 비교 기반 정렬의 이론적 하한인 $\Omega(n \log n)$과 동일한 평균 복잡도를 가지므로 매우 효율적인 알고리즘입니다.

2.  **파티션 방식에 따라 성능 차이가 존재한다**: In-place 방식 중에서는 **호어(Hoare) 파티션**이 로무토(Lomuto) 파티션보다 평균적인 교환 횟수가 적어 더 빠른 성능을 보입니다.

3.  **최악의 경우를 피하기 위한 최적화는 필수적이다**: 정렬된 데이터에 대한 $O(n^2)$ 성능 저하를 막기 위해 **3-Median 피벗 선택**과 같은 기법을 적용하는 것이 중요합니다.

4.  **데이터의 특성에 따라 최적의 전략이 다르다**: **중복된 값이 많은 데이터**의 경우, **3분할(3-Way) 퀵 정렬**이 압도적인 성능 향상을 보입니다.

5.  **현대적 구현은 더욱 발전된 형태를 띤다**: **듀얼 피벗 퀵 정렬**은 재귀 깊이를 줄여 이론적, 실제적으로 더 나은 성능을 보여주며, 여러 표준 라이브러리의 기본 정렬 알고리즘으로 채택되었습니다.