# 1. Định nghĩa sắp xếp
Để tìm kiếm dữ liệu nhanh ta phải sắp xếp thứ tự dữ liệu theo thứ tự tăng dần hoặc giảm dần.

Tầm quan trọng của việc sắp xếp nằm ở chỗ, việc tìm kiếm dữ liệu có thể được tối ưu hóa ở mức rất cao, nếu dữ liệu được lưu trữ theo cách được sắp xếp. Sắp xếp cũng được sử dụng để thể hiện dữ liệu ở các định dạng dễ đọc hơn.

Theo cách thức sắp thứ tự các thuật toán sắp thứ tự mảng được phân chia thành các nhóm:

+ Xen vào: Insertion Sort, Shell Sort...
+ Chọn lựa: Selection Sort, Heap Sort...
+ Đổi chổ: Bubble Sort, Quick Sort...
+ Chia để trị: Merge Sort, Quick Sort, Shell Sort...
+ Không so sánh: Radix Sort, Bucket Sort...

# 2. Các thuật toán sắp xếp

## Insertion Sort

Xét dãy a0, a1, a2, ..., ai-1 có thứ tự tăng dần, ta tìm vị trí thích hợp trong dãy này để ai vào dãy so cho thành dãy a0, a1, a2, ..., ai có thứ tự tăng dần.

### Mã giả:
+ Cho x=ai
+ Với j=i-1 phía bên trái ai: nếu khóa của aj > khóa của ai thì di chuyển aj qua phải gán aj cho aj+1 ngược lại gán ai bằng aj+1

<img align="left" width="500" height="500" src="images/Insertion_sort.png">

In [1]:
def insertion_sort(array):
    for i in range(1, len(array)):
        j = i-1
        element_i = array[i]
   # So sánh element thứ i với array[i-1]
        while (array[j] > element_i) and (j >= 0): # j>=0 là điều kiện tiếp tục ngược lại j<0 chính là dk thoát lặp while
            array[j+1] = array[j] #Đổi chổ
            j=j-1
        array[j+1] = element_i
list_A = [19,2,31,45,30,11,121,27]
insertion_sort(list_A)
print(list_A)

[2, 11, 19, 27, 30, 31, 45, 121]


### Nhận xét:
+ Giải thuật InsertSort là ổn định

+ Độ phức tạp: O(n^2)

## Shell Sort
Xét dãy ai, ai+k, ai+2k, ... có khoảng gap là k.

Thuật toán shell sort là trường hợp tổng quát của insertion và insertion_sort có gap là 1.

<img align="left" width="500" height="500" src="images/Shell_Sort.jpg">

In [2]:
def ShellSort(array):
    gap = len(array) // 2
    while gap > 0:
        for i in range(gap, len(array)):
            temp = array[i]
            j = i
            while j >= gap and array[j - gap] > temp: # Tìm gap tối ưu mà có thể sắp xếp
                array[j] = array[j - gap]
                j = j-gap
                array[j] = temp
        gap = gap//2
list_A = [19,2,31,45,30,11,121,27]
ShellSort(list_A)
print(list_A)

[2, 11, 19, 27, 30, 31, 45, 121]


## Nhận xét:
+ Giải thuật Shell Sort không ổn định
+ Độ phức tạp: $O(n*log_2{n})$

## Selection Sort
Xét dãy ai, ai+1,..., an-1 ta tìm amin nhỏ nhất hoán đổi với ai.

<img align="left" width="500" height="500" src="images/Selection_Sort.jpg">

In [3]:
def Selection_sort(array):
    for i in range(len(array)):
        min_id = i
        for j in range(i+1, len(array)):
            if array[min_id] > array[j]:
                min_id = j

            array[i], array[min_id] = array[min_id], array[i]
l = [19,2,31,45,30,11,121,27]
Selection_sort(l)
print(l)

[2, 11, 19, 27, 30, 31, 45, 121]


### Nhận xét:
+ Thuật toán Selection Sort là ổn định
+ Độ phúc tạp: O(n^2)

## Bubble Sort
Ta duyệt ngược dãy ai, ai+1,... ,an-1 từ dưới lên trên 

Nếu khóa aj nhỏ hơn khóa aj-1 thì ta hoán đổi aj với aj-1

<img align="left" width="500" height="500" src="images/Bubble_Sort.png">

In [4]:
def BubbleSort(array):
    # Duyệt ngược từ a[n-1] đến a[i]
    for iter_i in range(len(array)-1,0,-1):
        for i in range(iter_i):
            if array[i]>array[i+1]:
                # Swap a[i] với a[i+1]
                temp = array[i]
                array[i] = array[i+1]
                array[i+1] = temp
list_A = [19,2,31,45,6,11,121,27]
BubbleSort(list_A)
print(list_A)

[2, 6, 11, 19, 27, 31, 45, 121]


### Nhận xét:
+ Giải thuật Bubble Sort là ổn định
+ Độ phức tạp: O(n^2)

## Quick Sort

Thuật toán được lấy ý tưởng từ bài tìm kiếm nhị phân cần thực hiện nhanh nhất để chia dãy đã cho thành 2 phần được ngăn cách bởi phần tử pivot.

Phân đoạn dãy a_start và a_end thành hai dãy con:
+ Bước 1: Chọn điểm pivot là khóa của một phần tử thuộc dãy để phân đoạn, thường ta sẽ chọn phần tử ở giữa của dãy
+ Bước 2: Cho i di chuyển từ trái qua đến gặp khóa của a_i >= pivot. Cho j di chuyển từ phải qua đến khi gặp khóa của a_j <= pivot
+ Bước 3: Nếu i<j, i chưa gặp j thì hoán đổi a_i và a_j, cho i qua phải và j qua trái. Nếu i >=j, i gặp j thì kết thúc giải thuật, ngược lại tới bước 2

Kết thúc phân đoạn ta được hai dãy con:
+ Dãy con 1 a_start đến a_j chứa các phần tử có khóa nhỏ hơn hoặc bằng pivot
+ Dãy con a_j+1 đến a_end chưa các phần tử có khóa lơn hơn hoặc bằng pivot
<img align="left" width="500" height="500" src="images/Quick_Sort.png">

In [5]:
def Partition(array,id_start,id_end):
    pivot=array[id_end]
    i=id_start-1
    for j in range(id_start,id_end):
        if array[j]<pivot:
            i=i+1
            array[i],array[j]=array[j],array[i]
    if array[i+1]>array[id_end]:
        array[i+1],array[id_end]=array[id_end],array[i+1]
    return i+1
def QuickSort(array,id_start,id_end):
    if id_start<id_end:
        Parti=Partition(array,id_start,id_end)
        QuickSort(array,id_start,Parti-1)
        QuickSort(array,Parti+1,id_end)
array=[2,5,1,-1,100,99,15,9]
QuickSort(array,0,len(array)-1)
print(array)

[-1, 1, 2, 5, 9, 15, 99, 100]


### Nhận xét:
+ Giải thuật Quick Sort là không ổn định
+ Độ phức tạp: $O(n*log_2{n})$

# Merge Sort
Đường chạy (run) là một dãy có thứ tự tăng dần. Chiều dài đường chạy là số phần tử của đường chạy này. Merge Sort lặp lại nhiều lần việc trộn hai đường chạy có chiều dài nhỏ hơn thành một đường chạy có chiều dài lớn hơn.
<img align="left" width="500" height="500" src="images/Merge_Sort.png">

In [6]:
def merge_sort(array):
    if len(array) <= 1:
        return array
    
    middle = len(array) // 2
    left_list = array[:middle]
    right_list = array[middle:]

    left_list = merge_sort(left_list)
    right_list = merge_sort(right_list)
    return merge(left_list, right_list)

def merge(left_half, right_half):
    results = []
    while len(left_half) != 0 and len(right_half) != 0:
        if left_half[0] < right_half[0]:
            results.append(left_half[0])
            left_half.remove(left_half[0])
        else:
            results.append(right_half[0])
            right_half.remove(right_half[0])
    if len(left_half) == 0:
        results = results + right_half
    else:
        results = results + left_half
    return results

array =[64, 34, 25, 12, 22, 11, 90]
print(merge_sort(array))

[11, 12, 22, 25, 34, 64, 90]


### Nhận xét:
+ Thuật toán Merge Sort là ổn định
+ Độ phức tạp: $O(n*log_2{n})$

## Radix Sort
Là thuật toán sắp xếp thứ tự không cần so sánh, để sắp xếp thứ tự các khóa nguyên bằng cách gom nhóm các khóa theo các ký số riêng biệt mà chúng có cùng trọng số.

Vì số nguyên có thể biểu diễn chuỗi ký tự, do đó Radix Sort không chỉ được dùng để sắp xếp thứ tự các số nguyên.
<img align="left" width="500" height="500" src="images/Radix_Sort.jpg">

In [8]:
def countingSort(array, place):
    size = len(array)
    output = [0] * size
    count = [0] * 10

    # Đếm số lượng thành phần
    for i in range(0, size):
        index = array[i] // place
        count[index % 10] += 1

    #Tính số tích lũy
    for i in range(1, 10):
        count[i] += count[i - 1]

    # Đặt các thành phần thứ tự đã sắp xếp
    i = size - 1
    while i >= 0:
        index = array[i] // place
        output[count[index % 10] - 1] = array[i]
        count[index % 10] -= 1
        i -= 1

    for i in range(0, size):
        array[i] = output[i]



def radixSort(array):
    # Lấy max của mảng
    max_element = max(array)

    # Tính toán đếm các thành phần của sort dựa trên vị trí
    place = 1
    while max_element // place > 0:
        countingSort(array, place)
        place *= 10

data = [121, 432, 564, 23, 1, 45, 788]
radixSort(data)
print(data)

[1, 23, 45, 121, 432, 564, 788]


### Nhận xét:
+ Thuật toán Radix Sort là không ổn định
+ Độ phức tạp: $O(n*log_b{n})$ với b là cơ số

# 3. So sánh các thuật toán sắp xếp

<img align="left" width="500" height="500" src="images/Compare_Sort.jpg">

Nhìn vào bảng trên ta thấy thuật toán Quick Sort có độ phức tạp trung bình là O(n log(n))liệu có phải là nhanh nhất.

Để trả lời cho câu hỏi này chúng ta sẽ xem tốc độ sắp xếp của các thuật toán dựa theo dữ liệu đầu vào của từng trường hợp.

<img align="left" width="600" height="600" src="https://miro.medium.com/max/1400/1*bPpvELo9_QqQsDz7CSbwXQ.gif">

Ta sẽ thấy tùy từng trường hợp khác nhau thì sẽ có 1 thuật toán sắp xếp có lợi hơn. Ví dụ với dữ liệu Nearly Sorted thì Insertion Sort là nhanh nhất nhưng khi với những kiểu dữ liệu phức tạp hơn thì Insertion Sort lại không phải là nhanh nhất.