# Ch 3. 정렬 (Sort)

교제의 수도코드(pseudo-code)에서 사용하는 배열은 A[1,...,n]으로, 배열/리스트의 index가 1부터 시작된다.
그러나 컴퓨터 프로그래밍 언어에서 제공하는 배열/리스트와 같은 자료구조는 일반적으로 idex가 0부터 시작된다.
그러므로 교제의 수도코드를 구현할 때 이를 주의해서 구현해야 한다.

### 기본 알고리즘
* selectionSort (선택정렬)
* bubbleSort    (버블정렬)
* insertionSort (삽입정렬)

## 1. selectionSort (선택정렬)

배열 $A[0, ... , n-1]$의 값을 정렬하기 위하여 선택정렬은 다음과 같은 정렬 원리를 사용한다.

$$\text{ "$A[0, ... ,n-1]$의 값들을 비교하여 가장 큰 값이 $A[n-1]$에 위치하게 적절히 조정한다."}$$

선택정렬은 배열 $A[0....,n-1]$에 저장된 값들을 크기 순으로 정렬하기 위하여 배열 A의 값들을 비교한 후, 가장 큰 값을가진 요소 $A[k]$를 찾아 마지막 요소인 $A[n-1]$와 상호 교환한다. 이렇게 $A[n-1]$에 저장된 값은 처음 배열 A에 저장된 값들 중에서 $n$번째로 큰 값으로 적절한 정렬 위치를 찾은 것이다. 

이제 처음 배열 A에 저장된 값들 중에서 적절한 정렬 위치를 찾지 못한 요소의 수는 $n-2$개로, 이 값들은 $A[0,...,n-2]$에 저장되어 있다.
즉, 크기 $n$인 배열의 정렬 문제를 크기 $n-1$인 배열의 정렬 문제로 축소할 수 있다.

이와 같은 정렬의 대상이 되는 배열의 크기를 점차 축소시켜 배열의 크기가 $1$이 되면, 정렬 문제를 모두 해결한 것으로 간주한다.

선택 정렬에서 이와 같이 $k$개로 구성된 배열 $A[0,...,k-1]$의 요소 중에서 가장 큰 값을 찾아 배열 A의 마지막 요소 $A[k-1]$와 교환하는 작업을 수행하는 함수를 theLargest 라 하자. 정렬의 대상이 되는 배열의 크기를 점진적으로 축소시키면서 the Largest를 반복해서 호출한다.

예를 들어 크기 $5$인 배열 $A=[3,2,6,5,1]$를 가정하자.
배열 A의 처음 요소 값부터 마지막 요소 값까지 비교하여 최대 값이 저장된 index를 찾는다.
배열 A에서 가장 큰 값($6$)을 저장하고 있는 요소는 $A[2]$이다.
이제 이 값을 배열의 마지막 요소의 값($1$)과 교환하면 배열 $A=[3,2,1,5,6]$이 된다. 
이와 같은 작업을 수행하면 배열 A에서 가장 큰은 배열이 큰에 위치하게 되며, 이 위치는 $6$이 정렬된 배열 A에 저장될 최종 위치가 된다. 이제 $6$을 제외한 나머지 요소 값들의 정렬 위치를 찾는 작업을 수행한다.

그림 1은 배열 A의 가장 큰 원소를 찾는 절차를 나타낸다.
![ch03_fig.1_theLargest.png](attachment:ch03_fig.1_theLargest.png)
[그림 1] the Largest 수행 절차


* step 1 : 초기화. A[0]를 A[0,...,last]에서 가장 큰 값이라 가정하고, largest에 A[0]의 index 0을 저장한다.
* step 2,3,5,6 : 요소의 값 비교. A[1,...,last]까지 A[largest]와 각각 값을 비교한다.
* step 4: 최대값 갱신. step 2,3,5,6을 수행하면서 A[largest]보다 큰 값을 가지는 배열의 요소가 발견되면, 해당 배열 요소의 index를 largest에 저장한다.
* step 7: A[largest]와 A[last] 값을 교환한다.


In [2]:
# -*- coding: utf-8 -*-
def theLargest(A, last):
    largest = 0;
    for i in range(1, last):
        if(A[i] >= A[largest]): #if(A[i] > A[largest]): 오류. why???
            largest = i;
    return largest

A=[3,2,6,6,5,1]
print(A)
largest = theLargest(A,A.__len__())
A[largest], A[A.__len__()-1] = A[A.__len__()-1], A[largest]
print(A)

[3, 2, 6, 6, 5, 1]
[3, 2, 6, 1, 5, 6]


배열 $𝐴=[3,2,1,5,6]$에 대하여 정렬의 대상이 되는 배열의 크기를 점진적으로 축소시키면서 theLargest를 호출하며, 그 절차는 다음과 같이 수행된다.

(1) input: $A=[3, 2, 1, 5, 6]$

(2) theLargest call $A=[3, 2, 1, 5, 6]$ --> $A=[3, 2, 1, 5]$ $[6]$

(3) theLargest call $A=[3, 2, 1, 5]$    --> $A=[3, 2, 1]$ $[5, 6]$

(4) theLargest call $A=[3, 2, 1]$       --> $A=[1, 2]$ $[3, 5, 6]$

(5) theLargest call $A=[1, 2]$          --> $A=[1]$ $[2, 3, 5, 6]$

(6) output: $[1, 2, 3, 5, 6]$

그림 2는 theLargest를 반복 호출하여 배열 A가 정렬되는 순서를 설명한다.

![ch03_fig.2_theLargest%20sequence.png](attachment:ch03_fig.2_theLargest%20sequence.png)
[그림 2] 선택 정렬의 예

theLargest는 크기가 $k$개인 배열에서 가장 큰 수를 찾기 위해서는 $k-1$번의 비교를 수행한다.

선택 정렬은 theLargest의 크기를 오른쪽 끝부터 1씩 줄이면서 배열의 크기가 1이 될때까지 theLargest를 호출한다.
즉, $n$개의 요소로 구성된 배열에 대하여 선택정렬을 수행하기 위해서는 $n-1$개의 부분 배열 $A[0,...,n-1]$, $A[0,...,n-2]$, $A[0,...,n-3]$, $...$, $A[0,1,2]$, $A[0,1]$을 입력 파라메터로 하여 theLargest를 각각 호출하고, 이 때 수행되는 대소비교의 총 회수는
$$ (n-1)+(n-2)+...+2+1= \frac{n(n-1)}{2}$$
가 된다.

그러므로 선택정렬의 수행시간은 $\theta(n^2)$이다.


In [1]:
# -*- coding: utf-8 -*-
#선택정렬
def theLargest(A, last):
    largest = 0;
    for i in range(1, last):
        if(A[i] >= A[largest]): #if(A[i] > A[largest]): 오류. why???
            largest = i;
    return largest 

def selectionSort(A, n):      
    for last in range(n-1, 0,-1):
        largest= theLargest(A, last)               
        A[largest], A[last] = A[last], A[largest]  
        
A=[3,2,4,9,2,7,4,4,8]
#A=[0x123,0x2154,0x222,0x4,0x283,0x1560,0x1061,0x2150,0x37]
#A=[3,4,2,39,29,33,31, 22, 11, 16]
#B=[]
n=A.__len__()    
firstIndex=0
lastIndex=n-1
print(A)
selectionSort(A, lastIndex)
print(A)

[3, 2, 4, 9, 2, 7, 4, 4, 8]
[2, 2, 3, 4, 4, 4, 7, 9, 8]


## 2. bubbleSort    (버블정렬)

배열 $A[0, ... , n-1]$의 값을 정렬하기 위하여 버블정렬은 다음과 같은 정렬 원리를 사용한다.

 $$\text{ $A[i]$와 $A[i+1]$의 값을 비교하여 더 큰 값이 $A[i+1]$에 위치하게 적절히 조정한다.}$$
 
이를 위하여 버블정렬은 

(1) $A[0]$의 값과 $A[1]$의 값을 비교하여, $A[1]$의 값이 더 작으면 두 값을 교환한다.

(2) $A[1]$의 값과 $A[2]$의 값을 비교하여, $A[2]$의 값이 더 작으면 두 값을 교환한다.

(3) $A[2]$의 값과 $A[3]$의 값을 비교하여, $A[3]$의 값이 더 작으면 두 값을 교환한다.

...

이와 같은 작은을 계속 반복하여 마지막으로

$A[n-2]$의 값과 $A[n-1]$의 값을 비교하여, $A[n-1]$의 값이 더 작으면 두 값을 교환한다.

그림 3은 크기 $5$인 배열 $A=[3, 2, 1, 5, 6]$에 대하여 이와 같은 작업을 수행하는 절차를 나타낸다.

![ch03_fig.3_bubble.png](attachment:ch03_fig.3_bubble.png)
[그림 3] 버블 동작의 예

그림 3에서와 같이 배열 $A=[3, 2, 1, 5, 6]$에서 가장 큰 값 $6$은 배열 A의 마지막에 위치하게 된다. 즉, $6$은 적절한 배열 위치를 지정 받은 것이다. 그러므로 배열 A의 나머지 4개의 요소 값들의 정렬만 고려하면 된다.

즉, 크기 $n$인 배열 A에 대하여 정렬을 수행할 때, 이와 같은 동작절차를 수행하면, 크기 $n-1$인 배열의 정렬 문제로 축소가 가능하다.

그림 4은 이와 같은 문제의 크기 축소를 통한 정렬 과정을 예를 들어 설명한 것이다. 각 라운드가 진행됨에 따라 정렬 대상의 크기는 1씩 감소하게 되며, 정렬 대상의 크기가 1이 되면 정렬이 완료된 것으로 간주한다.

![ch03_fig.4_bubbleSort.png](attachment:ch03_fig.4_bubbleSort.png)
[그림 4] 버블 정렬의 예

In [2]:
# -*- coding: utf-8 -*-
#버블정렬
def bubbleSort(A, n):
    for last in range(n-1, 0,-1): # 1<= last <= n-1
        for i in range(0, last):  # 0 <= i <= last-1
            if A[i] > A[i+1]: 
                A[i], A[i+1]=A[i+1], A[i] 
        
A=[3,2,4,9,2,7,4,4,8]
#A=[0x123,0x2154,0x222,0x4,0x283,0x1560,0x1061,0x2150,0x37]
#A=[3,4,2,39,29,33,31, 22, 11, 16]
#B=[]
n=A.__len__()    
firstIndex=0
lastIndex=n-1
print(A)
bubbleSort(A, lastIndex)
print(A)

[3, 2, 4, 9, 2, 7, 4, 4, 8]
[2, 2, 3, 4, 4, 4, 7, 9, 8]


### 3. insertionSort (삽입정렬)

In [3]:
# -*- coding: utf-8 -*-
#삽입정렬
def insertionSort(A,n):
    for i in range(1, n):
        loc     = i-1
        newItem = A[i]
        while loc >= 0 and newItem < A[loc]:
            A[loc+1]=A[loc]
            loc-=1
        A[loc+1]=newItem
        
A=[3,2,4,9,2,7,4,4,8]
#A=[0x123,0x2154,0x222,0x4,0x283,0x1560,0x1061,0x2150,0x37]
#A=[3,4,2,39,29,33,31, 22, 11, 16]
#B=[]
n=A.__len__()    
firstIndex=0
lastIndex=n-1
print(A)
insertionSort(A, lastIndex)
print(A)

[3, 2, 4, 9, 2, 7, 4, 4, 8]
[2, 2, 3, 4, 4, 4, 7, 9, 8]


### 고급정렬알고리즘
* mergeSort    (병합정렬)
* quickSort     (퀵정렬)
* heapSort       (힙정렬)

### 4. mergeSort    (병합정렬)

In [4]:
# -*- coding: utf-8 -*-
#병합정렬
def merge(A,p,q,r):
    i, j, t = p, q+1, 1
    temp=[]
    while i <= q and j <= r:
        if A[i] <= A[j] :
            temp.append(A[i])
            i+=1
        else:
            temp.append(A[j])
            j+=1
    while i <= q:
        temp.append(A[i])
        i+=1
    while j <= r:
        temp.append(A[j])
        j+=1
    i=p 
    t=0
    while i <= r:
        A[i]=temp[t] 
        i+=1
        t+=1

def mergeSort(A, p, r):
    if p < r :        
        q = int((p+r)/2)
        mergeSort(A, p, q)
        mergeSort(A, q+1,r)
        merge(A,p,q,r)
        
A=[3,2,4,9,2,7,4,4,8]
#A=[0x123,0x2154,0x222,0x4,0x283,0x1560,0x1061,0x2150,0x37]
#A=[3,4,2,39,29,33,31, 22, 11, 16]
#B=[]
n=A.__len__()    
firstIndex=0
lastIndex=n-1
print(A)
insertionSort(A, lastIndex)
print(A)

[3, 2, 4, 9, 2, 7, 4, 4, 8]
[2, 2, 3, 4, 4, 4, 7, 9, 8]


### 5. quickSort     (퀵정렬)

In [5]:
# -*- coding: utf-8 -*-
#퀵정렬
def partition(A,p,r):
    x = A[r]
    i = p-1
    for j in range(p, r):  # p <= j <= r-1
        print(j, r)
        if A[j] <= x: 
            i+=1
            A[i], A[j] = A[j], A[i] 
    i+=1
    A[i], A[r] = A[r], A[i] 
    return i
def quickSort(A,p,r):
    if p < r:
        q = partition(A, p, r)
        #print("q is %d"%q, A)
        quickSort(A, p, q-1)
        quickSort(A, q+1, r)
        
A=[3,2,4,9,2,7,4,4,8]
#A=[0x123,0x2154,0x222,0x4,0x283,0x1560,0x1061,0x2150,0x37]
#A=[3,4,2,39,29,33,31, 22, 11, 16]
#B=[]
n=A.__len__()    
firstIndex=0
lastIndex=n-1
print(A)
insertionSort(A, lastIndex)
print(A)

[3, 2, 4, 9, 2, 7, 4, 4, 8]
[2, 2, 3, 4, 4, 4, 7, 9, 8]


### 6. heapSort       (힙정렬)

In [6]:
# -*- coding: utf-8 -*-
#힙정렬
def heapify(A, k, n): #To make a heap for a subtree which its subroot is A[k]
    leftChild   = 2*k 
    rightChild  = 2*k+1
    if rightChild <= n:
        if A[leftChild] < A[rightChild]:
            smaller = leftChild 
        else:
            smaller = rightChild 
    elif leftChild <= n:
        smaller = leftChild 
    else:
        return
    if A[smaller] < A[k]:
        A[k], A[smaller] = A[smaller], A[k]
        heapify(A, smaller, n)

def buildHeap(A, n):
    last = int(n/2)
    for i in range(last, -1, -1):  # n/2 >= i > 0
        heapify(A, i, n)
#        print("i is %d"%i, A)
        
def heapSort(A, n):
    buildHeap(A, n)
    for i in range(n, 0, -1):
        A[0], A[i] = A[i], A[0]
        heapify(A, 0, i-1)        
#        print(A)

A=[3,2,4,9,2,7,4,4,8]
#A=[0x123,0x2154,0x222,0x4,0x283,0x1560,0x1061,0x2150,0x37]
#A=[3,4,2,39,29,33,31, 22, 11, 16]
#B=[]
n=A.__len__()    
firstIndex=0
lastIndex=n-1
print(A)
insertionSort(A, lastIndex)
print(A)

[3, 2, 4, 9, 2, 7, 4, 4, 8]
[2, 2, 3, 4, 4, 4, 7, 9, 8]


### 특수정렬
* radixSort (기수정렬)
* countingSort (계수정렬)

### 7. radixSort (기수정렬)

In [7]:
# -*- coding: utf-8 -*-
#기수정렬
#16진수를 base로 하는 기수정렬

from math import log
def radixSort_base16(A,n):
    base=16 #16진수 기준    
    
    digit = int(log(max(A), base) + 1)
    #print(digit)
    mask=0xF
    rightSift=0;    
       
    for x in range(0,digit):
        list = []
        for y in range(0, base-1):
            list.append([])        
        #for y in range(0, base-1):
        #    print(list[y])
        for i in range(0, n+1):
            y = A[i] & mask
        #    print("%d digit,i is %d"%(x,i), hex(A[i]),A[i], "is appended in list[%d]"%y)            
            y = y >> rightSift
            list[y].append(A[i])
        #   for y in range(0, base-1):
        #        print(y, list[y])        
        i=0
        for y in range(0, base-1):
            for k in range(0, list[y].__len__() ):                
                A[i]=list[y][k]
                i+=1
        rightSift +=4
        mask = mask << 4 

A=[3,2,4,9,2,7,4,4,8]
A=[0x123,0x2154,0x222,0x4,0x283,0x1560,0x1061,0x2150,0x37]
#A=[3,4,2,39,29,33,31, 22, 11, 16]
#B=[]
n=A.__len__()    
firstIndex=0
lastIndex=n-1
print(A)
radixSort_base16(A, lastIndex)
print(A)

[291, 8532, 546, 4, 643, 5472, 4193, 8528, 55]
[4, 55, 291, 546, 643, 4193, 5472, 8528, 8532]


### 8. countingSort (계수정렬)

In [8]:
# -*- coding: utf-8 -*-
#계수 정렬
#16진수를 base로 하는 기수정렬

def countSort(A, B, n):    
    
    for i in range(0, A.__len__()):
        B.append(0)
    
    k=max(A)
    C=[]
    for i in range(0, k+1):
        C.append(0)    
    
    for i in range(0, n+1):
        C[ A[i] ] +=1
        
    for i in range(1, k+1):
        C[i] += C[i-1]
            
    for i in range(0, n+1):        
        B[ C[ A[i]]-1 ] =A[i]  # C[ A[i]]-1  : index가 0부터 시작하므로
        C[ A[i]] -=1
        
#A=[3,2,4,9,2,7,4,4,8]
#A=[0x123,0x2154,0x222,0x4,0x283,0x1560,0x1061,0x2150,0x37]
A=[3,4,2,39,29,33,31, 22, 11, 16]
B=[]
n=A.__len__()    
firstIndex=0
lastIndex=n-1
print(A)
countSort(A, B, lastIndex)
print(B)

[3, 4, 2, 39, 29, 33, 31, 22, 11, 16]
[2, 3, 4, 11, 16, 22, 29, 31, 33, 39]
