# 정렬
* 정렬 알고리즘 종류 : 삽입정렬(insertion sorts), 선택정렬(selection sort), 병합정렬(merge sorts), 퀵정렬(quick sorts), 버블정렬(bubble sorts) 등등

In [2]:
import numpy as np
import random

#### 안정정렬, 불안정정렬 ? 
- 정렬의 안정적 특성 : 정렬 안된 상태에서 **같은 키값**을 가진 데이터가 **정렬 후**에도 **순서가 유지**되면 **안정적 특성**을 가진다 라고 함

[Reference](https://seongjaemoon.github.io/python/2017/12/16/pythonSort.html)
### [ 정렬 알고리즘]
1. 삽입정렬
2. 버블정렬
3. 선택정렬
4. 퀵정렬
5. 병합정렬
6. 쉘정렬
7. 기수정렬

### [ 파이선 내장 (리스트)정렬함수]
1. 리스트.sort() : 리스트 메소드
2. sorted(리스트) : 파이선 내장 함수

___

### [ 정렬 알고리즘]

- **삽입정렬** (안정정렬)
  - 데이터가 많아질수록 효율이 나빠짐 
  - 최대 복잡도 : O(n^2)

###### 예) 삽입정렬

In [32]:
a = random.sample(range(1,10), 5)
print(a)

[1, 7, 4, 3, 2]


In [33]:
for i in range(1,len(a)):         # 리스트 크기 만큼 반복
    print("a[i] : ",a[i])
    for j in range(i, 0, -1):     # 리스트 인덱스 값에서 1씩 줄어들면서 삽입 위치 찾음
        print("  a[j] : ",a[j])
        if a[j] < a[j-1] :          # 현재 인덱스의 값이 현재 인덱스-1 번째 값 보다 작다면...
            a[j], a[j-1] = a[j-1] , a[j]    # 두 값을 교체 
        else :
            break

a[i] :  7
  a[j] :  7
a[i] :  4
  a[j] :  4
  a[j] :  4
a[i] :  3
  a[j] :  3
  a[j] :  3
  a[j] :  3
a[i] :  2
  a[j] :  2
  a[j] :  2
  a[j] :  2
  a[j] :  2


In [34]:
print(a)

[1, 2, 3, 4, 7]


* 삽입정렬 함수로 생성

In [35]:
def sort_insertionSorts(arr=None):
    a = None
    
    if arr == None:
        a = random.sample(range(1,10), 5)
    else :
        a = arr
    
    print("original array \t: ",a)
    
    for i in range(1,len(a)):         # 리스트 크기 만큼 반복
        for j in range(i, 0, -1):     # 리스트 인덱스 값에서 1씩 줄어들면서 삽입 위치 찾음
            if a[j] < a[j-1] :          # 현재 인덱스의 값이 현재 인덱스-1 번째 값보다 작다면...
                a[j], a[j-1] = a[j-1] , a[j]    # 두 값을 교체 
            else :
                break
    
    print("sorted array \t: ",a)
    return a

In [36]:
sort_insertionSorts()

original array 	:  [7, 8, 3, 1, 5]
sorted array 	:  [1, 3, 5, 7, 8]


[1, 3, 5, 7, 8]

- **버블(거품)정렬** (안정정렬)
  - 모든 원소를 하나하나 비교하여 swap 작업을 반복
  - 최대 복잡도 : O(n^2)

###### 예) 버블정렬

In [37]:
a = random.sample(range(1,10), 5)
print(a)

[3, 5, 9, 8, 4]


In [38]:
for i in range(len(a)-1):           # 리스트 크기-1 만큼 반복
    for j in range(i+1, len(a)):    # 해당 인덱스+1 번째부터, 리스트 크기만큼 반복
        if a[i] > a[j]:               # 현재 인덱스의 값이 현재 인덱스+1 번째 값 보다 크다면...
            a[i], a[j] = a[j], a[i]   # 두 값을 교체

In [39]:
print(a)

[3, 4, 5, 8, 9]


* 버블정렬 함수로...

In [40]:
def sort_bubbleSorts(arr=None) : 
    a = None
    
    if arr == None:
        a = random.sample(range(1,10), 5)
    else :
        a = arr
    
    print("original array \t: ",a)
    
    for i in range(len(a)-1):           # 리스트 크기-1 만큼 반복
        for j in range(i+1, len(a)):    # 해당 인덱스+1 번째부터, 리스트 크기만큼 반복
            if a[i] > a[j]:               # 현재 인덱스의 값이 현재 인덱스+1 번째 값보다 크다면...
                a[i], a[j] = a[j], a[i]   # 두 값을 교체
                
    print("sorted array \t: ",a)
    return a 

In [31]:
sort_bubbleSorts()

original array 	:  [4, 5, 2, 7, 3]
sorted array 	:  [2, 3, 4, 5, 7]


[2, 3, 4, 5, 7]

- **선택정렬** (불안정정렬)
  - 나보다 작은 항목을 선택하고 자기 자리로 바꾸는 정렬
  - 최대 복잡도 : O(n^2)

###### 예) 선택정렬

In [41]:
a = random.sample(range(1,10), 5)
print(a)

[8, 9, 3, 2, 5]


In [42]:
for i in range(len(a)-1):           # 리스트 크기-1 만큼 반복
    for j in range(i+1, len(a)):    # 해당 인덱스+1 번째 부터 리스트 크기만큼 반복
        if a[i] > a[j]:               # 현재 인덱스의 값이 현재 인덱스+1 번째 값보다 크다면...
            a[i], a[j] = a[j], a[i]   # 두 값을 교체            

In [43]:
print(a)

[2, 3, 5, 8, 9]


* 선택정렬 함수로...

In [49]:
def sort_selectionSotrs(arr = None):
    a = None
    
    if arr == None:
        a = random.sample(range(1,10), 5)
    else :
        a = arr
    
    print("original array \t: ",a)
    
    for i in range(len(a)-1):           # 리스트 크기-1 만큼 반복
        for j in range(i+1, len(a)):    # 해당 인덱스+1 번째 부터 리스트 크기만큼 반복
            if a[i] > a[j]:               # 현재 인덱스의 값이 현재 인덱스+1 번째 값보다 크다면...
                a[i], a[j] = a[j], a[i]   # 두 값을 교체            
                
    print("sorted array \t: ",a)
    return a

In [50]:
sort_selectionSotrs()

original array 	:  [3, 8, 5, 4, 6]
sorted array 	:  [3, 4, 5, 6, 8]


[3, 4, 5, 6, 8]

- **퀵정렬** (불안정정렬)
  - 재귀함수를 통해 구현됨
  - 최대 복잡도 : O(nlogn)

###### 예) 퀵정렬

In [51]:
a = random.sample(range(1,10), 5)
print(a)

[1, 7, 8, 5, 3]


In [53]:
def quickSort(arr, start, end):      # 재귀함수(리스트 , 시작인덱스, 종료인덱스)
    if start < end :                 # 시작인덱스가 종료인덱스 보다 작을 경우
        left = start                 # left 변수에 시작인덱스 지정
        pivot = a[end]               # pivot값은 리스트의 마지막 원소 값
        
        for i in range(start, end):                    # 시작인덱스부터 종료인덱스까지 반복
            if arr[i] < pivot:                         # 현재인덱스 값이 pivot(리스트 마지막 원소 값) 보다 작다면...
                arr[i], arr[left] = arr[left], arr[i]  # 현재인덱스와 left 인덱스의 값을 교체 
                left += 1                              # 인덱스를 증가하여 위치를 다음 인덱스로 바꿈
        
        arr[left], arr[end] = arr[end], arr[left]      # left인덱스와 끝 인덱스 값을 교체
        print(left)
        quickSort(arr, start, left-1)  # 재귀 호출(리스트, 시작인덱스, left-1)
        quickSort(arr, left+1, end)    # 재귀 호출(리스트, left+1, 종료인덱스)

In [54]:
quickSort(a, 0, len(a)-1)
print("\n")
print(a)

1
3


[1, 3, 5, 7, 8]


- **병합정렬**
  - 재귀함수를 통해 구현됨
  - 최대 복잡도 : O(logn)

###### 예) 병합정렬

In [10]:
a = random.sample(range(1,10), 5)
print(a)

[4, 2, 7, 5, 6]


In [11]:
def mergeSort(arr):
    if len(arr) > 1:              # 배열의 길이가 1보다 클경우에만 재귀함수 호출을 반복함
        mid = len(arr)//2         # 중간값을 전체 길이의 절반의 값을 취함
        la, ra = arr[:mid], arr[mid:]   #la(left area), ra(right area) 중간값을 기준으로 좌우로 나눔
        mergeSort(la)             # 왼쪽 서브리스트의 값을 기준으로 병합정렬 재귀 호출
        mergeSort(ra)             # 오른쪽 서브리스트의 값을 기준으로 병합정렬 재귀 호출
        li, ri , i = 0, 0, 0      # li(left index), ri(right index), i(index)정렬을 위한 변수 선언
        
        while li < len(la) and ri < len(ra):  # 서브리스트의 정렬이 끝날때까지 반복
            if la[li] < ra[ri]:               # 오른쪽 리스트의 값이 클 경우
                arr[i] = la[li]                  # 왼쪽 리스트의 해당 인덱스의 값을 할당
                li += 1                         # 왼쪽 리스트의 인덱스 1증가
            else:                             # 왼쪽 리스트의 값이 클 경우
                arr[i] = ra[ri]                  # 오른쪽 리스트의 해당 인덱스의 값을 할당
                ri += 1                         # 오른쪽 리스트의 인덱스 1증가
            i += 1                            # 기준 인덱스 1증가
        
        arr[i:] = la[li:] if li != len(la) else ra[ri:]
        # 왼쪽 리스트의 인덱스의 값이 서브리스트의 값과 같지 않을 경우라면 정렬 끝
        # 왼쪽 서브 리스트의 값을 리스트에 덮어쓰기, 그렇지 않은 경우라면 오른쪽 서브 리스트의 값 할당

In [12]:
mergeSort(a)
print(a)

[2, 4, 5, 6, 7]


* 쉘 정렬(불안정 정렬)
  - 삽입 정렬을 개선한 확장판 버전
  - 일정한 구간을 나눠서 그 구간에서 삽잊 정렬을 실행
  - 최대 복잡도 : O(n^2) -> O(nlog2n)이 최선

In [13]:
a = random.sample(range(1,10), 5)
print(a)

[6, 1, 5, 9, 8]


In [14]:
def InsertionSort(x, start, gap):                # 삽입정렬 구현
    for target in range(start+gap, len(x), gap): # (시작인덱스+차이, 리스트 크기만큼 반복, 차이까지)
        val = x[target]                          # 리스트의 값
        i = target                               # 인덱스 저장
        while i > start:                           #  증감 값 보다 인덱스가 크다면 반복
            if x[i-gap] > val:                       # 리스트의 비교 인덱스 값 보다 크다면
                x[i] = x[i-gap]                      #  해당 인덱스 값 할당
            else:                                  # 리스트의 비교 인덱스 값 보다 작다면
                break                                # 반복 중지
            i -= gap                               # 중간 값만큼 빼주기
        x[i] = val                               # 해당 값 삽입

def shellSort(x): #
    gap = len(x) // 2 # 리스트를 2로 나눈 몫 (중간 값) 취함
    while gap > 0: #
        for start in range(gap): # 중간 값의 크기만큼 반복
            InsertionSort(x, start, gap) # 삽입정렬 메소드 호출 (리스트, 증감 값, 중간 값)
        gap = gap // 2 # 리스트를 2로 나눈 몫 (중간 값) 취함 (반으로 줄여나간다.)


In [16]:
shellSort(a)
print(a) 

[1, 5, 6, 8, 9]


* 기수 정렬(불안정 정렬)
  - MSB -> LSB 큰 자리수부터 정렬
  - LSB -> MSB 작은 자리수 부터 정렬, 2가지 방식 
  - 최대 복잡도 : O(d(n+k))
    - d: 자리수 
    - d 자리수 숫자 n개가 주어졌을때 최대 k값을 가질 수 있음

###### 예) 기수 정렬

In [18]:
a = random.sample(range(1,10), 5)
print(a)

[7, 9, 2, 8, 3]


In [19]:
def radixSort(a):
    isSort = False # 정렬 완료시 True
    index = 1 # 시작 인덱스
    while not isSort: # 정렬이 되지 않았다면 반복
        isSort = True # 정렬 상태 확인 변수
        sortList = [list()for _ in range(10)] # 빈 리스트 선언

        for num in a: # 리스트의 크기만큼 반복
            number = (int)(num/index)%10 # 자리 수를 기준으로 정렬하기 위한 변수 할당
            sortList[number].append(num) # 자리 수를 기준으로 리스트에 인덱스 선언
            if isSort and number > 0: # 정렬 되지 않았다면 && 자리 수 변수가 0보다 크다면
                isSort = False # 정렬 안 됨~

        i = 0 # 인덱스 증가용 변수 선언
        for number1 in sortList: # 정렬 리스트 크기만큼 반복
            for num in number1: # 증감 값의 크기만큼 반복
                a[i] = num # 리스트에 인덱스 값 넣기
                i += 1 # 인덱스 증가
        index *= 10 # 자리 수 증가

In [20]:
radixSort(a)
print(a)

[2, 3, 7, 8, 9]


### [ 파이선 내장 (리스트)정렬함수]
1. 리스트.sort() : 리스트 메소드
  - `sort(*, key=None, reverse=False)`

2. sorted(리스트) : 파이선 내장 함수
  - `sorted(iterable, *, key=None, reverse=False)`


* 리스트 선언

In [22]:
a = random.sample(range(1,20), 10)
print("> 정렬 전 원본 데이터 리스트")
print(a)

> 정렬 전 원본 데이터 리스트
[15, 18, 11, 4, 13, 19, 6, 17, 7, 12]


* sort()

In [28]:
# 오른 차순 정렬 
a.sort()
print(a)

[4, 6, 7, 11, 12, 13, 15, 17, 18, 19]


In [29]:
# 내림 차순 정렬
a.sort(reverse=True)
print(a)

[19, 18, 17, 15, 13, 12, 11, 7, 6, 4]


* sorted() 

In [31]:
# sorted() 파이썬 내장 정렬 함수 사용
print(sorted(a))

[4, 6, 7, 11, 12, 13, 15, 17, 18, 19]


In [32]:
# sorted 함수를 이용한 키 값 기준 정렬
print(sorted("This is a Moon's world".split(), key=str.lower)) 

['a', 'is', "Moon's", 'This', 'world']


In [38]:
# 불특정 tuple을 갖는 리스트 생성
b= [('abc','A',3), ('bcd','B',1), ('cde','C',15)] 
# tuple의 2번째(2번째 인덱스)) 요소를 가지고 정렬
# 1, 3, 15 <- 정수를 가지고 정렬 함
print(sorted(b, key=lambda b: b[2])) 

[('bcd', 'B', 1), ('abc', 'A', 3), ('cde', 'C', 15)]
