## 정렬 알고리즘

1. 버블정렬
2. 선택정렬
3. 삽입정렬
4. 퀵정렬
5. 계수정렬
6. 병합정렬

1. 버블정렬
한 번 정렬할 때 (O(n)) 그 중에서 제일 큰 수를 맨 뒤에 위치시키는 정렬 알고리즘
총 갯수만큼 정렬해야 하기 때문에 모든 상황에서 O(n^2) 

선택정렬, 삽입정렬과 같은 복잡도이지만 연산수가 가장 많아 정렬 알고리즘 중에서 제일 효율성이 낮은 알고리즘 

In [1]:
def bubbleSort(lis):
    size=len(lis)-1
    for j in range(len(lis)):
        for i in range(size):
            if lis[i]>lis[i+1]:
                lis[i],lis[i+1]=lis[i+1],lis[i]
        size-=1

    return lis

lis=[7,3,5,8,7,4,2,5]

print(bubbleSort(lis))

[2, 3, 4, 5, 5, 7, 7, 8]


2. 선택정렬
주어진 데이터 중에서 현재 위치에 맞는 데이터를 찾아 위치를 교한하는 정렬 알고리즘
앞에서부터 정렬한다고 생각하면 된다.

1. 0~n번까지 제일 작은 값을 찾아 0번과 swap
2. 1~n 동일하게
3. 2~n
... 
4. n-1~n 

1번의 버블정렬이 뒤에서부터 정렬하는 알고리즘이라면 선택정렬은 앞에서부터 정렬하는 알고리즘
시간복잡도는 O(n^2)이다. 

In [3]:
def selectionSort(lis):
    for i in range(len(lis)):
        min=i
        for j in range(i+1,len(lis)):
            if lis[min]>lis[j]:
                min=j
        lis[min],lis[i]=lis[i],lis[min]

    return lis

lis=[7,3,5,8,7,4,2,5]
print(selectionSort(lis))

[2, 3, 4, 5, 5, 7, 7, 8]


3. 삽입정렬
처리되지 않은 데이터를 하나씩 선택해 적절한 위치에 넣는 정렬 알고리즘

**이미 정렬된 부분**에 새로운 요소를 넣는다고 생각하면 적절함

1. 0번 인덱스는 고려 x
2. 0~1번 인덱스 중 1번 인덱스 요소가 들어갈 위치 찾아 넣음
3. 0~2번 ..
4. 0~n번 .. 

In [4]:
def insertSort(lis):
    for i in range(1,len(lis)):
        #들어갈 위치를 찾아서 넣어줌 (이 과정은 버블정렬과 비슷함)
        for j in range(i,0,-1): #뒤에서부터 찾음 
            if lis[j]<lis[j-1]:
                lis[j],lis[j-1]=lis[j-1],lis[j]
            else:
                #넣을 부분이 이미 정렬된 부분이라 같거나 작으면
                break

    return lis

lis=[7,3,5,8,7,4,2,5]
print(insertSort(lis))

[2, 3, 4, 5, 5, 7, 7, 8]


4. 퀵 정렬

가장 많이 사용되는 정렬 알고리즘
병합 정렬과 마찬가지로 분할 정복을 통한 정렬방법
-> 차이점은 병합정렬은 분할 단계에서는 아무 것도 하지 않고 병합 단계에서 정렬 수행
But, 퀵 정렬은 분할 단계에서 정렬 수행하고 병합 시에는 병합만 함
+ 퀵 정렬은 리스트를 비균등하게 분할, 머지소트는 균등하게 분할함

퀵 정렬의 시간 복잡도: O(NlogN)
최악의 경우: O(n^2) -> 이는 데이터가 정렬되어 있는 경우 n개의 데이터를 n번만큼 해야하기 때문임 

피벗이란? 
- 큰 숫자와 작은 숫자를 교환할 때, 교환하기 위한 기준을 pivot이라고 표현

결론적으로, 기준(pivot)을 설정한 다음 큰 수와 작은 수를 교환한 후 리스트를 반으로 나누는 방식으로 동작하는 정렬 알고리즘

[수행 과정]
1. 피벗을 설정한 후, 왼쪽에서 피벗보다 큰 데이터를 찾고 오른쪽에서 피벗보다 작은 데이터를 찾음
-> 이 과정에서 피벗을 중심으로 작은 요소들은 모두 피벗의 왼쪽으로, 큰 요소들은 피벗의 오른쪽으로 옮겨진다
2. 부분 리스트들이 더 이상 분할이 불가능할 때까지 반복 (재귀를 사용함으로 종료조건 확실히 있어야 함)

이 과정에서 정렬이 됨

파이썬으 sort는 퀵 정렬을 기본으로 함. 

In [8]:
def quickSort(lis):
    #재귀 종료조건 
    if len(lis)<=1: return lis

    #피벗은 첫번째 원소로 정해줌(별 특별한 이유 없음)
    pivot=lis[0]
    remains=lis[1:] #index 1~끝까지

    left=[];right=[]

    #피벗을 기준으로 왼쪽에 작은 거, 오른쪽에 큰
    for i in remains:
        if pivot>=i:
            left.append(i)
        else:
            right.append(i)

    return quickSort(left)+[pivot]+quickSort(right)

lis=[7,3,5,8,7,4,2,5]
print(quickSort(lis))

"""
이 구현은 재귀 호출 시에 새로운 리스트를 생성하여 리턴 -> 메모리 사용 측면에서 비효율적
추가 메모리 사용이 적은 in-place 정렬을 많이 이용함 

in-place 정렬이 그 low, high 있는 것 -> 추가적으로 해보기 
"""

[2, 3, 4, 5, 5, 7, 7, 8]


5. 계수정렬

별도의 리스트를 선언하고 그 안에 정렬에 대한 정보를 담는 알고리즘
**데이터의 크기 범위가 제한되어 정수 형태로 표현할 수 있을 때**만 사용할 수 있음.
일반적으로 가장 큰 데이터와 가장 작은 데이터의 차이가 1,000,000을 넘지 않을 때 효과적임.

1. 가장 큰 데이터와 가장 작은 데이터의 범위가 모두 담길 수 있도록 하나의 리스트 생성
2. 처음에는 리스트의 모든 데이터가 0이 되도록 초기화
3. 데이터를 하나씩 확인하며 데이터의 값과 동일한 인덱스의 데이터를 1씩 증가시킴

데이터 개수 n, 데이터 중 최댓값의 크기 k
계수 정렬의 시간 복잡도: O(n+k)
계수 정렬의 공간 복잡도: O(n+k)

결과적으로, 계수 정렬은 데이터의 크기가 한정되어 있고, 데이터의 크기가 많이 중복되어 있을수록 유리하며 항상 사용할 수는 없다. 

6. 병합정렬 O(nlogn)

최악의 상황에서도 병합정렬, 힙 정렬은 O(nlogn)을 유지하지만 순수한 퀵 정렬은 오히려 O(n^2)의 시간 복잡도가 나온다.

병합정렬이란? 
