# 8강 병합 정렬(Merge Sort)

* 개념
    * 배열 전체를 반으로 계속 쪼갠후, 
    * 병합하면서 정렬하는 방식

* 특징
    * 분할 정복 방법을 채택함
    * 퀵 정렬은 편향되게 정렬할수 있지만, 
    * 병합정렬은 정확히 반으로 나누기 때문에, O(nlogn)을 더 잘 보장함
    * 평균적으로 퀵정렬보다 빠른 것은 아님
    * 시간 복잡도 : O(nlogn)

In [14]:
list_input = [7, 6, 5, 8, 3, 5, 9, 1]
n = len(list_input)

list_temp = [0 for i in range(n)]    # 전역 변수 리스트가 필요함

def merge(data, start, middle, end):
    
    i = start
    j = middle +1
    k = start
    
    # 작은 순서대로, list_temp에 삽입
    while(i<=middle and j<=end):
        if data[i] <= data[j]:
            list_temp[k] = data[i]
            i+=1
        else:
            list_temp[k] = data[j]
            j+=1
            
        k+=1
        
    # 남은 데이터 삽입
    if i > middle:    # 앞 배열이 먼저 끝난경우 뒷 배열 나머지 넣기
        for a in range(j, end+1):
            list_temp[k] = data[j]
            k+=1
    else:            # 뒷 배열이 먼저 끝난경우 앞 배열 나머지 넣기
        for a in range(i, middle+1):
            list_temp[k] = data[i]
            k+=1
    
    for a in range(start, end+1):
        data[a] = list_temp[a]
        
def mergeSort(data, start, end):
    
    # 크기가 1보다 큰 경우
    if start < end:
        middle = int((start + end)/2)
        mergeSort(data, start, middle)
        mergeSort(data, middle+1, end)
        merge(data, start, middle, end)
        
        
mergeSort(list_input, 0, len(list_input)-1)
print(list_input)


[1, 3, 5, 5, 6, 7, 8, 9]


# 힙 정렬(Heap Sort)

* 최대 힙 : 부모 노드가 자식 노드보다 큰 힙
* 최소 힙 : 부모 노드가 자식 노드보다 작은 힙

* 힙을 만드는(heapify) 시간 복잡도 : O(logn)
* 힙을 이용한 정렬의 시간 복잡도 : O(n*logn)   # 루트 뽑아내기와 heapify 반복

파이썬은 그냥 heapq 모듈 쓰자!
Note_heapq 참조

In [19]:
arr = [8, 3, 5, 4, 6, 1]

In [20]:
import heapq

h = arr

heapq.heapify(h)

while(len(h)>0):
    print(heapq.heappop(h), end=" ")

1 3 4 5 6 8 

# 계수 정렬(Counting Sort)


* 특정 조건 : 정해진 값(0~N) 이하의 숫자들에 대한 정렬

* 개념
    * 0~N 범위의 수 열을 정렬할 때,
    * N 개의 0 배열을 만들고,
    * 수를 하나씩 읽어가며, 해당 숫자 값 위치에 counting을 해준 후,
    * 마지막에 counting 한 수 만큼 표현하는 방식

* 시간 복잡도 : O(N)

In [16]:
arr = [1, 3, 2, 4, 3, 2, 5, 3, 1, 2, 
       3, 4, 4, 3, 5, 1, 2, 3, 5, 2, 
       3, 1, 4, 3, 5, 1, 2, 1, 1, 1]

In [17]:
count = [0 for i in range(6)] # 인덱스를 5까지 사용하기 위해 6개 요소 생성
count

[0, 0, 0, 0, 0, 0]

In [18]:
for i in arr:
    count[i] +=1
    
for i in range(1, 6):
    if count[i] != 0:
        for j in range(count[i]):
            print(i, end = " ")

1 1 1 1 1 1 1 1 2 2 2 2 2 2 3 3 3 3 3 3 3 3 4 4 4 4 5 5 5 5 

# 심화 정렬 문제 풀어보기

# 백준_1181_ 단어 정렬

In [31]:
cnt = int(input())
arr = []

for i in range(cnt):
    a = input()
    arr.append((len(a), a))     # (길이, 입력값)를 튜플로 삽입

    
# 중복 값 제거
arr = list(set(arr))

arr.sort()   ## 첫번째 요소 = 길이순, 두번째 단어순으로 정렬

for i in range(len(arr)):
    print(arr[i][1])

13
but
i
wont
hesitate
no
more
no
more
it
cannot
wait
im
yours
i
im
it
no
but
more
wait
wont
yours
cannot
hesitate


 * 표준 입력

In [None]:
from sys import stdin

cnt = int(stdin.readline().rstrip())
arr = []

for i in range(cnt):
    a = stdin.readline().rstrip()
    arr.append((len(a), a))     # (길이, 입력값)를 튜플로 삽입

    
# 중복 값 제거
arr = list(set(arr))

arr.sort()   ## 첫번째 요소 = 길이순, 두번째 단어순으로 정렬

for i in range(len(arr)):
    print(arr[i][1])

# 백준_1431_시리얼 번호

1. 길이가 짧은것 부터
2. 자릿수 합이 작은 것부터(숫자만 더할 것)
3. 1-2로 비교 안되면, 사전순(숫자가 알파벳보다 먼저)

 * 확인용(표준입력 사용불가)

In [35]:
n = int(input())

arr = []

for i in range(n):
    d = input()
    arr.append((len(d), d))
    
arr.sort()   # sort 함수가 길이가 짧은 순, 알파벳순, 숫자가 알파벳보다 먼저 조건은 처리해 줌

arr

5
ABCD
145C
A
A910
Z321


[(1, 'A'), (4, '145C'), (4, 'A910'), (4, 'ABCD'), (4, 'Z321')]

 * 각 숫자의 합을 2번쨰 요소로 만들자!

In [37]:
ord('1')

49

In [49]:
chr(49)

'1'

In [38]:
ord('9')

57

In [50]:
a = [(1, 'A'), (4, '145C'), (4, 'A910'), (4, 'ABCD'), (4, 'Z321')]

for i in a:
    hap = 0
    for j in i[1]:
        if ord(j) >= 49 and ord(j) <= 57:
            hap += int(chr(ord(j)))
    a[a.index(i)] = [a[a.index(i)][0], hap, a[a.index(i)][1]]
    
a

[[1, 0, 'A'], [4, 10, '145C'], [4, 10, 'A910'], [4, 0, 'ABCD'], [4, 6, 'Z321']]

In [51]:
a.sort()
a

[[1, 0, 'A'], [4, 0, 'ABCD'], [4, 6, 'Z321'], [4, 10, '145C'], [4, 10, 'A910']]

In [55]:
n = int(input())

arr = []

for i in range(n):
    d = input()
    arr.append((len(d), d))
    
arr.sort()   # sort 함수가 길이가 짧은 순, 알파벳순, 숫자가 알파벳보다 먼저 조건은 처리해 줌

for i in arr:
    hap = 0
    for j in i[1]:
        if ord(j) >= 49 and ord(j) <= 57:
            hap += int(chr(ord(j)))
    arr[arr.index(i)] = [arr[arr.index(i)][0], hap, arr[arr.index(i)][1]]
    
arr.sort()

for i in arr:
    print(i[2])

5
ABCD
145C
A
A910
Z321
A
ABCD
Z321
145C
A910


# 백준_10989_수 정렬하기 3

    * 매우 빠르게 정렬해서 풀리는 문제 => 계수 정렬 사용
    * 데이터 갯수 10,000,000 이하
        => 천만 => n+logn 하면 거의 2억인데, 이 정도면 보통 오답처리 한다.
    * 데이터 값의 범위 10,000 이하 자연수
    
### 데이터 범위 조건이 있으므로 빼박, 계수 정렬 문제이다.   

In [None]:
from sys import stdin

N = int(stdin.readline().rstrip())

counting = [0 for i in range(10001)]

for i in range(N):
    counting[int(stdin.readline().rstrip())] += 1
    
for i in range(1, 10001):
    for j in range(counting[i]):
        print(i)

 * 확인용

In [56]:
N = int(input())

counting = [0 for i in range(10001)]

for i in range(N):
    counting[int(input())] += 1
    
for i in range(1, 10001):
    for j in range(counting[i]):
        print(i)

10
5
2
3
1
4
2
3
5
1
7
1
1
2
2
3
3
4
5
5
7
