## 정렬

정렬이란 특정한 기준에 따라서 순서대로 나열하는 것이다. 정렬하는 이유는 검색의 효율성 때문인데 대표적인 이진탐색이 가능하다. 선택정렬 삽입정렬 퀵정렬 계수 정렬을 배우고 파이썬 기본 정렬 라이브러리를 통해 효과적인 정렬 수행 방법을 살펴보자

### 선택정렬(Selection Sort)
가장 작은 데이터를 선택해 맨 앞에 있는 데이터와 바꾸고, 그 다음 작은 데이터를 선택해 앞에서 두 번째 데이터와 바꾸는 과정을 반복

In [1]:
array = [7,5,9,0,3,1,6,2,4,8]

for i in range(len(array)):
    min_index = i #가장 작은 원소의 인덱스
    for j in range(i+1,len(array)):
        if array[min_index] > array[j]:
            min_index = j
    array[min_index] , array[i] = array[i], array[min_index]

print(array)

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]


전체 횟수로 보면 이중 for문을 지닌다. 0번부터 시작을 하면 1에서 마지막, 그다음 1번부터 시작을 하면 2부터 마지막 이런식으로 매 for문의 길이는 한 인덱스씩 짧아지지만 비교를 하게 된다. 일단 시작하는 지점의 인덱스가 가장 작다고 가정하고 뒤에 있는 인덱스와 비교를 한다. 그리고 시작 지점보다 더 작은 값이 있다면 비교해서 갱신을 하게 되고 스와핑(교환)을 실행하게 된다. 간단한 방법이다.  

좀더 정교하게 시간 복잡도 측면으로 보자 전체 연산은 $(N^2 + N)\over2$로 볼 수 있으니 빅오표기법으로는 $O(N^2)$가 된다.

선택정렬보다는 퀵정렬이 그것보다는 기본정렬 라이브러리의 속도가 빠르지만 특정 리스트에서 가장 작은 데이터를 찾는 일이 코테에서는 자주 있으니 선택 정렬 소스코드 형태에 익숙해질 필요가 있다고 한다.

### 삽입정렬(Insertation Sort)
말그대로 카드가 있으면 카드를 하나 가져다가 왼쪽에다가 순서대로 삽입해 넣는다

In [6]:
array = [7,5,9,0,3,1,6,2,4,8]

for i in range(1, len(array)):
#어차피 첫번째 있는 것은 건드릴 필요(옮길 이유)가 없다.
    for j in range(i,0,-1):
        if array[j] < array[j-1]: #한 칸씩 왼쪽으로 이동
            array[j],array[j-1] = array[j-1],array[j]
        else: #자기보다 작은 데이터를 만나면 멈춤
            break
print(array)

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]


일단 7이 아닌 5번부터 살펴보게 된다. 그리고 i는 [1,0]을 먼저 보게 되는데 이때 왼쪽으로 갈수록 인덱스와 값이 작아야 한다. 그러니 여기서 7과 5를 비교하는데 5가더 오른쪽에 있으니 교환을 하게 되고 그런것이 없으니 종료 하고 첫번째 정렬에서 5,7,9,0,3,1,6,2,4,8이 이루어진다. 그 다음으로는 인덱스2의 값인 9를 비교하게 되는데 마찬가지로 5와 7을 보면 이동할게 없으니 5,7,9에서 종료 그다음 0을 보면 5보다 작기 때문에 첫번째 위치에 삽입하고 이를 반복한다.  
삽입정렬의 경우 시간 복잡도는 $O(N^2)$ 이지만 거의 정렬이 이루어졌다면 시간복잡도는 $O(N)$정도라고 한다. 그러니 이미 정렬이 거의 이루어져있다면 퀵정렬대신 삽입정렬이 우수할 수 있다.

### 퀵정렬(Quick Sort)
퀵 정렬은 가장 많이 사용되는 알고리즘으로 "기준 데이터를 설정하고 그 기준보다 큰 데이터와 작은 데이터의 위치를 바꾸면 어떨까?" 기준을 설정한 다음 큰 수와 작은 수를 교환후 리스트를 반으로 나누는 방식으로 동작한다. 이를 이해할 수있다면 병합, 힙 다른 고급 정렬 기법에 비해서 쉽게 소스코드를 작성 할 수 있다고 한다.  

퀵 정렬에는 피벗이 사용된다. 큰 숫자와 자긍ㄴ 숫자를 교환할 때, 교환하기 위한 기준을 바로 피벗이라고 한다. 퀵 정렬을 수행하기 전에는 피벗을 어떻게 설정할 것인지 미리 명시해야 한다. 피벗을 설정하고 리스트를 분할하는 방법에 따라서 여러가지 방식으로 퀵 정렬을 구분하는데, 대표적인 호어 분할 방식을 기준으로 퀵 정렬을 설명한다.

* 리스트에서 첫 번째 데이터를 피벗으로 정한다.

피벗을 설정한 뒤에는 왼쪽에서부터 피벗보다 큰 데이터를 찾고, 오른쪽에서부터 피벗보다 작은 데이터를 찾는다. 그 다음 큰 데이터와 작은 데이터의 위치를 서로 교환해준다.

In [4]:
array = [5,7,9,0,3,1,6,2,4,8]

def quick_sort(array, start, end):
    if start >= end: #원소가 1개인 경우 종료
        return
    pivot = start #피벗은 첫 번째 원소
    left = start + 1
    right = end
    while left < right:
        #피벗보다 큰 데이터를 찾을 때까지 반복
        while left <= end and array[left] <= array[pivot]:
            left += 1
        #피벗보다 작은 데이터를 찾을 때까지 반복
        while right > start and array[right] >= array[pivot]:
            right -= 1
        if left > right: #엇갈렸다면 작은 데이터와 피벗을 교체
            array[right], array[pivot] = array[pivot], array[right]
        else: #엇갈리지 않았다면 작은 데이터와 큰 데이터를 교체
            array[left], array[right] = array[right], array[left]
        #분할 이후 왼쪽 부분과 오른쪽 부분에서 각각 정렬 수행
    quick_sort(array,start,right-1)
    quick_sort(array,right+1, end)
    
quick_sort(array,0, len(array)-1)
print(array)

[0, 1, 2, 4, 3, 5, 6, 8, 7, 9]


In [6]:
#파이썬의 장점을 살린 퀵 정렬 코드
array = [5,7,9,0,3,1,6,2,4,8]

def quick_sort(array):
    #리스트가 하나 이하의 원소만을 담고 있다면 종료
    if len(array) <= 1:
        return array
    
    pivot = array[0] #피벗은 첫 번째 원소
    tail = array[1:] #피벗을 제외한 리스트
    
    left_side = [x for x in tail if x <= pivot] #분할된 왼쪽 부분
    right_side = [x for x in tail if x > pivot] #분할된 오른쪽 부분
    
    #분할 이후 왼쪽 부분과 오른쪽 부분에서 각각 정렬을 수행하고, 전체 리스트를 반환
    return quick_sort(left_side) + [pivot] + quick_sort(right_side)

print(quick_sort(array))

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]


확실히 직접 펜이랑 종이들고 해보니 첫번째 방법이 효율적이지만 아무래도 기억하기 편리한 두번째 것을 사용해야 할 거 같다. 퀵정렬의 평균 시간 복잡도는 $O(NlogN)$이다. 하지만 데이터가 이미 거의 정렬되어 있을 경우 삽입정렬보다 느리다는 점이 있다.

파이썬의 정렬 라이브러리는 퀵 정렬과 동작 방식이 비슷한 병합 정렬을 기반으로 만들어 졌는데 병합 정렬은 일반적으로 퀵 정렬보다 느리지만 최악의 경우에도 시간 복잡도 $O(NlogN)$을 보장한다는 특징이 있다. 이러한 sorted() 함수는 리스트, 딕셔너리 자료형 등을 입력 받아서 정렬된 결과를 출력한다.

In [8]:
array = [5,7,9,0,3,1,6,2,4,8]
result = sorted(array)
print(result)
print(array) #내부 원소는 변하지 않는다.

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
[5, 7, 9, 0, 3, 1, 6, 2, 4, 8]


In [9]:
array = [5,7,9,0,3,1,6,2,4,8]
array.sort() #이렇게하면 내부 원소가 바로 정렬된다.
print(array)

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]


sorted나 sort를 이용할 때는 key매개변수를 입력으로 받을 수 있다. key값으로는 하나의 함수가 들어가야하며 이는 정렬기준이 된다. 예를 들어 리스트의 데이터가 튜플로 구성되어 있을 때, 각 데이터의 두 번째 원소를 기준으로 설정하는 경우 다음과 같은 형태의 소스코드를 작성할 수 있다. 혹은 람다 함수를 사용할 수도 있다.

In [11]:
array = [('바나나',2),('사과',5),('당근',3)]

def setting(data):
    return data[1]
result = sorted(array, key=setting)
print(result)

[('바나나', 2), ('당근', 3), ('사과', 5)]


정렬 라이브러리는 항상 최악의 경우에도 시간 복잡도 $O(NlogN)$을 보장한다.

정렬알고리즘 문제는 3가지로 나타낼 수 있다.

1. 정렬 라이브러리로 풀 수 있는 문제
2. 정렬 알고리즘의 원리를 물어보는 문제 : 선택, 삽입, 퀵 정렬 등의 원리를 알고 있어야 한다.
3. 더 빠른 정렬을 요구 : 계수 정렬등의 다른 정렬 알고리즘을 사용하거나 기존 알고리즘에 구조적인 개선을 시켜야 한다.


### 1. 위에서 아래로
입력을 받으면 큰수에서 작은수의 순서로 정렬

In [16]:
n = int(input())

array = []
for i in range(n):
    array.append(int(input()))

array.sort(reverse=True)
print(array)

3
15
27
12
[27, 15, 12]


### 2. 성적이 낮은 순서로 학생 출력하기

In [22]:
n = int(input())

array = []
for i in range(n):
    in_data = input().split()
    array.append((in_data[0],in_data[1]))
    
def setting(data):
    return data[1]

result = sorted(array, key=setting, reverse=False)

#함수를 사용하지 않으려면 람다함수를 이용
#array = sorted(array,key=lambda student:student[1])

for student in range(n):
    print(result[i][0],end=' ')

2
홍길동 95
이순신 77
이순신 홍길동 

### 두 배열의 원소 교체  
동빈이는 두개의 배열 A와 B를 가지고 있다. 두 배열은 N개의 원소로 구성되어 있으며, 배열의 원소는 모두 자연수이다. 동빈이는 최대 K번의 바꿔치기 연산ㅇ르 수행할 수 있는데 바꿔치기 연산이랑 배열 A에 있는 원소 하나와 배열 B에 있는 원소 하나를 골라서 두 원소를 서로 바꾸는 것. 동빈이의 최종 목표는 배열 A의 모든 원소의 합이 최대가 되도록 하는 것이다.

N,K그리고 배열 A와 B의 정보가 주어졌을때 최대 K번 바꿔치기 연산을 수행하여 만들 수 있는 배열 A의 모든 원소의 합의 최댓값을 출력하는 프로그램을 작성

In [28]:
n,k = map(int, input().split())
a = list(map(int,input().split()))
b = list(map(int,input().split()))

a.sort()
b.sort(reverse=True)

for i in range(k):
    if a[i]<b[i]:
        a[i], b[i] = b[i], a[i]
    else:
        break
    
print(sum(a))

5 3
1 2 5 4 3
5 5 6 6 5
26


In [7]:
survey = ["AN", "CF", "MJ", "RT", "NA"]
choices = [5, 3, 2, 7, 5]

def cal(first,second,choices,ccti_dict):
    if choices == 1:
        ccti_dict[first]+=3
    elif choices == 2:
        ccti_dict[first]+=2
    elif choices == 3:
        ccti_dict[first]+=1
    elif choices == 5:
        ccti_dict[second]+=1
    elif choices == 6:
        ccti_dict[second]+=2
    else:
        ccti_dict[second]+=3
    return ccti_dict

ccti_dict = {'R':0,'T':0,'C':0,'F':0,'J':0,'M':0,'A':0,'N':0,}
for i in range(len(survey)):
    first = survey[i][0]
    second = survey[i][1]
    cal(first,second,choices[i],ccti_dict)

In [8]:
ccti_dict

{'R': 0, 'T': 3, 'C': 1, 'F': 0, 'J': 0, 'M': 2, 'A': 1, 'N': 1}

In [12]:
anstring=''
if ccti_dict['R']>=ccti_dict['T']:
    anstring+='R'
else:
    anstring+='T'
if ccti_dict['C']>=ccti_dict['F']:
    anstring+='C'
else:
    anstring+='F'
if ccti_dict['J']>=ccti_dict['M']:
    anstring+='J'
else:
    anstring+='M'
if ccti_dict['A']>=ccti_dict['N']:
    anstring+='A'
else:
    anstring+='N'

In [13]:
anstring

'TCMA'

In [75]:
queue1 = [3, 2, 7, 2]
queue2 = [4, 6, 5, 1]

In [76]:
check_num=0
check_sum=False
for i in range(len(queue1)+len(queue2)):
    if sum(queue1) > sum(queue2):
        temp = queue1[0]
        queue1.remove(temp)
        queue2.append(temp)
        check_num+=1
    elif sum(queue1) < sum(queue2):
        temp = queue2[0]
        queue2.remove(temp)
        queue1.append(temp)
        check_num+=1
    else:
        check_sum=True
        break

In [77]:
check_num

2

In [84]:
max(queue2)>sum(queue1) or max(queue1)>sum(queue2)

False

In [82]:
7%3!=0

True

In [90]:
alp=10
cop=10
problems = [[10,15,2,1,2],[20,20,3,3,4]]

In [91]:
problems[0][0]

10

In [92]:
problems[0][1]

15

In [93]:
len(problems)

2

In [94]:
for i in range(len(problems)):
    print(i)

0
1


In [108]:
def how_st(alp, cop, problems):
    count = 0
    if alp<problems[0]:
        count+=(problems[0]-alp)
    elif cop<problems[1]:
        count+=(problems[1]-cop)
    return count

In [109]:
alp=10
cop=10
problems = [[10,15,2,1,2],[20,20,3,3,4]]

In [110]:
count = how_st(alp, cop, problems[0])
print(count)

5


In [112]:
counts=0
for i in range(len(problems)):
    if i==(len(problems)-1):
        break
    if i==0:
        counts+=how_st(alp, cop, problems[i])
        continue

In [114]:
counts

5

In [147]:
rc = [[1, 2, 3], [4, 5, 6], [7, 8, 9]]

In [148]:

print(swap)

[1, 2, 3]
[4, 5, 6]
[7, 8, 9]
[7, 8, 9]


In [151]:
rc[0][0]

7

In [248]:
rc = [[1, 2, 3, 4], [5, 6, 7, 8], [9, 10, 11, 12]]

In [281]:
def shift_f(rc):
    for i in range(len(rc)):
        if i==0:
            swap=rc[0]
        else:
            swap,rc[i] = rc[i],swap
    rc[0] = swap
    return rc

In [282]:
def rotate_f(rc):
    swap=0
    col_num = len(rc[0])
    row_num = len(rc)

    for i in range(col_num):
        if i==0:
            swap=rc[0][0]
        else:
            swap,rc[0][i] = rc[0][i],swap

    for i in range(1,row_num):
        swap,rc[i][col_num-1] = rc[i][col_num-1],swap
        
    for i in range(1,col_num):
        swap,rc[row_num-1][col_num-i-1] = rc[row_num-1][col_num-i-1],swap

    for i in range(1,row_num):
        swap,rc[row_num-1-i][0] = rc[row_num-1-i][0],swap

    return rc

In [283]:
rc = [[1, 2, 3], [4, 5, 6], [7, 8, 9]]
rc = rotate_f(rc)
rc

[[4, 1, 2], [7, 5, 3], [8, 9, 6]]

In [284]:
rc = shift_f(rc)
rc

[[8, 9, 6], [4, 1, 2], [7, 5, 3]]