### Chapter 6 정렬

#### 선택 정렬
- 가장 작은 데이터를 선택해 맨 앞에 있는 데이터와 바꾸고, 그 다음 작은 데이터를 선택해 앞에서 두 번째 데이터와 바꾸는 과정 반복
- 가장 원시적인 방법으로 매번 '가장 작은 것을 선택'
- 시간복잡도 O(N^2)
- 효율은 안좋지만 코딩테스트 환경에서는 가장 작은 데이터를 찾을 일이 잦다.

In [2]:
# 예제 1
array = [7, 5, 9, 0, 3, 1, 6, 2, 4, 8]

for i in range(len(array)):
    min_index = i
    for j in range(i + 1, len(array)):
        if array[min_index] > array[j]:
            min_index = j
    array[i], array[min_index] = array[min_index], array[i]

print(array)

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]


In [3]:
# 예제 2 스와프
array = [3, 5]
array[0], array[1] = array[1], array[0]

print(array)

[5, 3]


#### 삽입 정렬
- 데이터를 하나씩 확인해서 각 데이터를 적절한 위치에 삽입
- 거의 정렬된 데이터에 효율적이다. 하지만 정렬되지 않은 데이터는 선택정렬과 비슷하다.
- 시간복잡도 : O(N^2) / 정렬된 상황의 시간복잡도 : O(N)

In [5]:
# 예제 1
array = [7, 5, 9, 0, 3, 1, 6, 2, 4, 8]

for i in range(1, len(array)):
    for j in range(i, 0, -1):
        if array[j] < array[j - 1]:
            array[j], array[j - 1] = array[j - 1], array[j]
        else:
            break

print(array)

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]


#### 퀵 정렬
- 기준 데이터를 설정하고 기준보다 큰 데이터와 작은 데이터의 위치를 바꾸는 법
- 시간복잡도 : O(NlogN) / 최악의 경우 시간복잡도 : O(N^2)
- 이미 정렬된 데이터에서는 느리게 작동한다.

In [6]:
# 예제 1
array = [7, 5, 9, 0, 3, 1, 6, 2, 4, 8]

def quick_sort(array, start, end):
    if start >= end:
        return
    pivot = start
    left = start + 1
    right = end
    while left <= right:
        while left <= end and array[left] <= array[pivot]:
            left += 1
        while right > start and array[right] >= array[pivot]:
            right -= 1
        if left > right:
            array[right], array[pivot] = array[pivot], array[right]
        else:
            array[left], array[right] = array[right], array[left]
    quick_sort(array, start, right - 1)
    quick_sort(array, right + 1, end)

quick_sort(array, 0, len(array) - 1)
print(array)

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]


In [9]:
# 파이썬의 장점을 살린 퀵 정렬 예제 2
array = [5, 7, 9, 0, 3, 1, 6, 2, 4, 8]

def quick_sort(array):
    if len(array) <= 1:
        return array
    
    pivot = array[0]
    tail = array[1:]
    
    left_side = [x for x in tail if x <= pivot]
    right_side = [x for x in tail if x > pivot]
    
    return quick_sort(left_side) + [pivot] + quick_sort(right_side)

print(quick_sort(array))

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]


#### 계수 정렬
- 특정한 조건이 부합할 때만 사용할 수 있지만, 매우 빠른 정렬 알고리즘
- 모든 데이터가 양의 정수일 때 시간 복잡도 : 코딩테스트 환경에서는 최악의 경우에도 O(N + K)

In [10]:
# 예제 1
array = [7, 5, 9, 0, 3, 1, 6, 2, 9, 1, 4, 8, 0, 5, 2]

count = [0] * (max(array) + 1)

for i in range(len(array)):
    count[array[i]] += 1

for i in range(len(count)):
    for j in range(count[i]):
        print(i, end = ' ')

0 0 1 1 2 2 3 4 5 5 6 7 8 9 9 

#### 파이썬의 정렬 라이브러리
- sorted() 함수 제공 / 시간 복잡도 : O(NlogN) 보장

- 정렬 라이브러리 : 단순히 정렬 기법을 알고 있는지 물어보는 문제
- 선택, 삽입, 퀵 정렬 등 : 정렬 알고리즘의 원리에 대해서 물어보는 문제
- 계수 정렬 등 : 퀵 정렬 기반의 정렬 라이브러리로는 풀 수 없을 때 (기존 라이브러리의 구조적인 개선을 거쳐야 됨)

In [11]:
# 정렬 라이브러리 예제 1
array = [7, 5, 9, 0, 3, 1, 6, 2, 4, 8]

result = sorted(array)
print(result)

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]


In [12]:
# 정렬 라이브러리 예제 2
array.sort()
print(array)

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]


In [13]:
# 정렬 라이브러리 예제 3
array = [('바나나', 2), ('사과', 5), ('당근', 3)]

def setting(data):
    return data[1]

result = sorted(array, key = setting)
print(result)

[('바나나', 2), ('당근', 3), ('사과', 5)]


#### 위에서 아래로

In [19]:
n = int(input())
arr = []

for i in range(n):
    a = int(input())
    arr.append(a)

brr = sorted(arr, reverse = True)

for i in range(n):
    print(brr[i], end = ' ')

3
15
27
12
27 15 12 

#### 성적이 낮은 순서로 학생 출력하기

In [24]:
n = int(input())
arr = []

for i in range(n):
    a = tuple(input().split())
    arr.append(a)

brr = sorted(arr)

for i in range(n):
    print(brr[i][0], end = ' ')

2
홍길동 95
이순신 77
이순신 홍길동 

#### 두 배열의 원소 교체

In [7]:
n, k = map(int, input(). split())
arr = list(map(int, input().split()))
brr = list(map(int, input().split()))


arr = sorted(arr)
brr = sorted(brr, reverse = True)

for i in range(k):
    if arr[i] < brr[i]:
        arr[i], brr[i] = brr[i], arr[i]
    else:
        break
    
print(sum(arr))

5 3
1 2 5 4 3
5 5 6 6 5
26


### Chapter 7 이진 탐색

#### 범위를 반씩 좁혀가는 탐색

#### 순차 탐색
- 리스트 안에 있는 특정한 데이터를 찾기 위해 앞에서부터 데이터를 하나씩 차례대로 확인하는 방법
- 정렬되지 않은 리스트에서 데이터를 찾아야 할 때 사용
- count 함수도 내부에서 순차 탐색이 수행
- 시간 복잡도 : 최악의 경우 O(N)

In [1]:
# 순차 탐색 소스코드
def sequential_search(n, target, array):
    for i in range(n):
        if array[i] == target:
            return i + 1

print("생성할 원소 개수를 입력한 다음 한 칸 띄고 찾을 문자열을 입력하세요.")
input_data = input().split()
n = int(input_data[0])
target = input_data[1]

print("앞서 적은 원소 개수만큼 문자열을 입력하세요. 구분은 띄어쓰기 한 칸으로 합니다.")
array = input().split()

print(sequential_search(n, target, array))

생성할 원소 개수를 입력한 다음 한 칸 띄고 찾을 문자열을 입력하세요.
5 Dongbin
앞서 적은 원소 개수만큼 문자열을 입력하세요. 구분은 띄어쓰기 한 칸으로 합니다.
Haneol Jonggu Dongbin Taeil Sangwook
3


#### 이진 탐색
- 반으로 쪼개면서 탐색하기
- 배열 내부의 데이터가 정렬되어 있어야만 사용할 수 있는 알고리즘
- 위치를 나타내는 변수 3개를 사용 (시작점, 끝점, 중간점)
- 찾으려는 데이터와 중간점 위치에 있는 데이터를 반복적으로 비교해서 원하는 데이터를 찾는 방법
- 시간 복잡도 : O(logN) / 퀵 정렬과 공통점이 있음

In [2]:
# 재귀함수를 이용한 이진 탐색
def binary_search(array, target, start, end):
    if start > end:
        return None
    mid = (start + end) // 2
    if array[mid] == target:
        return mid
    elif array[mid] > target:
        return binary_search(array, target, start, mid - 1)
    else:
        return binary_search(array, target, mid + 1, end)

n, target = list(map(int, input().split()))
array = list(map(int, input().split()))

result = binary_search(array, target, 0, n - 1)

if result == None:
    print("원소가 존재하지 않습니다.")
else:
    print(result + 1)

10 7
1 3 5 7 9 11 13 15 17 19
4


In [3]:
# 반복문을 이용한 이진 탐색
def binary_search(array, target, start, end):
    while start <= end:
        mid = (start + end) // 2
        
        if array[mid] == target:
            return mid
        elif array[mid] > target:
            end = mid - 1
        else:
            start = mid + 1
    return None

n, target = list(map(int, input().split()))
array = list(map(int, input().split()))

result = binary_search(array, target, 0, n - 1)

if result == None:
    print("원소가 존재하지 않습니다.")
else:
    print(result + 1)

10 7
1 3 5 7 9 11 13 15 17 19
4


#### 코딩 테스트에서의 이진 탐색
- 탐색 범위가 2000만을 넘어가면 이진 탐색으로 접근해보길 권함.
- 전 세계에 이진 탐색 알고리즘을 제대로 작성할 수 있는 사람은 10% 내외 (암기하란 뜻)

#### 트리 자료 구조
- 트리는 항상 정렬되어있기때문에 이진 탐색과 유사하다.
- 루트 노드 : 트리 최상단 / 단말 노드 : 트리 최하단 / 서브 트리 : 트리에서 일부를 떼어내고 트리 구조이며 이를 뜻함
- 계층적이고 정렬된 데이터를 다루기에 적합

#### 이진 탐색 트리
- 부모 노드보다 왼쪽 자식 노드가 작다.
- 부모 노드보다 오른쪽 자식 노드가 크다.
- 왼쪽 자식 노드 < 부모 노드 < 오른쪽 자식 노드

#### 빠르게 입력받기
- 데이터의 개수가 1000만개를 넘어가거나, 탐색 범위의 크기가 1000억 이상이라면 이진 탐색 알고리즘을 의심
- 이럴 때는 이진탐색을 의심하며 아래 소스코드를 외워 놓자

In [5]:
# 주피터에서는 stdin이 구현이 안된다...
import sys

input_data = sys.stdin.readline().rstrip()

print(input_data)




#### 부품 찾기

In [16]:
# 내 답안 - 교재의 집합자료형과 동일
import time
start_time = time.time()

n = int(input())
arr = list(map(int, input().split()))
m = int(input())
brr = list(map(int, input().split()))

for i in range(m):
    if brr[i] in arr:
        print('yes')
    else:
        print('no')

end_time = time.time()
print(end_time - start_time)

5
8 3 7 9 2
3
5 7 9
no
yes
yes
4.698369264602661


In [12]:
# 답안 예시 - 이진 탐색
def binary_search(array, target, start, end):
    while start <= end:
        mid = (start + end) // 2
        
        if array[mid] == target:
            return mid
        elif array[mid] > target:
            end = mid - 1
        else:
            start = mid + 1
    
    return None

start_time = time.time()

n = int(input())
arr = list(map(int, input().split()))
m = int(input())
brr = list(map(int, input().split()))

for i in brr:
    result = binary_search(arr, i, 0, n - 1)
    if result != None:
        print('yes', end = ' ')
    else:
        print('no', end = ' ')

end_time = time.time()
print(end_time - start_time)

5
8 3 7 9 2
3
5 7 9
no yes yes 4.4572412967681885


In [13]:
# 답안 예시 - 계수 정렬
start_time = time.time()

n = int(input())
array = [0] * 1000001

for i in input().split():
    array[int(i)] = 1

m = int(input())
x = list(map(int, input().split()))

for i in x:
    if array[i] == 1:
        print('yes', end = ' ')
    else:
        print('no', end = ' ')

end_time = time.time()
print(end_time - start_time)

5
8 3 7 9 2
3
5 7 9
no yes yes 4.426652669906616


#### 떡볶이 떡 만들기

In [8]:
# 여기 떡볶이 떡 문제 조건이 100만을 넘어가서 import sys
# input_data = sys.stdin.readline().rstrip() 써야 되는데... 주피터라 걍 input() 씀
n, m = map(int, input().split())
arr = list(map(int, input().split()))

start = 0
end = max(arr)

while start <= end:
    result = 0
    mid = (start + end) // 2
    
    for i in arr:
        if i > mid:
            total += i - mid
    if total < m:
        end = mid - 1
    else:
        result = mid
        start = mid + 1
    
print(result)

4 6
19 15 10 17
19
