### 정렬 알고리즘

Sorting.
- 프로그램의 가장 기본이 된다.
- 면접 단골 문제
- 이진탐색 알고리즘 전처리 과정
- 상황별로 효율성 상이 <- 상황파악 중요

# Sorting 알고리즘 종류:
- 선택정렬(Selection) : 가장 기본. 가장 느림
- 삽입정렬(insertion) : 현재 데이터 상태가 완전정렬과 가까우면 가까울수록 빠르다
- 퀵(Quick) : 일반적으로 가장 빠름.
- 계수정렬(Count) : 특정조건에서 가장 빠른

## 선택정렬
제일 작은 데이터를 제일 앞에 있는 데이터와 스왑(SWAP) 두 번째 작은 데이터를 제일 앞에서 두 번째 데이터와 스왑한다.

In [3]:
array = [7, 5, 9, 0, 3, 1, 6, 2, 4, 8]

for i in range(len(array)):
    min_index = i

    for j in range(i + 1, len(array)):
        if array[min_index] > array[j]:
            min_index = j

    # swap = a, b = b, a
    array[i], array[min_index] = array[min_index], array[i]  

array

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]

In [2]:
# SWAP
리스트 = [1, 7]

리스트[0], 리스트[1] = 리스트[1], 리스트[0]

리스트

[7, 1]

### 선택정렬의 시간 복잡도
- N - 1 만큼 swap : 가장 작은 수를 맨 앞으로 보낸다.
- 가장 작은 수를 찾는 비교 연산 N + (N-1) + (N-2) ...

O(N^2) : 정렬 대상이 100개 증가할 때 수행시간이 1000배 증가한다.

## 삽입정렬(insertion sorting)
데이터를 개별적으로 확인하되, 각 데이터를 적절한 위치에 삽입한다.
- 두 번째 데이터부터 정렬을 시작한다.

In [4]:
arry = [7, 5, 9, 0, 3, 1, 6, 2, 4, 8]

for i in range(1, len(array)):
    for j in range(i, 0, -1):
        if array[j] < array[j - 1]: # 한 칸씩 왼쪽으로 이동
           array[j], array[j - 1] = array[j - 1], array[j]
        else:
            break # 자기보다 작은 데이터를 만나면 그 위치에 멈춤

array 

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]

### 삽입정렬의 시간복잡도
O(N^2)
- 현재 데이터의 정렬상태가 완전 정렬상태에 가까울수록 선택정렬보다 빠르다.

## 퀵 정렬
- 일반적인 상황에서 일반적으로 가장 빠르다 : 가장 많이 사용한다.
- 정렬 라이브러리의 기본 알고리즘

#### 동작방식
1. 기준 설정
2. 큰 수와 작은 수 swap : pivot을 기준으로 교환 기준 설정
    - 파티션에서 제일 먼저 나오는 요소를 pivot으로 설정한다.
3. 큰 수와 작은 수 가 cross가 된다면 pivot과 작은 수를 swap해주고, 기존 pivot값을 기준으로 리스트를 반으로 나누어 준다.
(이 때 나누어지는 토막들을 보고 division/partition이라고 한다.)

-> merge, heap 등 고급정렬 방식으로 확장됨

In [7]:
arry = [7, 5, 9, 0, 3, 1, 6, 2, 4, 8]

def quick_sort(array):
    if len(array) <= 1:
        return array
    pivot = array[0] # 첫 번째 요소를 pivot으로 설정
    tail = array[1:] # pivot을 제외한 나머지

    left_side = [x for x in tail if x <= pivot]
    right_side = [x for x in tail if x > pivot]

    return quick_sort(left_side) + [pivot] + quick_sort(right_side)

quick_sort(array)

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]

In [None]:
# [x for x in tail if x <= pivot]
for x in tail:
    if x <= pivot:
        x 값을 정해줘라

### 퀵 정렬의 시간 복잡도

평균적으로 : O(NlogN)
- 데이터가 완전 무작위로 입력될 경우 퀵정렬의 성능이 좋다.

최악의 경우 : O(N^2)
- 데이터가 이미 정렬되어 이쓴ㄴ 경우 가장 느리다.

## 계수정렬(Count Sort)
특정 조건에서 매우 빠름 : '데이터의 크기 범위가 제한되어 정수 형태로만 표현할 수 있을 때'
- 0 <= N <= 1,000,000 사이의 정수값을 가질 때 빠르다.
<- 성적 데이터 정렬

#### 작동원리 
- 가장 큰 데이터와 가장 작은 데이터의 범위를 모두 담을 수 있는 0으로 이루어진 리스트 선언
- 데이터를 하나씩 확인하여 데이터의 값과 동일한 인덱스의 데이터를 1씩 증가한다.

In [9]:
arry = [7, 5, 9, 0, 3, 1, 6, 2, 4, 8]

count = [0] * (max(array) + 1)

for i in range(len(array)):
    count[array[i]] += 1 # 각 데이터에 해당하는 인덱스의 값

for i in range(len(count)): # 리스트에 기록된 정렬정보 확인
    for j in range(count[i]):
        print(i,  end = ' ')

0 1 2 3 4 5 6 7 8 9 

### 이진분류
- 최단경로 찾기
- 다이나믹 프로그래밍
- 그래프 이론

### 순차 탐색
앞에서 부터 하나씩 조회해서 찾아내는 작업
- 탐색 : 원하는 데이터를 찾는 작업

In [11]:
def sequential_search(n, target, array):
    for i in range(n):
        if array[i] == target:
            return i + 1

In [13]:
arry = [7, 5, 9, 0, 3, 1, 6, 2, 4, 8]

sequential_search(len(array), 4, array)

5

시간복잡도 : O(N)

# 이진탐색 : Binary Search
탐색범위를 절반씩 좁혀가며 데이터를 탐색한다.
- *데이터가 정렬되어 있어야 한다.*
- 매우 빠르게 데이터를 찾을 수 있다.

#### NOTE 이진탐색 알고리즘 코드
외워두는 것이 좋다.

## 트리 자료구조.
일반적인 데이터베이스는 트리 자료구조를 갖는다.

### 이진탐색 문제
- 입력 데이터가 많다 (> 1000만개)
- 탐색 범위가 넓다. (> 1000억 이상)
Note 시간제한은 입략 - 출력 모두 포함, 따라서, input()은 느려서 사용하면 안됨. readline() 함수 사용

In [None]:
import sys

# .rstrip()은 문자열 오른쪽에 공백을 제거하는 함수.
input_data = sys.stdin.readline().rstrip()

print(input_data)