# 5. 간단하면서 기본적인 정렬 알고리즘: 선택 정렬과 삽입 정렬

## 선택 정렬
- 리스트에서 N번 만큼 가장 작은 수를 찾아 맨 앞으로 보내는 정렬
- 아이디어가 매우 간단하다.
- 시간복잡도
  - N + (N-1) + ... + 3 + 2의 연산횟수를 가지므로 (N^2 + N - 2)의 연산횟수를 가진다고 표현 가능하다.
  - 이를 빅오 표기법에 따라 O(N^2)의  시간 복잡도로 나타낸다.
- 공간복잡도는 O(N)이다.

In [3]:
# 선택 정렬 구현
import random

array = [random.randint(0,100) for i in range(10)]
print('정렬 전 데이터 : ', array)

for i in range(len(array)):
  min_index = i # 처음은 i를 가장 작은 원소의 인덱스로 지정
  for j in range(i + 1, len(array)): # i + 1인덱스이상부터 len(array)미만 횟수만큼 비교
    if array[min_index] > array[j]:
      min_index = j # 현재의 최소 인덱스 원소보다 j 인덱스 원소의 값이 작다면 최소 인덱스를 j로 바꿔준다.
  array[i], array[min_index] = array[min_index], array[i] # 인덱스 i의 원소와 인덱스 두번째 for 문에서 도출한 min_index의 값을 바꿔준다.

print('정렬 후 데이터 : ', array)

정렬 전 데이터 :  [0, 25, 9, 55, 61, 69, 21, 28, 67, 40]
정렬 후 데이터 :  [0, 9, 21, 25, 28, 40, 55, 61, 67, 69]


## 삽입 정렬
- 처리되지 않은 데이터를 하나씩 골라 적절한 위치에 삽입하는 정렬
- 선택 정렬에 비해 구현 난이도가 높지만, 시간 복잡도가 낮아 효율적이다.
- 시간 복잡도
  - 삽입 정렬의 시간 복잡도는 기본적으로는 O(N^2)이다.
  - 하지만 리스트가 거의 정렬되어 있다면 else : break에 의해 두번째 for문을 거의 실행하지 않으므로 최선의 경우 O(N)의 시간 복잡도를 가지는 가장 빠른 정렬이다.
- 공간복잡도는 O(N)이다.

In [None]:
# 삽입 정렬 구현

array = [random.randint(0,100) for i in range(10)]
print('정렬 전 데이터 : ', array)

for i in range(1, len(array)):
  for j in range(i, 0, -1): # 인덱스 i부터 1까지 1씩 감소하며 반복하므로 i가 3일때는 j가 3부터 시작해서 1까지 감소하며 반복
    if array[j] < array[j-1]: # 낮은 인덱스의 값이 더 크다면
      array[j], array[j-1] = array[j-1], array[j] # 낮은 인덱스의 값을 높은 인덱스(j)의 값과 바꿔준다.
    else: # 낮은 인덱스의 값이 더 작다면
      break # if문을 빠져나온다.

print('정렬 후 데이터 : ', array)

정렬 전 데이터 :  [61, 6, 33, 15, 43, 52, 92, 81, 25, 85]
정렬 후 데이터 :  [6, 15, 25, 33, 43, 52, 61, 81, 85, 92]


# 6. 더 빠른 정렬 알고리즘: 퀵 정렬과 계수 정렬


## 퀵 정렬
- 피벗 데이터를 설정하고 피벗보다 큰 데이터와 작은 데이터의 위치를 바꾸는 정렬
- 대부분의 경우에 가장 적합하며, 충분히 빠르다.
- 보통 피벗 데이터는 첫 번째 데이터로 한다.
- 동작 방법
  - (1)왼쪽에서부터 피벗보다 큰 데이터와 (1)오른쪽에서부터 기준보다 작은 데이터를 선택해 (1)과 (2)의 위치를 바꿔준다.
  - 만약 (1)과 (2)의 위치가 서로 엇갈린다면 피벗과 (2)의 위치를 서로 바꿔준다.
  - 이제 피벗을 기준으로 왼쪽은 작은 데이터 오른쪽은 큰 데이터로 분할이 이루어졌다.
  - 다시 첫 번째 데이터를 피벗으로 설정하고 위의 과정을 재귀적으로 반복한다.
- 이상적인 경우 분할이 절반씩 일어난다면 O(NlogN)의 시간 복잡도를 기대할 수 있지만 최악의 경우 O(N^2)의 시간 복잡도를 가진다.
- 공간복잡도는 O(N)이다.

In [None]:
# 퀵 정렬 구현

array = [random.randint(0,100) for i in range(10)]
print('정렬 전 데이터 : ', array)

def quick_sort(array, start, end):
  if start >= end: # 분할할 것이 남아있지 않은 경우(원소가 1개인 경우) 종료
    return
  pivot = start # 피벗은 첫번째 원소
  left = start + 1
  right = end
  while(left <= right): # 왼쪽과 오른쪽이 엇갈리기 전까지 계속 반복
    while(left <= end and array[left] <= array[pivot]): # 왼쪽 데이터가 끝에 도달하기 전이고 피벗의 크기보다 작다면
      left += 1 # 왼쪽 데이터를 인덱스+1의 데이터로 바꾼다
    while(right > start and array[right] >= array[pivot]): # 오른쪽 데이터가 처음에 도달하기 전이고 피벗의 크기보다 크다면
      right -= 1 # 오른쪽 데이터를 인덱스-1의 데이터로 바꾼다.
    if(left > right): # while문을 빠져나왔으므로 여기서는 왼쪽 데이터가 피벗보다 크고 오른쪽 데이터가 피벗보다 작은 상태에서 왼쪽이 오른쪽보다 커서 엇갈린 경우 if문 실행
      array[right], array[pivot] = array[pivot], array[right] # 왼쪽과 오른쪽이 엇갈렸으므로 피벗과 오른쪽 데이터의 위치를 바꿔주는데 이때 분할이 완료된 것이다.
    else:
      array[left], array[right] = array[right], array[left] # 왼쪽과 오른쪽이 엇갈리지 않았으므로 왼쪽과 오른쪽 데이터를 서로 바꿔준다.

  # while문을 빠져나왔을 때는 왼쪽과 오른쪽이 서로 엇갈려 분할이 완료되었을 때이다.
  quick_sort(array, start, right - 1) # 피벗과 오른쪽의 위치가 서로 바뀌었으므로 right-1은 피벗보다 -1의 위치를 나타내고, 따라서 이 코드는 피벗 기준으로 왼쪽에 다시 퀵정렬 수행을 의미한다.
  quick_sort(array, right + 1, end) # 마찬가지로 피벗 기준으로 오른쪽에 다시 퀵정렬 수행을 의미한다.

quick_sort(array, 0, len(array) - 1)
print('정렬 후 데이터 : ', array)

정렬 전 데이터 :  [24, 87, 79, 44, 18, 86, 77, 6, 17, 37]
정렬 후 데이터 :  [6, 17, 18, 24, 37, 44, 77, 79, 86, 87]


In [None]:
# 퀵 정렬 구현(보다 간단한 방식)

array = [random.randint(0,100) for i in range(10)]
print('정렬 전 데이터 : ', array)

def quick_sort(array):
  if len(array) <= 1: # 분할할 것이 남아있지 않은 경우(원소가 1개인 경우) 종료
    return array
  pivot = array[0] # 피벗은 첫번째 원소
  tail = array[1:] # 피벗을 제외한 나머지 리스트

  left_side = [x for x in tail if x <= pivot] # 분할된 왼쪽 부분
  right_side = [x for x in tail if x > pivot] # 분할된 오른쪽 부분

  return quick_sort(left_side) + [pivot] + quick_sort(right_side) # 분할 후 왼쪽과 오른쪽 부분에 각각 퀵정렬 수행하고 그 사이에 피벗을 넣어 리스트 반환

print('정렬 후 데이터 : ', quick_sort(array))

정렬 전 데이터 :  [5, 86, 8, 55, 81, 10, 74, 32, 86, 6]
정렬 후 데이터 :  [5, 6, 8, 10, 32, 55, 74, 81, 86, 86]


## 계수 정렬
- 특정한 조건이 부합될 때만 사용할 수 있지만 매우 빠르게 동작하는 정렬
- 데이터의 크기 범위가 제한되어 데이터가 정수 형태로 표현 가능할 때 사용가능하다.
- 데이터 개수가 N, 데이터 최댓값이 K일 때, 최악의 경우에도 O(N+K)의 시간복잡도를 보장한다.
- 동작 방법
  - 가장 작은 데이터부터 가장 큰 데이터까지의 범위가 모두 담기도록 리스트를 생성 ex) 범위가 1~9라면 길이가 9인 리스트 생성
  - 데이터를 하나씩 확인하며 데이터 값과 동일한 인덱스의 Count를 1씩 증가시킨다.
  - 최종 리스트에는 각 데이터가 몇 번 등장했는지 횟수가 기록된다.
  - 리스트의 첫 번째 인덱스부터 Count만큼 각 인덱스를 출력하면 데이터가 정렬된 형태로 출력된다.
- 계수 정렬은 데이터 개수N에 비해 범위 K가 지나치게 크면 심각한 비효율성을 초래할 수 있다. 따라서 동일한 값을 가지는 데이터가 여러 개 등장한 경우 효율적이다.


In [None]:
# 계수 정렬 구현
# 모든 원소의 값이 0보다 크거나 같다고 가정

array = [random.randint(0,10) for i in range(20)]
print('정렬 전 데이터 : ', array)

count = [0] * (max(array) + 1) # 모든 데이터의 범위가 모두 담기도록 리스트 생성

for i in range(len(array)):
  count[array[i]] += 1 # array의 데이터 = count의 index인 경우 count의 value에 +1 해준다.

print ('정렬 후 데이터 :', end=' ')

for i in range(len(count)): # count의 길이만큼 반복
  for j in range(count[i]): # count의 각 인덱스에 해당하는 value값 즉 카운팅 된 만큼 데이터 i를 출력하여 준다.
    print(i, end=' ')

정렬 전 데이터 :  [1, 9, 2, 1, 9, 9, 10, 9, 7, 8, 9, 2, 7, 2, 0, 7, 3, 8, 5, 10]
정렬 후 데이터 : 0 1 1 2 2 2 3 5 7 7 7 8 8 9 9 9 9 9 10 10 

# 7. 정렬 알고리즘 비교 및 기초 문제 풀이


- 대부분의 프로그래밍 언어에서 지원하는 표준 정렬 라이브러리는 최악의 경우에도 O(NlogN)을 보장하도록 설계되어 있다.

## 선택 정렬과 기본 라이브러리 수행 시간 비교

In [4]:
# 선택 정렬의 수행 시간
from random import randint
import time

# 배열에 10,000개의 정수를 삽입
array = [random.randint(1,100) for i in range(10000)]

# 선택 정렬 프로그램 성능 측정
start_time = time.time()

# 선택 정렬 프로그램 소스코드
for i in range(len(array)):
  min_index = i # 처음은 i를 가장 작은 원소의 인덱스로 지정
  for j in range(i + 1, len(array)):
    if array[min_index] > array[j]:
      min_index = j
  array[i], array[min_index] = array[min_index], array[i]

# 측정 종료
end_time = time.time()
# 수행 시간 출력
print('선택 정렬 수행 시간 : ', end_time - start_time)

선택 정렬 수행 시간 :  9.716703414916992


In [None]:
# 기본 정렬 라이브러리 수행 시간

# 배열에 10,000개의 정수를 삽입
array = [random.randint(1,100) for i in range(10000)]

# 기본 정렬 라이브러리 성능 측정
start_time = time.time()

# 기본 정렬 라이브러리 사용
array.sort()

# 측정 종료
end_time = time.time()
# 수행 시간 출력
print('기본 정렬 라이브러리 수행 시간 : ', end_time - start_time)

- 선택 정렬은 O(N^2)의 시간복잡도를 가지고 기본 정렬은 O(NlogN)의 시간 복잡도를 가지므로, 둘의 수행 시간 차이가 생긴다.

## 두 배열의 원소 교체

In [None]:
# 입력
n, k = map(int, input().split()) # N과 K를 입력 받기
a = list(map(int, input().split())) # 배열 A의 모든 원소 입력 받기
b = list(map(int, input().split())) # 배열 B의 모든 원소 입력 받기

# 시간 측정 시작
start_time = time.time()

# 소스코드 구현

def change(k, a, b):
  a.sort()
  b.sort()
  for i in range(k):
    a[i], b[-i] = b[-i], a[i]
  return sum(a)

change(k, a, b)

# 측정 종료
end_time = time.time()

# 수행 시간 출력
print('소스코드 수행 시간 : ', end_time - start_time)

# 8. 그래프 탐색의 기본, DFS와 BFS

## DFS(깊이 우선 탐색)
- DFS는 그래프에서 깊은 부분을 우선적으로 탐색하는 알고리즘
- 동작 방법
  - 탐색 시작 노드를 스택에 삽입하고 방문처리한다.
  - 스택의 최상단 노드에 방문하지 않은 인접한 노드가 있으면 방문하지 않은 노드를 스택에 넣고 방문처리한다(여러개라면 방문 기준에 따라 방문)
  - 스택의 최상단 노드에 방문하지 않은 인접한 노드가 없으면 스택에서 최상단 노트를 꺼낸다.
  - 2,3번 과정을 수행할 수 없을 때까지 반복한다.

In [None]:
# DFS 구현
graph = [
    [], # 1번 노드
    [2,3,8], # 1번 노드와 연결된 노드
    [1,7], # 2번 노드와 연결된 노드
    [1,4,5],
    [3,5],
    [3,4],
    [7],
    [2,6,8],
    [1,7]
]
  # 노드가 연결된 정보를 표현하는 2차원 리스트

visited = [False] * 9
  # 각 노드의 방문정보를 기록, 방문하면 True로 변환

def dfs(graph, v, visited):
    # 노드정보가 담긴 graph, 현재 노드인 v, 방문정보가 담긴 visited를 매개변수로 함
  visited[v] = True
    # 현재 노드인 v를 이용해 visited의 v인덱스를 True로 바꿔 현재 노드를 방문처리
  print(v, end=' ')
    # v로 방문처리가 이루어지는 순서를 출력한다.
  for i in graph[v]:
    # 현재 노드의 연결된 노드 정보를 불러옴
    if not visited[i]:
      # 만약 현재 노드와 연결된 노드 중 하나가 True가 아니라면 실행, 즉 방문되지 않았다면 실행
      dfs(graph, i, visited)

dfs(graph, 1, visited)
  # 정의된 DFS 함수 호출

1 2 7 6 8 3 4 5 

## BFS(너비 우선 탐색)
- 그래프에서 가까운 노드부터 우선적으로 탐색하는 알고리즘
- 큐 자료구조를 이용하여 동작한다.
- 동작 방법
  - 시작 노드를 큐에 삽입하고 방문 처리를 한다.
  - 큐에서 노드를 꺼낸 뒤 해당 노드의 인접 노드 중 방문하지 않은 노드를 한번에 모두 큐에 삽입하고 방문처리한다.
  - 2번 과정을 수행할 수 없을 때까지 반복한다.
- 최단 거리 문제에 응용된다.

In [5]:
# BFS 구현
from collections import deque

graph = [
    [], # 1번 노드
    [2,3,8], # 1번 노드와 연결된 노드
    [1,7], # 2번 노드와 연결된 노드
    [1,4,5],
    [3,5],
    [3,4],
    [7],
    [2,6,8],
    [1,7]
]
  # 노드가 연결된 정보를 표현하는 2차원 리스트

visited = [False] * 9
  # 각 노드의 방문정보를 기록, 방문하면 True로 변환

def bfs(graph, start, visited):
  queue = deque([start])
    # queue 구현을 위해 deque 라이브러리를 사용한다.
  visited[start] = True
    # 현재 노드를 방문처리
  while queue:
    # queue에 데이터가 있는 경우 True이므로 반복
    v = queue.popleft()
      # queue에서 하나의 원소를 뽑아 v에 할당
    print(v, end=' ')
      # v를 출력해 방문처리되어 queue를 나간 순서를 기록한다.
    for i in graph[v]:
      if not visited[i]:
        # 방문처리되지 않았으면(False이면) 실행
        queue.append(i)
          # 스택에 노드 입력
        visited[i] = True
          # 스택에 넣고 바로 방문처리
          # for문 아래에서 실행되므로 여기서 인접 노드를 한번에 방문처리 함을 알 수 있다.

bfs(graph, 1, visited)
  # 정의된 BFS 함수 호출

1 2 3 8 7 4 5 6 

# 9. 그래프 탐색 실습, DFS와 BFS 기초 문제 풀이

In [6]:
import numpy as np
import pandas as pd

## 음료수 얼려 먹기
- 입력 조건
  - 첫 번째 줄에 얼음틀의 세로 길이 N과 가로길이 M이 주어짐.
  - 두 번째 줄부터 N+1번째 줄까지 얼음 틀의 형태가 주어짐.
  - 구멍이 뚫려있는 부분은 0, 않은 부분은1
- 출력 조건
  - 한 번에 만들 수 있는 아이스크림의 개수 출력

In [9]:
# 입력
n, m = map(int, input().split())
  # input으로 입력 받고, 입력을 공백 기준으로 split하여 리스트 형태로 반환한다.
  # map함수를 통해 int함수를 입력 받은 객체의 각 요소에 적용한다.
  # int 함수가 적용된 객체를 n, m에 할당한다.
graph = []
for i in range(n):
  graph.append(list(map(int, input())))
    # 2차원 리스트의 맵 정보 입력 받기(공백없는 문자열로 입력)

# 출력
result = 0
for i in range(n):
  for j in range(m):
    # n * m 크기의 각 위치에서 dfs수행
    if dfs(i,j) == True:
      result += 1

# dfs 함수
# dfs 특정 노드를 방문하고 연결된 모든 노드들도 방문
def dfs(x, y):
  if x <= -1 or x >= n or y <= -1 or y >= m:
    # 주어진 범위 벗어나면 종료
    return False
  if graph[x][y] == 0:
    # 현재 노드를 아직 방문하지 않았다면
    graph[x][y] = 1
      # 해당 노드 방문 처리하고
      # 상하좌우의 노드에 대해서도 dfs 수행
    dfs(x-1, y)
    dfs(x, y-1)
    dfs(x+1, y)
    dfs(x, y+1)
    return True
  return False

  print(result)

4 5
11010
11000
11100
00011
2


## 미로 탈출 문제
- 입력 조건
  - 첫째 줄에 두 정수 N, M(4 <= N,M <= 200)이 주어진다.
  - 다음 N개의 줄에는 각각 M개의 정수로 미로의 정보가 주어진다.
  - 각각의 수들은 공백 없이 붙어서 입력으로 제시된다.
  - 시작칸과 마지막 칸은 항상 1이다.
- 출력 조건
  - 첫째 줄에 최소 이동 칸의 개수를 출력한다.

In [12]:
from collections import deque

# 입력
n, m = map(int, input().split())
graph = []
for i in range(n):
  graph.append(list(map(int, input())))

# 출력
dx = [-1, 1, 0, 0]
dy = [0, 0, -1, 1]
  # 상하좌우로 이동하기 위한 방향데이터 정의

# bfs 함수
def bfs(x, y):
  queue = deque()
  queue.append((x, y))
  while queue:
    x,y = queue.popleft()
      # 큐에 데이터 있으면 큐가 빌 때까지 빼낸다.
    for i in range(4):
      nx = x + dx[i]
      ny = y + dy[i]
        # 현재 위치에서 네 방향으로의 위치 확인
      if nx < 0 or nx >= n or ny < 0 or ny >= m:
        continue
        # 주어진 범위 벗어나면 무시
      if graph[nx][ny] == 0:
          continue
          # 벽인 경우에도 무시
      if graph[nx][ny] == 1:
          graph[nx][ny] = graph[x][y] + 1
          queue.append((nx, ny))
  return graph[n-1][m-1]
   # 가장 오른쪽 아래까지의 최단 거리 반환

print(bfs(0, 0))

5 6
101010
111111
000001
111111
111111
10
