# 이진 탐색(Binary Search)
- 검색 범위를 반으로 줄여 나가면서 원하는 데이터를 검색하는 매우 빠른 알고리즘
- 처음 중간의 값을 임의의 값으로 선택하여, 그 값과 찾고자 하는 값의 크고 작음을 비교하는 방식을 채택하고 있다. 처음 선택한 중앙값이 만약 찾는 값보다 크면 그 값은 새로운 최고값이 되며, 작으면 그 값은 새로운 최하값이 된다.
- 입력으로 미리 정렬된 원소 리스트를 받아야 함
- O(log n)

In [6]:
def binary_search(list, item):
    low = 0             # low와 high는 전체 리스트 중에서 어떤 부분을 탐색해야 하는지 알려줌
    high = len(list) - 1

    while low <= high:  # 탐색 범위를 하나로 줄이지 못하면 계속 실행
        mid = (low + high) // 2  # 가운데 숫자를 확인(// 연산자를 쓰는 이유는 정수값을 얻기위해)
        guess = list[mid]
        
        if guess == item:
            return mid
        if guess > item:
            high = mid - 1
        else: # guess < item 인 경우
            low = mid + 1
    return None

In [6]:
my_list = [1, 4, 6, 7, 8, 17, 23]

print(binary_search(my_list, 8))
print(binary_search(my_list, -1))

4
None


# Big O notation  
- 알고리즘이 동작하기 위해 필요한 연산 횟수를 나타냄
- 모든 경우의 연산 횟수를 가지는 최악의 경우에 대한 것
- 많이 사용하는 빅오 실행 시간의 예(빠른 것부터 느린 순서)
  0. O(log n), 로그 시간: 예) 이진 탐색 
  0. O(n), 선형 시간: 예) 단순 탐색
  0. O(n * log n): 예) 퀵 정렬과 같은 빠른 정렬 알고리즘
  0. O(n^2): 예) 선택 정렬과 같은 느린 정렬 알고리즘
  0. O(n!): 예) 외판원 문제와 같이 정말 느린 알고리즘
  0. O(1), 상수 시간: 예) 평균적인 경우의 해시 함수

# 연결 리스트(Linked List)와 배열(Array)
- 연결 리스트(Linked List)
  - 각 노드가 데이터와 포인터를 가지고 한 줄로 연결되어 있는 방식
  - 각 원소에는 목록의 다음 원소에 대한 주소가 저장되어 있음
  - 이웃하지 않은 여러 가지 임의의 메모리 주소들이 하나의 목록으로 연결되어 있는 것 
 
  - 장점
    - 원소를 추가, 삭제하기 좋음
    
  - 단점
    - 특정 원소를 알기 위해서는 앞의 원소부터 순차적으로 찾아 나가야 함(원소가 이웃 하고 있지 않기 때문)
    - 순차 접근(sequential access)만 가능
    
- 배열(Array)
  - 순서대로 번호가 붙은 원소들이 연속적인 형태로 구성된 구조
  - 모든 원소의 주소를 다 알고 있음
  
  - 장점
    - 임의의 원소값을 쉽게 읽을 수 있음(임의 접근(random access)이 가능)
    - 읽기 속도가 빠름
  
  - 단점
    - 원소를 삽입하기 위해서는 다음에 오는 모든 원소의 위치를 바꾸어야 함
***

|      | 배열 | 리스트 |
|------|------|--------|
| 읽기 | O(1) | O(n)   |
| 삽입 | O(n) | O(1)   |
| 삭제 | O(n) | O(1)   |

# 선택 정렬(Selection Sort)
- 주어진 리스트에서 최솟값을 찾아 오름차순으로 정렬하는 방법
- 1. 주어진 리스트 중에 최솟값을 찾는다.
  2. 그 값을 맨 앞에 위치한 값과 교체한다(패스(pass)).
  3. 맨 처음 위치를 뺀 나머지 리스트를 같은 방법으로 교체한다.
- 깔끔한 알고리즘 이지만 빠르진 않음
- O(n^2)

In [3]:
# 배열에서 가장 작은 원소를 찾는 함수
def findSmallest(arr):
    smallest = arr[0]  # 가장 작은 정수를 저장하는 변수
    smallest_index = 0  # 가장 작은 정수의 인덱스를 저장하는 변수
    for i in range(1, len(arr)):
        if arr[i] < smallest:
            smallest = arr[i]
            smallest_index = i
    return smallest_index
    
def selectionSort(arr):
    newArr = []
    for i in range(len(arr)):
        smallest = findSmallest(arr)  # 배열에서 가장 작은 정수를 찾아 새로운 배열에 추가
        newArr.append(arr.pop(smallest))
    return newArr

print(selectionSort([6, 7, 3, 8, 15]))

[3, 6, 7, 8, 15]


# 재귀(Recursion)
- 함수가 자기 자신을 호출하는 것
- 재귀 함수는 기본 단계(Base case)와 재귀 단계(Recursive case)로 이루어져 있음
  - 기본 단계는 함수가 자기 자신을 다시 호출하지 않는 경우, 즉 무한 반복으로 빠져들지 않게 하는 부분
  - 재귀 단계는 함수가 자기 자신을 호출하는 부분
- 재귀를 쓴다고 성능이 더 나아지지는 않는다. 사실 반복문이 더 성능이 좋은 경우가 많다.  
  프로그램에 반복문을 사용하면 프로그램의 성능을 향상시킬 수 있지만, 재귀를 사용하면 프로그래머의 능력을 향상시킬 수 있다. - 레이 캐드웰  
  => 상황에 따라 적절한 방법을 골라 사용하자

In [4]:
def countdown(i):
    print(i)
    if i <= 1:  # 기본 단계(무한 반복으로 빠져들지 않게 하는 부분)
        return
    else:
        countdown(i-1)  # 재귀 단계
        
countdown(3)

3
2
1


# 스택(Stack)
- Push(삽입)와 Pop(떼어내고 읽기)만 가능한 자료구조
- 새 항목을 추가할 때 기존의 목록 위에 쌓게된다.  
  항목을 읽을 때는 가장 위에 있는 항목만 읽고 떼어낼 수 있다.
- 후입선출(Last-In, First-Out; LIFO)의 자료구조
- 스택을 사용하면 편리하긴 하지만 모든 정보를 저장해야 하기때문에 메모리를 많이 소비함

In [1]:
def fact(x):
    if x == 1:
        return 1
    else:
        return x * fact(x-1) # 재귀함수에서 호출 스택이라고 불리는 스택을 사용
                             # 호출 스택: 여러 개의 함수를 호출하면서 함수에 사용되는 변수를
                             #           저장하는 스택
fact(4)

24

# 퀵 정렬(Quick Sort)
- 선택 정렬보다 빠름, 평균적인 상황에서 최고의 성능을 나타냄
- 최악의 경우에는 시간복잡도가 O(n^2)가 되는데, 기준 원소를 최솟값이나 최댓값으로 계속해서 잡게 되는 경우
- 분할 정복 전략(재귀적 알고리즘)을 사용(알고리즘보다는 방법론에 가까움)  
  1. 가장 간단한 경우로 기본 단계를 찾는다.
  2. 주어진 문제를 작게 줄여서 기본 단계가 되도록 만드는 법을 찾는다.  
  (비어 있는 배열이나 원소가 하나인 배열이 기본 단계가 됨)
- 배열을 정리하는 방법
  1. 기준 원소(Pivot)를 고른다.
  2. 배열을 기준 원소보다 작은 원소의 배열과 기준 원소보다 큰 원소의 배열, 이렇게 두 개의 하위 배열로 분할(Partitioning)한다.  
  => 기준 원소보다 작은 원소의 하위 배열 / 기준 원소 / 기준 원소보다 큰 원소의 하위 배열
  3. 하위 배열에 대해 재귀적으로 퀵 정렬을 호출한다.
  4. 어떤 기준 원소를 고르든 두 개의 하위 배열에 재귀적으로 퀵 정렬을 호출하면 된다.
- 최악의 경우 O(n), 최선의 경우 O(log n)

In [4]:
def quickSort(array):
    if len(array) < 2:
        return array  # 기본 단계: 원소의 개수가 0이나 1이면 이미 정렬되어 있는 상태
    else:
        pivot = array[0]
        less = [i for i in array[1:] if i <= pivot]
        greater = [i for i in array[1:] if i > pivot]
        
        return quicksort(less) + [pivot] + quicksort(greater)
    
print(quickSort([2, 1, 3, 5, 11, 8, 26, 40]))

[1, 2, 3, 5, 8, 11, 26, 40]


# 병합 정렬(Merge Sort)
- 배열의 원소 개수가 1 또는 0이 될 때까지 두 부분으로 분할해서 (두 개씩이 될때까지) 자른 순서의 역순으로 크기를 비교해 병합해 나가는 정렬방식, 대표적 분할 정복 알고리즘 중 하나
- O(n*log n)

In [None]:
def mergeSort(array):
    if len(array) < 2:
        return array
    else:
        

# 해시 함수(Hash Function)
- 문자열(string)을 받아서 숫자를 반환하는 함수  
  문자열에 대해 숫자를 할당(mapping)한다.
- 해시 함수에는 일관성이 있어야 함
- 해시 테이블은 해시 맵, 맵, 딕셔너리, 연관 배열 이라는 이름으로도 알려져 있음
- 파이썬에는 딕셔너리라고 불리는 해시 테이블이 있음  
  키(key)와 값(value)을 가짐
- 장점  
  1. 어떤 것과 다른 것 사이의 관계를 모형화할 수 있음
  2. 중복을 막을 수 있음
  3. 서버에게 작업을 시키지 않고 자료를 캐싱할 수 있음
- 이상적인 해시 함수는 키를 해시 테이블 전체에 고르게 할당해야함
- 평균적인 경우 모든 항목에 대해 O(1) 시간이 걸림(매우 빠름)  
  ※ O(1)은 상수 시간이라고 불림 => 상수 시간은 순간적이라는 뜻이 아니라 해시 테이블의 크기에 상관없이 항상 똑같은 시간이 걸린다는 의미  
  최악의 경우에는 모든 항목에 대해 O(n) 시간(선형 시간)이 걸림

|      | 해시 테이블 (평균적인 경우) | 해시 테이블 (최악의 경우) | 배열 | 연결 리스트 |
|:----:|:---------------------------:|:-------------------------:|:----:|:-----------:|
| 탐색 |             O(1)            |            O(n)           | O(1) |     O(n)    |
| 삽입 |             O(1)            |            O(n)           | O(n) |     O(1)    |
| 삭제 |             O(1)            |            O(n)           | O(n) |     O(1)    |

# 너비 우선 탐색(Breadth-First Search)
- 시작 정점을 방문한 후 시작 정점에 인접한 모든 정점들을 우선 방문하는 방법  
  (깊이를 우선시하는 깊이 우선 탐색법(Depth First Search)도 있음)
- 더 이상 방문하지 않은 정점이 없을 때까지 방문하지 않은 모든 정점들에 대해서도 넓이 우선 검색을 적용
- <정점 A에서 정점 B로 가는 경로가 존재 하는지> 혹은, <정점 A에서 정점 B로 가는 최단 경로는 무엇인지> 찾을 때 사용
- 큐(Queue) 자료구조를 사용

# 큐(Queue)
- 실생활에서의 큐(대기열)와 완전히 같은 개념
- 데이터가 들어오는 위치는 가장 뒤(Rear 또는 Back이라고 한다.)에 있고, 데이터가 나가는 위치는 가장 앞(Front라고 한다.)에 있어서, 먼저 들어오는 데이터가 먼저 나가게 된다
- 큐에는 삽입(Enqueue)과 제거(Dequeue)의 두 가지 연산이 있음
- 선입선출(First-In, First-Out; FIFO)의 자료구조

In [None]:
def search(name):
    search_queue = deque()
    search_queue += graph[name]
    searched = []
    while search_queue:
        person

# 깊이 우선 탐색(Depth-First Search)
- 트리나 그래프에서 한 루트로 탐색하다가 특정 상황에서 최대한 깊숙히 들어가서 확인한 뒤 다시 돌아가 다른 루트로 탐색하는 방식