<a href="https://colab.research.google.com/github/Zamoca42/TIL/blob/main/DS/Sort.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# 이진 탐색 (Binary Search)

- 정렬된 자료를 반으로 나누어 탐색하는 방법
- O(log N)의 시간복잡도
- 이진 탐색을 반복할수록 남아있는 자료의 개수는 1/2로 줄어든다

In [1]:
def binary_search(arr, target):
    # 1. 데이터의 중간 인덱스 값을 찾는다.
    # 2. 중간 인덱스 위치를 기준으로 arr을 절반으로 나눈다.
    # 3. 나눠진 절반의 리스트에서 target 값을 찾는다.

    l = 0 # 왼쪽 끝 값
    r = len(arr) - 1 # 오른쪽 끝 값

    while l <= r:
        m = (l + r) // 2 # 중간 값
        if arr[m] < target:
            l = m + 1
        elif arr[m] > target:
            r = m - 1
        else:
            return m
    
    return -1



if __name__ == "__main__":
    arr = [1,2,3,4,5,6,7,8,9]
    print(binary_search(arr, 3))
    print(binary_search(arr, 7))
    print(binary_search(arr, 15))

2
6
-1


In [2]:
# 바이너리 서치
# data 중에서 target 을 검색하여 index 값을 return 한다.
# 없으면 None을 return한다.

def binary_search(target, data):
    data.sort()
    start = 0
    end = len(data) - 1

    while start <= end:
        mid = (start + end) // 2

        if data[mid] == target:
            return mid # 함수를 끝내버린다.
        elif data[mid] < target:
            start = mid + 1
        else:
            end = mid -1

    return None

# 테스트용 코드
if __name__ == "__main__":
  li = [i**2 for i in range(11)]
  target = 9
  idx = binary_search(target, li)

  if idx:
      print(li[idx])
  else:
      print("찾으시는 타겟 {}가 없습니다".format(target))

9


# 버블 정렬 (Bubble Sort)

- 인접한 두 수를 비교하며 정렬해나가는 방법으로 O($ N^2 $)의 시간복잡도

- 거품 정렬은 점점 큰 값들을 뒤에서 부터 앞으로 하나씩 쌓여 나가게 때문에 후반으로 갈수록 정렬 범위가 하나씩 줄어들게 됨

- 무작위 배열수의 거품 정렬 예  
  ![Bubble_sort_animation](https://user-images.githubusercontent.com/96982072/201142099-fd06657f-bb90-4696-a666-24a48a37afc9.gif)


In [3]:
def bubble_sort(arr):
    for i in range(len(arr) - 1):
        for j in range(len(arr) - i - 1):
            if arr[j] > arr[j + 1]:
                arr[j], arr[j + 1] = arr[j + 1], arr[j]


if __name__ == "__main__":
    arr = [9,1,6,3,7,2,8,4,5,0]
    bubble_sort(arr)

    print(arr)

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]


# 삽입 정렬 (Insertion Sort)

- 정렬된 데이터 그룹을 늘려가며 추가되는 데이터는 알맞은 자리에 삽입하는 방식

-  이미 정렬된 배열 부분과 비교하여, 자신의 위치를 찾아 삽입함으로써 정렬을 완성하는 알고리즘

- $ O(n^2) $

In [4]:
def insertion_sort(arr):
    for i in range(1, len(arr)):
        key = arr[i] # 삽입 위치를 찾아줄 데이터
        j = i - 1 # 0-j 정렬된 서브 리스트
        while j >= 0 and arr[j] > key:
            arr[j + 1] = arr[j]
            j -= 1
        arr[j + 1] = key


if __name__ == "__main__":
    arr = [9,1,6,3,7,2,8,4,5,0]
    insertion_sort(arr)
    print(arr)

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]


# 병합 정렬(Merge Sort)

- 하나의 리스트를 두 개의 균등한 크기의 리스트로 분할하고 부분 리스트를 합치면서 정렬하여 전체가 정렬

- 분할 정복 (Divide and Conquer) 알고리즘

- 예시

  - 분할  
    ![divide](https://user-images.githubusercontent.com/96982072/201147663-585c2e04-b934-4d03-8a0b-513234acd14b.png)
    주어진 배열을 원소가 하나 밖에 남지 않을 때까지 둘로 쪼갠다.
  
  - 병합  
  ![merge](https://user-images.githubusercontent.com/96982072/201147668-0e32958a-b6be-430f-a5be-fc8bca464321.png)
  
- 시간복잡도 $ O(N\log N) $  
  ![스크린샷 2022-11-11 오전 1 28 22](https://user-images.githubusercontent.com/96982072/201152656-d4e2db50-c786-48a2-9d2f-9338121f12e9.png)

  

In [5]:
def merge_sort(arr):
    if len(arr) <= 1:
        return

    # divide
    mid = len(arr) // 2
    left = arr[:mid]
    right = arr[mid:]

    merge_sort(left)
    merge_sort(right)

    # conquer
    i = 0   # left idx
    j = 0   # right idx
    k = 0   # arr idx
    while i < len(left) and j < len(right):
        if left[i] <= right[j]:
            arr[k] = left[i]
            i += 1
        else:
            arr[k] = right[j]
            j += 1
        k += 1

    while i < len(left):
        arr[k] = left[i]
        i += 1
        k += 1

    while j < len(right):
        arr[k] = right[j]
        j += 1
        k += 1


if __name__ == "__main__":
    arr = [9,1,6,3,7,2,8,4,5,0]
    merge_sort(arr)
    print(arr)

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]


# 퀵 정렬 (Quick Sort)

- 시간복잡도 $O(N \log N)$
  - 참조 지역성(locality of reference)
  - 한번 결정된 pivot 값은 이후의 연산에서 제외
  - 평균 -> $O(N \log N)$
  - 최악
    - 정렬된 리스트 -> $ O(N^2) $

- 추가적인 메모리 공간 사용 X
- 불안정 정렬
- 분할 정복 (Divide and Conquer) 알고리즘

- 예시

  1. 항상 정 가운데를 기준으로 분할을 하는 병합 정렬과 달리, 퀵 정렬은 흔히 피봇(pivot)이라고 불리는 임의의 기준값을 사용
  ![quick1](https://user-images.githubusercontent.com/96982072/201157036-398570ce-30e0-4344-b6e8-a68c858d9af6.png)  
  pivot 값보다 작은 값들은 모두 왼편으로 몰고, 큰 값들은 모두 오른편으로 몰면 기준값은 정확히 정렬된 위치에 놓이게 됨 
  
  2. 다음 차례로 왼쪽에 있는 값과 오른쪽의 있는 값을 pivot 기준으로 정한 뒤 
  ![quick2](https://user-images.githubusercontent.com/96982072/201157040-0e81968c-0e31-4e9c-a74d-e47243c2cfc1.png)    
  1번 방식대로 다시 정렬  
  ![quick3](https://user-images.githubusercontent.com/96982072/201157047-d8b8fda8-2c37-421e-a809-582e0b034c33.png)

  3. 계속 반복  
  ![quick4](https://user-images.githubusercontent.com/96982072/201157051-91247696-6876-4972-9c3b-b085e8f4249e.png)

- 최악의 시나리오

  - 정렬된 리스트 -> $ O(N^2) $
    ![bad](https://user-images.githubusercontent.com/96982072/201157030-b6ea294d-8caa-4d40-9d76-0cf9baeb5a40.png)

In [6]:
def quick_sort(arr):
    __sort(arr, 0, len(arr) - 1)

def __sort(arr, low, high):
    if low >= high:
        return
    
    pivot = (low + high) // 2
    pivot_val = arr[pivot]

    left, right = low, high
    while left <= right:
        while arr[left] < pivot_val:
            left += 1

        while arr[right] > pivot_val:
            right -= 1

        if left <= right:
            arr[right], arr[left] = arr[left], arr[right]
            left += 1
            right -= 1

    __sort(arr, low, right)
    __sort(arr, left, high)


if __name__ == "__main__":
    arr = [9,1,6,3,7,2,8,4,5,0]
    quick_sort(arr)
    print(arr)


[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
