## 문제 07 **순차 탐색**

**주어진 리스트에 특정한 값이 있는지 찾아 위치를 돌려주는 알고리즘 만들기**

##### **순차 탐색으로 특정 값의 위치 찾기**

아래는 순차 탐색 알고리즘을 이용해 주어진 리스트에서 특정 갑슬 찾아 위치 번호를 돌려 주는 프로그램이다.

In [0]:
# 리스트에서 특정 숫자의 위치 찾기
# 입력: 리스트 a, 찾는 값 x
# 출력: 찾으면 그 값의 위치, 찾지 못하면 -1

def search_list(a, x):
  n = len(a)
  for i in range(0, n):
    if x == a[i]:
      return i
  return -1

v = [17, 92, 18, 33, 58, 7, 33, 42]
print(search_list(v,18))
print(search_list(v, 33))
print(search_list(v, 900))

2
3
-1


##### **알고리즘 분석**

순차 탐색 알고리즘에서 원하는 값을 얻으려면 계산(비교)을 얼마나 해야 할까?
- 경우에 따라 다르다. 원하는 값이 앞에 있다면 한 번의 계산으로 끝나지만, 리스트에 없거나 마지막에 위치해 있다면 리스트 길이만큼 계산해야 한다.

이처럼 계산 횟수가 경우에 따라 다르다면 보통 최악의 경우를 분석한다.
- 길이가 n인 리스트를 순차 탐색한다면 최악의 경우의 계산 복잡도는 $O(n)$이다.

##### **연습 문제**

In [0]:
# 7-1. 찾는 값이 나오는 모든 위치를 리스트로 돌려주는 탐색 알고리즘 만들기.
def search_list(a, x):
  lst = []
  lst_len = len(a)
  for i in range(lst_len):
    if x == a[i]:
      lst.append(i)
      
  return lst

v = [1,2, 3, 4, 5, 6, 5, 4, 3, 2, 1]
print(search_list(v, 2))

[1, 9]


In [0]:
# 7-2. 연습 문제 7-1 프로그램은 계산 복잡도는?

# 기존의 순차 탐색 알고리즘과 동일. O(n).

In [0]:
# 7-3. 
def search_name(no_list, name_list, n):
  lst_len = len(no_list)
  for i in range(0, lst_len):
    if n == no_list[i]:
      return name_list[i]
      
  return "?"

stu_no = [39, 14, 67, 105]
stu_name = ['Justin', 'John', 'Mike', 'Summer']
print(search_name(stu_no, stu_name, 39))
print(search_name(stu_no, stu_name, 1))

Justin
?


# 문제 08 **선택 정렬**

**주어진 리스트 안의 자료를 작은 수부터 큰 수 순서로 배열하는 정렬 알고리즘 만들기**

##### **쉽게 설명한 선택 정렬 알고리즘**

In [0]:
# 입력: 리스트 a
# 출력: 정렬된 새 리스트
# 주어진 리스트에서 최솟값의 위치를 돌려주는 함수

def find_min_idx(a):
  min_idx = 0
  for i in range(0, len(a)):
    if a[i] < a[min_idx]:
      min_idx = i
  return min_idx

def sel_sort(a):
  result = []
  while a:  # 리스트 a가 빌 때 까지
    min_idx = find_min_idx(a)  # 리스트 a의 최솟값 인덱스를 찾고
    value = a.pop(min_idx)  # 그 value를 추출한 후 저장하고
    result.append(value)  # 저장한 value를 result 리스트에 추가.
  return result

print(sel_sort([1, 3, 5, 4, 2]))

[1, 2, 3, 4, 5]


##### **일반적인 선택 정렬 알고리즘**

In [0]:
# 입력: 리스트 a
# 출력: 없음(입력으로 주어진 a가 정렬됨)

def sel_sort(a):
  n = len(a)
  min_idx = 0
  for i in range(0, n-1):
    min_idx = i
    for j in range(i+1, n):
      if a[j] < a[min_idx]:
        min_idx = j
    a[i], a[min_idx] = a[min_idx], a[i]

a = [1, 3, 5, 4, 2]
sel_sort(a)
print(a)

[1, 2, 3, 4, 5]


##### **알고리즘 분석**

문제 03에서 처리했던 방식과 유사하다. $\frac{n(n-1)}{2}$. 계산 복잡도는 $O(n^2)$.
- 이해하기 쉽고 간단해서 많이 이용되는데, 이 문제의 계산 복잡도 특성 상 입력 크기가 커지면 정렬하는데 오랜 시간이 걸린다.


##### **연습 문제**

In [0]:
# 8-2. 프로그램 8-1과 8-2는 오름차순이였는데, 문제를 내림차순으로 바꾸려면 어느 부분을 수정해야 할까?

def sel_sort(a):
  n = len(a)
  max_idx = 0 
  for i in range(0, n-1):
    max_idx = i
    for j in range(i+1, n):
      if a[j] > a[max_idx]:
        max_idx = j
    a[max_idx], a[i] = a[i], a[max_idx]

a = [1, 3, 5, 4, 2]
sel_sort(a)
a

[5, 4, 3, 2, 1]

# 문제 09 **삽입 정렬**

**리스트 안의 자료를 작은 수부터 큰 수 순서로 배열하는 정렬 알고리즘을 만들기**

##### **쉽게 설명한 삽입 정렬 알고리즘**

In [0]:
# 입력: 리스트 a
# 출력: 정렬된 새 리스트

# 리스트 r에서 v가 들어가야 할 위치를 돌려주는 함수
def find_ins_idx(r, v):
  # 이미 정렬된 리스트 r의자료를 앞에서부터 차례로 확인하여
  for i in range(0, len(r)):
    # v값보다 i번 위치에 있는 자료 값이 크면
    # v가 그 값 바로 앞에 놓여야 정렬 순서가 유지됨
    if v < r[i]:
      return i
  # 적절한 위치를 못 찾았을 떄는
  # v가 r의 모든 자료보다 크다는 뜻이므로 맨 뒤에 삽입.
  return len(r)

def ins_sort(a):
  result = []  # 새 리스트를 만들어 정렬된 값을 저장.
  while a:  # 기존 리스트에 값이 남아 있는 동안 반복.
    value = a.pop(0)  # 기존 리스트의 첫 번째를 꺼냄
    ins_idx = find_ins_idx(result, value)  # 꺼낸 값이 들어갈 적당한 위치 찾기
    result.insert(ins_idx, value)  # 찾은 위치에 값 삽입(이후 값은 한 칸씩 밀려남)
  return result

d = [1, 3, 5, 4, 2]
print(ins_sort(d))

[1, 2, 3, 4, 5]


##### **일반적인 삽입 정렬 알고리즘**

In [0]:
# 입력: 리스트 a
# 출력: 없음(입력으로 주어진 a가 정렬됨)

def ins_sort(a):
  n = len(a)
  for i in range(1, n):  # 1부터 n-1까지
    key = a[i]  # i번 위치에 있는 값을 key에 저장
    # j를 i 바로 왼쪽 위치로 저장
    j = i-1
    # 리스트의 j번 위치에 있는 값과 key를 비교해 key가 삽입될 적절한 위치를 찾음
    while j >= 0 and a[j] > key:
      a[j+1] = a[j]  # 삽입할 공간이 생기도록 값을 오른쪽으로 한 칸 이동
      j -= 1
    a[j+1] = key

d = [1, 3, 5, 4, 2]
ins_sort(d)
print(d)

[1, 2, 3, 4, 5]


##### **알고리즘 분석**

계산복잡도는 조금 독특함.
- 정렬된 리스트는 $O(n)$으로 마칠수 있지만, 이런 경우는 특별한 경우.
- 일반적인 입력에서는 선택 정렬과 같은 $O(n^2)$다.

##### **연습 문제**

In [0]:
# 9-2. 오름차순 정렬인 위 프로그램을 내림차순으로 바꾸기.
def ins_sort(a):
  n = len(a)
  for i in range(1, n):
    key = a[i]
    j = i-1
    while j>=0 and a[j]<key:
      a[j+1] = a[j]
      j -= 1
    a[j+1] = key

d = [1, 3, 5, 4, 2]
ins_sort(d)
d

[5, 4, 3, 2, 1]

# 문제 10 **병합 정렬**

**리스트 안의 자료를 작은 수 부터 큰 수 순서로 배열하는 정렬 알고리즘 만들기**

##### **쉽게 설명한 병합 정렬 알고리즘**

In [0]:
def merge_sort(a):
  n = len(a)
  # 종료 조건: 정렬할 리스트의 자료 개수가 한 개 이하면 정렬할 필요 없음.
  if n <= 1:
    return a
  # 그룹을 나누어 각각 병합 정렬을 호출하는 과정
  mid = n // 2  # 중간을 기준으로 두 그룹으로 나눔
  g1 = merge_sort(a[:mid])  # 재귀 호출로 첫 번째 그룹을 정렬
  g2 = merge_sort(a[mid:])  # 재귀 호출로 두 번째 그룹을 정렬

  # 두 그룹을 하나로 병합
  result = []  # 두 그룹을 합쳐 만들 최종 결과
  while g1 and g2:  # 두 그룹에 모두 자료가 남아 있는 동안 반복
    if g1[0] < g2[0]:
      # g1 값이 더 작으면 그 값을 빼내어 결과로 추가
      result.append(g1.pop(0))
    else:
      # g2 값이 더 작으면 그 값을 빼내어 결과로 추가
      result.append(g2.pop(0))
  # 아직 남아 있는 자료들을 결과에 추가
  # g1과 g2 중 이미 빈 것은 while을 바로 지나감
  while g1:
    result.append(g1.pop(0))
  while g2:
    result.append(g2.pop(0))
  return result

d = [6, 8, 3, 9, 10, 1, 2, 4, 7, 5]
print(merge_sort(d))

[1, 2, 3, 4, 5, 6, 7, 8, 9, 10]


##### **일반적인 병합 정렬 알고리즘**

In [0]:
def merge_sort(a):
  n = len(a)
  # 종료 조건: 정렬할 리스트의 자료 개수가 한 개 이하면 정렬할 필요 없음.
  if n <= 1:
    return 
  # 그룹을 나누어 각각 병합 정렬을 호출하는 과정
  mid = n // 2  # 중간을 기준으로 두 그룹으로 나눔
  g1 = a[:mid]
  g2 = a[mid:]
  merge_sort(g1)
  merge_sort(g2)
  # 두 그룹을 하나로 병합
  i1 = 0
  i2 = 0
  ia = 0
  while i1 < len(g1) and i2 < len(g2):  # 두 리스트 중 하나가 빌 때 까지
    if g1[i1] < g2[i2]:
      a[ia] = g1[i1]
      i1 += 1
      ia += 1
    else:
      a[ia] = g2[i2]
      i2 += 1
      ia += 1
  # 아직 남아 있는 자료들을 결과에 추가
  while i1 < len(g1):
    a[ia] = g1[i1]
    i1 += 1
    ia += 1
  while i2 < len(g2):
    a[ia] = g2[i2]
    i2 += 1
    ia += 1

d = [6, 8, 3, 9, 10, 1, 2, 4, 7, 5]
merge_sort(d)
print(d)

[1, 2, 3, 4, 5, 6, 7, 8, 9, 10]


##### **알고리즘 분석**

병합 정렬은 주어진 문제를 절반으로 나눈 다음 각각을 재귀 호출로 풀어 가는 방식이다.
- 이런 알고리즘 설계 기법을 **분할 정복**(divide and conquer)라고 한다.
- 분할 정복을 이용한 병합 정렬의 계산 복잡도는 $O(n \cdot \log n)$.
  - 선택 정렬이나 삽입 정렬의 계산 복잡도보다 훨씬 낮다.

##### **연습 문제**

In [0]:
# 10-1. 내림차순으로 변경

def merge_sort(a):
  n = len(a)
  if n <= 1:
    return
  mid = n // 2
  g1 = a[:mid]
  g2 = a[mid:]
  merge_sort(g1)
  merge_sort(g2)
  i1 = 0
  i2 = 0
  ia = 0
  while i1 < len(g1) and i2 < len(g2):
    if g1[i1] < g2[i2]:
      a[ia] = g2[i2]
      ia += 1
      i2 += 1
    else:
      a[ia] = g1[i1]
      ia += 1
      i1 += 1
  while i1 < len(g1):
    a[ia] = g1[i1]
    ia += 1
    i1 += 1
  while i2 < len(g2):
    a[ia] = g2[i2]
    ia += 1
    i2 += 1

d = [6, 8, 3, 9, 10, 1, 2, 4, 7, 5]
merge_sort(d)
print(d)

[10, 9, 8, 7, 6, 5, 4, 3, 2, 1]


# 문제 11 **퀵 정렬**

**리스트 안의 자료를 작은 수부터 큰 수 순서로 배열하는 정렬 알고리즘 만들기**

##### **쉽게 설명한 퀵 정렬 알고리즘**

In [0]:
# 입력: 리스트 a
# 출력: 정렬된 새 리스트

def quick_sort(a):
  n = len(a)
  if n <= 1:
    return a
  # 기준 값을 정하고 기준에 맞춰 그룹을 나누는 과정.
  pivot = a[-1]  # 편의상 리스트의 마지막 값을 기준 값으로 정함.
  g1, g2 = [], []  # 기준보다 작은 값을 g1에, 큰 값을 g2에 담음.
  for i in range(0, n-1):  # 마지막 값은 기준 값이므로 제외.
    if a[i] < pivot:  # 기준 값과 비교
      g1.append(a[i])
    else:
      g2.append(a[i])
  # 각 그룹에 대해 재귀 호출로 퀵 정렬을 한 후 
  # 기준 값과 합쳐 하나의 리스트로 결괏값 반환
  return quick_sort(g1) + [pivot] + quick_sort(g2)

d = [6, 8,  3, 9, 10, 1, 2, 4, 7, 5]
print(quick_sort(d))

[1, 2, 3, 4, 5, 6, 7, 8, 9, 10]


##### **일반적인 퀵 정렬 알고리즘**

In [0]:
# 입력: 리스트 a
# 출력: 없음(입력으로 주어진 a가 정렬됨)

# 리스트 a에서 어디부터(start) 어디까지(end)가 정렬 대상인지
# 범위를 지정하여 정렬하는 재귀 호출 함수
def quick_sort_sub(a, start, end):
  # 종료 조건: 정렬 대상이 한 개 이하면 정렬할 필요 없음.
  if end - start <= 0:
    return 
  # 기준 값을 정하고 기준 값에 맞춰 리스트 안에서 각 자료의 위치를 맞춤
  # [기준 값보다 작은 값들, 기준 값, 기준 값보다 큰 값들]
  pivot = a[end]  # 편의상 리스트의 마지막 값을 기준 값으로 정함
  i = start
  for j in range(start, end):
    if a[j] <= pivot:
      a[i], a[j] = a[j], a[i]
      i += 1
  a[i], a[end] = a[end], a[i]
    # 재귀 호출 부분
  quick_sort_sub(a, start, i-1)  # 기준 값보다 작은 그룹을 재귀 호출로 다시 정렬
  quick_sort_sub(a, i+1, end)  # 기준 값보다 큰 그룹을 재귀 호출로 다시 정렬

# 리스트 전체(0~len(a)-1)를 대상으로 재귀 호출 함수 호출
def quick_sort(a):
  quick_sort_sub(a, 0, len(a)-1)

d = [6, 8, 3, 9, 10, 1, 2, 4, 7, 5]
quick_sort(d)
print(d)

[1, 2, 3, 4, 5, 6, 7, 8, 9, 10]


##### **알고리즘 분석**

퀵 정렬은 기준값 설정이 중요하다.
- 기준으로 정한 학생이 열 명 중 키가 가장 작은 학생이라면, 그룹을 두 개로 나눠도 의미가 없어진다.
- 좋은 기준을 정하는 게 중요한데, 그 부분은 범위를 넘어선다.

계산 복잡도는 최악의 경우 선택, 삽입 정렬과 같은 $O(n^2)$이지만, 평균적일 땐 병합 정렬과 같은 $O(n\cdot \log n)$.

##### **연습 문제**

In [0]:
# 11-1. 거품 정렬 구현
def bubble_sort(a):
  for i in range(0, len(a)-1):
    j = i + 1
    if a[i] > a[j]:
      print(a)
      a[i], a[j] = a[j], a[i]
      bubble_sort(a)

d = [1, 3, 5, 7, 6, 4, 2]
bubble_sort(d)

[1, 3, 5, 7, 6, 4, 2]
[1, 3, 5, 6, 7, 4, 2]
[1, 3, 5, 6, 4, 7, 2]
[1, 3, 5, 4, 6, 7, 2]
[1, 3, 4, 5, 6, 7, 2]
[1, 3, 4, 5, 6, 2, 7]
[1, 3, 4, 5, 2, 6, 7]
[1, 3, 4, 2, 5, 6, 7]
[1, 3, 2, 4, 5, 6, 7]


In [0]:
# 책에 나온 해답
 
def bubble_sort(a): 
  n = len(a)
  while True:
    changed = False
    for i in range(0, n-1):
      if a[i] > a[i+1]:
        print(a)
        a[i], a[i+1] = a[i+1], a[i]
        changed = True
    if changed == False:
      return

d = [2, 4, 5, 1, 3]
bubble_sort(d)
print(d)

[2, 4, 5, 1, 3]
[2, 4, 1, 5, 3]
[2, 4, 1, 3, 5]
[2, 1, 4, 3, 5]
[2, 1, 3, 4, 5]
[1, 2, 3, 4, 5]


# 문제 12 **이분 탐색**

**자료가 크기 순서대로 정렬된 리스트에서 특정한 값이 있는지 찾아 그 위치를 돌려주는 알고리즘 만들기.**

##### **이분 탐색 알고리즘**

이분 탐색의 원리를 일반적으로 정리하면 다음과 같다.
1. 중간 위치를 찾는다.
2. 찾는 값과 중간 위치 값을 비교한다.
3. 같다면 원하는 값을 찾은 것이므로 위치 번호를 결괏값으로 돌려준다.
4. 찾는 값이 중간 위치 값보다 크다면 중간 위치의 오른쪽을 대상으로 다시 탐색한다 (1번 과정부터 반복).
5. 찾는 값이 중간 위치 값보다 작다면 중간 위치의 왼쪽을 대상으로 다시 탐색한다 (1번 과정부터 반복).

In [9]:
# 리스트에서 특정 숫자 위치 찾기(이분 탐색)
# 입력: 리스트 a, 찾는 값 x
# 출력: 찾으면 그 값의 위치, 찾지 못하면 -1

def binary_search(a, v):
  # 탐색할 범위를 저장하는 변수 start, end
  # 리스트 전체를 범위로 탐색 시작 (0~len(a)-1)
  start = 0
  end = len(a) - 1

  while start <= end:  # 탐색할 범위가 남아 있는 동안 반복
    mid = (start+end) // 2  # 탐색 범위의 중간 위치
    if v == a[mid]:  # 발견.
      return mid
    elif v > a[mid]:  # 찾는 값이 더 크면 오른족으로 범위를 좁혀 계속 탐색
      start = mid + 1
    else:  # 찾는 값이 더 작으면 왼쪽으로 범위를 좁혀 계속 탐색
      end = mid - 1  
    
  return -1  # 찾지 못했을 때

d = [1, 4, 9, 16, 25, 36, 49, 64, 81]
print(binary_search(d, 36))

5


##### **알고리즘 분석**

이분 탐색은 값을 비교할 때마다 찾는 값이 있을 범위를 절반씩 좁히면서 탐색하는 효율적인 탐색 알고리즘.
- 이분 탐색의 계산 복잡도는 $O(\log n)$. 순차 탐색의 계산 복잡도인 $O(n)$보다 더 효율적이다.
- 미리 정렬해야한다는 단점이 있지만, 필요한 값을 여러 번 찾아야 한다면 자료를 한 번 정렬한 다음에 이분 탐색을 이용하는 방법이 효율적이다.

In [27]:
# 12-1. 재귀 호출을 사용해 이분 탐색 알고리즘을 만들기.
def binary_search_sub(a, x, start, end):
  # 종료 조건: 남은 탐색 범위가 비었으면 종료
  if start > end:
    return -1

  mid = (start+end) // 2  # 탐색 범위의 중간 위치
  if x == a[mid]:  # 발견
    return mid
  elif x > a[mid]:  # 찾는 값이 더 크면 중간을 기준으로 오른쪽 값을 대상으로 재귀 호출
    return binary_search_sub(a, x, mid+1, end)
  else:
    return binary_search_sub(a, x, start, mid-1)
  
  return -1

# 리스트 전체를 대상으로 재귀 호출 함수 호출
def binary_search(a, x):
  return binary_search_sub(a, x, 0, len(a)-1)

d = [1, 4, 9, 16, 25, 36, 49, 64, 81]
print(binary_search(d, 36))

5
