# Search Algorithm
- 알고리즘은 목표를 찾기 위해 체계적인 규칙이 필요.
- 탐색(search) : 상태 공간에서 시작 상태 -> 목표 상태까지의 경로를 찾는 것
    - 상태 공간(state space) : 상태들이 모여있는 공간
    - 연산자 : 하나의 상태를 다른 상태로 변경한다.
    - 탐색에서 중복된 상태를 막기 위하여 OPEN 리스트와 CLOSED 리스트를 사용

## Search Algorithm 종류
```
탐색 알고리즘 --- + --- 맹목적인 탐색
                |   |
                |   + --- BFS(Breadth-First Search)
                |   |
                |   + --- DFS(Depth-First Search)
                |   |
                |   + --- UCS(Uniform Cost Search)
                |
                + --- 경험적 탐색(Heuristic Search)
                      |
                      + --- A* Algorithm
                      |
                      + --- 탐욕적인 탐색
```

## DFS(Depth-First Search) 알고리즘
- DFS (깊이 우선 탐색) : 맹목적 탐색방법의 하나로 탐색트리의 최근에 첨가된 노드를 선택하고, 이 노드에 적용 가능한 동작자 중 하나를 적용하여 트리에 다음 수준의 한 개의 자식노드를 첨가하며, 첨가된 자식 노드가 목표 노드일 때까지 앞의 자식 노드의 첨가 과정을 반복해 가는 방식

- 장점
    - 단지 현 경로상의 노드들만을 기억하면 되므로 저장공간의 수요가 비교적 적다
    - 목표 노드가 깊은 단계에 있을 경우 해를 빨리 구할 수 있다.
- 단점 
    - 해가 없는 경로에 깊이 빠질 가능성이 있다. 따라서 실제의 경우 미리 지정한 임의의 깊이까지만 탐색하고 목표 노드를 발견하지 못하면 다음의 경로를 따라 탐색하는 방법이 유용
    - 얻어진 해가 최단 경로가 된다는 보장이 없다. 이는 목표에 이르는 경로가 다수인 문제에 대해 깊이 우선 탐색은 해에 다다르면 탐색을 끝내버리므로, 이때 얻어진 해는 최적이 아닐 수 있다는 의미

- 만약 각 상태당 가능한 행동의 수가 b개이고 최대 깊이가 D라면
    - 검색 공간 : $O(D)$
    - 시간 복잡도 : 최악의 경우 $O(b^D)$


In [1]:
import numpy as np

- open list : 트리에서 열렸지만 아직 탐색되지 않은 상태들의 목록
- closed list : 이미 탐색이 끝난 상태들의 목록

In [2]:
tree  = {
    'A': ['B', 'C'],
    'B': ['D', 'E'],
    'C': ['F', 'G'],
    'D': ['H', 'I'],
    'E': ['I'],
    'F': ['U'],
    'G': [],
    'H': [],
    'I': [],
    'U': []
}

initialState = 'A'
goalState = 'U' # 찾아야하는 값

open_list = []
closed_list = []

cnt = 0
print(f'{cnt}. open = {open_list};\tclosed = {closed_list}')

0. open = [];	closed = []


In [3]:
open_list.append(initialState) # 첫 검색 노드가 open_list에 들어간다.
cnt += 1 # count 증가
print(f'{cnt}. open = {open_list};\t closed = {closed_list}')

1. open = ['A'];	 closed = []


In [4]:
while (open_list != []): # 비어있지 않을때
    cnt += 1

    X = open_list.pop(0) # pop() 연산, A를 꺼내서 비워준다.

    if X == goalState: # 목표 노드 발견하면 break
        print(f'{cnt}. 목표 노드 {goalState} 발견!')
        break 
    else:
        child = tree[X] 
        closed_list.append(X)
        for c in child:
            if (c in open_list) or (c in closed_list):
                child.remove(c)

        open_list = child + open_list # child를 먼저 써서 open_list내의 새로운 탐색 노드를 맨 앞에 추가해준다.
        
    print(f'{cnt}. open = {open_list};\t closed = {closed_list}')

2. open = ['B', 'C'];	 closed = ['A']
3. open = ['D', 'E', 'C'];	 closed = ['A', 'B']
4. open = ['H', 'I', 'E', 'C'];	 closed = ['A', 'B', 'D']
5. open = ['I', 'E', 'C'];	 closed = ['A', 'B', 'D', 'H']
6. open = ['E', 'C'];	 closed = ['A', 'B', 'D', 'H', 'I']
7. open = ['C'];	 closed = ['A', 'B', 'D', 'H', 'I', 'E']
8. open = ['F', 'G'];	 closed = ['A', 'B', 'D', 'H', 'I', 'E', 'C']
9. open = ['U', 'G'];	 closed = ['A', 'B', 'D', 'H', 'I', 'E', 'C', 'F']
10. 목표 노드 U 발견!


- `pop()`: 인덱스 없이 호출하면 리스트의 마지막 항목을 제거하고 그 값을 반환
    - `pop(index)`: 인덱스를 지정하면 해당 인덱스의 항목을 제거하고 그 값을 반환
- `child = tree[X]` : 현재 노드 X에 대한 자식 노드를 tree라는 딕셔너리(또는 유사한 자료구조)에서 가져옴

- ```python
  for c in child:
              if (c in open_list) or (c in closed_list):
                  child.remove(c)
  ```
  - child 리스트를 반복하면서, 각 자식 노드 c가 이미 open_list나 closed_list에 있는지 확인하고 있다면 child 리스트에서 제거

## BFS (Breadth-First Search) 알고리즘
- 너비 우선 탐색 : 명목적 탐색 방법의 하나로 시작 정점을 방문한 후 시작 정점에 인접한 모든 정점들을 우선 방문하는 방법
- 더이상 방문하지 않은 정점이 없을 떄까지 방문하지 않은 모든 정점들에 대해서도 너비 우선 검색을 적용
- open list는 queue를 사용해야만 레벨 순서대로 접근 가능

- 장점
    - 출발 노드에서 목표 노드까지의 최단 길이 경로를 보장
- 단점
    - 경로가 매우 길 경우 : 탐색 가지가 급격히 증가함에 따라 보다 많은 기억 공간을 필요로 함
    - 해가 존재하지 않는다면 유한 그래프의 경우에는 모든 그래프를 탐색한 후에 실패로 끝난다.
    - 무한 그래프의 경우에는 결코 해를 찾지도 못하고, 끝내지도 못한다.

In [5]:
tree  = {
    'A': ['B', 'C'],
    'B': ['D', 'E'],
    'C': ['F', 'G'],
    'D': ['H', 'I'],
    'E': ['I'],
    'F': ['U'],
    'G': [],
    'H': [],
    'I': [],
    'U': []
}

initialState = 'A'
goalState = 'U' # 찾아야하는 값

open_list = []
closed_list = []

cnt = 0
print(f'{cnt}. open = {open_list};\tclosed = {closed_list}')

open_list.append(initialState) # 첫 검색 노드가 open_list에 들어간다.
cnt += 1 # count 증가
print(f'{cnt}. open = {open_list};\t closed = {closed_list}')

0. open = [];	closed = []
1. open = ['A'];	 closed = []


In [6]:
while (open_list != []): 
    cnt += 1

    X = open_list.pop(0) 

    if X == goalState: 
        print(f'{cnt}. 목표 노드 {goalState} 발견!')
        break 
    else:
        child = tree[X] 
        closed_list.append(X)
        for c in child:
            if (c in open_list) or (c in closed_list):
                child.remove(c)

        open_list += child # open_list = open_list + child, 너비우선탐색
        
    print(f'{cnt}. open = {open_list};\t closed = {closed_list}')

2. open = ['B', 'C'];	 closed = ['A']
3. open = ['C', 'D', 'E'];	 closed = ['A', 'B']
4. open = ['D', 'E', 'F', 'G'];	 closed = ['A', 'B', 'C']
5. open = ['E', 'F', 'G', 'H', 'I'];	 closed = ['A', 'B', 'C', 'D']
6. open = ['F', 'G', 'H', 'I'];	 closed = ['A', 'B', 'C', 'D', 'E']
7. open = ['G', 'H', 'I', 'U'];	 closed = ['A', 'B', 'C', 'D', 'E', 'F']
8. open = ['H', 'I', 'U'];	 closed = ['A', 'B', 'C', 'D', 'E', 'F', 'G']
9. open = ['I', 'U'];	 closed = ['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H']
10. open = ['U'];	 closed = ['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H', 'I']
11. 목표 노드 U 발견!


## 8-puzzle Problem

In [7]:
import queue

In [10]:
# 상태를 나타내는 클래스, f(n) 값을 저장한다.
class State: 
    def __init__(self, board, goal, moves=0):
        self.board = board # 보드 상태 저장
        self.moves = moves # 단순 카운트
        self.goal = goal # 최종 목표 상태

    # 위치 i1과 i2를 교환하여 새로운 상태를 반환한다.
    def get_new_board(self, i1, i2, moves):
        new_board = self.board[:]
        new_board[i1], new_board[i2] = new_board[i2], new_board[i1]
        return State(new_board, self.goal, moves)

    # 자식 노드를 확장하여 리스트에 저장하여 반환한다.
    def expand(self, moves):
        result = [] # child Node
        i = self.board.index(0)  # 숫자 0(빈칸)의 위치를 찾는다.
        if not i in [0, 1, 2]:  # UP 연산자
            result.append(self.get_new_board(i, i-3, moves))
        if not i in [0, 3, 6]:  # LEFT 연산자, [0, 3, 6]일때는 제외
            result.append(self.get_new_board(i, i-1, moves))
        if not i in [2, 5, 8]:  # RIGHT 연산자
            result.append(self.get_new_board(i, i+1, moves))
        if not i in [6, 7, 8]:  # DOWN 연산자
            result.append(self.get_new_board(i, i+3, moves))
        return result
        
    # 객체를 쉽게 출력할 때 사용한다.
    def __str__(self):
        return str(self.board[:3]) + "\n" +\
        str(self.board[3:6]) + "\n" +\
        str(self.board[6:]) + "\n" +\
        "------------------"

    def __eq__(self, other):
        return self.board == other.board

In [11]:
puzzle = [1, 2, 3,
          0, 4, 6,
          7, 5, 8]

goal = [1, 2, 3,
        4, 5, 6,
        7, 8, 0]

# open 리스트
open_queue = []
open_queue.append(State(puzzle, goal))

closed_queue = []
moves = 0

while len(open_queue) != 0:
    current = open_queue.pop(0)  # OPEN 리스트의 앞에서 삭제
    print(current)
    if current.board == goal:
        print("탐색 성공")
        break
    
    moves = current.moves + 1
    closed_queue.append(current)
    for state in current.expand(moves):
        if (state in closed_queue) or (state in open_queue):  # 이미 생성한 노드이면 노드를 버린다.
            continue
        else:
            open_queue.append(state)  # OPEN 리스트의 끝에 추가

[1, 2, 3]
[0, 4, 6]
[7, 5, 8]
------------------
[0, 2, 3]
[1, 4, 6]
[7, 5, 8]
------------------
[1, 2, 3]
[4, 0, 6]
[7, 5, 8]
------------------
[1, 2, 3]
[7, 4, 6]
[0, 5, 8]
------------------
[2, 0, 3]
[1, 4, 6]
[7, 5, 8]
------------------
[1, 0, 3]
[4, 2, 6]
[7, 5, 8]
------------------
[1, 2, 3]
[4, 6, 0]
[7, 5, 8]
------------------
[1, 2, 3]
[4, 5, 6]
[7, 0, 8]
------------------
[1, 2, 3]
[7, 4, 6]
[5, 0, 8]
------------------
[2, 3, 0]
[1, 4, 6]
[7, 5, 8]
------------------
[2, 4, 3]
[1, 0, 6]
[7, 5, 8]
------------------
[0, 1, 3]
[4, 2, 6]
[7, 5, 8]
------------------
[1, 3, 0]
[4, 2, 6]
[7, 5, 8]
------------------
[1, 2, 0]
[4, 6, 3]
[7, 5, 8]
------------------
[1, 2, 3]
[4, 6, 8]
[7, 5, 0]
------------------
[1, 2, 3]
[4, 5, 6]
[0, 7, 8]
------------------
[1, 2, 3]
[4, 5, 6]
[7, 8, 0]
------------------
탐색 성공


## 참고 : 매직 메소드
- 스페셜 메소드(Special Method) 라고도 불리며, 사용자가 만든 객체나 클래스에 대한 연산을 다루기 위해 파이썬에 내장된 메소드
- 일반적으로 양쪽에 두 개의 언더스코어 '_'로 감싼 형태 사용
- 기본 매직 메소드 : `__init__()`
    - 클래스를 생성할 때 자동으로 호출되며, 일반적으로 클래스 변수를 선언하기 위해 사용
- `__str__()` : 클래스를 출력할 때 호출되는 메소드
- `__add__()` : 덧셈 연산자를 사용할 때 호출되는 메소드


In [35]:
# ex
class Person:
    
    def __init__(self):
        self.age = 20
        self.income = 100

p1 = Person()
print(p1)

<__main__.Person object at 0x10a18c690>


In [36]:
class Person:
    
    def __init__(self):
        self.age = 20
        self.income = 100

    def __str__(self):
        return 'age: '  + str(self.age) + '\n' +\
               'income: ' + str(self.income)
    
p1 = Person()
print(p1)

age: 20
income: 100


In [39]:
class Person:
    
    def __init__(self, age, income): # age, income 매개변수로 추가
        self.age = age
        self.income = income

    def __str__(self):
        return 'age: '  + str(self.age) + '\n' +\
               'income: ' + str(self.income)
    
    def __add__(self, other): # other 매개변수로 추가
        return self.income + other.income
    
p1 = Person(20, 100)
p2 = Person(30, 200)
print(p1 + p2)

300


|...| DFS | BFS |
| :---: | :---: | :---: |
| 개념 | 가장 깊이 내려간 뒤, 갈 곳이 없을 경우 옆으로 탐색 | 인접한 노드를 먼저 탐색 |
| 구현 방법 | 스택 or 재귀 | 큐 |
| 문제 적용 | 가능한 모든 해 탐색, 사이클 검출 문제 | 최단 거리 문제, 웹 크롤링 |
| 검색 속도 | 검색 대상 그래프가 너무 크면 DFS | 검색 대상의 규모가 크지 않을 경우 BFS |


## Heuristic Search

- 특정 문제에 대해 정보, 경험, 지식이 제공된다면, 우리는 그러한 장점들을 문제에 적용하여 검색 알고리즘을 더 빠르게 만들 수 있다.
    - 목표 노드에 대한 경험적인 정보를 사용하는 방법을 `경험적 탐색(Heuristic Search)`이라고 한다.
    - 문제에 대한 정보를 `휴리스틱 정보(Heuristic Information)`라고 한다.

### Hill-Climbing Search (언덕 등반 탐색)
- 평가함수를 사용하여 평가함수 값을 증가(감소)시키는 방향으로 나가는 탐색 전략
- `평가 함수` : 각 노드에 대해 얼마나 좋은 선택인지를 평가하는 함수

- 문제 : 시작 노드에서 목표 노드까지 가는 비용을 고려하지 않기 때문에 탐색 비용이 크다.
    - 탐색 과정이 길어지면 탐색 비용 매우 커진다
    - 지역 최소 문제가 있다.

    - Local Minima Problem (지역 최소 문제)
        - 언덕 등반 탐색은 지역 최소 문제에 빠질 수 있다.
        - 지역 최소 문제란, 어떤 노드에서 더 이상 이동할 수 없는 상태에 도달했을 때, 이 노드가 최적의 해가 아닐 수 있다는 문제
        - 이 문제를 해결하기 위해, 언덕 등반 탐색을 여러 번 실행하거나, 다른 휴리스틱 정보를 사용하는 방법이 있다.

### A* Search
- A* 알고리즘은 언덕 등반 탐색의 문제점을 해결하기 위해 만들어진 알고리즘
- 주요 특징으로는 주어진 시작 노드에서 목표 노드까지 최단 경로를 효과적으로 구할 수 있다.
    - 주로 게임에서 특정 유닛을 목표 지점으로 이동 시킬 때 사용하는 알고리즘
- A* 알고리즘은 두 가지 정보를 사용하여 `f(n)` 값을 계산
    - `h(n)` : 현재 노드에서 목표 노드까지의 거리
        - 휴리스틱 함수(Heuristic Function)라고 부르며, 이 함수의 설계 방법에 따라 알고리즘 성능이 결정
    - `g(n)` : 시작 노드에서 현재 노드까지의 비용 (경로 가중치)
    - `f(n) = g(n) + h(n)` : 두 정보를 합친 값

In [20]:
# 상태를 나타내는 클래스, f(n) 값을 저장한다.
class State: 
    def __init__(self, board, goal, moves=0):
        self.board = board # 보드 상태 저장
        self.moves = moves # 단순 카운트
        self.goal = goal # 최종 목표 상태

    # 위치 i1과 i2를 교환하여 새로운 상태를 반환한다.
    def get_new_board(self, i1, i2, moves):
        new_board = self.board[:]
        new_board[i1], new_board[i2] = new_board[i2], new_board[i1]
        return State(new_board, self.goal, moves)

    # 자식 노드를 확장하여 리스트에 저장하여 반환한다.
    def expand(self, moves):
        result = [] # child Node
        i = self.board.index(0)  # 빈칸(0 비어있는 위치) 찾는다.
        if not i in [0, 1, 2]:  # UP 연산자
            result.append(self.get_new_board(i, i-3, moves))
        if not i in [0, 3, 6]:  # LEFT 연산자, [0, 3, 6]일때는 제외
            result.append(self.get_new_board(i, i-1, moves))
        if not i in [2, 5, 8]:  # RIGHT 연산자
            result.append(self.get_new_board(i, i+1, moves))
        if not i in [6, 7, 8]:  # DOWN 연산자
            result.append(self.get_new_board(i, i+3, moves))
        return result
    
    # f(n)을 계산하여 반환한다.
    def f(self):
        return self.h() + self.g()

    # 휴리스틱 함수 값 h(n)을 계산하여 반환한다.
    # 현재 상태에서 목표 상태까지 몇 개의 타일이 잘못된 위치에 있는지를 리스트 컴프리헨션으로 계산한다.
    # 현재 제 위치에 있지 않은 타일의 개수를 리스트 함축으로 계산
    def h(self):
        return sum([1 if self.board[i] != self.goal[i] else 0 for i in range(8)])

    # 시작 노드부터의 경로를 반환한다.
    def g(self):
        return self.moves

    # 상태와 상태를 비교하기 위하여 less than 연산자를 정의한다.
    def __lt__(self, other):
        return self.f() < other.f()

    def __str__(self):
        return "------------------f(n)="+str(self.f())+"\n"+\
        "------------------h(n)="+str(self.h())+"\n"+\
        "------------------g(n)="+str(self.g())+"\n"+\
        str(self.board[:3]) + "\n" +\
        str(self.board[3:6]) + "\n" +\
        str(self.board[6:]) + "\n" +\
        "------------------"
        
    def __eq__(self, other):
        return self.board == other.board

In [21]:
# 초기 상태
puzzle = [1, 2, 3,
          0, 4, 6,
          7, 5, 8]

# 목표 상태
goal = [1, 2, 3,
        4, 5, 6,
        7, 8, 0]

# open 리스트는 우선순위 큐로 생성
open_queue = queue.PriorityQueue()
open_queue.put(State(puzzle, goal))
closed_queue = []
moves = 0

In [22]:
while not open_queue.empty():
    current = open_queue.get()
    print(current)
    if current.board == goal:
        print("탐색 성공")
        break
    moves = current.moves + 1
    for state in current.expand(moves):
        if state not in closed_queue:
            open_queue.put(state)
    closed_queue.append(current)
else:
    print('탐색 실패')

------------------f(n)=3
------------------h(n)=3
------------------g(n)=0
[1, 2, 3]
[0, 4, 6]
[7, 5, 8]
------------------
------------------f(n)=3
------------------h(n)=2
------------------g(n)=1
[1, 2, 3]
[4, 0, 6]
[7, 5, 8]
------------------
------------------f(n)=3
------------------h(n)=1
------------------g(n)=2
[1, 2, 3]
[4, 5, 6]
[7, 0, 8]
------------------
------------------f(n)=3
------------------h(n)=0
------------------g(n)=3
[1, 2, 3]
[4, 5, 6]
[7, 8, 0]
------------------
탐색 성공


#### Basic Queue

In [16]:
data_queue = queue.Queue()

data_queue.put("abc")
data_queue.put(1)

data_queue.qsize() # 2
data_queue.get() # abc -> 제일 먼저 인서트된 데이터 출력

data_queue.qsize() # 1 -> 9번줄에서 abc가 빠져나갔기 때문
data_queue.get() # 1 출력

1

#### LifoQueue

In [23]:
data_queue = queue.LifoQueue()

data_queue.put("abc")
data_queue.put(1)

data_queue.qsize() # 2
data_queue.get() # 1 -> LIFO 구조이기 때문에 1이 먼저 출력

data_queue.qsize() # 1 -> 9번줄에서 1이 빠져나갔기 때문
data_queue.get() # abc 출력

'abc'

#### PriorityQueue

In [24]:
data_queue = queue.PriorityQueue()

data_queue.put((10, "abc"))  # 우선순위를 포함하기 위해 튜플로 인서트 (우선순위, value)
data_queue.put((5, 1))
data_queue.put((15, "ef"))

data_queue.qsize()  # 3 -> 데이터는 3개
data_queue.get()  # (5, 1) -> 우선순위가 가장 낮은 데이터 추출

data_queue.qsize()  # 2 -> (5, 1)가 빠져나가기 때문
data_queue.get()  # (10, "abc") -> 두 번째 우선순위

(10, 'abc')