In [1]:
"""탐색을 통한 문제 해결을 위해 필요한 기반 구조들.
GitHub의 aima-python 코드를 기반으로 일부 내용을 수정하였음."""
import math
import heapq
import sys
from collections import defaultdict, deque


class Problem:
    """해결할 문제에 대한 추상 클래스
    다음 절차에 따라 이 클래스를 활용하여 문제해결하면 됨.
    1. 이 클래스의 서브클래스 생성 (이 서브클래스를 편의상 YourProblem이라고 하자)
    2. 다음 메쏘드들 구현
       - actions
       - result
       - 필요에 따라 h, __init__, is_goal, action_cost도
    3. YourProblem의 인스턴스를 생성
    4. 다양한 탐색 함수들을 사용해서 YourProblem을 해결"""

    def __init__(self, initial=None, goal=None, **kwds): #Problem 클래스의 생성자 
        # **가변 키워드 인자 : 임의의 키워드 인자를 받을 수 있도록 한다. 
        # =None 매개변수를 지정하지 않았을 경우, none 으로 초기화한다.
        """초기 상태(initial), 목표 상태(goal) 지정.
        필요에 따라 다른 파라미터들 추가"""
        self.__dict__.update(initial=initial, goal=goal, **kwds)  
        # __dict__: 객체의 '속성' 정보를 담고 있는 딕셔너리
        # 클래스의 속성 정보를 저장하는 코드

    def actions(self, state):
        """행동: 주어진 상태(state)에서 취할 수 있는 행동들을 리턴함.
        대개 리스트 형태로 리턴하면 될 것임.
        한꺼번에 리턴하기에 너무 많은 행동들이 있을 경우, yield 사용을 검토할 것."""
        raise NotImplementedError

    def result(self, state, action):
        """이행모델: 주어진 상태(state)에서 주어진 행동(action)을 취했을 때의 결과 상태를 리턴함.
        action은 self.actions(state) 중 하나여야 함."""
        raise NotImplementedError

    def is_goal(self, state):
        """목표검사: 상태가 목표 상태이면 True를 리턴함.
        상태가 self.goal과 일치하는지 혹은 self.goal이 리스트인 경우 그 중의 하나인지 체크함.
        더 복잡한 목표검사가 필요할 경우 이 메쏘드를 오버라이드하면 됨."""
        if isinstance(self.goal, list):
            return is_in(state, self.goal)
        else:
            return state == self.goal

    def action_cost(self, state1, action, state2):
        """행동 비용: state1에서 action을 통해 state2에 이르는 비용을 리턴함.
        경로가 중요치 않은 문제의 경우에는 state2만을 고려한 함수가 될 것임.
        현재 구현된 기본 버전은 모든 상태에서 행동 비용을 1로 산정함."""
        return 1

    def h(self, node):
        """휴리스틱 함수:
        문제에 따라 휴리스틱 함수를 적절히 변경해줘야 함."""
        return 0
    
    def __str__(self):
        return f'{type(self).__name__}({self.initial!r}, {self.goal!r})'

    
def is_in(elt, seq):
    """elt가 seq의 원소인지 체크.
    (elt in seq)와 유사하나 ==(값의 비교)이 아닌 is(객체의 일치 여부)로 비교함."""
    return any(x is elt for x in seq)


class Node:
    """탐색 트리의 노드. 다음 요소들로 구성됨.
    - 이 노드에 대응되는 상태(한 상태에 여러 노드가 대응될 수도 있음)
    - 이 노드를 생성한 부모에 대한 포인터
    - 이 상태에 이르게 한 행동
    - 경로 비용(g)
    이 클래스의 서브클래스를 만들 필요는 없을 것임."""

    def __init__(self, state, parent=None, action=None, path_cost=0):
        """parent에서 action을 취해 만들어지는 탐색 트리의 노드 생성"""
        self.__dict__.update(state=state, parent=parent, action=action, path_cost=path_cost)

    def __repr__(self):
        return f"<{self.state}>"

    def __len__(self): # 탐색 트리에서 이 노드의 깊이
        return 0 if self.parent is None else (1 + len(self.parent))
    
    def __lt__(self, other):
        return self.path_cost < other.path_cost
        
        
failure = Node('failure', path_cost=math.inf) # 알고리즘이 해결책을 찾을 수 없음을 나타냄
cutoff  = Node('cutoff',  path_cost=math.inf) # 반복적 깊이 증가 탐색이 중단(cut off)됐음을 나타냄


def expand(problem, node): 
    """노드 확장: 이 노드에서 한 번의 움직임으로 도달 가능한 자식 노드들을 생성하여 yield함"""
    s = node.state #현재 상태
    for action in problem.actions(s):
        s1 = problem.result(s, action) #상태의 전이모델 result()의 반환값
        cost = node.path_cost + problem.action_cost(s, action, s1)
        yield Node(s1, node, action, cost) #새로운 Node 객체를 생성하여 반환하는 역할
        

def path_actions(node):
    """루트 노드에서부터 이 노드까지 이르는 행동 시퀀스. 
    결국 node가 목표 상태라면 이 행동 시퀀스는 해결책임.
    목표 상태 발견 후 리턴할 행동 시퀀스 생성을 위해 사용됨.
    부모 포인터를 역으로 추적하여 시퀀스 생성"""
    if node.parent is None:
        return []  
    return path_actions(node.parent) + [node.action]


def path_states(node):
    """루트 노드에서부터 이 노드까지 이르는 상태 시퀀스"""
    if node in (cutoff, failure, None): 
        return []
    return path_states(node.parent) + [node.state]


# FIFO Queue
FIFOQueue = deque

# LIFO Queue(Stack)
LIFOQueue = list



In [2]:
# 탐색을 통한 문제 해결을 위해 필요한 기반 구조들은 search_common.py에 코드를 옮겨서 저장해뒀음.
from search_common import *
import operator

import random
import numpy as np
import matplotlib.pyplot as plt  # 시각화 모듈
from PIL import Image
import bisect

In [None]:
#simulated annealing

In [5]:
def exp_schedule(k=20, lam=0.005, limit=10000): 
    ## k: 초기 온도를 결정하는 상수. lam: 시간에 따른 온도의 감소율을 결정하는 상수. limit:온도가 0이 될 때까지의 시간(또는 반복 횟수)의 한계
    """simulated annealing용 schedule 함수"""
    return lambda t: (k * np.exp(-lam * t) if t < limit else 0) 
    #t가 limit보다 작은 경우에는 초기 온도 k에 지수함수 형태로 감소하는 값을 반환하고, 그렇지 않으면 0을 반환


def simulated_annealing(problem, schedule=exp_schedule()):
    """simulated annealing"""
    current = Node(problem.initial) #노드 객체 생성
    for t in range(sys.maxsize): #0~maxsize 까지 1씩 증가하며 반복
        T = schedule(t)
        
        if T == 0:
            return current.state
        
        neighbors = [n for n in expand(problem, current)]
        
        if len(neighbors) == 0:
            return current.state
        
        next_choice = random.choice(neighbors) #이웃하는 노드 중에서 무작위 추출
        delta_e = problem.value(next_choice.state) - problem.value(current.state)
        if delta_e > 0 or probability(np.exp(delta_e / T)): #다음상태-현재상태 >0 ==> 다음상태가 더 커지는 방향으로 가겠다
            current = next_choice #다음 상태로 현재 상태를 이동

            
def probability(p):
    """p의 확률로 True를 리턴함."""
    return p > random.uniform(0.0, 1.0)

In [6]:
# 미리 정의된 행동들
directions4 = [(-1, 0), (0, 1), (1, 0), (0, -1)] # 상우하좌 4 방향 (4방향으로만 행동을 허용하도록 문제를 정의할 경우 사용) 배열로 생각하기
directions8 = directions4 + [(-1, 1), (1, 1), (1, -1), (-1, -1)] # 대각선 4 방향 추가 (대각선 방향 행동도 허용하여 문제 정의할 경우 사용)

class PeakFindingProblem(Problem):
    """봉우리 찾기 문제. 상태는 현재의 위치. 예: (1, 2)"""

    def __init__(self, initial, grid, defined_actions=directions4):
        """grid: 2차원 배열/리스트. grid의 각 상태는 위치 인덱스 튜플 (x, y)로 표현됨.
        defined_actions: 문제에서 허용할 행동 정의(기본값: 4방향 이동 행동)"""
        super().__init__(initial) #에이전트의 시작 위치
        self.grid = grid #상태 공간
        self.defined_actions = defined_actions #4방향 이동 가능하다는 행동
        
        self.n = len(grid)  # 행 인덱스(x)의 최대값 , 3
        assert self.n > 0 #주어진 조건식이 거짓이면 AssertionError
        self.m = len(grid[0])  # 열 인덱스(y)의 최대값 , 4; 결국 이 그리드의 크기는 n행 m열, 3행 4열
        assert self.m > 0

    def actions(self, state): #행동들의 집합, state에서 가능한 행동 리스트(=배열) 반환
        """주어진 상태에서 허용되는 행동 리스트"""
        allowed_actions = []
        for action in self.defined_actions: #[(-1, 0), (0, 1), (1, 0), (0, -1)]
            
            next_state = vector_add(state, action) #state(1,2 현위치) + action(-1,0 왼쪽으로 이동) = (0,2)
            
            if 0 <= next_state[0] <= self.n - 1 and 0 <= next_state[1] <= self.m - 1:
                #행이 0~2 사이이고, 열이 0~3 사이인지 확인
                
                allowed_actions.append(action) #가능한 행동이므로 추가
                
        return allowed_actions

    def result(self, state, action): #state에서 action(배열)의 결과 'state', 전이모델 #expand()에서 상태로 사용
        """행동에 명시된 방향으로 이동"""
        return vector_add(state, action) # 두백터의 합을 반환

    def value(self, state): #상태 --> 여기서는 배열의 x,y인덱스에 저장된 실제 값을 반환 / 우리는 경로의 거리의 전체 합을 반환해야함
        """상태 값: 이 문제에서는 그 위치에 놓인 숫자 값을 리턴함"""
        x, y = state #튜플의 값을 대입 x,y=(1,2)
        assert 0 <= x < self.n
        assert 0 <= y < self.m
        return self.grid[x][y]


def vector_add(a, b):
    """두 벡터의 각 성분별로 덧셈 연산"""
    return tuple(map(operator.add, a, b))

In [7]:
# 숫자들의 배치
grid = [[3, 7, 2, 8], [5, 2, 9, 1], [5, 3, 3, 1]] #상태 공간

initial = (0, 0)
problem = PeakFindingProblem(initial, grid, directions4) #초기상태, 상태공간, 가능한 행동의 집합을 설정

In [8]:
final = simulated_annealing(problem) #알고리즘 시작
print(final, problem.value(final), sep='\t')

(0, 1)	7


In [9]:
# 여러번 반복해서 해를 찾고 그 결과 중 최대값을 리턴하면 최적해일 가능성이 높아질 것임
solutions = {problem.value(simulated_annealing(problem)) for i in range(100)}
print(solutions, max(solutions), sep='\t')

{8, 9, 5, 7}	9


In [10]:
print(len(grid))
print(len(grid[0])) #[3,7,2,8]

3
4
