적대적 탐색 알고리즘의 동작 방식을 이해하고 이를 이용하여 게임 프로그램을 만드는 예를 살펴 봅시다. 여기 제공하는 코드는 GitHub aima-python의 코드를 기반으로 일부 수정한 것임.

In [7]:
from collections import defaultdict
import random
import math
infinity = math.inf

## 게임 문제 정의
자신만의 게임 문제를 정의하려면 Game 클래스의 서브 클래스를 정의하면 됨.

In [8]:
class Game:
    """문제를 정의하기 위한 Problem 클래스에 대응되는 게임 정의를 위한 클래스.
    경로 비용과 목표 검사 대신 각 상태에 대한 효용 함수와 종료 검사로 구성됨.
    게임을 정의하려면 이 클래스의 서브 클래스를 만들어서
    actions, result, is_terminal, utility를 구현하면 됨.
    필요에 따라 게임의 초기 상태를 지정하려면,
    클래스 생성자에서 초기 상태를 initial 에 세팅하면 됨."""

    def actions(self, state):
        """주어진 상태에서 허용 가능한 수(move) 리스트"""
        raise NotImplementedError

    def result(self, state, move):
        """주어진 상태(state)에서 수(move)를 두었을 때의 결과 상태 리턴"""
        raise NotImplementedError

    def is_terminal(self, state):
        """state가 종료 상태이면 True 리턴"""
        return not self.actions(state)
    
    def utility(self, state, player):
        """종료 상태 state에서 게임이 종료됐을 때 player의 효용 함수 값"""
        raise NotImplementedError

In [45]:
def play_game(game, strategies: dict, verbose=False):
    """번갈아 가면서 두는 게임 진행 함수.
    strategies: {참가자 이름: 함수} 형태의 딕셔너리. 
    여기서 함수(game, state)는 상태 state에서 참가자의 수(move)를 찾는 함수"""
    state = game.initial
    while not game.is_terminal(state):
        player = state.to_move
        move = strategies[player](game, state)
        state = game.result(state, move)
        if verbose: 
            print('Player', player, 'move:', move)
            print(state)
    return state

## 적대적 탐색 알고리즘 구현

### 미니맥스 탐색

In [31]:
def minimax_search(game, state):
    """최고의 수를 결정하기 위한 게임 트리 탐색.
    (미니맥스 값, 수) 쌍을 리턴함."""

    player = state.to_move

    def max_value(state):
        if game.is_terminal(state):
            return game.utility(state, player), None
        v, move = -infinity, None
        for a in game.actions(state):
            v2, _ = min_value(game.result(state, a))
            if v2 > v:
                v, move = v2, a
        return v, move

    def min_value(state):
        if game.is_terminal(state):
            return game.utility(state, player), None
        v, move = +infinity, None
        for a in game.actions(state):
            v2, _ = max_value(game.result(state, a))
            if v2 < v:
                v, move = v2, a
        return v, move

    return max_value(state)

### 알파-베타 탐색

In [32]:
def alphabeta_search(game, state):
    """알파-베타 가지치기를 사용하여 최고의 수를 결정하기 위한 게임 트리 탐색."""

    player = state.to_move

    def max_value(state, alpha, beta):
        if game.is_terminal(state):
            return game.utility(state, player), None
        v, move = -infinity, None
        for a in game.actions(state):
            v2, _ = min_value(game.result(state, a), alpha, beta)
            if v2 > v:
                v, move = v2, a
                alpha = max(alpha, v)
            if v >= beta:
                return v, move
        if not move:
            return min_value(state, alpha, beta)
        return v, move

    def min_value(state, alpha, beta):
        if game.is_terminal(state):
            return game.utility(state, player), None
        v, move = +infinity, None
        for a in game.actions(state):
            v2, _ = max_value(game.result(state, a), alpha, beta)
            if v2 < v:
                v, move = v2, a
                beta = min(beta, v)
            if v <= alpha:
                return v, move
        return v, move

    return max_value(state, -infinity, +infinity)

### 휴리스틱 알파-베타 탐색

In [33]:
def cutoff_depth(d):
    """깊이 d까지만 탐색하도록 하는 중단 함수: depth > d이면 True 리턴."""
    return lambda game, state, depth: depth > d

def h_alphabeta_search(game, state, cutoff=cutoff_depth(6), h=lambda s, p: 0):
    """휴리스틱 알파-베타 탐색"""

    player = state.to_move

    def max_value(state, alpha, beta, depth):
        if game.is_terminal(state):
            return game.utility(state, player), None
        if cutoff(game, state, depth):
            return h(state, player), None
        v, move = -infinity, None
        for a in game.actions(state):
            v2, _ = min_value(game.result(state, a), alpha, beta, depth+1)
            if v2 > v:
                v, move = v2, a
                alpha = max(alpha, v)
            if v >= beta:
                return v, move
        return v, move

    def min_value(state, alpha, beta, depth):
        if game.is_terminal(state):
            return game.utility(state, player), None
        if cutoff(game, state, depth):
            return h(state, player), None
        v, move = +infinity, None
        for a in game.actions(state):
            v2, _ = max_value(game.result(state, a), alpha, beta, depth + 1)
            if v2 < v:
                v, move = v2, a
                beta = min(beta, v)
            if v <= alpha:
                return v, move
        return v, move

    return max_value(state, -infinity, +infinity, 0)

## Othello(리버시) 게임

### 게임 정의

In [34]:
class Board:
    """{(x, y): player} 형식의 딕셔너리. player: 'X' 또는 'O'
    .to_move: 누가 둘 차례인가?
    .width, .height: 보드 크기"""
    
    empty = '.'
    off = '#'
    
    def __init__(self, width, height, to_move):
        self.squares = [[ '.' for x in range(width)] for y in range(height)]
        self.squares[width//2][height//2]='●'
        self.squares[width//2-1][height//2-1]='●'
        self.squares[width//2-1][height//2]='○'
        self.squares[width//2][height//2-1]='○'
        self.to_move = to_move
        self.width = width
        self.height = height
        self.blank_cnt = width*height - 4
        
    def new(self, action):
        """기존 보드 복사해서 행동 적용한 보드 반환"""
        board = Board(self.width, self.height, self.to_move)
        
        board.squares = [self.squares[x][:] for x in range(self.height)]
        
        board.turn_all_drit(action)
        board.squares[action[0]][action[1]] = self.to_move
        
        if self.to_move=='○' : board.to_move = '●'
        else: board.to_move = '○'
        board.blank_cnt-=1
        
        return board
    
    def turn_check(self, x, y, dxy):
        '''진짜 뒤집음'''
        if(x>=self.width or y>=self.height or self.squares[x][y]=='.'):
            return -1
        elif(self.squares[x][y]==self.to_move):
            return 0
        else:
            tmp = self.turn_check(x+dxy[0], y+dxy[1], dxy)
            if(tmp != -1):
                self.squares[x][y] = self.to_move
                return 0
            return -1
    
    def turn_all_drit(self,action):
        '''8방향 뒤집기 체크'''
        move = ((0,1),(1,0),(0,-1),(-1,0),(1,1),(-1,1),(1,-1),(-1,-1))
        
        for d in move:
            self.turn_check(action[0]+d[0], action[1]+d[1], d)


    def __missing__(self, loc):
        x, y = loc
        if 0 <= x < self.width and 0 <= y < self.height:
            return self.empty
        else:
            return self.off
            
    def __hash__(self): 
        return hash(tuple(sorted(self.items()))) + hash(self.to_move)
    
    def __repr__(self):
        def row(y): return ' '.join(self[x, y] for x in range(self.width))
        return '\n'.join(map(row, range(self.height))) +  '\n'
    

In [49]:
class Othello(Game):
    """Othello 게임. 보드 크기: width * height. 모든 판을 채웠을 때 더 많은 색을 가진 사람이 승리
    '●'와 '○'가 게임 플레이. '●'가 먼저 플레이.
    (0, 0) 위치는 보드의 좌상단 끝 위치."""

    def __init__(self, height=4, width=4):
        self.height=height
        self.width=width
        self.board = Board(width=width, height=height, to_move='●')

    def actions(self):
        move = ((0,1),(1,0),(0,-1),(-1,0),(1,1),(-1,1),(1,-1),(-1,-1))
        """내 돌을 놓을 수 있는 위치들"""
        action = set()
        for i in range(self.width):
            for j in range(self.height):
                for d in move:
                    if(self.turn_check(i+d[0], j+d[1], d)>0):
                        action.add((i,j))
                        break
        return action


    def turn_check(self, player, x, y, dxy):
        if(x>=self.width or y>=self.height or self.board.squeres[x][y]=='.'):
            return -1
        elif(self.board.squeres[x][y]==player):
            return 0
        else:
            tmp = self.turn_check(player, x+dxy[0], y+dxy[1], dxy)
            if(tmp!=-1):
                return tmp+1
            return -1
    

    def result(self, action):
        """board의 square 위치에 현재 플레이어의 표시를 위치시킴."""
        player = self.board.to_move
        board = self.board.new(action)
        win = k_in_row(board, player, self.k)
        #board.utility = (0 if not win else +1 if player == 'X' else -1)
        return board

    def utility(self, board, player):
        """승리: 1, 패배: -1, 그외: 0"""
        return board.utility if player == 'X' else -board.utility

    def is_terminal(self, board):
        """승/패가 결정되었거나 빈 위치가 존재하지 않으면 종료 상태임."""
        return board.utility != 0 or len(self.squares) == len(board)

    def display(self, board):  # print(board) => 아래 코드로 변경
        for i in range(board.height):
            for j in range(board.width):
                print(board.squares[i][j], end=" ")
            print()


def k_in_row(board, player, square, k):
    """일직선으로 k개의 player 돌이 놓여 있으면 True 리턴."""
    def in_row(x, y, dx, dy): return 0 if board[x, y] != player else 1 + in_row(x + dx, y + dy, dx, dy)
    return any(in_row(*square, dx, dy) + in_row(*square, -dx, -dy) - 1 >= k
               for (dx, dy) in ((0, 1), (1, 0), (1, 1), (1, -1)))

### 게임 참가자(player) 정의

In [36]:
def random_player(game, state):
    """허용되는 수(move) 중에서 무작위로 하나를 선택하는 플레이어"""
    return random.choice(list(game.actions(state)))

def player(search_algorithm):
    """지정된 탐색 알고리즘을 사용하는 플레이어: (game, state)를 입력 받아 move를 리턴하는 함수."""
    return lambda game, state: search_algorithm(game, state)[1]

In [37]:
def query_player(game, state):
    """다음 수(move)를 직접 입력하는 형태의 플레이어"""
    print("현재 상태:")
    game.display(state)
    print(f"가능한 수: {game.actions(state)}")
    print("")
    move = None
    if game.actions(state):
        move_string = input('당신의 수는? (돌을 둘 위치 입력; 예: (1,1)): ')
        try:
            move = eval(move_string)
        except NameError:
            move = move_string
    else:
        print('가능한 수가 없음: 상대방에게 순서가 넘어감.')
    return move

## 게임하기

In [38]:
a = Othello(4, 4)

In [39]:
board = Board(4, 4, '●')

In [40]:
print(board.squares)

[['.', '.', '.', '.'], ['.', '●', '○', '.'], ['.', '○', '●', '.'], ['.', '.', '.', '.']]


In [41]:
a.display(board)

. . . . 
. ● ○ . 
. ○ ● . 
. . . . 


In [42]:
play_game(TicTacToe(), {'X':random_player, 'O':player(alphabeta_search)}, verbose=True).utility

NameError: name 'TicTacToe' is not defined

In [51]:
play_game(TicTacToe(), {'X':player(alphabeta_search), 'O':player(minimax_search)}, verbose=True).utility

AttributeError: 'Board' object has no attribute 'utility'

In [52]:
play_game(TicTacToe(), {'X':player(h_alphabeta_search), 'O':player(h_alphabeta_search)}, verbose=True).utility

NameError: name 'TicTacToe' is not defined

In [6]:
play_game(TicTacToe(), {'X':player(h_alphabeta_search), 'O':random_player}, verbose=True).utility

NameError: name 'play_game' is not defined

In [None]:
%%time
play_game(TicTacToe(), {'X':player(minimax_search), 'O':player(h_alphabeta_search)})

In [None]:
%%time
play_game(TicTacToe(), {'X':player(alphabeta_search), 'O':player(h_alphabeta_search)})

CPU times: user 351 ms, sys: 886 µs, total: 352 ms
Wall time: 354 ms


O O X
X X O
O X X

In [None]:
%%time
play_game(TicTacToe(), {'X':player(h_alphabeta_search), 'O':player(h_alphabeta_search)})

CPU times: user 232 ms, sys: 951 µs, total: 233 ms
Wall time: 236 ms


O O X
X X O
O X X

In [55]:
play_game(TicTacToe(), {'X':query_player, 'O':random_player})

TypeError: 'Board' object is not subscriptable