<a href="https://colab.research.google.com/github/quoctrung2005/TTNT/blob/main/min_max.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

min_max trong tictaxtoe



In [22]:
import copy
import math
import numpy

# Ký hiệu cho người chơi
X = "X"
O = "O"
EMPTY = "None"

user = None
ai = None


# ------------------------------
#  Khởi tạo bàn cờ
# ------------------------------
def initial_state():
    return [
        [EMPTY, EMPTY, EMPTY],
        [EMPTY, EMPTY, EMPTY],
        [EMPTY, EMPTY, EMPTY]
    ]


# ------------------------------
# Xác định người chơi tiếp theo
# ------------------------------
def player(board):
    count = 0
    for row in board:
        for cell in row:
            if cell != EMPTY:     # chỉ đếm ô không rỗng
                count += 1
    # X luôn đi trước
    return X if count % 2 == 0 else O


# ------------------------------
# Trả về danh sách các nước đi có thể (ô trống)
# ------------------------------
def actions(board):
    result = set()
    for i in range(3):
        for j in range(3):
            if board[i][j] == EMPTY:
                result.add((i, j))
    return result


# ------------------------------
# Trả về bàn cờ mới sau khi thực hiện hành động
# ------------------------------
def result(board, action):
    new_board = copy.deepcopy(board)
    i, j = action
    new_board[i][j] = player(board)   # đặt quân X/O
    return new_board


# ------------------------------
# Kiểm tra thắng theo hàng ngang
# ------------------------------
def get_horizontal_winner(board):
    for row in board:
        if row[0] != EMPTY and row[0] == row[1] == row[2]:
            return row[0]
    return None


# ------------------------------
# Kiểm tra thắng theo cột dọc
# ------------------------------
def get_vertical_winner(board):
    for col in range(3):
        if board[0][col] != EMPTY and board[0][col] == board[1][col] == board[2][col]:
            return board[0][col]
    return None


# ------------------------------
# Kiểm tra thắng theo đường chéo
# ------------------------------
def get_diagonal_winner(board):
    # Chéo trái → phải
    if board[0][0] != EMPTY and board[0][0] == board[1][1] == board[2][2]:
        return board[0][0]

    # Chéo phải → trái
    if board[0][2] != EMPTY and board[0][2] == board[1][1] == board[2][0]:
        return board[0][2]

    return None


# ------------------------------
# Trả về người thắng cuộc nếu có
# ------------------------------
def winner(board):
    return (
        get_horizontal_winner(board)
        or get_vertical_winner(board)
        or get_diagonal_winner(board)
    )


# ------------------------------
# Kiểm tra xem trò chơi kết thúc chưa
# ------------------------------
def terminal(board):
    if winner(board) is not None:
        return True
    for row in board:
        for cell in row:
            if cell == EMPTY:
                return False
    return True  # Hết ô → hòa


# ------------------------------
# Điểm số của bàn cờ
# ------------------------------
def utility(board):
    win = winner(board)
    if win == X:
        return 1
    elif win == O:
        return -1
    return 0


# ------------------------------
# Minimax – xử lý cho người chơi X (maximize)
# ------------------------------
def maxValue(state):
    if terminal(state):
        return utility(state)

    v = -math.inf
    for action in actions(state):
        v = max(v, minValue(result(state, action)))
    return v


# ------------------------------
# Minimax – xử lý cho người chơi O (minimize)
# ------------------------------
def minValue(state):
    if terminal(state):
        return utility(state)

    v = math.inf
    for action in actions(state):
        v = min(v, maxValue(result(state, action)))
    return v


# ------------------------------
# Chọn nước đi tối ưu bằng minimax
# ------------------------------
def minimax(board):
    current = player(board)

    best_move = None

    if current == X:  # maximize
        best_val = -math.inf
        for action in actions(board):
            value = minValue(result(board, action))
            if value > best_val:
                best_val = value
                best_move = action
    else:  # minimize (O)
        best_val = math.inf
        for action in actions(board):
            value = maxValue(result(board, action))
            if value < best_val:
                best_val = value
                best_move = action

    return best_move


# ------------------------------
# MAIN GAME LOOP
# ------------------------------
if __name__ == "__main__":
    board = initial_state()
    ai_turn = False

    print("Choose your player (X/O): ")
    user = input().strip().upper()

    if user == X:
        ai = O
    else:
        ai = X

    while True:
        game_over = terminal(board)
        current = player(board)

        # Game over
        if game_over:
            w = winner(board)
            if w is None:
                print("Game Over: Tie.")
            else:
                print(f"Game Over: {w} wins.")
            break

        # Đến lượt AI
        if current == ai:
            print("AI is thinking...")
            move = minimax(board)
            board = result(board, move)
            print(numpy.array(board))

        # Đến lượt người
        else:
            print("Your turn!")
            print("Enter the position to move (row, col):")
            i = int(input("Row: "))
            j = int(input("Col: "))

            if board[i][j] == EMPTY:
                board = result(board, (i, j))
                print(numpy.array(board))
            else:
                print("Invalid move! Spot already taken.")


Choose your player (X/O): 
x
Your turn!
Enter the position to move (row, col):
Row: 0
Col: 1
[['None' 'X' 'None']
 ['None' 'None' 'None']
 ['None' 'None' 'None']]
AI is thinking...
[['None' 'X' 'None']
 ['None' 'None' 'None']
 ['None' 'O' 'None']]
Your turn!
Enter the position to move (row, col):
Row: 0
Col: 2
[['None' 'X' 'X']
 ['None' 'None' 'None']
 ['None' 'O' 'None']]
AI is thinking...
[['O' 'X' 'X']
 ['None' 'None' 'None']
 ['None' 'O' 'None']]
Your turn!
Enter the position to move (row, col):
Row: 2
Col: 2
[['O' 'X' 'X']
 ['None' 'None' 'None']
 ['None' 'O' 'X']]
AI is thinking...
[['O' 'X' 'X']
 ['None' 'None' 'O']
 ['None' 'O' 'X']]
Your turn!
Enter the position to move (row, col):
Row: 1
Col: 1
[['O' 'X' 'X']
 ['None' 'X' 'O']
 ['None' 'O' 'X']]
AI is thinking...
[['O' 'X' 'X']
 ['None' 'X' 'O']
 ['O' 'O' 'X']]
Your turn!
Enter the position to move (row, col):


KeyboardInterrupt: Interrupted by user

In [23]:


import os, math

def GetWinner(board):
    """
    Trả về người thắng trên bàn cờ hiện tại nếu có, ngược lại trả về None
    """

    # kiểm tra hàng ngang
    if board[0] == board[1] and board[1] == board[2]:
        return board[0]
    elif board[3] == board[4] and board[4] == board[5]:
        return board[3]
    elif board[6] == board[7] and board[7] == board[8]:
        return board[6]

    # kiểm tra cột dọc
    elif board[0] == board[3] and board[3] == board[6]:
        return board[0]
    elif board[1] == board[4] and board[4] == board[7]:
        return board[1]
    elif board[2] == board[5] and board[5] == board[8]:
        return board[2]

    # kiểm tra đường chéo
    elif board[0] == board[4] and board[4] == board[8]:
        return board[0]
    elif board[2] == board[4] and board[4] == board[6]:
        return board[2]

    return None


def PrintBoard(board):
    """
    Xóa màn hình console và in bàn cờ hiện tại
    """
    os.system('cls' if os.name == 'nt' else 'clear')
    print(f'''
{board[0]}|{board[1]}|{board[2]}
{board[3]}|{board[4]}|{board[5]}
{board[6]}|{board[7]}|{board[8]}
''')


def GetAvailableCells(board):
    """
    Trả về danh sách các ô trống trên bàn cờ
    """
    available = []
    for cell in board:
        if cell != "X" and cell != "O":
            available.append(cell)
    return available


def minimax(position, depth, alpha, beta, isMaximizing):
    """
    Thuật toán AI chọn nước đi tốt nhất
    """

    winner = GetWinner(position)
    if winner != None:
        return 10 - depth if winner == "X" else -10 + depth

    if len(GetAvailableCells(position)) == 0:
        return 0

    if isMaximizing:
        maxEval = -math.inf
        for cell in GetAvailableCells(position):
            position[cell - 1] = "X"
            Eval = minimax(position, depth + 1, alpha, beta, False)
            maxEval = max(maxEval, Eval)
            alpha = max(alpha, Eval)

            position[cell - 1] = cell
            if beta <= alpha:
                break
        return maxEval

    else:
        minEval = +math.inf
        for cell in GetAvailableCells(position):
            position[cell - 1] = "O"
            Eval = minimax(position, depth + 1, alpha, beta, True)
            minEval = min(minEval, Eval)
            beta = min(beta, Eval)

            position[cell - 1] = cell
            if beta <= alpha:
                break
        return minEval


def FindBestMove(currentPosition, AI):
    """
    Trả về nước đi tốt nhất cho AI
    """
    bestVal = -math.inf if AI == "X" else +math.inf
    bestMove = -1

    for cell in GetAvailableCells(currentPosition):
        currentPosition[cell - 1] = AI

        moveVal = minimax(currentPosition, 0, -math.inf, +math.inf,
                          False if AI == "X" else True)

        currentPosition[cell - 1] = cell

        if AI == "X" and moveVal > bestVal:
            bestMove = cell
            bestVal = moveVal
        elif AI == "O" and moveVal < bestVal:
            bestMove = cell
            bestVal = moveVal

    return bestMove


def main():
    player = input("Chơi với X hay O? ").strip().upper()
    AI = "O" if player == "X" else "X"

    currentGame = [*range(1, 10)]  # bàn cờ 1..9

    currentTurn = "X"  # X đi trước
    counter = 0

    while True:

        if currentTurn == AI:
            cell = FindBestMove(currentGame, AI)
            currentGame[cell - 1] = AI
            currentTurn = player

        elif currentTurn == player:
            PrintBoard(currentGame)
            while True:
                humanInput = int(input("Nhập số ô: ").strip())

                if humanInput in currentGame:
                    currentGame[humanInput - 1] = player
                    currentTurn = AI
                    break
                else:
                    PrintBoard(currentGame)
                    print("Ô đã được đánh.")

        if GetWinner(currentGame) != None:
            PrintBoard(currentGame)
            print(f"{GetWinner(currentGame)} THẮNG!!!")
            break

        counter += 1
        if GetWinner(currentGame) == None and counter == 9:
            PrintBoard(currentGame)
            print("Hòa.")
            break


if __name__ == "__main__":
    main()


Chơi với X hay O? x

1|2|3
4|5|6
7|8|9

Nhập số ô: 1

X|2|3
4|O|6
7|8|9

Nhập số ô: 3

X|O|X
4|O|6
7|8|9

Nhập số ô: 8

X|O|X
O|O|6
7|X|9

Nhập số ô: 6

X|O|X
O|O|X
7|X|O

Nhập số ô: 7

X|O|X
O|O|X
X|X|O

Hòa.
