<a href="https://colab.research.google.com/github/thongle28625/ttnt/blob/main/LeQuocThong_2001230937_TTNT.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

**Thuật toán Minimax**

1. Các biến toàn cục

In [None]:
import copy
import math
import numpy
X = "X"
O = "O"
EMPTY = None
user = None
ai = None

- X và O: Là ký tự đại diện cho hai người chơi trong trò chơi Tic-Tac-Toe. Một người sẽ chơi bằng dấu "X", người còn lại sẽ chơi bằng dấu "O".
- EMPTY: Đại diện cho các ô trống trên bảng (chưa có dấu X hay O).
- user và ai: Biến dùng để lưu trữ người chơi và AI. Mỗi khi bắt đầu trò chơi, người chơi sẽ chọn "X" hoặc "O", và AI sẽ tự động nhận ký tự còn lại.

2. Hàm initial_state()

In [None]:
def initial_state():
    return [[EMPTY, EMPTY, EMPTY],
            [EMPTY, EMPTY, EMPTY],
            [EMPTY, EMPTY, EMPTY]]

Hàm này trả về trạng thái ban đầu của bảng Tic-Tac-Toe. Mỗi ô trên bảng bắt đầu là EMPTY (None), tạo thành một bảng 3x3 trống.

3. Hàm player(board)

In [None]:
def player(board):
    count = 0
    for i in board:
        for j in i:
            if j:
                count += 1
    if count % 2 != 0:
        return ai
    return user

- Hàm này xác định người chơi tiếp theo dựa trên số ô đã có dấu (X hoặc O).

- Nếu số ô đã được đánh dấu là số lẻ, thì AI sẽ đi tiếp, ngược lại, người chơi sẽ đi tiếp.

4. Hàm actions(board)

In [None]:
def actions(board):
    res = set()
    board_len = len(board)
    for i in range(board_len):
        for j in range(board_len):
            if board[i][j] == EMPTY:
                res.add((i, j))
    return res


- Hàm này trả về tất cả các hành động hợp lệ (tức là các ô trống) mà người chơi hoặc AI có thể chọn.

- **res** là một tập hợp các chỉ số (i, j) đại diện cho các ô trống trên bảng.

5. Hàm result(board, action)

In [None]:

def result(board, action):
    curr_player = player(board)
    result_board = copy.deepcopy(board)
    (i, j) = action
    result_board[i][j] = curr_player
    return result_board

- Hàm này trả về trạng thái bảng mới sau khi một người chơi hoặc AI thực hiện một nước đi.

- action là một tuple (i, j) xác định vị trí mà người chơi chọn.

- **curr_player** là người chơi hiện tại (người hoặc AI), và hàm sẽ đặt dấu của người chơi vào ô (i, j) trên bản sao của bảng (để không thay đổi bảng gốc).

6. Hàm kiểm tra người thắng (get_horizontal_winner(board))

In [None]:
def get_horizontal_winner(board):
    # check horizontally
    board_len = len(board)
    for i in range(board_len):
        winner_val = board[i][0]
        if winner_val is not EMPTY:
            all_same = True
            for j in range(1, board_len):
                if board[i][j] != winner_val:
                    all_same = False
                    break
            if all_same:
                return winner_val
    return None

- Hàm này kiểm tra các hàng trên bảng để xác định liệu có người thắng không.

- Nếu **một hàng có tất cả các ô** giống nhau (toàn bộ là "X" hoặc "O"), thì người thắng sẽ được xác định là người sở hữu ký tự đó.

7. Hàm get_vertical_winner(board)

In [None]:
def get_vertical_winner(board):
    # check vertically
    board_len = len(board)
    for i in range(board_len):
        winner_val = board[0][i]
        if winner_val is not EMPTY:
            all_same = True
            for j in range(1, board_len):
                if board[j][i] != winner_val:
                    all_same = False
                    break
            if all_same:
                return winner_val
    return None

Hàm này kiểm tra các cột trên bảng theo cách tương tự như hàm get_horizontal_winner(). Nếu **tất cả các ô trong một cột** giống nhau, người thắng sẽ được xác định.

8. Hàm get_diagonal_winner(board)

In [None]:
def get_diagonal_winner(board):
    # check diagonally
    board_len = len(board)

    # Check the first diagonal (top-left to bottom-right)
    winner_val = board[0][0]
    if winner_val is not EMPTY:
        all_same = True
        for i in range(1, board_len):
            if board[i][i] != winner_val:
                all_same = False
                break
        if all_same:
            return winner_val

    # Check the second diagonal (top-right to bottom-left)
    winner_val = board[0][board_len - 1]
    if winner_val is not EMPTY:
        all_same = True
        for i in range(1, board_len):
            j = board_len - 1 - i
            if board[i][j] != winner_val:
                all_same = False
                break
        if all_same:
            return winner_val

    return None

- Hàm này kiểm tra cả **hai đường chéo** của bảng để tìm ra người thắng.

- Nó kiểm tra xem các ô trên đường chéo từ góc trên bên trái đến góc dưới bên phải, và từ góc trên bên phải đến góc dưới bên trái, có đồng nhất không.

9. Hàm winner(board)

In [None]:
def winner(board):
    # Check for horizontal winner
    h_winner = get_horizontal_winner(board)
    if h_winner:
        return h_winner
    # Check for vertical winner
    v_winner = get_vertical_winner(board)
    if v_winner:
        return v_winner
    # Check for diagonal winner
    d_winner = get_diagonal_winner(board)
    if d_winner:
        return d_winner
    return None

- Hàm này sử dụng ba hàm kiểm tra thắng đã giải thích ở trên để xác định người thắng của trò chơi (nếu có).

- Nếu không có ai thắng, nó sẽ trả về None.

10. Hàm terminal(board)

In [None]:
def terminal(board):
    if winner(board) != None:
        return True
    for i in board:
        for j in i:
            if j == EMPTY:
                return False
    return True


- Hàm này kiểm tra xem trò chơi đã kết thúc hay chưa.

- Trò chơi kết thúc khi có người thắng hoặc tất cả các ô trên bảng đều đã được đánh dấu (tức là một trận hòa).

11. Hàm utility(board)

In [None]:
def utility(board):
    winner_val = winner(board)
    if winner_val == X:
        return 1
    elif winner_val == O:
        return -1
    return 0

Hàm này trả về giá trị utility của trò chơi: 1 nếu người chơi "X" thắng, -1 nếu người chơi "O" thắng, và 0 nếu không có ai thắng (hòa hoặc chưa kết thúc).

12. Các hàm Minimax (maxValue, minValue)

In [None]:
def maxValue(state):
    if terminal(state):
        return utility(state)
    v = -math.inf
    for action in actions(state):
        v = max(v, minValue(result(state, action)))
    return v

def minValue(state):
    if terminal(state):
        return utility(state)
    v = math.inf
    for action in actions(state):
        v = min(v, maxValue(result(state, action)))
    return v

- Đây là phần minimax algorithm cho AI.

- maxValue(state): Dành cho AI (người chơi "X"). AI sẽ cố gắng chọn nước đi có giá trị utility lớn nhất (thắng).

- minValue(state): Dành cho người chơi (người chơi "O"). Người chơi sẽ cố gắng chọn nước đi có giá trị utility nhỏ nhất (thắng).

13. Hàm minimax(board)

In [None]:
def minimax(board):
    current_player = player(board)
    if current_player == X:
        max_val = -math.inf
        move = None # Initialize move
        for action in actions(board):
            check = minValue(result(board, action))
            if check > max_val:
                max_val = check
                move = action
        return move
    else:
        min_val = math.inf
        move = None # Initialize move
        for action in actions(board):
            check = maxValue(result(board, action))
            if check < min_val:
                min_val = check
                move = action
        return move

- Hàm này chọn nước đi tối ưu cho người chơi hiện tại, dựa trên kết quả của minimax.

- Nếu AI đang chơi, nó sẽ chọn nước đi tối ưu bằng cách gọi minValue.

- Nếu người chơi đang chơi, nó sẽ chọn nước đi tối ưu bằng cách gọi maxValue.

Main Game Loop

In [None]:
if __name__ == "__main__":
    board = initial_state()
    ai_turn = False
    print("Choose a player (X/O): ")
    user = input()
    if user == "X":
        ai = "O"
    else:
        ai = "X"

    while True:
        game_over = terminal(board)
        playr = player(board)
        if game_over:
            final_winner = winner(board) # Renamed to avoid conflict with function name
            if final_winner is None:
                print("Game Over: Tie.")
            else:
                print(f"Game Over: {final_winner} wins.")
            break
        else:
            # Print current board state for better visualization
            print("Current Board:")
            horizontal_line = "----------"
            print(horizontal_line)
            for row in board:
                formatted_cells = []
                for cell in row:
                    if cell == EMPTY:
                        formatted_cells.append('__')
                    else:
                        formatted_cells.append(str(cell) + '_')
                print("|" + "|".join(formatted_cells) + "|")
            print(horizontal_line)
            print(f"It's {playr}'s turn.")

            if user != playr and not game_over:
                if ai_turn:
                    print("AI is thinking...")
                    move = minimax(board)
                    board = result(board, move)
                    ai_turn = False
                    print("AI made a move:")
            elif user == playr and not game_over:
                ai_turn = True
                print("Enter the position to move (row,col) e.g., 1,2:")
                try:
                    user_input = input()
                    i_str, j_str = user_input.split(',')
                    i = int(i_str.strip())
                    j = int(j_str.strip())

                    if not (0 <= i < 3 and 0 <= j < 3):
                        print("Invalid input: Row and column must be between 0 and 2.")
                        ai_turn = False # Let user try again
                        continue
                    if board[i][j] == EMPTY:
                        board = result(board, (i, j))
                    else:
                        print("Invalid move: Cell is not empty.")
                        ai_turn = False # Let user try again
                except ValueError:
                    print("Invalid input: Please enter numbers for row and column in 'row,col' format.")
                    ai_turn = False # Let user try again
                except IndexError:
                    print("Invalid input: Row and column must be within board limits (0-2). Please use 'row,col' format.")
                    ai_turn = False # Let user try again

            # Print board after a move is made
            print("Board after move:")
            horizontal_line = "----------"
            print(horizontal_line)
            for row in board:
                formatted_cells = []
                for cell in row:
                    if cell == EMPTY:
                        formatted_cells.append('__')
                    else:
                        formatted_cells.append(str(cell) + '_')
                print("|" + "|".join(formatted_cells) + "|")
            print(horizontal_line)
            print("\n")

**1. Khởi tạo trò chơi:**
- Khởi tạo bảng: Chương trình bắt đầu với một bảng Tic-Tac-Toe 3x3, tất cả các ô đều trống.
- Lựa chọn người chơi và AI: Người chơi sẽ chọn giữa "X" hoặc "O", và AI sẽ tự động nhận ký tự còn lại.

**2. Quy trình chơi game:**
- Sau khi khởi tạo, chương trình sẽ kiểm tra xem ai là người chơi tiếp theo dựa trên số lượng ô đã được đánh dấu trên bảng. Người chơi và AI sẽ thay phiên nhau thực hiện các nước đi.
- Cả người chơi và AI đều có lượt đi lần lượt:
  + AI: Sử dụng thuật toán minimax để tính toán nước đi tối ưu.
  + Người chơi: Người chơi nhập vào vị trí họ muốn đi trên bảng (theo định dạng hàng và cột).
- Sau mỗi lượt đi, trạng thái của bảng sẽ được in ra để người chơi có thể theo dõi.

**3. Kiểm tra kết thúc trò chơi:**
- Sau mỗi nước đi, chương trình kiểm tra xem trò chơi có kết thúc chưa:
  + Kết thúc nếu có người thắng: Chương trình sẽ kiểm tra các hàng, cột và đường chéo để xác định người thắng.
  + Kết thúc nếu hòa: Nếu bảng đầy mà không có ai thắng, trò chơi kết thúc với kết quả hòa.
- Khi trò chơi kết thúc, kết quả sẽ được thông báo (ai thắng hoặc hòa) và vòng lặp sẽ dừng lại.

**Thuật toán cắt tỉa Alpha-beta**

1. Khai báo thư viện

In [None]:
import os
import math

2. Hàm GetWinner():

In [None]:
def GetWinner(board, N):
    # Kiểm tra chiến thắng theo các dòng, cột và chéo
    # Kiểm tra các dòng ngang
    for row in range(N):
        if all(board[row * N + j] == board[row * N] and board[row * N] is not None for j in range(N)):
            return board[row * N]

    # Kiểm tra các cột dọc
    for col in range(N):
        if all(board[j * N + col] == board[col] and board[col] is not None for j in range(N)):
            return board[col]

    # Kiểm tra các đường chéo
    # Đường chéo chính (top-left to bottom-right)
    if all(board[i * N + i] == board[0] and board[0] is not None for i in range(N)):
        return board[0]

    # Đường chéo phụ (top-right to bottom-left)
    if all(board[i * N + (N - 1 - i)] == board[N - 1] and board[N - 1] is not None for i in range(N)):
        return board[N - 1]

    return None

- Chức năng này kiểm tra tất cả các dòng (hàng, cột và chéo) để xác định người thắng.
- Trả về "X" hoặc "O" nếu có người thắng, nếu không thì trả về None.

3. Cập nhật PrintBoard():

In [None]:
def PrintBoard(board, N):
    os.system('cls' if os.name == 'nt' else 'clear')
    for i in range(N):
        print(" | ".join([str(cell) if cell is not None else ' ' for cell in [board[i * N + j] for j in range(N)]]))
        if i < N - 1:
            print("-" * (N * 4 - 1))

- Dùng để in ra bàn cờ sau mỗi lượt chơi.

- Đầu tiên, hàm sẽ xóa màn hình (dùng lệnh os.system('cls' cho Windows và 'clear' cho Linux/Mac) để làm mới giao diện.

- Sau đó, in từng hàng của bàn cờ, mỗi ô cách nhau bằng dấu |.

- Nếu có nhiều hàng, sẽ in thêm dấu - để phân cách các hàng.

4. Hàm GetAvailableCells():



In [None]:
def GetAvailableCells(board):
    available = []
    for i, cell in enumerate(board):
        if cell is None:
            available.append(i)
    return available

- Duyệt qua tất cả các ô trên bàn cờ và kiểm tra xem ô đó có phải là None (ô trống không có người chơi đánh vào) không.

- Trả về danh sách các chỉ số của các ô trống.

5. Hàm minimax():

In [None]:
def minimax(position, depth, alpha, beta, isMaximizing, N):
    winner = GetWinner(position, N)
    if winner == "X":
        return 10 - depth
    elif winner == "O":
        return -10 + depth
    if len(GetAvailableCells(position)) == 0:
        return 0

    if isMaximizing:
        maxEval = -math.inf
        for cell in GetAvailableCells(position):
            position[cell] = "X"  # AI move
            eval = minimax(position, depth + 1, alpha, beta, False, N)
            maxEval = max(maxEval, eval)
            alpha = max(alpha, eval)
            position[cell] = None  # Undo move
            if beta <= alpha:
                break  # Alpha-beta pruning
        return maxEval
    else:
        minEval = math.inf
        for cell in GetAvailableCells(position):
            position[cell] = "O"  # Player move
            eval = minimax(position, depth + 1, alpha, beta, True, N)
            minEval = min(minEval, eval)
            beta = min(beta, eval)
            position[cell] = None  # Undo move
            if beta <= alpha:
                break  # Alpha-beta pruning
        return minEval

- Thuật toán **Minimax** giúp AI tính toán tất cả các khả năng đi của mình và đối thủ, từ đó chọn được nước đi tốt nhất.

- **Alpha-Beta Pruning** giúp giảm thiểu số lượng nước đi cần kiểm tra, từ đó tiết kiệm thời gian tính toán. Khi alpha >= beta, thuật toán sẽ cắt bớt những nhánh không cần thiết.

- **isMaximizing**: Biến này xác định xem AI đang muốn tối đa hóa hay người chơi đang muốn tối thiểu hóa điểm số. AI muốn có điểm cao nhất, còn người chơi muốn có điểm thấp nhất.

- Nếu AI thắng, hàm trả về 10 - depth (chỉ số càng thấp càng tốt cho AI). Nếu người chơi thắng, trả về -10 + depth (chỉ số càng thấp càng xấu cho AI).

- Nếu không ai thắng và bàn cờ đã đầy, trả về 0 (hòa).

6. Hàm FindBestMove():

In [None]:
def FindBestMove(currentPosition, AI, N):
    bestVal = -math.inf if AI == "X" else math.inf
    bestMove = -1
    for cell in GetAvailableCells(currentPosition):
        currentPosition[cell] = AI
        moveVal = minimax(currentPosition, 0, -math.inf, math.inf, False if AI == "X" else True, N)
        currentPosition[cell] = None
        if (AI == "X" and moveVal > bestVal):
            bestMove = cell
            bestVal = moveVal
        elif (AI == "O" and moveVal < bestVal):
            bestMove = cell
            bestVal = moveVal
    return bestMove

- Hàm này gọi thuật toán **Minimax** để tính toán giá trị của từng nước đi của AI và chọn nước đi tốt nhất.

- **bestVal** lưu trữ giá trị tối ưu của nước đi, với AI muốn tối đa hóa giá trị nếu chơi "X" hoặc tối thiểu hóa giá trị nếu chơi "O".

- Sau khi kiểm tra tất cả các nước đi, hàm trả về **bestMove** là chỉ số của nước đi tốt nhất.


7. Hàm Main():

In [None]:
def main():
    N = int(input("Enter the size of the board (N, for example 3 for a 3x3 board): ").strip())
    player = input("Play as X or O? ").strip().upper()
    AI = "O" if player == "X" else "X"
    currentGame = [None] * (N * N)  # Board with N*N empty spots
    currentTurn = "X"  # X always starts
    counter = 0

    while True:
        if currentTurn == AI:
            PrintBoard(currentGame, N) # Print board before AI move to show current state
            print("AI is thinking...") # Add this line to show AI is processing
            # AI makes its move
            cell = FindBestMove(currentGame, AI, N)
            currentGame[cell] = AI
            currentTurn = player  # Switch turn to player
        elif currentTurn == player:
            PrintBoard(currentGame, N)
            while True:
                try:
                    humanInput = int(input(f"Enter Number (1-{N * N}): ").strip()) - 1
                    if currentGame[humanInput] is None:
                        currentGame[humanInput] = player
                        currentTurn = AI  # Switch turn to AI
                        break
                    else:
                        print("Cell not available. Please try again.")
                except (ValueError, IndexError):
                    print(f"Invalid input. Please enter a number between 1 and {N * N}.")

        # PrintBoard(currentGame, N) # Removed this as it's already printed inside the if/elif blocks

        winner = GetWinner(currentGame, N)
        if winner:
            print(f"{winner} WON!!!")
            break

        counter += 1
        if counter == N * N:
            print("Tie.")
            break


if __name__ == "__main__":
    main()

- Nhập size của bảng cờ
- Người chơi chọn ký hiệu (X hoặc O).

- Nếu người chơi chọn X, AI sẽ chơi O và ngược lại.

- Bàn cờ được tạo ra với kích thước N x N, với các ô trống là None.

- Trò chơi sẽ tiếp tục đến khi có người thắng hoặc hòa