In [21]:
import numpy as np
import time
import random
class TicTacToe:
    def __init__(self):
        self.board = np.zeros((3, 3))  # 0: empty, 1: X, 2: O
        self.current_player = 1  # X starts
        self.game_over = False
        self.winner = None
        self.winner1 = 0
        self.winner2 = 0 
        self.draw = 0
        
    def reset(self):
        self.board = np.zeros((3, 3))
        self.current_player = 1
        self.game_over = False
        self.winner = None
        
    def available_moves(self):
        return [(i, j) for i in range(3) for j in range(3) if self.board[i, j] == 0]
    
    def make_move(self, row, col):
        if self.board[row, col] == 0 and not self.game_over:
            self.board[row, col] = self.current_player
            self.check_game_over()
            self.current_player = 3 - self.current_player  # Switch player
            return True
        return False
    
    def check_game_over(self):
        # Check rows
        for i in range(3):
            if self.board[i, 0] == self.board[i, 1] == self.board[i, 2] != 0:
                self.game_over = True
                self.winner = self.board[i, 0]
                return
                
        # Check columns
        for j in range(3):
            if self.board[0, j] == self.board[1, j] == self.board[2, j] != 0:
                self.game_over = True
                self.winner = self.board[0, j]
                return
                
        # Check diagonals
        if self.board[0, 0] == self.board[1, 1] == self.board[2, 2] != 0:
            self.game_over = True
            self.winner = self.board[0, 0]
            return
            
        if self.board[0, 2] == self.board[1, 1] == self.board[2, 0] != 0:
            self.game_over = True
            self.winner = self.board[0, 2]
            return
            
        # Check for draw
        if len(self.available_moves()) == 0:
            self.game_over = True
            self.winner = 0  # Draw
    
    def evaluate(self):
        if self.winner == 1:
            return 1
        elif self.winner == 2:
            return -1
        else:
            return 0
    
    def minimax(self, depth, is_maximizing):
        if self.game_over:
            return self.evaluate()
            
        if is_maximizing:
            best_score = -float('inf')
            for move in self.available_moves():
                self.board[move[0], move[1]] = 1
                self.check_game_over()
                score = self.minimax(depth + 1, False)
                self.board[move[0], move[1]] = 0
                self.game_over = False
                self.winner = None
                best_score = max(score, best_score)
            return best_score
        else:
            best_score = float('inf')
            for move in self.available_moves():
                self.board[move[0], move[1]] = 2
                self.check_game_over()
                score = self.minimax(depth + 1, True)
                self.board[move[0], move[1]] = 0
                self.game_over = False
                self.winner = None
                best_score = min(score, best_score)
            return best_score
    
    def find_best_move(self):
        if self.current_player == 1 and np.all(self.board == 0):
            first_random_move = random.choice(self.available_moves())
            print(f"بازیکن X حرکت اول را به ({first_random_move[0]}, {first_random_move[1]}) انتخاب کرد.")
            return first_random_move
        best_score = -float('inf') if self.current_player == 1 else float('inf')
        best_move = None
        
        for move in self.available_moves():
            self.board[move[0], move[1]] = self.current_player
            self.check_game_over()
            
            if self.current_player == 1:
                score = self.minimax(0, False)
                if score > best_score:
                    best_score = score
                    best_move = move
            else:
                score = self.minimax(0, True)
                if score < best_score:
                    best_score = score
                    best_move = move
            
            self.board[move[0], move[1]] = 0
            self.game_over = False
            self.winner = None
            
        return best_move
    
    def display(self):
        symbols = {0: ' ', 1: 'X', 2: 'O'}
        print("  0 1 2")
        for i in range(3):
            row = [symbols[self.board[i, j]] for j in range(3)]
            print(f"{i} {'|'.join(row)}")
            if i < 2:
                print("  -----")
        print()

def simulate_ai_vs_ai(game):
    move_count = 0
    
    while not game.game_over:
        #game.display()
        move = game.find_best_move()
        game.make_move(move[0], move[1])
        move_count += 1
        #print(f"بازیکن {'X' if game.current_player == 2 else 'O'} حرکت کرد: ({move[0]}, {move[1]})")
    
    if game.winner == 1:
        print("X برنده شد!")
        game.winner1 += 1
    elif game.winner == 2:
        print("O برنده شد!")
        game.winner2 += 1
    else:
        #print("بازی مساوی شد!")
        game.draw += 1
    

In [25]:
# اجرای بازی بین دو هوش مصنوعی
numebr_of_games = 100
draws = winner1 = winner2 = 0
for i in range(numebr_of_games):
    game = TicTacToe()
    simulate_ai_vs_ai(game)
    if game.winner1 == 1:
        winner1 += 1
    elif game.winner == 2:
        winner2 += 1
    else:
        draws += 1
print(f"X برنده شد: {winner1} ({winner1/numebr_of_games*100}%)")
print(f"O برنده شد: {winner2} ({winner2/numebr_of_games*100}%)")
print(f"بازی مساوی شد: {draws} ({draws/numebr_of_games*100}%)")

بازیکن X حرکت اول را به (0, 1) انتخاب کرد.
بازیکن X حرکت اول را به (2, 2) انتخاب کرد.
بازیکن X حرکت اول را به (2, 1) انتخاب کرد.
بازیکن X حرکت اول را به (0, 0) انتخاب کرد.
بازیکن X حرکت اول را به (2, 0) انتخاب کرد.
بازیکن X حرکت اول را به (1, 2) انتخاب کرد.
بازیکن X حرکت اول را به (0, 0) انتخاب کرد.
بازیکن X حرکت اول را به (0, 2) انتخاب کرد.
بازیکن X حرکت اول را به (2, 2) انتخاب کرد.
بازیکن X حرکت اول را به (1, 0) انتخاب کرد.
بازیکن X حرکت اول را به (1, 1) انتخاب کرد.
بازیکن X حرکت اول را به (2, 1) انتخاب کرد.
بازیکن X حرکت اول را به (1, 2) انتخاب کرد.
بازیکن X حرکت اول را به (0, 0) انتخاب کرد.
بازیکن X حرکت اول را به (2, 1) انتخاب کرد.
بازیکن X حرکت اول را به (1, 2) انتخاب کرد.
بازیکن X حرکت اول را به (0, 1) انتخاب کرد.
بازیکن X حرکت اول را به (2, 0) انتخاب کرد.
بازیکن X حرکت اول را به (2, 1) انتخاب کرد.
بازیکن X حرکت اول را به (2, 0) انتخاب کرد.
بازیکن X حرکت اول را به (1, 0) انتخاب کرد.
بازیکن X حرکت اول را به (2, 2) انتخاب کرد.
بازیکن X حرکت اول را به (2, 2) انتخاب کرد.
بازیکن X حر

In [5]:
def simulate_games(num_games=100):
    results = {'X': 0, 'O': 0, 'Draw': 0}
    game = TicTacToe()
    
    for _ in range(num_games):
        game.reset()
        while not game.game_over:
            if game.current_player == 1:
                move = game.find_best_move()
                game.make_move(move[0], move[1])
            else:
                move = game.find_best_move()
                game.make_move(move[0], move[1])
        
        if game.winner == 1:
            results['X'] += 1
        elif game.winner == 2:
            results['O'] += 1
        else:
            results['Draw'] += 1
    
    return results

stats = simulate_games(num_games=50)
print("نتایج 100 بازی بین دو عامل Min-Max:")
print(f"برد X: {stats['X']} ({stats['X']/10}%)")
print(f"برد O: {stats['O']} ({stats['O']/10}%)")
print(f"مساوی: {stats['Draw']} ({stats['Draw']/10}%)")

نتایج 100 بازی بین دو عامل Min-Max:
برد X: 50 (5.0%)
برد O: 0 (0.0%)
مساوی: 0 (0.0%)


In [None]:
def find_winning_paths(num_games=1000):
    winning_paths = []
    game = TicTacToe()
    
    for _ in range(num_games):
        game.reset()
        path = []
        while not game.game_over:
            if game.current_player == 1:
                move = game.find_best_move()
                game.make_move(move[0], move[1])
                path.append(('X', move))
            else:
                # Random move for O
                moves = game.available_moves()
                move = moves[np.random.randint(len(moves))]
                game.make_move(move[0], move[1])
                path.append(('O', move))
        
        if game.winner == 1:
            winning_paths.append(path)
    
    return winning_paths

winning_paths = find_winning_paths()
print(f"تعداد مسیرهای برد X در 1000 بازی: {len(winning_paths)}")
print("نمونه مسیر برد:")
for i, (player, move) in enumerate(winning_paths[0]):
    print(f"حرکت {i+1}: {player} در ({move[0]}, {move[1]})")

In [None]:
def minimax_alpha_beta(self, depth, is_maximizing, alpha=-float('inf'), beta=float('inf')):
    if self.game_over:
        return self.evaluate()
        
    if is_maximizing:
        best_score = -float('inf')
        for move in self.available_moves():
            self.board[move[0], move[1]] = 1
            self.check_game_over()
            score = self.minimax_alpha_beta(depth + 1, False, alpha, beta)
            self.board[move[0], move[1]] = 0
            self.game_over = False
            self.winner = None
            best_score = max(score, best_score)
            alpha = max(alpha, best_score)
            if beta <= alpha:
                break
        return best_score
    else:
        best_score = float('inf')
        for move in self.available_moves():
            self.board[move[0], move[1]] = 2
            self.check_game_over()
            score = self.minimax_alpha_beta(depth + 1, True, alpha, beta)
            self.board[move[0], move[1]] = 0
            self.game_over = False
            self.winner = None
            best_score = min(score, best_score)
            beta = min(beta, best_score)
            if beta <= alpha:
                break
        return best_score

In [None]:
def compare_performance():
    game = TicTacToe()
    
    # Test standard minimax
    start_time = time.time()
    game.find_best_move()
    minimax_time = time.time() - start_time
    
    # Test alpha-beta
    game.reset()
    start_time = time.time()
    best_score = -float('inf')
    best_move = None
    for move in game.available_moves():
        game.board[move[0], move[1]] = 1
        game.check_game_over()
        score = game.minimax_alpha_beta(0, False)
        game.board[move[0], move[1]] = 0
        game.game_over = False
        game.winner = None
        if score > best_score:
            best_score = score
            best_move = move
    alpha_beta_time = time.time() - start_time
    
    print(f"زمان Min-Max استاندارد: {minimax_time:.6f} ثانیه")
    print(f"زمان Min-Max با هرس آلفا-بتا: {alpha_beta_time:.6f} ثانیه")
    print(f"بهبود سرعت: {(minimax_time - alpha_beta_time)/minimax_time*100:.2f}%")

compare_performance()

In [None]:
def play_interactive():
    game = TicTacToe()
    human_player = 2  # O
    
    while True:
        game.display()
        
        if game.game_over:
            if game.winner == 1:
                print("AI (X) برنده شد!")
            elif game.winner == 2:
                print("شما (O) برنده شدید!")
            else:
                print("مساوی!")
            break
            
        if game.current_player == human_player:
            try:
                row = int(input("ردیف (0-2): "))
                col = int(input("ستون (0-2): "))
                if not game.make_move(row, col):
                    print("حرکت نامعتبر! دوباره امتحان کنید.")
            except:
                print("ورودی نامعتبر! دوباره امتحان کنید.")
        else:
            print("AI در حال فکر کردن...")
            move = game.find_best_move()
            game.make_move(move[0], move[1])

# برای اجرای بازی:
# play_interactive()