In [1]:
import matplotlib.pyplot as plt
import numpy as np
import os
import pyspiel
import gym
import re


In [12]:
# 创建井字棋游戏环境
env = pyspiel.load_game("tic_tac_toe")
state = env.new_initial_state()

print("=== 井字棋游戏状态查询 ===")
print()

# 查询当前玩家
current_player = state.current_player()
print(f"当前玩家: {current_player}")

# 根据玩家ID确定棋子形状
def get_player_symbol(player_id):
    """根据玩家ID返回对应的棋子符号"""
    if player_id == 0:
        return 'X'
    elif player_id == 1:
        return 'O'
    else:
        return '?'

player_symbol = get_player_symbol(current_player)
print(f"当前玩家的棋子形状: {player_symbol}")

print()
print("=== 游戏进行中的状态变化 ===")
print()

# 显示初始棋盘
print("初始棋盘:")
print(state)
print()

# 进行几步棋，观察玩家变化
for step in range(5):
    if state.is_terminal():
        break
    
    # 查询当前玩家
    current_player = state.current_player()
    player_symbol = get_player_symbol(current_player)
    
    print(f"第{step+1}步 - 当前玩家: {current_player} ({player_symbol})")
    
    # 获取合法行动
    legal_actions = state.legal_actions()
    print(f"合法行动: {legal_actions}")
    
    # 选择第一个合法行动
    action = legal_actions[0]
    print(f"选择行动: {action}")
    
    # 执行行动
    state.apply_action(action)
    
    # 显示棋盘
    print("棋盘状态:")
    print(state)
    print(f"轮到下一个玩家: {state.current_player()}")
    print("-" * 30)


=== 井字棋游戏状态查询 ===

当前玩家: 0
当前玩家的棋子形状: X

=== 游戏进行中的状态变化 ===

初始棋盘:
...
...
...

第1步 - 当前玩家: 0 (X)
合法行动: [0, 1, 2, 3, 4, 5, 6, 7, 8]
选择行动: 0
棋盘状态:
x..
...
...
轮到下一个玩家: 1
------------------------------
第2步 - 当前玩家: 1 (O)
合法行动: [1, 2, 3, 4, 5, 6, 7, 8]
选择行动: 1
棋盘状态:
xo.
...
...
轮到下一个玩家: 0
------------------------------
第3步 - 当前玩家: 0 (X)
合法行动: [2, 3, 4, 5, 6, 7, 8]
选择行动: 2
棋盘状态:
xox
...
...
轮到下一个玩家: 1
------------------------------
第4步 - 当前玩家: 1 (O)
合法行动: [3, 4, 5, 6, 7, 8]
选择行动: 3
棋盘状态:
xox
o..
...
轮到下一个玩家: 0
------------------------------
第5步 - 当前玩家: 0 (X)
合法行动: [4, 5, 6, 7, 8]
选择行动: 4
棋盘状态:
xox
ox.
...
轮到下一个玩家: 1
------------------------------


In [None]:
# 更详细的游戏状态查询示例
print("=== 更详细的游戏状态查询 ===")
print()

# 重新创建游戏状态
env = pyspiel.load_game("tic_tac_toe")
state = env.new_initial_state()

# 游戏信息
print("游戏信息:")
print(f"游戏名称: {env.get_type().short_name}")
print(f"玩家数量: {env.num_players()}")
print(f"最大游戏长度: {env.max_game_length()}")
print()

# 创建一个更完整的状态查询函数
def analyze_game_state(state):
    """分析游戏状态的详细信息"""
    print("--- 游戏状态分析 ---")
    print(f"当前玩家: {state.current_player()}")
    print(f"当前玩家棋子: {get_player_symbol(state.current_player())}")
    print(f"游戏是否结束: {state.is_terminal()}")
    print(f"已进行回合数: {state.move_number()}")
    
    if not state.is_terminal():
        legal_actions = state.legal_actions()
        print(f"当前玩家可选行动: {legal_actions}")
        
        # 将行动转换为坐标
        print("行动对应坐标:")
        for action in legal_actions:
            row = action // 3
            col = action % 3
            print(f"  行动 {action}: 第{row}行第{col}列")
    else:
        returns = state.returns()
        print(f"游戏结果: {returns}")
        if returns[0] > returns[1]:
            print("玩家0 (X) 获胜！")
        elif returns[1] > returns[0]:
            print("玩家1 (O) 获胜！")
        else:
            print("平局！")
    
    print("当前棋盘:")
    print(state)
    print()

# 分析初始状态
analyze_game_state(state)

# 手动进行一局游戏
print("=== 手动进行一局游戏 ===")
moves = [0, 4, 1, 3, 2]  # 预设的行动序列

for i, move in enumerate(moves):
    if state.is_terminal():
        break
    
    print(f"第{i+1}步:")
    print(f"玩家{state.current_player()}选择行动 {move}")
    state.apply_action(move)
    analyze_game_state(state)
    
    if state.is_terminal():
        break


In [2]:
env=pyspiel.load_game("tic_tac_toe")

In [3]:
state=env.new_initial_state()

In [4]:
print(state)

...
...
...


In [11]:
print(state.legal_actions())
print(state)
print(state.current_player())
print(state.is_terminal())

[0, 3, 4, 5, 6, 7, 8]
.xo
...
...
0
False


In [8]:
state.apply_action(2)

In [9]:
print(state)

.xo
...
...
