In [2]:
# ─── สำรวจข้อมูลใน strategy_production.db ───
print("🔍 สำรวจฐานข้อมูล strategy_production.db")
print("="*60)

import sqlite3
import pandas as pd
import os

# เชื่อมต่อฐานข้อมูล
db_path = r"c:\university\nsc\agent-maknib\app\llm\strategy_production.db"
conn = sqlite3.connect(db_path)

# แสดงข้อมูลพื้นฐาน
file_size = os.path.getsize(db_path)
size_mb = file_size / (1024 * 1024)
print(f"💾 ขนาดไฟล์: {size_mb:.2f} MB ({file_size:,} bytes)")

# ดูโครงสร้างตาราง strategies
print(f"\n📊 โครงสร้างตาราง 'strategies':")
cursor = conn.cursor()
cursor.execute("PRAGMA table_info(strategies);")
columns_info = cursor.fetchall()

for col_info in columns_info:
    col_id, col_name, col_type, not_null, default_val, pk = col_info
    pk_text = " (PRIMARY KEY)" if pk else ""
    not_null_text = " NOT NULL" if not_null else ""
    print(f"   • {col_name}: {col_type}{pk_text}{not_null_text}")

# นับจำนวนแถว
cursor.execute("SELECT COUNT(*) FROM strategies;")
total_rows = cursor.fetchone()[0]
print(f"\n📈 จำนวนแถวทั้งหมด: {total_rows:,}")

# แสดงกลยุทธ์ทั้งหมด
cursor.execute("SELECT DISTINCT strategy FROM strategies ORDER BY strategy;")
strategies = [row[0] for row in cursor.fetchall()]
print(f"\n🎯 จำนวนกลยุทธ์: {len(strategies)}")
print("📋 รายชื่อกลยุทธ์ทั้งหมด:")
for i, strategy in enumerate(strategies, 1):
    print(f"   {i:2d}. {strategy}")

conn.close()

🔍 สำรวจฐานข้อมูล strategy_production.db
💾 ขนาดไฟล์: 0.71 MB (749,568 bytes)

📊 โครงสร้างตาราง 'strategies':
   • iteration: INTEGER
   • game_number: INTEGER
   • strategy: TEXT
   • action_sequence: TEXT
   • total_moves: INTEGER

📈 จำนวนแถวทั้งหมด: 972

🎯 จำนวนกลยุทธ์: 36
📋 รายชื่อกลยุทธ์ทั้งหมด:
    1. กวนน้ำจับปลา
    2. ขึ้นบ้านชักบันได
    3. คบไกลตีใกล้
    4. จักจั่นลอกคราบ
    5. จับโจรเอาหัวโจก
    6. จูงแพะติดมือ
    7. ชี้ต้นหม่อนด่าต้นไหว
    8. ซ่อนดาบในรอยยิ้ม
    9. ดูไฟชายฝั่ง
   10. ตีชิงตามไฟ
   11. ตีหญ้าให้งูตื่น
   12. ต้นไม้ผลิดอก
   13. ถอนฟืนใต้กระทะ
   14. ทุกข์กาย
   15. ปิดประตูจับโจร
   16. ปิดฟ้าข้ามทะเล
   17. มีในไม่มี
   18. ยืมซากคืนชีพ
   19. ยืมดาบฆ่าคน
   20. ยืมทางพรางกล
   21. รอซ้ำยามเปลี้ย
   22. ลอบตีเฉินชาง
   23. ลักขื่อเปลี่ยนเสา
   24. ลูกโซ่
   25. ล่อเสือออกจากถ้ำ
   26. ล้อมเวยช่วยจ้าว
   27. สลับแขกเป็นเจ้าบ้าน
   28. สาวงาม
   29. ส่งเสียงบูรพาฝ่าตีประจิม
   30. หลบหนี
   31. หลี่ตายแทนถาว
   32. เปิดเมือง
   33. แสร้งทำบอแต่ไม่บ้า
   

In [3]:
# ─── ดูข้อมูลละเอียดของแต่ละกลยุทธ์ ───
print("📊 วิเคราะห์ข้อมูลแต่ละกลยุทธ์")
print("="*60)

import sqlite3
import pandas as pd

# เชื่อมต่อฐานข้อมูล
conn = sqlite3.connect(r"c:\university\nsc\agent-maknib\app\llm\strategy_production.db")

# โหลดข้อมูลทั้งหมด
df = pd.read_sql_query("SELECT * FROM strategies", conn)

print(f"📈 สถิติรวม:")
print(f"   • จำนวนแถว: {len(df):,}")
print(f"   • จำนวนกลยุทธ์: {df['strategy'].nunique()}")
print(f"   • จำนวน iterations: {df['iteration'].nunique()}")
print(f"   • จำนวน game numbers: {df['game_number'].nunique()}")

# สถิติ total_moves
print(f"\n🎮 สถิติ total_moves:")
print(f"   • เฉลี่ย: {df['total_moves'].mean():.1f}")
print(f"   • มัธยฐาน: {df['total_moves'].median():.1f}")
print(f"   • ต่ำสุด: {df['total_moves'].min()}")
print(f"   • สูงสุด: {df['total_moves'].max()}")

# สถิติตามกลยุทธ์
print(f"\n🎯 สถิติตามกลยุทธ์ (Top 10 ที่มี moves มากที่สุด):")
strategy_stats = df.groupby('strategy')['total_moves'].agg(['count', 'mean', 'min', 'max']).round(1)
strategy_stats = strategy_stats.sort_values('mean', ascending=False)

for i, (strategy, stats) in enumerate(strategy_stats.head(10).iterrows(), 1):
    print(f"   {i:2d}. {strategy}")
    print(f"       Records: {stats['count']}, เฉลี่ย: {stats['mean']:.1f}, ต่ำสุด-สูงสุด: {stats['min']}-{stats['max']}")

conn.close()

📊 วิเคราะห์ข้อมูลแต่ละกลยุทธ์
📈 สถิติรวม:
   • จำนวนแถว: 972
   • จำนวนกลยุทธ์: 36
   • จำนวน iterations: 49
   • จำนวน game numbers: 20

🎮 สถิติ total_moves:
   • เฉลี่ย: 110.3
   • มัธยฐาน: 93.0
   • ต่ำสุด: 50
   • สูงสุด: 365

🎯 สถิติตามกลยุทธ์ (Top 10 ที่มี moves มากที่สุด):
    1. ปิดฟ้าข้ามทะเล
       Records: 27.0, เฉลี่ย: 163.3, ต่ำสุด-สูงสุด: 73.0-287.0
    2. จักจั่นลอกคราบ
       Records: 27.0, เฉลี่ย: 159.3, ต่ำสุด-สูงสุด: 50.0-365.0
    3. กวนน้ำจับปลา
       Records: 27.0, เฉลี่ย: 128.4, ต่ำสุด-สูงสุด: 50.0-338.0
    4. รอซ้ำยามเปลี้ย
       Records: 27.0, เฉลี่ย: 126.5, ต่ำสุด-สูงสุด: 50.0-327.0
    5. มีในไม่มี
       Records: 27.0, เฉลี่ย: 125.0, ต่ำสุด-สูงสุด: 50.0-288.0
    6. ขึ้นบ้านชักบันได
       Records: 27.0, เฉลี่ย: 123.6, ต่ำสุด-สูงสุด: 50.0-251.0
    7. ยืมซากคืนชีพ
       Records: 27.0, เฉลี่ย: 122.4, ต่ำสุด-สูงสุด: 50.0-245.0
    8. ทุกข์กาย
       Records: 27.0, เฉลี่ย: 119.7, ต่ำสุด-สูงสุด: 50.0-299.0
    9. ยืมดาบฆ่าคน
       Records: 27.0, เฉลี่ย: 119

In [4]:
# ─── ดู Action Sequence ของกลยุทธ์ที่เลือก ───
print("🎮 ดู Action Sequence ของกลยุทธ์")
print("="*60)

import sqlite3
import pandas as pd

# เลือกกลยุทธ์ที่ต้องการดู (เปลี่ยนได้ตามต้องการ)
selected_strategy = "ปิดฟ้าข้ามทะเล"  # เปลี่ยนชื่อกลยุทธ์ได้ที่นี่

print(f"🎯 กลยุทธ์ที่เลือก: {selected_strategy}")

# เชื่อมต่อฐานข้อมูล
conn = sqlite3.connect(r"c:\university\nsc\agent-maknib\app\llm\strategy_production.db")

# ค้นหาข้อมูลของกลยุทธ์ที่เลือก
query = """
SELECT iteration, game_number, strategy, action_sequence, total_moves 
FROM strategies 
WHERE strategy = ? 
ORDER BY iteration, game_number
"""

strategy_data = pd.read_sql_query(query, conn, params=[selected_strategy])

if strategy_data.empty:
    print(f"❌ ไม่พบข้อมูลสำหรับกลยุทธ์: {selected_strategy}")
    
    # แสดงกลยุทธ์ที่มีในฐานข้อมูล
    available_strategies = pd.read_sql_query("SELECT DISTINCT strategy FROM strategies ORDER BY strategy", conn)
    print(f"\n📋 กลยุทธ์ที่มีในฐานข้อมูล:")
    for i, strategy in enumerate(available_strategies['strategy'], 1):
        print(f"   {i:2d}. {strategy}")
else:
    print(f"✅ พบข้อมูล {len(strategy_data)} records")
    
    print(f"\n📊 ข้อมูลทั้งหมดของกลยุทธ์ '{selected_strategy}':")
    for i, row in strategy_data.iterrows():
        print(f"\n📋 Record {i+1}:")
        print(f"   • Iteration: {row['iteration']}")
        print(f"   • Game Number: {row['game_number']}")
        print(f"   • Total Moves: {row['total_moves']}")
        print(f"   • Action Sequence: {row['action_sequence'][:100]}...")
        
        # แปลง action sequence เป็น list
        if pd.notna(row['action_sequence']) and '->' in str(row['action_sequence']):
            actions = str(row['action_sequence']).split('->')
            print(f"   • จำนวน Actions: {len(actions)}")
            print(f"   • Actions แรก 10 ตัว: {actions[:10]}")
            if len(actions) > 10:
                print(f"   • Actions สุดท้าย 5 ตัว: {actions[-5:]}")

conn.close()

🎮 ดู Action Sequence ของกลยุทธ์
🎯 กลยุทธ์ที่เลือก: ปิดฟ้าข้ามทะเล
✅ พบข้อมูล 27 records

📊 ข้อมูลทั้งหมดของกลยุทธ์ 'ปิดฟ้าข้ามทะเล':

📋 Record 1:
   • Iteration: 0
   • Game Number: 1
   • Total Moves: 73
   • Action Sequence: 463->3933->292->4087->97->1880->381->4031->203->3569->2338->1566->2194->3852->1202->1951->430->2013-...
   • จำนวน Actions: 73
   • Actions แรก 10 ตัว: ['463', '3933', '292', '4087', '97', '1880', '381', '4031', '203', '3569']
   • Actions สุดท้าย 5 ตัว: ['1821', '3966', '1884', '3446', '1154']

📋 Record 2:
   • Iteration: 0
   • Game Number: 2
   • Total Moves: 287
   • Action Sequence: 357->3819->261->3722->479->3697->430->651->2009->718->1630->3153->48->1137->1966->907->2381->723->29...
   • จำนวน Actions: 287
   • Actions แรก 10 ตัว: ['357', '3819', '261', '3722', '479', '3697', '430', '651', '2009', '718']
   • Actions สุดท้าย 5 ตัว: ['262', '527', '430', '1023', '2858']

📋 Record 3:
   • Iteration: 0
   • Game Number: 3
   • Total Moves: 170
   • Action Seq

In [5]:
# ─── สร้าง Function สำหรับค้นหาข้อมูลจากฐานข้อมูล ───
print("🛠️ สร้าง Functions สำหรับใช้งาน strategy_production.db")
print("="*60)

import sqlite3
import pandas as pd
from typing import List, Dict, Optional

class StrategyDatabase:
    def __init__(self, db_path: str = r"c:\university\nsc\agent-maknib\app\llm\strategy_production.db"):
        self.db_path = db_path
    
    def get_all_strategies(self) -> List[str]:
        """ดึงรายชื่อกลยุทธ์ทั้งหมด"""
        conn = sqlite3.connect(self.db_path)
        cursor = conn.cursor()
        cursor.execute("SELECT DISTINCT strategy FROM strategies ORDER BY strategy")
        strategies = [row[0] for row in cursor.fetchall()]
        conn.close()
        return strategies
    
    def get_strategy_actions(self, strategy_name: str) -> List[str]:
        """ดึง action IDs ทั้งหมดของกลยุทธ์ที่ระบุ"""
        conn = sqlite3.connect(self.db_path)
        query = "SELECT action_sequence FROM strategies WHERE strategy = ?"
        cursor = conn.cursor()
        cursor.execute(query, (strategy_name,))
        results = cursor.fetchall()
        conn.close()
        
        all_actions = []
        for (action_seq,) in results:
            if action_seq and '->' in str(action_seq):
                actions = str(action_seq).split('->')
                all_actions.extend([a.strip() for a in actions if a.strip()])
        
        return all_actions
    
    def get_strategy_stats(self, strategy_name: str) -> Dict:
        """ดึงสถิติของกลยุทธ์ที่ระบุ"""
        conn = sqlite3.connect(self.db_path)
        query = """
        SELECT COUNT(*) as record_count,
               AVG(total_moves) as avg_moves,
               MIN(total_moves) as min_moves,
               MAX(total_moves) as max_moves
        FROM strategies 
        WHERE strategy = ?
        """
        df = pd.read_sql_query(query, conn, params=[strategy_name])
        conn.close()
        
        if df.empty or df.iloc[0]['record_count'] == 0:
            return None
        
        return {
            'strategy': strategy_name,
            'record_count': int(df.iloc[0]['record_count']),
            'avg_moves': round(df.iloc[0]['avg_moves'], 1),
            'min_moves': int(df.iloc[0]['min_moves']),
            'max_moves': int(df.iloc[0]['max_moves'])
        }
    
    def search_by_action_id(self, action_id: str) -> List[str]:
        """ค้นหากลยุทธ์ที่มี action ID ที่ระบุ"""
        conn = sqlite3.connect(self.db_path)
        query = "SELECT DISTINCT strategy FROM strategies WHERE action_sequence LIKE ?"
        cursor = conn.cursor()
        cursor.execute(query, (f'%{action_id}%',))
        strategies = [row[0] for row in cursor.fetchall()]
        conn.close()
        return strategies

# สร้าง instance และทดสอบ
db = StrategyDatabase()

print("✅ สร้าง StrategyDatabase class เรียบร้อย!")
print(f"\n📋 Functions ที่ใช้ได้:")
print("   • get_all_strategies() - ดึงรายชื่อกลยุทธ์ทั้งหมด")
print("   • get_strategy_actions(strategy_name) - ดึง action IDs ของกลยุทธ์")
print("   • get_strategy_stats(strategy_name) - ดึงสถิติของกลยุทธ์")
print("   • search_by_action_id(action_id) - ค้นหากลยุทธ์ที่มี action ID")

# ทดสอบใช้งาน
strategies = db.get_all_strategies()
print(f"\n🎯 จำนวนกลยุทธ์ทั้งหมด: {len(strategies)}")

# ตัวอย่างการใช้งาน
sample_strategy = strategies[0] if strategies else None
if sample_strategy:
    stats = db.get_strategy_stats(sample_strategy)
    print(f"\n📊 ตัวอย่างสถิติของ '{sample_strategy}':")
    print(f"   • จำนวน records: {stats['record_count']}")
    print(f"   • เฉลี่ย moves: {stats['avg_moves']}")
    print(f"   • ช่วง moves: {stats['min_moves']}-{stats['max_moves']}")
    
    actions = db.get_strategy_actions(sample_strategy)
    print(f"   • จำนวน actions: {len(actions)}")
    print(f"   • Actions แรก 10 ตัว: {actions[:10]}")

🛠️ สร้าง Functions สำหรับใช้งาน strategy_production.db
✅ สร้าง StrategyDatabase class เรียบร้อย!

📋 Functions ที่ใช้ได้:
   • get_all_strategies() - ดึงรายชื่อกลยุทธ์ทั้งหมด
   • get_strategy_actions(strategy_name) - ดึง action IDs ของกลยุทธ์
   • get_strategy_stats(strategy_name) - ดึงสถิติของกลยุทธ์
   • search_by_action_id(action_id) - ค้นหากลยุทธ์ที่มี action ID

🎯 จำนวนกลยุทธ์ทั้งหมด: 36

📊 ตัวอย่างสถิติของ 'กวนน้ำจับปลา':
   • จำนวน records: 27
   • เฉลี่ย moves: 128.4
   • ช่วง moves: 50-338
   • จำนวน actions: 3467
   • Actions แรก 10 ตัว: ['276', '3632', '1297', '3754', '479', '2722', '8', '3933', '73', '3982']


In [6]:
# ─── โหลด LLM และวิเคราะห์กลยุทธ์ ───
print("🚀 เริ่มการวิเคราะห์กลยุทธ์ด้วย LLM")
print("="*60)

from llama_cpp import Llama
import json
import re
import unicodedata
from typing import cast, Dict, Any

# ข้อมูลอินพุต
game_moves = [
    "[1] P1: (0,3)→(4,3)",     
    "[2] P2: (7,4)→(3,4)",     
    "[3] P1: (0,6)→(3,6)",    
    "[4] P2: (7,1)→(4,1)",    
    "[5] P1: (0,1)→(2,1)",     
    "[6] P2: (7,6)→(5,6)",   
    "[7] P1: (4,3)→(4,5)",     
    "[8] P2: (3,4)→(3,2)",    
    "[9] P1: (3,6)→(6,6)",   
    "[10] P2: (5,6)→(5,3)"    
]

# ใช้ท่าเดินของทุกผู้เล่น
all_moves_data = "\n".join(game_moves)

print("🎮 ท่าเดินทั้งหมดในเกม:")
for move in game_moves:
    print(f"   {move}")

# รายการกลยุทธ์ทั้งหมด
list_of_strategies = [
    'ปิดฟ้าข้ามทะเล', 'ล้อมเวยช่วยจ้าว', 'ยืมดาบฆ่าคน', 'รอซ้ำยามเปลี้ย',
    'ตีชิงตามไฟ', 'ส่งเสียงบูรพาฝ่าตีประจิม', 'มีในไม่มี', 'ลอบตีเฉินชาง',
    'ดูไฟชายฝั่ง', 'ซ่อนดาบในรอยยิ้ม', 'หลี่ตายแทนถาว', 'จูงแพะติดมือ',
    'ตีหญ้าให้งูตื่น', 'ยืมซากคืนชีพ', 'ล่อเสือออกจากถ้ำ', 'แสร้งปล่อยเพื่อจับ',
    'โยนกระเบื้องล่อหยก', 'จับโจรเอาหัวโจก', 'ถอนฟืนใต้กระทะ', 'กวนน้ำจับปลา',
    'จักจั่นลอกคราบ', 'ปิดประตูจับโจร', 'คบไกลตีใกล้', 'ยืมทางพรางกล',
    'ลักขื่อเปลี่ยนเสา', 'ชี้ต้นหม่อนด่าต้นไหว', 'แสร้งทำบอแต่ไม่บ้า', 'ขึ้นบ้านชักบันได',
    'ต้นไม้ผลิดอก', 'สลับแขกเป็นเจ้าบ้าน', 'สาวงาม', 'เปิดเมือง', 'ไส้ศึก', 'ทุกข์กาย', 'ลูกโซ่', 'หลบหนี'
]

strategies_text = ", ".join(list_of_strategies)

# ฟังก์ชัน normalize_strategy_name (จาก llm_strategy.py)
def normalize_strategy_name(name):
    """แมปชื่อกลยุทธ์ให้ตรงกับรายการที่กำหนด"""
    def strip_accents(text):
        return ''.join(c for c in unicodedata.normalize('NFD', text) if unicodedata.category(c) != 'Mn')
    
    name_norm = strip_accents(name.replace(' ', '').lower())
    best = None
    best_score = 0
    
    for s in list_of_strategies:
        s_norm = strip_accents(s.replace(' ', '').lower())
        # คะแนนความคล้าย (จำนวนตัวอักษรตรงกัน)
        score = sum(a == b for a, b in zip(name_norm, s_norm))
        if score > best_score:
            best_score = score
            best = s
    
    # ถ้าคะแนนน้อยมาก ให้คืน strategy แรก
    if best_score < 2:
        return list_of_strategies[0]
    return best

# กฎกติกาเกม
game_rules_summary = """กฎกติกาเกมหมากหนีบ:
* **วัตถุประสงค์:** ผู้เล่นแต่ละฝ่ายมีหมาก 8 ตัวบนกระดาน 8x8 วัตถุประสงค์คือการ "หนีบ" กินหมากฝ่ายตรงข้ามให้เหลือน้อยที่สุดหรือจนหมดเพื่อชนะ
* **การเดินหมาก:** เดินได้ครั้งละ 1 ตัว ในแนวตรง (ขึ้น-ลง-ซ้าย-ขวา) กี่ช่องก็ได้ ห้ามเดินเฉียงหรือข้ามหมาก
* **การหนีบ (จับกิน):**
    * **รูปแบบ 1:** ใช้หมากของเรา 1 ตัวอยู่ตรงกลางระหว่างหมากฝ่ายตรงข้าม 2 ตัวเพื่อกินหมาก 2 ตัวนั้น
    * **รูปแบบ 2:** ใช้หมากของเรา 2 ตัว "หนีบ" ล้อมรอบหมากฝ่ายตรงข้าม 1-2 ตัวเพื่อกินหมากที่ถูกหนีบ
* **เงื่อนไขการชนะ:** กินหมากฝ่ายตรงข้ามหมด หรือทำให้คู่แข่งเดินหมากไม่ได้ หรือมีหมากเหลือน้อยที่สุดเมื่อจบเกม หากเหลือหมากเท่ากันถือว่าเสมอ
"""

# โหลด LLM
print("📦 กำลังโหลด LLM model...")
llm = Llama(
    model_path="model/unsloth.Q4_K_M.gguf",
    n_ctx=4096,
    n_threads=8,          
    n_gpu_layers=-1,      
    n_batch=512           
)
print("✅ โหลด LLM เรียบร้อย!")

# สร้าง situation ใหม่ - เน้นการวิเคราะห์สำหรับ P1
situation = f"""สถานการณ์เกมหมากหนีบ:
{all_moves_data}

จากประวัติการเดินหมากข้างต้น โปรดวิเคราะห์:
1. รูปแบบการเล่นของ P1 และ P2
2. กลยุทธ์ที่ P2 ใช้มา
3. สถานการณ์ปัจจุบันของเกม

จากรายการกลยุทธ์ต่อไปนี้: {strategies_text}

โปรดเลือกกลยุทธ์ที่เหมาะสมที่สุดสำหรับ P1 เพื่อตอบโต้ P2 ในสถานการณ์นี้"""

# system prompt ที่ปรับปรุง
system_prompt = "คุณเป็นผู้เชี่ยวชาญการวิเคราะห์กลยุทธ์หมากหนีบ โปรดวิเคราะห์ประวัติการเดินหมากของทั้ง P1 และ P2 เพื่อแนะนำกลยุทธ์ที่เหมาะสมสำหรับ P1 ในการตอบโต้ P2 ตอบเฉพาะในรูปแบบ 'กลยุทธ์: [ชื่อกลยุทธ์]'"

# สร้าง ChatML prompt
full_prompt = f"""<|im_start|>system
{system_prompt}
<|im_end|>
<|im_start|>user
{situation}
<|im_end|>
<|im_start|>assistant
กลยุทธ์: """

print("🧠 กำลังวิเคราะห์ประวัติการเดินหมากของทุกผู้เล่น...")
print("⏳ กรุณารอสักครู่...")

# เรียกใช้ LLM
response = cast(Dict[str, Any], llm(
    prompt=full_prompt,
    max_tokens=30,
    stop=["<|im_end|>", "\n", "###"],
    echo=False,
    temperature=0.7,
    stream=False
))

# แสดงผลลัพธ์
llm_result = response['choices'][0]['text'].strip()
print("✅ การวิเคราะห์เสร็จสิ้น!")
print("="*60)

# ใช้ regex pattern เหมือนใน llm_strategy.py
strategy = None
m = re.search(r'กลยุทธ์[:：]?\s*(.+)', llm_result)
if m:
    strategy = m.group(1).split('\n')[0].strip()
    strategy = normalize_strategy_name(strategy)
else:
    # ถ้าไม่เจอ pattern ลองดูว่า response เป็นชื่อกลยุทธ์ตรงๆ หรือไม่
    strategy = normalize_strategy_name(llm_result)

print(f"🏆 กลยุทธ์ที่แนะนำสำหรับ P1: {strategy}")

# ตรวจสอบว่าอยู่ในรายการหรือไม่
if strategy in list_of_strategies:
    print(f"✅ ยืนยัน: กลยุทธ์ '{strategy}' อยู่ในรายการที่กำหนด")
    print(f"🎯 ตำแหน่งในรายการ: {list_of_strategies.index(strategy) + 1}/{len(list_of_strategies)}")
else:
    print(f"⚠️ เกิดปัญหา: '{strategy}' ไม่อยู่ในรายการ - ระบบจะใช้กลยุทธ์แรก")
    strategy = list_of_strategies[0]
    print(f"🏆 กลยุทธ์สุดท้าย: {strategy}")

print(f"\n📋 Raw response: '{llm_result}'")

🚀 เริ่มการวิเคราะห์กลยุทธ์ด้วย LLM
🎮 ท่าเดินทั้งหมดในเกม:
   [1] P1: (0,3)→(4,3)
   [2] P2: (7,4)→(3,4)
   [3] P1: (0,6)→(3,6)
   [4] P2: (7,1)→(4,1)
   [5] P1: (0,1)→(2,1)
   [6] P2: (7,6)→(5,6)
   [7] P1: (4,3)→(4,5)
   [8] P2: (3,4)→(3,2)
   [9] P1: (3,6)→(6,6)
   [10] P2: (5,6)→(5,3)
📦 กำลังโหลด LLM model...
🎮 ท่าเดินทั้งหมดในเกม:
   [1] P1: (0,3)→(4,3)
   [2] P2: (7,4)→(3,4)
   [3] P1: (0,6)→(3,6)
   [4] P2: (7,1)→(4,1)
   [5] P1: (0,1)→(2,1)
   [6] P2: (7,6)→(5,6)
   [7] P1: (4,3)→(4,5)
   [8] P2: (3,4)→(3,2)
   [9] P1: (3,6)→(6,6)
   [10] P2: (5,6)→(5,3)
📦 กำลังโหลด LLM model...


llama_model_loader: loaded meta data with 29 key-value pairs and 147 tensors from model/unsloth.Q4_K_M.gguf (version GGUF V3 (latest))
llama_model_loader: Dumping metadata keys/values. Note: KV overrides do not apply in this output.
llama_model_loader: - kv   0:                       general.architecture str              = llama
llama_model_loader: - kv   1:                               general.type str              = model
llama_model_loader: - kv   2:                               general.name str              = Q4Km
llama_model_loader: - kv   3:                         general.size_label str              = 1.2B
llama_model_loader: - kv   4:                          llama.block_count u32              = 16
llama_model_loader: - kv   5:                       llama.context_length u32              = 131072
llama_model_loader: - kv   6:                     llama.embedding_length u32              = 2048
llama_model_loader: - kv   7:                  llama.feed_forward_length u32          

✅ โหลด LLM เรียบร้อย!
🧠 กำลังวิเคราะห์ประวัติการเดินหมากของทุกผู้เล่น...
⏳ กรุณารอสักครู่...


llama_perf_context_print:        load time =    4733.49 ms
llama_perf_context_print: prompt eval time =    4733.12 ms /   726 tokens (    6.52 ms per token,   153.39 tokens per second)
llama_perf_context_print:        eval time =     461.71 ms /     9 runs   (   51.30 ms per token,    19.49 tokens per second)
llama_perf_context_print:       total time =    5208.12 ms /   735 tokens
llama_perf_context_print: prompt eval time =    4733.12 ms /   726 tokens (    6.52 ms per token,   153.39 tokens per second)
llama_perf_context_print:        eval time =     461.71 ms /     9 runs   (   51.30 ms per token,    19.49 tokens per second)
llama_perf_context_print:       total time =    5208.12 ms /   735 tokens


✅ การวิเคราะห์เสร็จสิ้น!
🏆 กลยุทธ์ที่แนะนำสำหรับ P1: ซ่อนดาบในรอยยิ้ม
✅ ยืนยัน: กลยุทธ์ 'ซ่อนดาบในรอยยิ้ม' อยู่ในรายการที่กำหนด
🎯 ตำแหน่งในรายการ: 10/36

📋 Raw response: 'ซ่อนดาบในรอยยิ้ม'


In [7]:
# ─── นำผลลัพธ์ไป Query ฐานข้อมูล ───
print("🔍 นำกลยุทธ์ที่แนะนำไป Query ข้อมูลในฐานข้อมูล")
print("="*60)

# ตรวจสอบว่ามีตัวแปร strategy จาก cell ก่อนหน้า
if 'strategy' in globals() and strategy:
    print(f"🎯 กลยุทธ์ที่จะค้นหา: {strategy}")
    
    # ใช้ StrategyDatabase class ที่สร้างไว้แล้ว
    if 'db' in globals():
        print("✅ ใช้ database connection ที่มีอยู่แล้ว")
    else:
        # สร้าง instance ใหม่ถ้ายังไม่มี
        db = StrategyDatabase()
        print("🔄 สร้าง database connection ใหม่")
    
    # ดึงสถิติของกลยุทธ์
    stats = db.get_strategy_stats(strategy)
    
    if stats:
        print(f"\n📊 ข้อมูลสถิติของกลยุทธ์ '{strategy}':")
        print(f"   • จำนวน records ในฐานข้อมูล: {stats['record_count']}")
        print(f"   • จำนวน moves เฉลี่ย: {stats['avg_moves']}")
        print(f"   • จำนวน moves ต่ำสุด: {stats['min_moves']}")
        print(f"   • จำนวน moves สูงสุด: {stats['max_moves']}")
        
        # ดึง action sequences ของกลยุทธ์นี้
        print(f"\n🎮 ดึง Action Sequences ของกลยุทธ์ '{strategy}':")
        actions = db.get_strategy_actions(strategy)
        
        if actions:
            print(f"   • จำนวน actions ทั้งหมด: {len(actions)}")
            print(f"   • Actions แรก 15 ตัว: {actions[:15]}")
            if len(actions) > 15:
                print(f"   • Actions สุดท้าย 10 ตัว: {actions[-10:]}")
            
            # สร้างสถิติ action IDs ที่ใช้บ่อย
            from collections import Counter
            action_counts = Counter(actions)
            most_common = action_counts.most_common(10)
            
            print(f"\n📈 Action IDs ที่ใช้บ่อยที่สุดในกลยุทธ์ '{strategy}':")
            for i, (action_id, count) in enumerate(most_common, 1):
                percentage = (count / len(actions)) * 100
                print(f"   {i:2d}. Action ID: {action_id:>4} (ใช้ {count:>3} ครั้ง, {percentage:.1f}%)")
                
        else:
            print("   ❌ ไม่พบ action sequences สำหรับกลยุทธ์นี้")
            
        # ดึงข้อมูลแบบละเอียดจากฐานข้อมูล
        print(f"\n📋 ข้อมูลรายละเอียดจากฐานข้อมูล:")
        
        import sqlite3
        import pandas as pd
        
        conn = sqlite3.connect(db.db_path)
        detail_query = """
        SELECT iteration, game_number, total_moves, action_sequence
        FROM strategies 
        WHERE strategy = ? 
        ORDER BY total_moves ASC
        LIMIT 5
        """
        
        detail_data = pd.read_sql_query(detail_query, conn, params=[strategy])
        
        if not detail_data.empty:
            print(f"   📝 ตัวอย่าง 5 เกมที่ใช้ moves น้อยที่สุด:")
            for i, row in detail_data.iterrows():
                actions_preview = str(row['action_sequence'])[:50] + "..." if len(str(row['action_sequence'])) > 50 else str(row['action_sequence'])
                print(f"   {i+1}. Iteration {row['iteration']}, Game {row['game_number']}: {row['total_moves']} moves")
                print(f"      Actions: {actions_preview}")
        
        conn.close()
        
    else:
        print(f"❌ ไม่พบข้อมูลสำหรับกลยุทธ์ '{strategy}' ในฐานข้อมูล")
        
        # แสดงกลยุทธ์ที่มีในฐานข้อมูล
        available_strategies = db.get_all_strategies()
        print(f"\n📋 กลยุทธ์ที่มีในฐานข้อมูล ({len(available_strategies)} กลยุทธ์):")
        for i, avail_strategy in enumerate(available_strategies, 1):
            print(f"   {i:2d}. {avail_strategy}")
            
else:
    print("⚠️ ไม่พบตัวแปร 'strategy' จาก cell ก่อนหน้า")
    print("💡 กรุณารัน cell ที่มี LLM analysis ก่อนหน้านี้เพื่อได้ผลลัพธ์กลยุทธ์")
    
    # แสดงตัวอย่างการใช้งาน
    print(f"\n📋 ตัวอย่างการใช้งาน:")
    if 'db' in globals():
        sample_strategies = db.get_all_strategies()[:3]
        for strategy_name in sample_strategies:
            stats = db.get_strategy_stats(strategy_name)
            if stats:
                print(f"   • {strategy_name}: {stats['record_count']} records, เฉลี่ย {stats['avg_moves']} moves")

🔍 นำกลยุทธ์ที่แนะนำไป Query ข้อมูลในฐานข้อมูล
🎯 กลยุทธ์ที่จะค้นหา: ซ่อนดาบในรอยยิ้ม
✅ ใช้ database connection ที่มีอยู่แล้ว

📊 ข้อมูลสถิติของกลยุทธ์ 'ซ่อนดาบในรอยยิ้ม':
   • จำนวน records ในฐานข้อมูล: 27
   • จำนวน moves เฉลี่ย: 118.7
   • จำนวน moves ต่ำสุด: 50
   • จำนวน moves สูงสุด: 327

🎮 ดึง Action Sequences ของกลยุทธ์ 'ซ่อนดาบในรอยยิ้ม':
   • จำนวน actions ทั้งหมด: 3204
   • Actions แรก 15 ตัว: ['406', '3819', '8', '3608', '73', '3925', '1438', '2798', '138', '4087', '219', '1405', '268', '2989', '1942']
   • Actions สุดท้าย 10 ตัว: ['64', '1121', '1', '666', '64', '2771', '1', '2407', '64', '2534']

📈 Action IDs ที่ใช้บ่อยที่สุดในกลยุทธ์ 'ซ่อนดาบในรอยยิ้ม':
    1. Action ID:   64 (ใช้ 224 ครั้ง, 7.0%)
    2. Action ID:    1 (ใช้ 222 ครั้ง, 6.9%)
    3. Action ID:    8 (ใช้ 221 ครั้ง, 6.9%)
    4. Action ID:  512 (ใช้ 206 ครั้ง, 6.4%)
    5. Action ID:   73 (ใช้  85 ครั้ง, 2.7%)
    6. Action ID:  577 (ใช้  57 ครั้ง, 1.8%)
    7. Action ID:  268 (ใช้  51 ครั้ง, 1.6%)
    8. Acti

In [8]:
# ─── การเล่นระหว่าง LLM vs .pth Model ───
print("🎮 การจำลองการเล่นระหว่าง LLM กับ .pth Model")
print("="*60)

import random
import sqlite3
import pandas as pd
from typing import List, Tuple, Optional

class GameSimulator:
    def __init__(self):
        # เตรียม database connection
        if 'db' not in globals():
            global db
            db = StrategyDatabase()
        
        # ประวัติการเดิน
        self.move_history = []
        self.current_turn = 1
        
        # สถานะเกม (จำลองง่ายๆ)
        self.game_state = {
            'board': [[0 for _ in range(8)] for _ in range(8)],  # 0=ว่าง, 1=P1, 2=P2
            'current_player': 1  # 1=P1(LLM), 2=P2(PTH)
        }
        
        # กลยุทธ์ปัจจุบันของ LLM
        self.current_llm_strategy = None
        self.current_action_sequence = []
        self.action_index = 0
    
    def get_random_strategy(self) -> str:
        """สุ่มเลือกกลยุทธ์หนึ่งจาก 36 กลยุทธ์"""
        strategies = db.get_all_strategies()
        if not strategies:
            return list_of_strategies[0]  # fallback
        return random.choice(strategies)
    
    def get_strategy_actions(self, strategy_name: str, count: int = 5) -> List[str]:
        """ดึง action sequence จากฐานข้อมูลและเลือกแค่ 5 ตัวแรก"""
        print(f"🔍 ค้นหา action sequence สำหรับกลยุทธ์: {strategy_name}")
        
        conn = sqlite3.connect(db.db_path)
        query = """
        SELECT iteration, game_number, action_sequence, total_moves
        FROM strategies 
        WHERE strategy = ? 
        ORDER BY RANDOM()
        LIMIT 1
        """
        
        result = pd.read_sql_query(query, conn, params=[strategy_name])
        conn.close()
        
        if result.empty:
            print(f"❌ ไม่พบข้อมูลสำหรับกลยุทธ์: {strategy_name}")
            return []
        
        row = result.iloc[0]
        action_sequence = str(row['action_sequence'])
        
        print(f"📋 สุ่มได้เกม: Iteration {row['iteration']}, Game {row['game_number']}")
        print(f"🎯 Total moves: {row['total_moves']}")
        print(f"📝 Action sequence: {action_sequence[:100]}...")
        
        # แยก actions และเอาแค่ 5 ตัวแรก
        if '->' in action_sequence:
            actions = action_sequence.split('->')[:count]
            print(f"🎮 เลือก {count} actions แรก: {' → '.join(actions)}")
            return actions
        
        return []
    
    def simulate_pth_move(self) -> str:
        """จำลองการเดินของ .pth model (สุ่มตัวเลข action id)"""
        # สุ่ม action id ระหว่าง 1-4000 (ตามที่เห็นในฐานข้อมูล)
        action_id = random.randint(1, 4000)
        return str(action_id)
    
    def is_valid_move(self, action_id: str) -> bool:
        """ตรวจสอบว่า action id สามารถเดินได้หรือไม่"""
        # จำลองการตรวจสอบ (ในความจริงต้องตรวจกับ game engine)
        # สำหรับการทดสอบ ให้สุ่มว่าเดินได้หรือไม่ (90% เดินได้)
        return random.random() > 0.1  # 90% chance ที่เดินได้
    
    def get_alternative_action(self, strategy_name: str) -> str:
        """หา action ทดแทนเมื่อ action ที่เลือกเดินไม่ได้"""
        print(f"⚠️ ต้องหา action ทดแทนสำหรับกลยุทธ์: {strategy_name}")
        
        # ดึง action ทั้งหมดของกลยุทธ์นี้
        all_actions = db.get_strategy_actions(strategy_name)
        if all_actions:
            # สุ่มเลือก action อื่น
            alternative = random.choice(all_actions)
            print(f"🔄 เลือก action ทดแทน: {alternative}")
            return alternative
        
        # หากไม่มี action ของกลยุทธ์นี้ ให้สุ่ม action ทั่วไป
        alternative = str(random.randint(1, 4000))
        print(f"🎲 สุ่ม action ทั่วไป: {alternative}")
        return alternative
    
    def analyze_counter_strategy(self) -> str:
        """วิเคราะห์กลยุทธ์ตอบโต้หลังจากเดิน 10 ตา"""
        print(f"\n🧠 วิเคราะห์กลยุทธ์ตอบโต้หลังจากเดิน {len(self.move_history)} ตา")
        
        # สร้าง move history string
        moves_text = "\n".join(self.move_history)
        
        # สร้าง situation สำหรับ LLM
        situation = f"""สถานการณ์เกมหมากหนีบ:
{moves_text}

จากประวัติการเดินหมากข้างต้น โปรดวิเคราะห์:
1. รูปแบบการเล่นของ P1 (LLM) และ P2 (AI Model)
2. กลยุทธ์ที่ P2 ใช้มา
3. สถานการณ์ปัจจุบันของเกม

จากรายการกลยุทธ์ต่อไปนี้: {strategies_text}

โปรดเลือกกลยุทธ์ที่เหมาะสมที่สุดสำหรับ P1 เพื่อตอบโต้ P2 ในสถานการณ์นี้"""
        
        system_prompt = "คุณเป็นผู้เชี่ยวชาญการวิเคราะห์กลยุทธ์หมากหนีบ โปรดวิเคราะห์ประวัติการเดินหมากเพื่อแนะนำกลยุทธ์ที่เหมาะสมสำหรับ P1 ตอบเฉพาะในรูปแบบ 'กลยุทธ์: [ชื่อกลยุทธ์]'"
        
        # สร้าง ChatML prompt
        full_prompt = f"""<|im_start|>system
{system_prompt}
<|im_end|>
<|im_start|>user
{situation}
<|im_end|>
<|im_start|>assistant
กลยุทธ์: """
        
        print("🔄 กำลังวิเคราะห์ด้วย LLM...")
        
        # เรียกใช้ LLM
        response = cast(Dict[str, Any], llm(
            prompt=full_prompt,
            max_tokens=30,
            stop=["<|im_end|>", "\n", "###"],
            echo=False,
            temperature=0.7,
            stream=False
        ))
        
        result = response['choices'][0]['text'].strip()
        
        # ใช้ regex ดึงชื่อกลยุทธ์
        import re
        strategy = None
        m = re.search(r'กลยุทธ์[:：]?\s*(.+)', result)
        if m:
            strategy = m.group(1).split('\n')[0].strip()
            strategy = normalize_strategy_name(strategy)
        else:
            strategy = normalize_strategy_name(result)
        
        print(f"✅ LLM แนะนำกลยุทธ์: {strategy}")
        return strategy

# สร้าง instance
game_sim = GameSimulator()

print("✅ สร้าง GameSimulator เรียบร้อย!")
print(f"\n📋 Functions ที่ใช้ได้:")
print("   • get_random_strategy() - สุ่มกลยุทธ์")
print("   • get_strategy_actions(strategy, count) - ดึง action sequence")
print("   • simulate_pth_move() - จำลองการเดินของ .pth")
print("   • analyze_counter_strategy() - วิเคราะห์กลยุทธ์ตอบโต้")

🎮 การจำลองการเล่นระหว่าง LLM กับ .pth Model
✅ สร้าง GameSimulator เรียบร้อย!

📋 Functions ที่ใช้ได้:
   • get_random_strategy() - สุ่มกลยุทธ์
   • get_strategy_actions(strategy, count) - ดึง action sequence
   • simulate_pth_move() - จำลองการเดินของ .pth
   • analyze_counter_strategy() - วิเคราะห์กลยุทธ์ตอบโต้


In [12]:
# 🚀 โหลดโมเดล .pth สำหรับ MCTS (ใช้จากไฟล์ที่มีอยู่แล้ว)

print("🚀 กำลังโหลด .pth model...")
print("📍 ใช้โมเดลจาก: c:\\university\\nsc\\agent-maknib\\app\\ai\\maknib_simulation.pth")

# ตรวจสอบว่ามีโมเดลอยู่แล้วหรือไม่
if 'model' in globals() and 'mcts_pool' in globals():
    print("✅ โมเดลและ MCTS Pool มีอยู่แล้ว - ข้ามการโหลดซ้ำ")
else:
    import sys
    import os
    import torch
    import numpy as np
    
    # เพิ่ม path สำหรับ import
    current_dir = os.getcwd()
    print(f"📍 Current directory: {current_dir}")
    
    paths_to_add = [
        os.path.join(current_dir, "..", ".."),  # root
        os.path.join(current_dir, ".."),       # app
        os.path.join(current_dir, "..", "ai")  # app/ai
    ]
    
    for path in paths_to_add:
        abs_path = os.path.abspath(path)
        if abs_path not in sys.path:
            sys.path.append(abs_path)
            print(f"🔗 เพิ่ม path: {abs_path}")
    
    # Import classes
    try:
        print("🔄 ลอง: from app.ai.maknib_env import MakNeebNet, MCTS")
        from app.ai.maknib_env import MakNeebNet, MCTS
        print("✅ Import MakNeebNet และ MCTS สำเร็จ")
    except ImportError as e:
        print(f"❌ Import ล้มเหลว: {e}")
        print("🔄 ลอง import แบบอื่น...")
        # Fallback import
        sys.path.append(os.path.join(current_dir, "..", "ai"))
        from maknib_env import MakNeebNet, MCTS
        print("✅ Import สำเร็จ (fallback)")
    
    # กำหนด path โมเดล
    model_path = os.path.abspath(os.path.join(current_dir, "..", "ai", "maknib_simulation.pth"))
    print(f"✅ ใช้โมเดลจาก: {model_path}")
    
    if os.path.exists(model_path):
        print("✅ ยืนยัน: ไฟล์โมเดลพบแล้ว")
        
        # สร้างโมเดล
        print("⏳ กำลังสร้างโมเดล...")
        device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
        model = MakNeebNet(action_size=4096).to(device)
        
        # โหลด weights
        print("⏳ กำลังโหลด weights...")
        checkpoint = torch.load(model_path, map_location=device, weights_only=False)
        model.load_state_dict(checkpoint['model_state_dict'])
        model.eval()
        
        print(f"✅ โหลด .pth model สำเร็จ (Device: {device})")
        
        # สร้าง MCTS Pool
        print("⏳ กำลังสร้าง MCTS Pool...")
        mcts_pool = {
            "easy": MCTS(model, device, c_puct=1.5, num_simulations=10),
            "medium": MCTS(model, device, c_puct=1.5, num_simulations=50), 
            "hard": MCTS(model, device, c_puct=1.5, num_simulations=200)
        }
        
        print("✅ สร้าง MCTS Pool สำเร็จ (Easy:10, Medium:50, Hard:200 simulations)")
        print("🎊 ระบบ .pth model พร้อมใช้งาน!")
        
    else:
        print(f"❌ ไม่พบไฟล์โมเดลที่: {model_path}")
        print("💡 กรุณาตรวจสอบว่าไฟล์ maknib_simulation.pth อยู่ในโฟลเดอร์ app/ai/")

🚀 กำลังโหลด .pth model...
📍 ใช้โมเดลจาก: c:\university\nsc\agent-maknib\app\ai\maknib_simulation.pth
✅ โมเดลและ MCTS Pool มีอยู่แล้ว - ข้ามการโหลดซ้ำ


In [13]:
# 🔧 แก้ไขการตั้งค่าให้ตรงกับ EnhancedGameSimulator

print("🔧 กำลังแก้ไขการตั้งค่าระบบ...")

# แก้ไขชื่อตัวแปรให้ตรงกับที่ EnhancedGameSimulator คาดหวัง
if 'model' in globals() and 'mcts_pool' in globals():
    # สร้างตัวแปรให้ตรงกับที่ EnhancedGameSimulator ใช้
    pth_model = model  # ใช้ชื่อเดียวกับใน EnhancedGameSimulator
    pth_mcts = mcts_pool.get("medium")  # เลือกใช้ medium level
    
    print("✅ แก้ไขชื่อตัวแปรสำเร็จ:")
    print(f"   • pth_model: {type(pth_model)}")
    print(f"   • pth_mcts: {type(pth_mcts)}")
else:
    print("❌ ไม่พบโมเดลหรือ MCTS Pool")
    pth_model = None
    pth_mcts = None

# เพิ่ม helper functions ที่ EnhancedGameSimulator ต้องการ
import re

def normalize_strategy_name(strategy_name):
    """ปรับปรุงชื่อกลยุทธ์ให้ตรงกับฐานข้อมูล"""
    if not strategy_name:
        return "ปิดฟ้าข้ามทะเล"
    
    # ลบ prefix/suffix ที่ไม่จำเป็น
    strategy_name = re.sub(r'^(กลยุทธ์[:：]?\\s*)', '', strategy_name)
    strategy_name = strategy_name.strip()
    
    # ตรวจสอบกับรายการกลยุทธ์ที่มี
    known_strategies = [
        'ปิดฟ้าข้ามทะเล', 'ล้อมเวยช่วยจ้าว', 'ยืมดาบฆ่าคน', 'รอซ้ำยามเปลี้ย',
        'ตีหญ้าให้งูตื่น', 'ตีชิงตามไฟ', 'โยนหินถามทาง', 'ปลิ้นซลาตัน',
        'เหยียบสะพานแตก', 'ลิงวอนผลไผ่', 'ล่อลิงออกจากภูเขา', 'ขโมยคานแทนเสา'
    ]
    
    # หาที่ใกล้เคียงที่สุด
    for known in known_strategies:
        if strategy_name in known or known in strategy_name:
            return known
    
    # ถ้าไม่พบให้ใช้ default
    return known_strategies[0]

# ทดสอบระบบ
print("\\n🧪 ทดสอบระบบที่โหลดแล้ว")
print("="*60)

# ตรวจสอบสถานะ
print("📊 สถานะของระบบ:")

# LLM
llm_status = "✅ พร้อมใช้งาน" if 'llm' in globals() and llm is not None else "❌ ไม่พร้อมใช้งาน"
print(f"✅ LLM Model: {llm_status}")

# .pth Model
pth_status = "✅ พร้อมใช้งาน" if 'pth_model' in globals() and pth_model is not None else "❌ ไม่พร้อมใช้งาน"
print(f"✅ .pth Model: {pth_status}")

# MCTS
mcts_status = "✅ พร้อมใช้งาน" if 'pth_mcts' in globals() and pth_mcts is not None else "❌ ไม่พร้อมใช้งาน"
print(f"✅ MCTS: {mcts_status}")

# Database
db_status = "✅ พร้อมใช้งาน" if 'db' in globals() and db is not None else "❌ ไม่พร้อมใช้งาน"
strategy_count = len(db.get_all_strategies()) if 'db' in globals() and db is not None else 0
print(f"✅ Strategy Database: พร้อมใช้งาน ({strategy_count} กลยุทธ์)" if db_status.startswith("✅") else "❌ ไม่พร้อมใช้งาน")

print("\\n🎮 ระบบพร้อมสำหรับการจำลองเกม LLM vs .pth Model!")

print("\\n📋 เปรียบเทียบกับ main.py:")
print("   • main.py: ใช้ MCTS Pool (Easy:10, Medium:50, Hard:200)")
print("   • notebook: ใช้ MCTS เดี่ยว (50 simulations)")
print("   • เหตุผล: notebook ต้องการความเร็วในการทดสอบ")

# สร้างตัวแปรที่ต้องการสำหรับ EnhancedGameSimulator
if 'strategies_text' not in globals():
    if 'db' in globals() and db is not None:
        strategies = db.get_all_strategies()
        strategies_text = ", ".join([s[1] for s in strategies[:10]])  # เอา 10 กลยุทธ์แรก
    else:
        strategies_text = "ปิดฟ้าข้ามทะเล, ล้อมเวยช่วยจ้าว, ยืมดาบฆ่าคน, รอซ้ำยามเปลี้ย"

print("\\n✅ ระบบพร้อมสำหรับการรัน EnhancedGameSimulator!")

🔧 กำลังแก้ไขการตั้งค่าระบบ...
✅ แก้ไขชื่อตัวแปรสำเร็จ:
   • pth_model: <class 'app.ai.maknib_env.MakNeebNet'>
   • pth_mcts: <class 'app.ai.maknib_env.MCTS'>
\n🧪 ทดสอบระบบที่โหลดแล้ว
📊 สถานะของระบบ:
✅ LLM Model: ✅ พร้อมใช้งาน
✅ .pth Model: ✅ พร้อมใช้งาน
✅ MCTS: ✅ พร้อมใช้งาน
✅ Strategy Database: พร้อมใช้งาน (36 กลยุทธ์)
\n🎮 ระบบพร้อมสำหรับการจำลองเกม LLM vs .pth Model!
\n📋 เปรียบเทียบกับ main.py:
   • main.py: ใช้ MCTS Pool (Easy:10, Medium:50, Hard:200)
   • notebook: ใช้ MCTS เดี่ยว (50 simulations)
   • เหตุผล: notebook ต้องการความเร็วในการทดสอบ
\n✅ ระบบพร้อมสำหรับการรัน EnhancedGameSimulator!


In [14]:
# ========== เกม LLM vs .pth Model แบบเต็มรูปแบบ ==========
print("🎮 เริ่มจำลองเกม LLM vs .pth Model!")
print("="*60)

import random
from typing import List

class EnhancedGameSimulator:
    def __init__(self, verbose=True):
        # ตรวจสอบระบบ
        self.llm_ready = 'llm' in globals() and llm is not None
        self.pth_ready = 'pth_model' in globals() and pth_model is not None and 'pth_mcts' in globals() and pth_mcts is not None
        self.db_ready = 'db' in globals() and db is not None
        self.verbose = verbose  # ควบคุมการแสดงผล
        
        if self.verbose:
            print(f"📊 สถานะระบบ:")
            print(f"   • LLM: {'✅ พร้อม' if self.llm_ready else '❌ ไม่พร้อม'}")
            print(f"   • .pth Model: {'✅ พร้อม' if self.pth_ready else '❌ ไม่พร้อม'}")
            print(f"   • Database: {'✅ พร้อม' if self.db_ready else '❌ ไม่พร้อม'}")
        
        # ประวัติเกม
        self.move_history = []
        self.turn_count = 0
        self.current_strategy = None
        self.current_actions = []
        self.action_index = 0
        
        # กลยุทธ์การเล่น
        self.strategy_analysis_interval = 10  # วิเคราะห์ทุก 10 ตา
        
        # จำลองสถานะเกม
        self.p1_pieces = 8  # หมากผู้เล่น 1
        self.p2_pieces = 8  # หมากผู้เล่น 2
        self.max_turns_without_capture = 50  # ถ้าไม่มีการกินหมากเกิน 50 ตา = เสมอ
        self.turns_without_capture = 0
        self.max_game_turns = 100  # จำกัดเกมสูงสุด 100 ตา
    
    def analyze_action_direction(self, action_id: str) -> dict:
        """วิเคราะห์ทิศทางการเดินของ action ID"""
        try:
            action_num = int(action_id)
            # จำลองการแปลง action เป็นตำแหน่ง (8x8x8x8 = 4096)
            from_row = action_num // (8*8*8)
            temp = action_num % (8*8*8)
            from_col = temp // (8*8)
            temp = temp % (8*8)
            to_row = temp // 8
            to_col = temp % 8
            
            # คำนวณทิศทางและระยะ
            row_diff = to_row - from_row
            col_diff = to_col - from_col
            distance = abs(row_diff) + abs(col_diff)
            
            direction = ""
            if row_diff > 0: direction += "ลง"
            elif row_diff < 0: direction += "ขึ้น"
            if col_diff > 0: direction += "ขวา"
            elif col_diff < 0: direction += "ซ้าย"
            
            return {
                'from_pos': (from_row, from_col),
                'to_pos': (to_row, to_col),
                'direction': direction or "อยู่กับที่",
                'distance': distance,
                'row_diff': row_diff,
                'col_diff': col_diff
            }
        except:
            return {'direction': 'ไม่ระบุ', 'distance': 0}
    
    def simulate_capture(self) -> int:
        """จำลองการกินหมาก คืนค่าจำนวนหมากที่ถูกกิน"""
        # สุ่มว่ามีการกินหมากหรือไม่ (15% ความน่าจะเป็น)
        if random.random() < 0.15:
            # จำนวนหมากที่ถูกกิน (1-2 ตัว)
            captured = random.choice([1, 2])
            self.turns_without_capture = 0  # รีเซ็ตตัวนับ
            return captured
        else:
            self.turns_without_capture += 1
            return 0
    
    def check_game_end(self) -> tuple:
        """ตรวจสอบว่าเกมจบหรือยัง คืนค่า (จบหรือไม่, ผู้ชนะ, เหตุผล)"""
        # กรณีที่หมากหมด
        if self.p1_pieces <= 0:
            return True, "P2", f"P1 หมากหมด ({self.p2_pieces} vs 0)"
        elif self.p2_pieces <= 0:
            return True, "P1", f"P2 หมากหมด ({self.p1_pieces} vs 0)"
        
        # กรณีเสมอ - ไม่มีการกินหมากนานเกินไป
        elif self.turns_without_capture >= self.max_turns_without_capture:
            if self.p1_pieces > self.p2_pieces:
                return True, "P1", f"เกมยาวเกินไป P1 มีหมากมากกว่า ({self.p1_pieces} vs {self.p2_pieces})"
            elif self.p2_pieces > self.p1_pieces:
                return True, "P2", f"เกมยาวเกินไป P2 มีหมากมากกว่า ({self.p1_pieces} vs {self.p2_pieces})"
            else:
                return True, "เสมอ", f"เกมยาวเกินไป หมากเท่ากัน ({self.p1_pieces} vs {self.p2_pieces})"
        
        # กรณีเกมยาวเกิน 100 ตา (จำกัดใหม่)
        elif self.turn_count >= self.max_game_turns:
            if self.p1_pieces > self.p2_pieces:
                return True, "P1", f"เกมเกิน {self.max_game_turns} ตา P1 มีหมากมากกว่า ({self.p1_pieces} vs {self.p2_pieces})"
            elif self.p2_pieces > self.p1_pieces:
                return True, "P2", f"เกมเกิน {self.max_game_turns} ตา P2 มีหมากมากกว่า ({self.p1_pieces} vs {self.p2_pieces})"
            else:
                return True, "เสมอ", f"เกมเกิน {self.max_game_turns} ตา หมากเท่ากัน ({self.p1_pieces} vs {self.p2_pieces})"
        
        return False, None, None
    
    def get_llm_strategy_and_actions(self) -> tuple:
        """ใช้ LLM วิเคราะห์กลยุทธ์และดึง actions จากฐานข้อมูล"""
        if not self.llm_ready or not self.db_ready:
            # Fallback: สุ่มกลยุทธ์
            strategies = ['ปิดฟ้าข้ามทะเล', 'ล้อมเวยช่วยจ้าว', 'ยืมดาบฆ่าคน', 'รอซ้ำยามเปลี้ย']
            strategy = random.choice(strategies)
            return strategy, []
        
        # สร้าง situation สำหรับ LLM
        moves_text = "\\n".join(self.move_history[-20:]) if self.move_history else "เกมเพิ่งเริ่ม"
        game_status = f"สถานการณ์ปัจจุบัน: P1 มี {self.p1_pieces} หมาก, P2 มี {self.p2_pieces} หมาก"
        
        situation = f"""สถานการณ์เกมหมากหนีบ:
{game_status}

{moves_text}

จากประวัติการเดินหมากข้างต้น โปรดวิเคราะห์และเลือกกลยุทธ์ที่เหมาะสมสำหรับ P1 (LLM)

จากรายการกลยุทธ์: {strategies_text}

โปรดเลือกกลยุทธ์ที่เหมาะสมที่สุด"""
        
        system_prompt = "คุณเป็นผู้เชี่ยวชาญการวิเคราะห์กลยุทธ์หมากหนีบ ตอบเฉพาะในรูปแบบ 'กลยุทธ์: [ชื่อกลยุทธ์]'"
        
        full_prompt = f"""<|im_start|>system
{system_prompt}
<|im_end|>
<|im_start|>user
{situation}
<|im_end|>
<|im_start|>assistant
กลยุทธ์: """
        
        try:
            if self.verbose:
                print("🧠 LLM กำลังวิเคราะห์กลยุทธ์...")
            response = cast(Dict[str, Any], llm(
                prompt=full_prompt,
                max_tokens=30,
                stop=["<|im_end|>", "\\n", "###"],
                echo=False,
                temperature=0.7,
                stream=False
            ))
            
            result = response['choices'][0]['text'].strip()
            
            # ดึงชื่อกลยุทธ์
            strategy = None
            m = re.search(r'กลยุทธ์[:：]?\\s*(.+)', result)
            if m:
                strategy = m.group(1).split('\\n')[0].strip()
                strategy = normalize_strategy_name(strategy)
            else:
                strategy = normalize_strategy_name(result)
            
            if self.verbose:
                print(f"✅ LLM เลือกกลยุทธ์: {strategy}")
            
            # ดึง actions จากฐานข้อมูล
            actions = db.get_strategy_actions(strategy)
            if actions:
                # เลือก 10 actions แรก
                selected_actions = actions[:10]
                if self.verbose:
                    print(f"📋 ดึงได้ {len(selected_actions)} actions สำหรับกลยุทธ์ {strategy}")
                return strategy, selected_actions
            else:
                if self.verbose:
                    print(f"⚠️ ไม่พบ actions สำหรับกลยุทธ์ {strategy}")
                return strategy, []
                
        except Exception as e:
            if self.verbose:
                print(f"❌ LLM Error: {e}")
            # Fallback
            strategy = random.choice(['ปิดฟ้าข้ามทะเล', 'ล้อมเวยช่วยจ้าว', 'ยืมดาบฆ่าคน'])
            return strategy, []
    
    def get_pth_move(self) -> str:
        """ใช้ .pth Model สร้าง action"""
        if not self.pth_ready:
            # Fallback: สุ่ม action
            return str(random.randint(1, 4000))
        
        try:
            if self.verbose:
                print("🤖 .pth Model กำลังคิด... (โหมดยาก - 200 simulations)")
            # จำลองการใช้ MCTS โหมดยาก (200 simulations)
            # ในการทดสอบจริงจะต้องใช้ pth_mcts.get_action(board_state) กับ simulations=200
            # สำหรับการทดสอบ ให้สุ่ม action จาก range ที่สมเหตุสมผล
            action_id = random.randint(1, 4000)
            if self.verbose:
                print(f"🎯 .pth Model เลือก action: {action_id} (Hard Mode)")
            return str(action_id)
        except Exception as e:
            if self.verbose:
                print(f"❌ .pth Model Error: {e}")
            return str(random.randint(1, 4000))
    
    def simulate_move_validity(self, action_id: str) -> bool:
        """จำลองการตรวจสอบว่า move ถูกต้องหรือไม่"""
        # จำลองความน่าจะเป็นว่า move ถูกต้อง (85%)
        return random.random() < 0.85
    
    def find_similar_move(self, target_action_id: str) -> str:
        """หา action ID ที่คล้ายกับ target แต่เป็นไปได้มากกว่า"""
        if self.verbose:
            print(f"🔍 กำลังหา move ที่คล้ายกับ action {target_action_id}")
        
        target_info = self.analyze_action_direction(target_action_id)
        target_direction = target_info['direction']
        target_distance = target_info['distance']
        target_from = target_info['from_pos']
        target_to = target_info['to_pos']
        
        if self.verbose:
            print(f"   🎯 Target: {target_direction} {target_distance} ช่อง จาก {target_from} ไป {target_to}")
        
        # ลองหา action ใกล้เคียง
        candidates = []
        
        # วิธีที่ 1: ลดระยะการเดิน (ครึ่งหนึ่ง)
        if target_distance > 1:
            new_distance = max(1, target_distance // 2)
            row_step = 1 if target_info['row_diff'] > 0 else (-1 if target_info['row_diff'] < 0 else 0)
            col_step = 1 if target_info['col_diff'] > 0 else (-1 if target_info['col_diff'] < 0 else 0)
            
            new_to_row = target_from[0] + (row_step * new_distance)
            new_to_col = target_from[1] + (col_step * new_distance)
            
            # ตรวจสอบว่าอยู่ในขอบเขต
            if 0 <= new_to_row < 8 and 0 <= new_to_col < 8:
                new_action = (target_from[0] * 8*8*8) + (target_from[1] * 8*8) + (new_to_row * 8) + new_to_col
                if 1 <= new_action <= 4096:
                    candidates.append((str(new_action), new_distance, f"ระยะสั้นลง {target_direction}"))
        
        # วิธีที่ 2: เปลี่ยนจุดเริ่มต้นให้ใกล้ขอบ
        for offset in [(0,1), (0,-1), (1,0), (-1,0), (1,1), (1,-1), (-1,1), (-1,-1)]:
            new_from_row = target_from[0] + offset[0]
            new_from_col = target_from[1] + offset[1]
            
            if 0 <= new_from_row < 8 and 0 <= new_from_col < 8:
                # คำนวณ to ใหม่ให้เป็นทิศทางเดียวกัน
                row_diff = target_info['row_diff']
                col_diff = target_info['col_diff']
                
                new_to_row = new_from_row + row_diff
                new_to_col = new_from_col + col_diff
                
                if 0 <= new_to_row < 8 and 0 <= new_to_col < 8:
                    new_action = (new_from_row * 8*8*8) + (new_from_col * 8*8) + (new_to_row * 8) + new_to_col
                    if 1 <= new_action <= 4096:
                        candidates.append((str(new_action), target_distance, f"เริ่มต้นใหม่ {target_direction}"))
        
        # วิธีที่ 3: ทิศทางเดียวกันแต่ระยะ 1 ช่อง
        if target_distance > 1:
            row_step = 1 if target_info['row_diff'] > 0 else (-1 if target_info['row_diff'] < 0 else 0)
            col_step = 1 if target_info['col_diff'] > 0 else (-1 if target_info['col_diff'] < 0 else 0)
            
            new_to_row = target_from[0] + row_step
            new_to_col = target_from[1] + col_step
            
            if 0 <= new_to_row < 8 and 0 <= new_to_col < 8:
                new_action = (target_from[0] * 8*8*8) + (target_from[1] * 8*8) + (new_to_row * 8) + new_to_col
                if 1 <= new_action <= 4096:
                    candidates.append((str(new_action), 1, f"ระยะ 1 ช่อง {target_direction}"))
        
        if candidates:
            # เลือก candidate ที่ดีที่สุด (ระยะใกล้เคียงที่สุด)
            best_candidate = min(candidates, key=lambda x: abs(x[1] - target_distance))
            chosen_action, chosen_distance, method = best_candidate
            if self.verbose:
                print(f"   ✅ เลือก action {chosen_action} ({method})")
            return chosen_action
        else:
            # ถ้าไม่มี candidate ให้สุ่มใน range เดียวกัน
            fallback = str(random.randint(max(1, int(target_action_id) - 100), 
                                        min(4096, int(target_action_id) + 100)))
            if self.verbose:
                print(f"   🎲 ไม่มี candidate เหมาะสม ใช้ range ใกล้เคียง: {fallback}")
            return fallback
    
    def play_one_turn(self) -> dict:
        """เล่น 1 turn (P1 = LLM, P2 = .pth)"""
        self.turn_count += 1
        current_player = 1 if self.turn_count % 2 == 1 else 2
        
        if self.verbose:
            print(f"\\n🎲 Turn {self.turn_count} - Player {current_player} (P1: {self.p1_pieces} หมาก, P2: {self.p2_pieces} หมาก)")
        
        if current_player == 1:  # LLM Turn
            if self.verbose:
                print("🧠 LLM's Turn")
            
            # ตรวจสอบว่าต้องวิเคราะห์กลยุทธ์ใหม่หรือไม่
            if (self.turn_count - 1) % self.strategy_analysis_interval == 0 or not self.current_actions:
                if self.verbose:
                    print(f"📊 วิเคราะห์กลยุทธ์ใหม่ (ทุก {self.strategy_analysis_interval} ตา)")
                self.current_strategy, self.current_actions = self.get_llm_strategy_and_actions()
                self.action_index = 0
            
            # เลือก action จากกลยุทธ์
            if self.current_actions and self.action_index < len(self.current_actions):
                chosen_action = self.current_actions[self.action_index]
                self.action_index += 1
                if self.verbose:
                    print(f"📋 ใช้ action จากกลยุทธ์ {self.current_strategy}: {chosen_action}")
            else:
                # ถ้าหมด actions หรือไม่มี actions ให้สุ่ม
                chosen_action = str(random.randint(1, 4000))
                if self.verbose:
                    print(f"🎲 สุ่ม action: {chosen_action}")
            
            # ตรวจสอบความถูกต้อง
            if self.simulate_move_validity(chosen_action):
                if self.verbose:
                    print(f"✅ LLM เดิน action {chosen_action} สำเร็จ")
                
                # จำลองการกินหมาก
                captured = self.simulate_capture()
                if captured > 0:
                    self.p2_pieces -= captured
                    if self.p2_pieces < 0:
                        self.p2_pieces = 0
                    if self.verbose:
                        print(f"🎯 P1 กินหมาก P2 ได้ {captured} ตัว! (P2 เหลือ {self.p2_pieces} หมาก)")
                
                action_info = self.analyze_action_direction(chosen_action)
                self.move_history.append(f"[{self.turn_count}] P1: {action_info['direction']} {action_info['distance']} ช่อง (action: {chosen_action})")
                return {'player': 1, 'action': chosen_action, 'success': True, 'strategy': self.current_strategy, 'captured': captured}
            else:
                if self.verbose:
                    print(f"❌ Action {chosen_action} ไม่ถูกต้อง")
                
                # ลองใช้ action สำรองแบบสุ่ม
                fallback = str(random.randint(1, 4000))
                if self.verbose:
                    print(f"🎲 ลอง action สำรอง: {fallback}")
                
                if self.simulate_move_validity(fallback):
                    if self.verbose:
                        print(f"✅ Action สำรอง {fallback} ใช้ได้")
                    captured = self.simulate_capture()
                    if captured > 0:
                        self.p2_pieces -= captured
                        if self.p2_pieces < 0:
                            self.p2_pieces = 0
                        if self.verbose:
                            print(f"🎯 P1 กินหมาก P2 ได้ {captured} ตัว! (P2 เหลือ {self.p2_pieces} หมาก)")
                    
                    action_info = self.analyze_action_direction(fallback)
                    self.move_history.append(f"[{self.turn_count}] P1: {action_info['direction']} {action_info['distance']} ช่อง (action: {fallback}, สำรอง)")
                    return {'player': 1, 'action': fallback, 'success': True, 'strategy': self.current_strategy, 'fallback': True, 'captured': captured}
                else:
                    if self.verbose:
                        print(f"❌ Action สำรอง {fallback} ก็ไม่ได้ - ใช้ intelligent fallback")
                    
                    # ใช้ intelligent fallback - หา move ที่คล้ายกับ original
                    intelligent_action = self.find_similar_move(chosen_action)
                    if self.verbose:
                        print(f"🧠 ใช้ intelligent action: {intelligent_action}")
                    
                    # สมมติว่า intelligent action จะใช้ได้เสมอ (เพราะคำนวณมาแล้ว)
                    captured = self.simulate_capture()
                    if captured > 0:
                        self.p2_pieces -= captured
                        if self.p2_pieces < 0:
                            self.p2_pieces = 0
                        if self.verbose:
                            print(f"🎯 P1 กินหมาก P2 ได้ {captured} ตัว! (P2 เหลือ {self.p2_pieces} หมาก)")
                    
                    action_info = self.analyze_action_direction(intelligent_action)
                    self.move_history.append(f"[{self.turn_count}] P1: {action_info['direction']} {action_info['distance']} ช่อง (action: {intelligent_action}, intelligent)")
                    return {'player': 1, 'action': intelligent_action, 'success': True, 'strategy': self.current_strategy, 'intelligent_fallback': True, 'captured': captured}
        
        else:  # .pth Model Turn
            if self.verbose:
                print("🤖 .pth Model's Turn")
            chosen_action = self.get_pth_move()
            
            # จำลองความสำเร็จ (.pth model มีโอกาสสำเร็จสูงกว่า)
            if self.simulate_move_validity(chosen_action) or random.random() < 0.95:
                if self.verbose:
                    print(f"✅ .pth Model เดิน action {chosen_action} สำเร็จ")
                
                # จำลองการกินหมาก
                captured = self.simulate_capture()
                if captured > 0:
                    self.p1_pieces -= captured
                    if self.p1_pieces < 0:
                        self.p1_pieces = 0
                    if self.verbose:
                        print(f"🎯 P2 กินหมาก P1 ได้ {captured} ตัว! (P1 เหลือ {self.p1_pieces} หมาก)")
                
                action_info = self.analyze_action_direction(chosen_action)
                self.move_history.append(f"[{self.turn_count}] P2: {action_info['direction']} {action_info['distance']} ช่อง (action: {chosen_action})")
                return {'player': 2, 'action': chosen_action, 'success': True, 'captured': captured}
            else:
                if self.verbose:
                    print(f"❌ .pth Model action {chosen_action} ไม่ถูกต้อง")
                fallback = str(random.randint(1, 4000))
                if self.verbose:
                    print(f"🔄 .pth Model ใช้ action ทดแทน: {fallback}")
                action_info = self.analyze_action_direction(fallback)
                self.move_history.append(f"[{self.turn_count}] P2: {action_info['direction']} {action_info['distance']} ช่อง (action: {fallback}, ทดแทน)")
                return {'player': 2, 'action': fallback, 'success': True, 'alternative': True, 'captured': 0}
    
    def play_complete_game(self) -> dict:
        """เล่นเกมเต็มรูปจนกว่าจะมีผู้ชนะ"""
        if self.verbose:
            print(f"🎮 เริ่มเกม LLM vs .pth Model! (เล่นจนกว่าจะมีผู้ชนะหรือเสมอ)")
            print("="*60)
        
        # รีเซ็ตเกม
        self.move_history = []
        self.turn_count = 0
        self.current_strategy = None
        self.current_actions = []
        self.action_index = 0
        self.p1_pieces = 8
        self.p2_pieces = 8
        self.turns_without_capture = 0
        
        game_log = []
        winner = None
        end_reason = ""
        
        while True:
            try:
                # เล่น 1 turn
                result = self.play_one_turn()
                game_log.append(result)
                
                # ตรวจสอบว่าเกมจบหรือยัง
                game_ended, winner, end_reason = self.check_game_end()
                if game_ended:
                    if self.verbose:
                        print(f"\\n🏁 เกมจบ! {end_reason}")
                    break
                
                # แสดงสถิติทุก 10 ตา (เฉพาะ verbose mode)
                if self.verbose and self.turn_count % 10 == 0:
                    print(f"\\n📊 สถิติหลัง {self.turn_count} ตา:")
                    p1_moves = len([m for m in game_log if m['player'] == 1])
                    p2_moves = len([m for m in game_log if m['player'] == 2])
                    print(f"   • P1 (LLM): {p1_moves} ตา, {self.p1_pieces} หมาก")
                    print(f"   • P2 (.pth): {p2_moves} ตา, {self.p2_pieces} หมาก")
                    if hasattr(self, 'current_strategy') and self.current_strategy:
                        print(f"   • กลยุทธ์ปัจจุบัน: {self.current_strategy}")
                    print(f"   • ตาที่ไม่มีการกิน: {self.turns_without_capture}/{self.max_turns_without_capture}")
                
            except KeyboardInterrupt:
                if self.verbose:
                    print("\\n⏹️ เกมถูกหยุดโดยผู้ใช้")
                winner = "ยกเลิก"
                end_reason = "ผู้ใช้หยุดเกม"
                break
            except Exception as e:
                if self.verbose:
                    print(f"\\n❌ เกิดข้อผิดพลาด: {e}")
                winner = "ข้อผิดพลาด"
                end_reason = f"เกิดข้อผิดพลาด: {e}"
                break
        
        # แปลงข้อมูลให้ตรงกับรูปแบบที่ 1000 games simulation ต้องการ
        total_captured_by_p1 = sum([log.get('captured', 0) for log in game_log if log['player'] == 1])
        total_captured_by_p2 = sum([log.get('captured', 0) for log in game_log if log['player'] == 2])
        p1_backup_actions = len([log for log in game_log if log['player'] == 1 and log.get('fallback')])
        p1_intelligent = len([log for log in game_log if log['player'] == 1 and log.get('intelligent_fallback')])
        p2_alternatives = len([log for log in game_log if log['player'] == 2 and log.get('alternative')])
        
        return {
            'total_turns': self.turn_count,
            'p1_final_pieces': self.p1_pieces,
            'p2_final_pieces': self.p2_pieces,
            'p1_captures': total_captured_by_p1,
            'p2_captures': total_captured_by_p2,
            'final_strategy': self.current_strategy or 'ไม่ระบุ',
            'winner': winner,
            'end_reason': end_reason,
            'p1_backup_actions': p1_backup_actions + p1_intelligent,
            'p2_substitute_actions': p2_alternatives
        }

print("✅ EnhancedGameSimulator พร้อมใช้งาน (รองรับ verbose mode + จำกัดเกม 100 ตา)")
print("⚡ อัพเดต: เกมจะจบภายใน 100 ตาเพื่อความรวดเร็ว")

🎮 เริ่มจำลองเกม LLM vs .pth Model!
✅ EnhancedGameSimulator พร้อมใช้งาน (รองรับ verbose mode + จำกัดเกม 100 ตา)
⚡ อัพเดต: เกมจะจบภายใน 100 ตาเพื่อความรวดเร็ว


In [None]:
# ========== การจำลอง 1000 เกม LLM vs .pth Model ==========
print("🚀 เริ่มการจำลอง 1000 เกม LLM vs .pth Model!")
print("="*70)

import csv
import time
from datetime import datetime
import os
import sys
import io
from contextlib import redirect_stderr

# สร้างโฟลเดอร์ผลลัพธ์
result_dir = os.path.join(os.getcwd(), "result-pth-vs-llm")
if not os.path.exists(result_dir):
    os.makedirs(result_dir)
    print(f"📁 สร้างโฟลเดอร์: {result_dir}")

# สร้างชื่อไฟล์ CSV
timestamp = datetime.now().strftime("%Y%m%d_%H%M%S")
csv_filename = f"simulation_1000_games_{timestamp}.csv"
csv_path = os.path.join(result_dir, csv_filename)

print(f"📄 ไฟล์ผลลัพธ์: {csv_filename}")
print(f"📁 โฟลเดอร์บันทึก: result-pth-vs-llm/")
print(f"🔇 ปิดการแสดง stderr เพื่อความเรียบร้อย")

# Headers สำหรับ CSV
csv_headers = [
    'game_number',
    'winner',
    'total_turns',
    'p1_final_pieces',
    'p2_final_pieces',
    'p1_captures',
    'p2_captures',
    'final_strategy',
    'end_reason',
    'game_duration_seconds',
    'p1_backup_actions',
    'p2_substitute_actions'
]

# สถิติรวม
total_stats = {
    'p1_wins': 0,
    'p2_wins': 0,
    'draws': 0,
    'total_turns': 0,
    'total_p1_captures': 0,
    'total_p2_captures': 0,
    'strategy_usage': {},
    'end_reasons': {},
    'game_durations': []
}

print(f"📊 เริ่มจำลอง 1000 เกม...")
print(f"💾 บันทึกผลลัพธ์ลงไฟล์: {csv_path}")
print(f"⏱️ Delay ระหว่างเกม: 3 วินาที")
print(f"📈 บันทึก CSV ทุก 100 เกม")
print(f"🤫 โหมดเงียบ - แสดงเฉพาะสถิติสำคัญ")

# เริ่มจำลอง
start_time = time.time()
game_data = []  # เก็บข้อมูลเกมสำหรับบันทึก CSV

# ปิด stderr เพื่อไม่ให้ llama แสดง performance logs
stderr_suppressor = io.StringIO()

for game_num in range(1, 1001):
    try:
        # แสดงความคืบหน้าแบบย่อ
        if game_num % 50 == 0 or game_num == 1:
            print(f"🎮 เกมที่ {game_num}/1000", end="")
            if game_num > 1:
                print(f" | P1: {total_stats['p1_wins']}, P2: {total_stats['p2_wins']}, เสมอ: {total_stats['draws']}")
            else:
                print()
        
        # เริ่มเกม (ปิด stderr)
        game_start_time = time.time()
        
        with redirect_stderr(stderr_suppressor):
            # สร้าง simulator ใหม่สำหรับแต่ละเกม
            game_sim = EnhancedGameSimulator(verbose=False)
            
            # เล่นเกมจนจบ (แบบไม่แสดงรายละเอียด)
            game_result = game_sim.play_complete_game()
        
        # คำนวณเวลาที่ใช้
        game_duration = time.time() - game_start_time
        
        # เตรียมข้อมูลสำหรับ CSV
        csv_row = {
            'game_number': game_num,
            'winner': game_result['winner'],
            'total_turns': game_result['total_turns'],
            'p1_final_pieces': game_result['p1_final_pieces'],
            'p2_final_pieces': game_result['p2_final_pieces'],
            'p1_captures': game_result['p1_captures'],
            'p2_captures': game_result['p2_captures'],
            'final_strategy': game_result['final_strategy'],
            'end_reason': game_result['end_reason'],
            'game_duration_seconds': round(game_duration, 2),
            'p1_backup_actions': game_result['p1_backup_actions'],
            'p2_substitute_actions': game_result['p2_substitute_actions']
        }
        
        # เก็บข้อมูลในหน่วยความจำ
        game_data.append(csv_row)
        
        # อัพเดทสถิติ
        if game_result['winner'] == 'P1':
            total_stats['p1_wins'] += 1
        elif game_result['winner'] == 'P2':
            total_stats['p2_wins'] += 1
        else:
            total_stats['draws'] += 1
        
        total_stats['total_turns'] += game_result['total_turns']
        total_stats['total_p1_captures'] += game_result['p1_captures']
        total_stats['total_p2_captures'] += game_result['p2_captures']
        total_stats['game_durations'].append(game_duration)
        
        # นับการใช้กลยุทธ์
        strategy = game_result['final_strategy']
        if strategy in total_stats['strategy_usage']:
            total_stats['strategy_usage'][strategy] += 1
        else:
            total_stats['strategy_usage'][strategy] = 1
        
        # นับเหตุผลการจบเกม
        reason = game_result['end_reason']
        if reason in total_stats['end_reasons']:
            total_stats['end_reasons'][reason] += 1
        else:
            total_stats['end_reasons'][reason] = 1
        
        # บันทึก CSV ทุก 100 เกม
        if game_num % 100 == 0:
            print(f"\n💾 บันทึก CSV รอบที่ {game_num//100}/10")
            
            # บันทึกข้อมูลลง CSV
            with open(csv_path, 'w', newline='', encoding='utf-8') as csvfile:
                writer = csv.DictWriter(csvfile, fieldnames=csv_headers)
                writer.writeheader()
                writer.writerows(game_data)
            
            elapsed_time = time.time() - start_time
            avg_time_per_game = elapsed_time / game_num
            estimated_remaining = avg_time_per_game * (1000 - game_num)
            
            print(f"📈 สถิติรอบ {game_num} เกม:")
            print(f"   🏆 P1(LLM): {total_stats['p1_wins']} ({total_stats['p1_wins']/game_num*100:.1f}%) | 🤖 P2(.pth): {total_stats['p2_wins']} ({total_stats['p2_wins']/game_num*100:.1f}%) | 🤝 เสมอ: {total_stats['draws']} ({total_stats['draws']/game_num*100:.1f}%)")
            print(f"   ⏱️ เวลาเฉลี่ย: {avg_time_per_game:.1f}s/เกม | 🕒 เหลือ: {estimated_remaining/60:.0f}นาที | 📊 ตาเฉลี่ย: {total_stats['total_turns']/game_num:.0f}")
            
            # แสดงกลยุทธ์ยอดนิยม 3 อันดับแรก
            if total_stats['strategy_usage']:
                sorted_strategies = sorted(total_stats['strategy_usage'].items(), key=lambda x: x[1], reverse=True)
                top3 = [f"{s[0]}({s[1]})" for s in sorted_strategies[:3]]
                print(f"   🧠 กลยุทธ์ยอดนิยม: {', '.join(top3)}")
            
            print("-" * 60)
        
        # Delay 3 วินาทีระหว่างเกม
        time.sleep(3)
        
    except KeyboardInterrupt:
        print(f"\n⏹️ หยุดการจำลองที่เกมที่ {game_num}")
        break
    except Exception as e:
        if game_num % 50 == 0:
            print(f"\n❌ Error เกม {game_num}: {str(e)[:50]}...")
        # เขียนข้อมูลว่างลง CSV เพื่อไม่ให้ข้ามไป
        error_row = {header: 'ERROR' if header == 'end_reason' else 0 for header in csv_headers}
        error_row['game_number'] = game_num
        error_row['end_reason'] = f"Error: {str(e)}"
        game_data.append(error_row)
        continue

# บันทึก CSV ครั้งสุดท้าย
print(f"\n💾 บันทึก CSV ครั้งสุดท้าย...")
with open(csv_path, 'w', newline='', encoding='utf-8') as csvfile:
    writer = csv.DictWriter(csvfile, fieldnames=csv_headers)
    writer.writeheader()
    writer.writerows(game_data)

total_time = time.time() - start_time

# แสดงสรุปผลสุดท้าย
print("\n" + "="*70)
print("🏁 การจำลอง 1000 เกมเสร็จสิ้น!")
print("="*70)

print(f"⏱️ เวลาทั้งหมด: {total_time/60:.2f} นาที")
print(f"📄 ไฟล์ผลลัพธ์: {csv_filename}")

# สถิติโดยรวม
games_completed = total_stats['p1_wins'] + total_stats['p2_wins'] + total_stats['draws']
print(f"\n📊 สรุปผลสุดท้าย ({games_completed} เกม):")

if games_completed > 0:
    # อัตราการชนะ
    print(f"\n🏆 ผลการแข่งขัน:")
    print(f"   🧠 P1 (LLM): {total_stats['p1_wins']} เกม ({total_stats['p1_wins']/games_completed*100:.1f}%)")
    print(f"   🤖 P2 (.pth Model Hard): {total_stats['p2_wins']} เกม ({total_stats['p2_wins']/games_completed*100:.1f}%)")
    print(f"   🤝 เสมอ: {total_stats['draws']} เกม ({total_stats['draws']/games_completed*100:.1f}%)")

    # ข้อสรุปว่าใครดีกว่า
    if total_stats['p1_wins'] > total_stats['p2_wins']:
        winner_analysis = f"🧠 LLM ชนะ .pth Model โดยเหนือกว่า {total_stats['p1_wins'] - total_stats['p2_wins']} เกม"
    elif total_stats['p2_wins'] > total_stats['p1_wins']:
        winner_analysis = f"🤖 .pth Model ชนะ LLM โดยเหนือกว่า {total_stats['p2_wins'] - total_stats['p1_wins']} เกม"
    else:
        winner_analysis = "🤝 LLM และ .pth Model สมรรถนะเท่ากัน"

    print(f"\n💡 สรุป: {winner_analysis}")

    print(f"\n🎯 สถิติเกม:")
    print(f"   📈 ตาเฉลี่ย: {total_stats['total_turns']/games_completed:.1f} | ⏱️ เวลาเฉลี่ย: {sum(total_stats['game_durations'])/len(total_stats['game_durations']):.1f}s")
    print(f"   🧠 P1 กินหมาก: {total_stats['total_p1_captures']} ({total_stats['total_p1_captures']/games_completed:.1f}/เกม)")
    print(f"   🤖 P2 กินหมาก: {total_stats['total_p2_captures']} ({total_stats['total_p2_captures']/games_completed:.1f}/เกม)")

    # กลยุทธ์ที่ใช้บ่อยที่สุด 5 อันดับแรก
    print(f"\n🧠 กลยุทธ์ LLM ยอดนิยม:")
    if total_stats['strategy_usage']:
        sorted_strategies = sorted(total_stats['strategy_usage'].items(), key=lambda x: x[1], reverse=True)
        for i, (strategy, count) in enumerate(sorted_strategies[:5]):
            print(f"   {i+1}. {strategy}: {count} ครั้ง ({count/games_completed*100:.1f}%)")
else:
    print("⚠️ ไม่มีเกมที่เสร็จสมบูรณ์")

print(f"\n💾 ไฟล์ CSV: result-pth-vs-llm/{csv_filename}")
print("🎊 จำลองเสร็จสิ้น! พร้อมวิเคราะห์ประสิทธิภาพ LLM vs .pth Model")

🚀 เริ่มการจำลอง 1000 เกม LLM vs .pth Model!
📄 ไฟล์ผลลัพธ์: simulation_1000_games_20250730_112301.csv
📁 โฟลเดอร์บันทึก: result-pth-vs-llm/
🔇 ปิดการแสดง stderr เพื่อความเรียบร้อย
📊 เริ่มจำลอง 1000 เกม...
💾 บันทึกผลลัพธ์ลงไฟล์: c:\university\nsc\agent-maknib\app\llm\result-pth-vs-llm\simulation_1000_games_20250730_112301.csv
⏱️ Delay ระหว่างเกม: 3 วินาที
📈 บันทึก CSV ทุก 100 เกม
🤫 โหมดเงียบ - แสดงเฉพาะสถิติสำคัญ
🎮 เกมที่ 1/1000


 # 1 ตา

In [12]:
# ========== เกม LLM vs .pth Model แบบเต็มรูปแบบ ==========
print("🎮 เริ่มจำลองเกม LLM vs .pth Model!")
print("="*60)

import random
from typing import List

class EnhancedGameSimulator:
    def __init__(self):
        # ตรวจสอบระบบ
        self.llm_ready = 'llm' in globals() and llm is not None
        self.pth_ready = 'pth_model' in globals() and pth_model is not None and 'pth_mcts' in globals() and pth_mcts is not None
        self.db_ready = 'db' in globals() and db is not None
        
        print(f"📊 สถานะระบบ:")
        print(f"   • LLM: {'✅ พร้อม' if self.llm_ready else '❌ ไม่พร้อม'}")
        print(f"   • .pth Model: {'✅ พร้อม' if self.pth_ready else '❌ ไม่พร้อม'}")
        print(f"   • Database: {'✅ พร้อม' if self.db_ready else '❌ ไม่พร้อม'}")
        
        # ประวัติเกม
        self.move_history = []
        self.turn_count = 0
        self.current_strategy = None
        self.current_actions = []
        self.action_index = 0
        
        # กลยุทธ์การเล่น
        self.strategy_analysis_interval = 10  # วิเคราะห์ทุก 10 ตา
        
        # จำลองสถานะเกม
        self.p1_pieces = 8  # หมากผู้เล่น 1
        self.p2_pieces = 8  # หมากผู้เล่น 2
        self.max_turns_without_capture = 50  # ถ้าไม่มีการกินหมากเกิน 50 ตา = เสมอ
        self.turns_without_capture = 0
    
    def analyze_action_direction(self, action_id: str) -> dict:
        """วิเคราะห์ทิศทางการเดินของ action ID"""
        try:
            action_num = int(action_id)
            # จำลองการแปลง action เป็นตำแหน่ง (8x8x8x8 = 4096)
            from_row = action_num // (8*8*8)
            temp = action_num % (8*8*8)
            from_col = temp // (8*8)
            temp = temp % (8*8)
            to_row = temp // 8
            to_col = temp % 8
            
            # คำนวณทิศทางและระยะ
            row_diff = to_row - from_row
            col_diff = to_col - from_col
            distance = abs(row_diff) + abs(col_diff)
            
            direction = ""
            if row_diff > 0: direction += "ลง"
            elif row_diff < 0: direction += "ขึ้น"
            if col_diff > 0: direction += "ขวา"
            elif col_diff < 0: direction += "ซ้าย"
            
            return {
                'from_pos': (from_row, from_col),
                'to_pos': (to_row, to_col),
                'direction': direction or "อยู่กับที่",
                'distance': distance,
                'row_diff': row_diff,
                'col_diff': col_diff
            }
        except:
            return {'direction': 'ไม่ระบุ', 'distance': 0}
    
    def simulate_capture(self) -> int:
        """จำลองการกินหมาก คืนค่าจำนวนหมากที่ถูกกิน"""
        # สุ่มว่ามีการกินหมากหรือไม่ (15% ความน่าจะเป็น)
        if random.random() < 0.15:
            # จำนวนหมากที่ถูกกิน (1-2 ตัว)
            captured = random.choice([1, 2])
            self.turns_without_capture = 0  # รีเซ็ตตัวนับ
            return captured
        else:
            self.turns_without_capture += 1
            return 0
    
    def check_game_end(self) -> tuple:
        """ตรวจสอบว่าเกมจบหรือยัง คืนค่า (จบหรือไม่, ผู้ชนะ, เหตุผล)"""
        # กรณีที่หมากหมด
        if self.p1_pieces <= 0:
            return True, "P2", f"P1 หมากหมด ({self.p2_pieces} vs 0)"
        elif self.p2_pieces <= 0:
            return True, "P1", f"P2 หมากหมด ({self.p1_pieces} vs 0)"
        
        # กรณีเสมอ - ไม่มีการกินหมากนานเกินไป
        elif self.turns_without_capture >= self.max_turns_without_capture:
            if self.p1_pieces > self.p2_pieces:
                return True, "P1", f"เกมยาวเกินไป P1 มีหมากมากกว่า ({self.p1_pieces} vs {self.p2_pieces})"
            elif self.p2_pieces > self.p1_pieces:
                return True, "P2", f"เกมยาวเกินไป P2 มีหมากมากกว่า ({self.p1_pieces} vs {self.p2_pieces})"
            else:
                return True, "เสมอ", f"เกมยาวเกินไป หมากเท่ากัน ({self.p1_pieces} vs {self.p2_pieces})"
        
        # กรณีเกมยาวเกิน 200 ตา
        elif self.turn_count >= 200:
            if self.p1_pieces > self.p2_pieces:
                return True, "P1", f"เกมเกิน 200 ตา P1 มีหมากมากกว่า ({self.p1_pieces} vs {self.p2_pieces})"
            elif self.p2_pieces > self.p1_pieces:
                return True, "P2", f"เกมเกิน 200 ตา P2 มีหมากมากกว่า ({self.p1_pieces} vs {self.p2_pieces})"
            else:
                return True, "เสมอ", f"เกมเกิน 200 ตา หมากเท่ากัน ({self.p1_pieces} vs {self.p2_pieces})"
        
        return False, None, None
    
    def get_llm_strategy_and_actions(self) -> tuple:
        """ใช้ LLM วิเคราะห์กลยุทธ์และดึง actions จากฐานข้อมูล"""
        if not self.llm_ready or not self.db_ready:
            # Fallback: สุ่มกลยุทธ์
            strategies = ['ปิดฟ้าข้ามทะเล', 'ล้อมเวยช่วยจ้าว', 'ยืมดาบฆ่าคน', 'รอซ้ำยามเปลี้ย']
            strategy = random.choice(strategies)
            return strategy, []
        
        # สร้าง situation สำหรับ LLM
        moves_text = "\\n".join(self.move_history[-20:]) if self.move_history else "เกมเพิ่งเริ่ม"
        game_status = f"สถานการณ์ปัจจุบัน: P1 มี {self.p1_pieces} หมาก, P2 มี {self.p2_pieces} หมาก"
        
        situation = f"""สถานการณ์เกมหมากหนีบ:
{game_status}

{moves_text}

จากประวัติการเดินหมากข้างต้น โปรดวิเคราะห์และเลือกกลยุทธ์ที่เหมาะสมสำหรับ P1 (LLM)

จากรายการกลยุทธ์: {strategies_text}

โปรดเลือกกลยุทธ์ที่เหมาะสมที่สุด"""
        
        system_prompt = "คุณเป็นผู้เชี่ยวชาญการวิเคราะห์กลยุทธ์หมากหนีบ ตอบเฉพาะในรูปแบบ 'กลยุทธ์: [ชื่อกลยุทธ์]'"
        
        full_prompt = f"""<|im_start|>system
{system_prompt}
<|im_end|>
<|im_start|>user
{situation}
<|im_end|>
<|im_start|>assistant
กลยุทธ์: """
        
        try:
            print("🧠 LLM กำลังวิเคราะห์กลยุทธ์...")
            response = cast(Dict[str, Any], llm(
                prompt=full_prompt,
                max_tokens=30,
                stop=["<|im_end|>", "\\n", "###"],
                echo=False,
                temperature=0.7,
                stream=False
            ))
            
            result = response['choices'][0]['text'].strip()
            
            # ดึงชื่อกลยุทธ์
            strategy = None
            m = re.search(r'กลยุทธ์[:：]?\\s*(.+)', result)
            if m:
                strategy = m.group(1).split('\\n')[0].strip()
                strategy = normalize_strategy_name(strategy)
            else:
                strategy = normalize_strategy_name(result)
            
            print(f"✅ LLM เลือกกลยุทธ์: {strategy}")
            
            # ดึง actions จากฐานข้อมูล
            actions = db.get_strategy_actions(strategy)
            if actions:
                # เลือก 10 actions แรก
                selected_actions = actions[:10]
                print(f"📋 ดึงได้ {len(selected_actions)} actions สำหรับกลยุทธ์ {strategy}")
                return strategy, selected_actions
            else:
                print(f"⚠️ ไม่พบ actions สำหรับกลยุทธ์ {strategy}")
                return strategy, []
                
        except Exception as e:
            print(f"❌ LLM Error: {e}")
            # Fallback
            strategy = random.choice(['ปิดฟ้าข้ามทะเล', 'ล้อมเวยช่วยจ้าว', 'ยืมดาบฆ่าคน'])
            return strategy, []
    
    def get_pth_move(self) -> str:
        """ใช้ .pth Model สร้าง action"""
        if not self.pth_ready:
            # Fallback: สุ่ม action
            return str(random.randint(1, 4000))
        
        try:
            print("🤖 .pth Model กำลังคิด...")
            # จำลองการใช้ MCTS (ในความจริงต้องใส่ board state)
            # สำหรับการทดสอบ ให้สุ่ม action จาก range ที่สมเหตุสมผล
            action_id = random.randint(1, 4000)
            print(f"🎯 .pth Model เลือก action: {action_id}")
            return str(action_id)
        except Exception as e:
            print(f"❌ .pth Model Error: {e}")
            return str(random.randint(1, 4000))
    
    def simulate_move_validity(self, action_id: str) -> bool:
        """จำลองการตรวจสอบว่า move ถูกต้องหรือไม่"""
        # จำลองความน่าจะเป็นว่า move ถูกต้อง (85%)
        return random.random() < 0.85
    
    def find_similar_move(self, target_action_id: str) -> str:
        """หา action ID ที่คล้ายกับ target แต่เป็นไปได้มากกว่า"""
        print(f"🔍 กำลังหา move ที่คล้ายกับ action {target_action_id}")
        
        target_info = self.analyze_action_direction(target_action_id)
        target_direction = target_info['direction']
        target_distance = target_info['distance']
        target_from = target_info['from_pos']
        target_to = target_info['to_pos']
        
        print(f"   🎯 Target: {target_direction} {target_distance} ช่อง จาก {target_from} ไป {target_to}")
        
        # ลองหา action ใกล้เคียง
        candidates = []
        
        # วิธีที่ 1: ลดระยะการเดิน (ครึ่งหนึ่ง)
        if target_distance > 1:
            new_distance = max(1, target_distance // 2)
            row_step = 1 if target_info['row_diff'] > 0 else (-1 if target_info['row_diff'] < 0 else 0)
            col_step = 1 if target_info['col_diff'] > 0 else (-1 if target_info['col_diff'] < 0 else 0)
            
            new_to_row = target_from[0] + (row_step * new_distance)
            new_to_col = target_from[1] + (col_step * new_distance)
            
            # ตรวจสอบว่าอยู่ในขอบเขต
            if 0 <= new_to_row < 8 and 0 <= new_to_col < 8:
                new_action = (target_from[0] * 8*8*8) + (target_from[1] * 8*8) + (new_to_row * 8) + new_to_col
                if 1 <= new_action <= 4096:
                    candidates.append((str(new_action), new_distance, f"ระยะสั้นลง {target_direction}"))
        
        # วิธีที่ 2: เปลี่ยนจุดเริ่มต้นให้ใกล้ขอบ
        for offset in [(0,1), (0,-1), (1,0), (-1,0), (1,1), (1,-1), (-1,1), (-1,-1)]:
            new_from_row = target_from[0] + offset[0]
            new_from_col = target_from[1] + offset[1]
            
            if 0 <= new_from_row < 8 and 0 <= new_from_col < 8:
                # คำนวณ to ใหม่ให้เป็นทิศทางเดียวกัน
                row_diff = target_info['row_diff']
                col_diff = target_info['col_diff']
                
                new_to_row = new_from_row + row_diff
                new_to_col = new_from_col + col_diff
                
                if 0 <= new_to_row < 8 and 0 <= new_to_col < 8:
                    new_action = (new_from_row * 8*8*8) + (new_from_col * 8*8) + (new_to_row * 8) + new_to_col
                    if 1 <= new_action <= 4096:
                        candidates.append((str(new_action), target_distance, f"เริ่มต้นใหม่ {target_direction}"))
        
        # วิธีที่ 3: ทิศทางเดียวกันแต่ระยะ 1 ช่อง
        if target_distance > 1:
            row_step = 1 if target_info['row_diff'] > 0 else (-1 if target_info['row_diff'] < 0 else 0)
            col_step = 1 if target_info['col_diff'] > 0 else (-1 if target_info['col_diff'] < 0 else 0)
            
            new_to_row = target_from[0] + row_step
            new_to_col = target_from[1] + col_step
            
            if 0 <= new_to_row < 8 and 0 <= new_to_col < 8:
                new_action = (target_from[0] * 8*8*8) + (target_from[1] * 8*8) + (new_to_row * 8) + new_to_col
                if 1 <= new_action <= 4096:
                    candidates.append((str(new_action), 1, f"ระยะ 1 ช่อง {target_direction}"))
        
        if candidates:
            # เลือก candidate ที่ดีที่สุด (ระยะใกล้เคียงที่สุด)
            best_candidate = min(candidates, key=lambda x: abs(x[1] - target_distance))
            chosen_action, chosen_distance, method = best_candidate
            print(f"   ✅ เลือก action {chosen_action} ({method})")
            return chosen_action
        else:
            # ถ้าไม่มี candidate ให้สุ่มใน range เดียวกัน
            fallback = str(random.randint(max(1, int(target_action_id) - 100), 
                                        min(4096, int(target_action_id) + 100)))
            print(f"   🎲 ไม่มี candidate เหมาะสม ใช้ range ใกล้เคียง: {fallback}")
            return fallback
    
    def play_one_turn(self) -> dict:
        """เล่น 1 turn (P1 = LLM, P2 = .pth)"""
        self.turn_count += 1
        current_player = 1 if self.turn_count % 2 == 1 else 2
        
        print(f"\\n🎲 Turn {self.turn_count} - Player {current_player} (P1: {self.p1_pieces} หมาก, P2: {self.p2_pieces} หมาก)")
        
        if current_player == 1:  # LLM Turn
            print("🧠 LLM's Turn")
            
            # ตรวจสอบว่าต้องวิเคราะห์กลยุทธ์ใหม่หรือไม่
            if (self.turn_count - 1) % self.strategy_analysis_interval == 0 or not self.current_actions:
                print(f"📊 วิเคราะห์กลยุทธ์ใหม่ (ทุก {self.strategy_analysis_interval} ตา)")
                self.current_strategy, self.current_actions = self.get_llm_strategy_and_actions()
                self.action_index = 0
            
            # เลือก action จากกลยุทธ์
            if self.current_actions and self.action_index < len(self.current_actions):
                chosen_action = self.current_actions[self.action_index]
                self.action_index += 1
                print(f"📋 ใช้ action จากกลยุทธ์ {self.current_strategy}: {chosen_action}")
            else:
                # ถ้าหมด actions หรือไม่มี actions ให้สุ่ม
                chosen_action = str(random.randint(1, 4000))
                print(f"🎲 สุ่ม action: {chosen_action}")
            
            # ตรวจสอบความถูกต้อง
            if self.simulate_move_validity(chosen_action):
                print(f"✅ LLM เดิน action {chosen_action} สำเร็จ")
                
                # จำลองการกินหมาก
                captured = self.simulate_capture()
                if captured > 0:
                    self.p2_pieces -= captured
                    if self.p2_pieces < 0:
                        self.p2_pieces = 0
                    print(f"🎯 P1 กินหมาก P2 ได้ {captured} ตัว! (P2 เหลือ {self.p2_pieces} หมาก)")
                
                action_info = self.analyze_action_direction(chosen_action)
                self.move_history.append(f"[{self.turn_count}] P1: {action_info['direction']} {action_info['distance']} ช่อง (action: {chosen_action})")
                return {'player': 1, 'action': chosen_action, 'success': True, 'strategy': self.current_strategy, 'captured': captured}
            else:
                print(f"❌ Action {chosen_action} ไม่ถูกต้อง")
                
                # ลองใช้ action สำรองแบบสุ่ม
                fallback = str(random.randint(1, 4000))
                print(f"🎲 ลอง action สำรอง: {fallback}")
                
                if self.simulate_move_validity(fallback):
                    print(f"✅ Action สำรอง {fallback} ใช้ได้")
                    captured = self.simulate_capture()
                    if captured > 0:
                        self.p2_pieces -= captured
                        if self.p2_pieces < 0:
                            self.p2_pieces = 0
                        print(f"🎯 P1 กินหมาก P2 ได้ {captured} ตัว! (P2 เหลือ {self.p2_pieces} หมาก)")
                    
                    action_info = self.analyze_action_direction(fallback)
                    self.move_history.append(f"[{self.turn_count}] P1: {action_info['direction']} {action_info['distance']} ช่อง (action: {fallback}, สำรอง)")
                    return {'player': 1, 'action': fallback, 'success': True, 'strategy': self.current_strategy, 'fallback': True, 'captured': captured}
                else:
                    print(f"❌ Action สำรอง {fallback} ก็ไม่ได้ - ใช้ intelligent fallback")
                    
                    # ใช้ intelligent fallback - หา move ที่คล้ายกับ original
                    intelligent_action = self.find_similar_move(chosen_action)
                    print(f"🧠 ใช้ intelligent action: {intelligent_action}")
                    
                    # สมมติว่า intelligent action จะใช้ได้เสมอ (เพราะคำนวณมาแล้ว)
                    captured = self.simulate_capture()
                    if captured > 0:
                        self.p2_pieces -= captured
                        if self.p2_pieces < 0:
                            self.p2_pieces = 0
                        print(f"🎯 P1 กินหมาก P2 ได้ {captured} ตัว! (P2 เหลือ {self.p2_pieces} หมาก)")
                    
                    action_info = self.analyze_action_direction(intelligent_action)
                    self.move_history.append(f"[{self.turn_count}] P1: {action_info['direction']} {action_info['distance']} ช่อง (action: {intelligent_action}, intelligent)")
                    return {'player': 1, 'action': intelligent_action, 'success': True, 'strategy': self.current_strategy, 'intelligent_fallback': True, 'captured': captured}
        
        else:  # .pth Model Turn
            print("🤖 .pth Model's Turn")
            chosen_action = self.get_pth_move()
            
            # จำลองความสำเร็จ (.pth model มีโอกาสสำเร็จสูงกว่า)
            if self.simulate_move_validity(chosen_action) or random.random() < 0.95:
                print(f"✅ .pth Model เดิน action {chosen_action} สำเร็จ")
                
                # จำลองการกินหมาก
                captured = self.simulate_capture()
                if captured > 0:
                    self.p1_pieces -= captured
                    if self.p1_pieces < 0:
                        self.p1_pieces = 0
                    print(f"🎯 P2 กินหมาก P1 ได้ {captured} ตัว! (P1 เหลือ {self.p1_pieces} หมาก)")
                
                action_info = self.analyze_action_direction(chosen_action)
                self.move_history.append(f"[{self.turn_count}] P2: {action_info['direction']} {action_info['distance']} ช่อง (action: {chosen_action})")
                return {'player': 2, 'action': chosen_action, 'success': True, 'captured': captured}
            else:
                print(f"❌ .pth Model action {chosen_action} ไม่ถูกต้อง")
                fallback = str(random.randint(1, 4000))
                print(f"🔄 .pth Model ใช้ action ทดแทน: {fallback}")
                action_info = self.analyze_action_direction(fallback)
                self.move_history.append(f"[{self.turn_count}] P2: {action_info['direction']} {action_info['distance']} ช่อง (action: {fallback}, ทดแทน)")
                return {'player': 2, 'action': fallback, 'success': True, 'alternative': True, 'captured': 0}
    
    def play_full_game(self) -> dict:
        """เล่นเกมเต็มรูปจนกว่าจะมีผู้ชนะ"""
        print(f"🎮 เริ่มเกม LLM vs .pth Model! (เล่นจนกว่าจะมีผู้ชนะหรือเสมอ)")
        print("="*60)
        
        # รีเซ็ตเกม
        self.move_history = []
        self.turn_count = 0
        self.current_strategy = None
        self.current_actions = []
        self.action_index = 0
        self.p1_pieces = 8
        self.p2_pieces = 8
        self.turns_without_capture = 0
        
        game_log = []
        winner = None
        end_reason = ""
        
        while True:
            try:
                # เล่น 1 turn
                result = self.play_one_turn()
                game_log.append(result)
                
                # ตรวจสอบว่าเกมจบหรือยัง
                game_ended, winner, end_reason = self.check_game_end()
                if game_ended:
                    print(f"\\n🏁 เกมจบ! {end_reason}")
                    break
                
                # แสดงสถิติทุก 10 ตา
                if self.turn_count % 10 == 0:
                    print(f"\\n📊 สถิติหลัง {self.turn_count} ตา:")
                    p1_moves = len([m for m in game_log if m['player'] == 1])
                    p2_moves = len([m for m in game_log if m['player'] == 2])
                    print(f"   • P1 (LLM): {p1_moves} ตา, {self.p1_pieces} หมาก")
                    print(f"   • P2 (.pth): {p2_moves} ตา, {self.p2_pieces} หมาก")
                    if hasattr(self, 'current_strategy') and self.current_strategy:
                        print(f"   • กลยุทธ์ปัจจุบัน: {self.current_strategy}")
                    print(f"   • ตาที่ไม่มีการกิน: {self.turns_without_capture}/{self.max_turns_without_capture}")
                
            except KeyboardInterrupt:
                print("\\n⏹️ เกมถูกหยุดโดยผู้ใช้")
                winner = "ยกเลิก"
                end_reason = "ผู้ใช้หยุดเกม"
                break
            except Exception as e:
                print(f"\\n❌ เกิดข้อผิดพลาด: {e}")
                winner = "ข้อผิดพลาด"
                end_reason = f"เกิดข้อผิดพลาด: {e}"
                break
        
        return {
            'total_turns': self.turn_count,
            'move_history': self.move_history,
            'game_log': game_log,
            'final_strategy': self.current_strategy,
            'winner': winner,
            'end_reason': end_reason,
            'final_score': {'P1': self.p1_pieces, 'P2': self.p2_pieces}
        }

# สร้าง Enhanced Game Simulator และเริ่มเกมทันที!
print("\\n🚀 สร้าง Enhanced Game Simulator และเริ่มเกมทันที!")
enhanced_sim = EnhancedGameSimulator()

# เริ่มเกมจนกว่าจะมีผู้ชนะ!
print("\\n🎯 เริ่มเกมจนกว่าจะมีผู้ชนะหรือเสมอ!")
game_result = enhanced_sim.play_full_game()

# แสดงสรุปผลเกม
print("\\n" + "="*60)
print("🏆 สรุปผลเกม")
print("="*60)
print(f"🎯 จำนวนตาทั้งหมด: {game_result['total_turns']}")
print(f"🏆 ผู้ชนะ: {game_result['winner']}")
print(f"📋 เหตุผลจบเกม: {game_result['end_reason']}")
print(f"📊 คะแนนสุดท้าย: P1 = {game_result['final_score']['P1']} หมาก, P2 = {game_result['final_score']['P2']} หมาก")
print(f"🧠 กลยุทธ์สุดท้ายของ LLM: {game_result['final_strategy']}")

print(f"\\n📋 ประวัติการเดินหมาก 10 ตาสุดท้าย:")
for move in game_result['move_history'][-10:]:
    print(f"   {move}")

# สถิติผู้เล่น
p1_moves = len([log for log in game_result['game_log'] if log['player'] == 1])
p2_moves = len([log for log in game_result['game_log'] if log['player'] == 2])
p1_alternatives = len([log for log in game_result['game_log'] if log['player'] == 1 and log.get('alternative')])
p1_fallbacks = len([log for log in game_result['game_log'] if log['player'] == 1 and log.get('fallback')])
p1_intelligent = len([log for log in game_result['game_log'] if log['player'] == 1 and log.get('intelligent_fallback')])
p2_alternatives = len([log for log in game_result['game_log'] if log['player'] == 2 and log.get('alternative')])
total_captured_by_p1 = sum([log.get('captured', 0) for log in game_result['game_log'] if log['player'] == 1])
total_captured_by_p2 = sum([log.get('captured', 0) for log in game_result['game_log'] if log['player'] == 2])

print(f"\\n📊 สถิติการเล่น:")
print(f"   🧠 P1 (LLM): {p1_moves} ตา")
print(f"      • ใช้ action สำรอง: {p1_fallbacks} ครั้ง")
print(f"      • ใช้ intelligent fallback: {p1_intelligent} ครั้ง")
print(f"      • กินหมากได้: {total_captured_by_p1} ตัว")
print(f"   🤖 P2 (.pth): {p2_moves} ตา")
print(f"      • ใช้ action ทดแทน: {p2_alternatives} ครั้ง") 
print(f"      • กินหมากได้: {total_captured_by_p2} ตัว")

print(f"\\n🎊 เกมจำลองเสร็จสิ้น! ผู้ชนะคือ: {game_result['winner']}")

🎮 เริ่มจำลองเกม LLM vs .pth Model!
\n🚀 สร้าง Enhanced Game Simulator และเริ่มเกมทันที!
📊 สถานะระบบ:
   • LLM: ✅ พร้อม
   • .pth Model: ✅ พร้อม
   • Database: ✅ พร้อม
\n🎯 เริ่มเกมจนกว่าจะมีผู้ชนะหรือเสมอ!
🎮 เริ่มเกม LLM vs .pth Model! (เล่นจนกว่าจะมีผู้ชนะหรือเสมอ)
\n🎲 Turn 1 - Player 1 (P1: 8 หมาก, P2: 8 หมาก)
🧠 LLM's Turn
📊 วิเคราะห์กลยุทธ์ใหม่ (ทุก 10 ตา)
🧠 LLM กำลังวิเคราะห์กลยุทธ์...


Llama.generate: 86 prefix-match hit, remaining 419 prompt tokens to eval
llama_perf_context_print:        load time =    9713.88 ms
llama_perf_context_print: prompt eval time =    7781.93 ms /   419 tokens (   18.57 ms per token,    53.84 tokens per second)
llama_perf_context_print:        eval time =    2112.72 ms /    29 runs   (   72.85 ms per token,    13.73 tokens per second)
llama_perf_context_print:       total time =   10020.06 ms /   448 tokens
llama_perf_context_print:        load time =    9713.88 ms
llama_perf_context_print: prompt eval time =    7781.93 ms /   419 tokens (   18.57 ms per token,    53.84 tokens per second)
llama_perf_context_print:        eval time =    2112.72 ms /    29 runs   (   72.85 ms per token,    13.73 tokens per second)
llama_perf_context_print:       total time =   10020.06 ms /   448 tokens
Llama.generate: 99 prefix-match hit, remaining 611 prompt tokens to eval
Llama.generate: 99 prefix-match hit, remaining 611 prompt tokens to eval


✅ LLM เลือกกลยุทธ์: ตีหญ้าให้งูตื่น
📋 ดึงได้ 10 actions สำหรับกลยุทธ์ ตีหญ้าให้งูตื่น
📋 ใช้ action จากกลยุทธ์ ตีหญ้าให้งูตื่น: 406
✅ LLM เดิน action 406 สำเร็จ
\n🎲 Turn 2 - Player 2 (P1: 8 หมาก, P2: 8 หมาก)
🤖 .pth Model's Turn
🤖 .pth Model กำลังคิด...
🎯 .pth Model เลือก action: 3239
✅ .pth Model เดิน action 3239 สำเร็จ
\n🎲 Turn 3 - Player 1 (P1: 8 หมาก, P2: 8 หมาก)
🧠 LLM's Turn
📋 ใช้ action จากกลยุทธ์ ตีหญ้าให้งูตื่น: 3957
❌ Action 3957 ไม่ถูกต้อง
🎲 ลอง action สำรอง: 2161
✅ Action สำรอง 2161 ใช้ได้
\n🎲 Turn 4 - Player 2 (P1: 8 หมาก, P2: 8 หมาก)
🤖 .pth Model's Turn
🤖 .pth Model กำลังคิด...
🎯 .pth Model เลือก action: 1961
✅ .pth Model เดิน action 1961 สำเร็จ
\n🎲 Turn 5 - Player 1 (P1: 8 หมาก, P2: 8 หมาก)
🧠 LLM's Turn
📋 ใช้ action จากกลยุทธ์ ตีหญ้าให้งูตื่น: 8
✅ LLM เดิน action 8 สำเร็จ
\n🎲 Turn 6 - Player 2 (P1: 8 หมาก, P2: 8 หมาก)
🤖 .pth Model's Turn
🤖 .pth Model กำลังคิด...
🎯 .pth Model เลือก action: 1014
✅ .pth Model เดิน action 1014 สำเร็จ
\n🎲 Turn 7 - Player 1 (P1: 8 หมาก, P2: 8 หมา

llama_perf_context_print:        load time =    9713.88 ms
llama_perf_context_print: prompt eval time =   11732.42 ms /   611 tokens (   19.20 ms per token,    52.08 tokens per second)
llama_perf_context_print:        eval time =    2251.13 ms /    29 runs   (   77.63 ms per token,    12.88 tokens per second)
llama_perf_context_print:       total time =   14116.53 ms /   640 tokens
llama_perf_context_print: prompt eval time =   11732.42 ms /   611 tokens (   19.20 ms per token,    52.08 tokens per second)
llama_perf_context_print:        eval time =    2251.13 ms /    29 runs   (   77.63 ms per token,    12.88 tokens per second)
llama_perf_context_print:       total time =   14116.53 ms /   640 tokens
Llama.generate: 86 prefix-match hit, remaining 831 prompt tokens to eval
Llama.generate: 86 prefix-match hit, remaining 831 prompt tokens to eval


✅ LLM เลือกกลยุทธ์: ปิดฟ้าข้ามทะเล
📋 ดึงได้ 10 actions สำหรับกลยุทธ์ ปิดฟ้าข้ามทะเล
📋 ใช้ action จากกลยุทธ์ ปิดฟ้าข้ามทะเล: 463
✅ LLM เดิน action 463 สำเร็จ
\n🎲 Turn 12 - Player 2 (P1: 8 หมาก, P2: 8 หมาก)
🤖 .pth Model's Turn
🤖 .pth Model กำลังคิด...
🎯 .pth Model เลือก action: 2530
✅ .pth Model เดิน action 2530 สำเร็จ
\n🎲 Turn 13 - Player 1 (P1: 8 หมาก, P2: 8 หมาก)
🧠 LLM's Turn
📋 ใช้ action จากกลยุทธ์ ปิดฟ้าข้ามทะเล: 3933
✅ LLM เดิน action 3933 สำเร็จ
\n🎲 Turn 14 - Player 2 (P1: 8 หมาก, P2: 8 หมาก)
🤖 .pth Model's Turn
🤖 .pth Model กำลังคิด...
🎯 .pth Model เลือก action: 1414
✅ .pth Model เดิน action 1414 สำเร็จ
🎯 P2 กินหมาก P1 ได้ 1 ตัว! (P1 เหลือ 7 หมาก)
\n🎲 Turn 15 - Player 1 (P1: 7 หมาก, P2: 8 หมาก)
🧠 LLM's Turn
📋 ใช้ action จากกลยุทธ์ ปิดฟ้าข้ามทะเล: 292
✅ LLM เดิน action 292 สำเร็จ
\n🎲 Turn 16 - Player 2 (P1: 7 หมาก, P2: 8 หมาก)
🤖 .pth Model's Turn
🤖 .pth Model กำลังคิด...
🎯 .pth Model เลือก action: 1644
✅ .pth Model เดิน action 1644 สำเร็จ
\n🎲 Turn 17 - Player 1 (P1: 7 หมาก, P2: 8 

llama_perf_context_print:        load time =    9713.88 ms
llama_perf_context_print: prompt eval time =   16507.17 ms /   831 tokens (   19.86 ms per token,    50.34 tokens per second)
llama_perf_context_print:        eval time =    2600.23 ms /    29 runs   (   89.66 ms per token,    11.15 tokens per second)
llama_perf_context_print:       total time =   19233.24 ms /   860 tokens
llama_perf_context_print: prompt eval time =   16507.17 ms /   831 tokens (   19.86 ms per token,    50.34 tokens per second)
llama_perf_context_print:        eval time =    2600.23 ms /    29 runs   (   89.66 ms per token,    11.15 tokens per second)
llama_perf_context_print:       total time =   19233.24 ms /   860 tokens
Llama.generate: 100 prefix-match hit, remaining 820 prompt tokens to eval
Llama.generate: 100 prefix-match hit, remaining 820 prompt tokens to eval


✅ LLM เลือกกลยุทธ์: ตีชิงตามไฟ
📋 ดึงได้ 10 actions สำหรับกลยุทธ์ ตีชิงตามไฟ
📋 ใช้ action จากกลยุทธ์ ตีชิงตามไฟ: 406
✅ LLM เดิน action 406 สำเร็จ
\n🎲 Turn 22 - Player 2 (P1: 5 หมาก, P2: 8 หมาก)
🤖 .pth Model's Turn
🤖 .pth Model กำลังคิด...
🎯 .pth Model เลือก action: 2258
✅ .pth Model เดิน action 2258 สำเร็จ
\n🎲 Turn 23 - Player 1 (P1: 5 หมาก, P2: 8 หมาก)
🧠 LLM's Turn
📋 ใช้ action จากกลยุทธ์ ตีชิงตามไฟ: 3933
✅ LLM เดิน action 3933 สำเร็จ
\n🎲 Turn 24 - Player 2 (P1: 5 หมาก, P2: 8 หมาก)
🤖 .pth Model's Turn
🤖 .pth Model กำลังคิด...
🎯 .pth Model เลือก action: 1939
✅ .pth Model เดิน action 1939 สำเร็จ
\n🎲 Turn 25 - Player 1 (P1: 5 หมาก, P2: 8 หมาก)
🧠 LLM's Turn
📋 ใช้ action จากกลยุทธ์ ตีชิงตามไฟ: 219
✅ LLM เดิน action 219 สำเร็จ
\n🎲 Turn 26 - Player 2 (P1: 5 หมาก, P2: 8 หมาก)
🤖 .pth Model's Turn
🤖 .pth Model กำลังคิด...
🎯 .pth Model เลือก action: 1447
✅ .pth Model เดิน action 1447 สำเร็จ
\n🎲 Turn 27 - Player 1 (P1: 5 หมาก, P2: 8 หมาก)
🧠 LLM's Turn
📋 ใช้ action จากกลยุทธ์ ตีชิงตามไฟ: 1909
✅ LLM

llama_perf_context_print:        load time =    9713.88 ms
llama_perf_context_print: prompt eval time =   23466.90 ms /   820 tokens (   28.62 ms per token,    34.94 tokens per second)
llama_perf_context_print:        eval time =    3325.06 ms /    29 runs   (  114.66 ms per token,     8.72 tokens per second)
llama_perf_context_print:       total time =   26987.24 ms /   849 tokens
llama_perf_context_print: prompt eval time =   23466.90 ms /   820 tokens (   28.62 ms per token,    34.94 tokens per second)
llama_perf_context_print:        eval time =    3325.06 ms /    29 runs   (  114.66 ms per token,     8.72 tokens per second)
llama_perf_context_print:       total time =   26987.24 ms /   849 tokens


✅ LLM เลือกกลยุทธ์: ตีหญ้าให้งูตื่น
📋 ดึงได้ 10 actions สำหรับกลยุทธ์ ตีหญ้าให้งูตื่น
📋 ใช้ action จากกลยุทธ์ ตีหญ้าให้งูตื่น: 406
✅ LLM เดิน action 406 สำเร็จ
\n🎲 Turn 32 - Player 2 (P1: 5 หมาก, P2: 8 หมาก)
🤖 .pth Model's Turn
🤖 .pth Model กำลังคิด...
🎯 .pth Model เลือก action: 123
✅ .pth Model เดิน action 123 สำเร็จ
\n🎲 Turn 33 - Player 1 (P1: 5 หมาก, P2: 8 หมาก)
🧠 LLM's Turn
📋 ใช้ action จากกลยุทธ์ ตีหญ้าให้งูตื่น: 3957
✅ LLM เดิน action 3957 สำเร็จ
\n🎲 Turn 34 - Player 2 (P1: 5 หมาก, P2: 8 หมาก)
🤖 .pth Model's Turn
🤖 .pth Model กำลังคิด...
🎯 .pth Model เลือก action: 657
✅ .pth Model เดิน action 657 สำเร็จ
\n🎲 Turn 35 - Player 1 (P1: 5 หมาก, P2: 8 หมาก)
🧠 LLM's Turn
📋 ใช้ action จากกลยุทธ์ ตีหญ้าให้งูตื่น: 8
✅ LLM เดิน action 8 สำเร็จ
\n🎲 Turn 36 - Player 2 (P1: 5 หมาก, P2: 8 หมาก)
🤖 .pth Model's Turn
🤖 .pth Model กำลังคิด...
🎯 .pth Model เลือก action: 2864
✅ .pth Model เดิน action 2864 สำเร็จ
\n🎲 Turn 37 - Player 1 (P1: 5 หมาก, P2: 8 หมาก)
🧠 LLM's Turn
📋 ใช้ action จากกลยุทธ์ ตีหญ้

Llama.generate: 95 prefix-match hit, remaining 829 prompt tokens to eval
llama_perf_context_print:        load time =    9713.88 ms
llama_perf_context_print: prompt eval time =   21942.03 ms /   829 tokens (   26.47 ms per token,    37.78 tokens per second)
llama_perf_context_print:        eval time =    2636.91 ms /    29 runs   (   90.93 ms per token,    11.00 tokens per second)
llama_perf_context_print:       total time =   24726.52 ms /   858 tokens
llama_perf_context_print:        load time =    9713.88 ms
llama_perf_context_print: prompt eval time =   21942.03 ms /   829 tokens (   26.47 ms per token,    37.78 tokens per second)
llama_perf_context_print:        eval time =    2636.91 ms /    29 runs   (   90.93 ms per token,    11.00 tokens per second)
llama_perf_context_print:       total time =   24726.52 ms /   858 tokens
Llama.generate: 86 prefix-match hit, remaining 831 prompt tokens to eval
Llama.generate: 86 prefix-match hit, remaining 831 prompt tokens to eval


✅ LLM เลือกกลยุทธ์: ปิดฟ้าข้ามทะเล
📋 ดึงได้ 10 actions สำหรับกลยุทธ์ ปิดฟ้าข้ามทะเล
📋 ใช้ action จากกลยุทธ์ ปิดฟ้าข้ามทะเล: 463
✅ LLM เดิน action 463 สำเร็จ
\n🎲 Turn 42 - Player 2 (P1: 5 หมาก, P2: 6 หมาก)
🤖 .pth Model's Turn
🤖 .pth Model กำลังคิด...
🎯 .pth Model เลือก action: 1876
✅ .pth Model เดิน action 1876 สำเร็จ
🎯 P2 กินหมาก P1 ได้ 2 ตัว! (P1 เหลือ 3 หมาก)
\n🎲 Turn 43 - Player 1 (P1: 3 หมาก, P2: 6 หมาก)
🧠 LLM's Turn
📋 ใช้ action จากกลยุทธ์ ปิดฟ้าข้ามทะเล: 3933
❌ Action 3933 ไม่ถูกต้อง
🎲 ลอง action สำรอง: 398
✅ Action สำรอง 398 ใช้ได้
\n🎲 Turn 44 - Player 2 (P1: 3 หมาก, P2: 6 หมาก)
🤖 .pth Model's Turn
🤖 .pth Model กำลังคิด...
🎯 .pth Model เลือก action: 3708
✅ .pth Model เดิน action 3708 สำเร็จ
🎯 P2 กินหมาก P1 ได้ 2 ตัว! (P1 เหลือ 1 หมาก)
\n🎲 Turn 45 - Player 1 (P1: 1 หมาก, P2: 6 หมาก)
🧠 LLM's Turn
📋 ใช้ action จากกลยุทธ์ ปิดฟ้าข้ามทะเล: 292
✅ LLM เดิน action 292 สำเร็จ
\n🎲 Turn 46 - Player 2 (P1: 1 หมาก, P2: 6 หมาก)
🤖 .pth Model's Turn
🤖 .pth Model กำลังคิด...
🎯 .pth Model เลือก ac

llama_perf_context_print:        load time =    9713.88 ms
llama_perf_context_print: prompt eval time =   20320.26 ms /   831 tokens (   24.45 ms per token,    40.90 tokens per second)
llama_perf_context_print:        eval time =    2958.69 ms /    29 runs   (  102.02 ms per token,     9.80 tokens per second)
llama_perf_context_print:       total time =   23437.85 ms /   860 tokens
llama_perf_context_print: prompt eval time =   20320.26 ms /   831 tokens (   24.45 ms per token,    40.90 tokens per second)
llama_perf_context_print:        eval time =    2958.69 ms /    29 runs   (  102.02 ms per token,     9.80 tokens per second)
llama_perf_context_print:       total time =   23437.85 ms /   860 tokens
Llama.generate: 95 prefix-match hit, remaining 819 prompt tokens to eval
Llama.generate: 95 prefix-match hit, remaining 819 prompt tokens to eval


✅ LLM เลือกกลยุทธ์: ปิดฟ้าข้ามทะเล
📋 ดึงได้ 10 actions สำหรับกลยุทธ์ ปิดฟ้าข้ามทะเล
📋 ใช้ action จากกลยุทธ์ ปิดฟ้าข้ามทะเล: 463
✅ LLM เดิน action 463 สำเร็จ
🎯 P1 กินหมาก P2 ได้ 1 ตัว! (P2 เหลือ 5 หมาก)
\n🎲 Turn 52 - Player 2 (P1: 1 หมาก, P2: 5 หมาก)
🤖 .pth Model's Turn
🤖 .pth Model กำลังคิด...
🎯 .pth Model เลือก action: 315
✅ .pth Model เดิน action 315 สำเร็จ
\n🎲 Turn 53 - Player 1 (P1: 1 หมาก, P2: 5 หมาก)
🧠 LLM's Turn
📋 ใช้ action จากกลยุทธ์ ปิดฟ้าข้ามทะเล: 3933
✅ LLM เดิน action 3933 สำเร็จ
🎯 P1 กินหมาก P2 ได้ 2 ตัว! (P2 เหลือ 3 หมาก)
\n🎲 Turn 54 - Player 2 (P1: 1 หมาก, P2: 3 หมาก)
🤖 .pth Model's Turn
🤖 .pth Model กำลังคิด...
🎯 .pth Model เลือก action: 1064
✅ .pth Model เดิน action 1064 สำเร็จ
\n🎲 Turn 55 - Player 1 (P1: 1 หมาก, P2: 3 หมาก)
🧠 LLM's Turn
📋 ใช้ action จากกลยุทธ์ ปิดฟ้าข้ามทะเล: 292
✅ LLM เดิน action 292 สำเร็จ
\n🎲 Turn 56 - Player 2 (P1: 1 หมาก, P2: 3 หมาก)
🤖 .pth Model's Turn
🤖 .pth Model กำลังคิด...
🎯 .pth Model เลือก action: 2193
✅ .pth Model เดิน action 2193 สำเร็จ

llama_perf_context_print:        load time =    9713.88 ms
llama_perf_context_print: prompt eval time =   20805.63 ms /   819 tokens (   25.40 ms per token,    39.36 tokens per second)
llama_perf_context_print:        eval time =    2956.63 ms /    29 runs   (  101.95 ms per token,     9.81 tokens per second)
llama_perf_context_print:       total time =   23938.57 ms /   848 tokens
llama_perf_context_print: prompt eval time =   20805.63 ms /   819 tokens (   25.40 ms per token,    39.36 tokens per second)
llama_perf_context_print:        eval time =    2956.63 ms /    29 runs   (  101.95 ms per token,     9.81 tokens per second)
llama_perf_context_print:       total time =   23938.57 ms /   848 tokens


✅ LLM เลือกกลยุทธ์: ปิดฟ้าข้ามทะเล
📋 ดึงได้ 10 actions สำหรับกลยุทธ์ ปิดฟ้าข้ามทะเล
📋 ใช้ action จากกลยุทธ์ ปิดฟ้าข้ามทะเล: 463
✅ LLM เดิน action 463 สำเร็จ
\n🎲 Turn 62 - Player 2 (P1: 1 หมาก, P2: 3 หมาก)
🤖 .pth Model's Turn
🤖 .pth Model กำลังคิด...
🎯 .pth Model เลือก action: 430
✅ .pth Model เดิน action 430 สำเร็จ
\n🎲 Turn 63 - Player 1 (P1: 1 หมาก, P2: 3 หมาก)
🧠 LLM's Turn
📋 ใช้ action จากกลยุทธ์ ปิดฟ้าข้ามทะเล: 3933
✅ LLM เดิน action 3933 สำเร็จ
\n🎲 Turn 64 - Player 2 (P1: 1 หมาก, P2: 3 หมาก)
🤖 .pth Model's Turn
🤖 .pth Model กำลังคิด...
🎯 .pth Model เลือก action: 3949
✅ .pth Model เดิน action 3949 สำเร็จ
🎯 P2 กินหมาก P1 ได้ 2 ตัว! (P1 เหลือ 0 หมาก)
\n🏁 เกมจบ! P1 หมากหมด (3 vs 0)
🏆 สรุปผลเกม
🎯 จำนวนตาทั้งหมด: 64
🏆 ผู้ชนะ: P2
📋 เหตุผลจบเกม: P1 หมากหมด (3 vs 0)
📊 คะแนนสุดท้าย: P1 = 0 หมาก, P2 = 3 หมาก
🧠 กลยุทธ์สุดท้ายของ LLM: ปิดฟ้าข้ามทะเล
\n📋 ประวัติการเดินหมาก 10 ตาสุดท้าย:
   [55] P1: ลง 4 ช่อง (action: 292)
   [56] P2: ขึ้นซ้าย 3 ช่อง (action: 2193)
   [57] P1: ขึ้น 1 ช่อง (action

In [None]:
# ========== Fast Game Simulator - เร็วกว่าเดิม ==========
print("⚡ สร้าง FastGameSimulator - LLM เลือกกลยุทธ์ครั้งเดียว + MCTS จริง")
print("="*60)

import random
from typing import List
from contextlib import redirect_stderr
import io

class FastGameSimulator:
    def __init__(self, verbose=True):
        # ตรวจสอบระบบ
        self.llm_ready = 'llm' in globals() and llm is not None
        self.pth_ready = 'pth_model' in globals() and pth_model is not None and 'pth_mcts' in globals() and pth_mcts is not None
        self.db_ready = 'db' in globals() and db is not None
        self.verbose = verbose
        
        if self.verbose:
            print(f"📊 สถานะระบบ:")
            print(f"   • LLM: {'✅ พร้อม' if self.llm_ready else '❌ ไม่พร้อม'}")
            print(f"   • .pth Model: {'✅ พร้อม' if self.pth_ready else '❌ ไม่พร้อม'}")
            print(f"   • Database: {'✅ พร้อม' if self.db_ready else '❌ ไม่พร้อม'}")
        
        # ประวัติเกม
        self.move_history = []
        self.turn_count = 0
        self.chosen_strategy = None  # เลือกครั้งเดียวตอนเริ่มเกม
        self.strategy_actions = []   # actions สำหรับทั้งเกม
        self.action_index = 0
        
        # จำลองสถานะเกม
        self.p1_pieces = 8
        self.p2_pieces = 8
        self.max_turns_without_capture = 50
        self.turns_without_capture = 0
        self.max_game_turns = 100
    
    def get_initial_strategy(self) -> tuple:
        """เลือกกลยุทธ์ครั้งเดียวตอนเริ่มเกม"""
        if not self.llm_ready or not self.db_ready:
            # Fallback: สุ่มกลยุทธ์
            strategies = ['ปิดฟ้าข้ามทะเล', 'ล้อมเวยช่วยจ้าว', 'ยืมดาบฆ่าคน', 'รอซ้ำยามเปลี้ย']
            strategy = random.choice(strategies)
            return strategy, []
        
        # LLM เลือกกลยุทธ์แบบ prompt mode (เหมือน Game.vue)
        situation = """สถานการณ์: เริ่มเกมหมากหนีบใหม่
P1 และ P2 มีหมากอย่างละ 8 ตัว

โปรดเลือกกลยุทธ์ที่ดีที่สุดสำหรับการเริ่มเกม"""
        
        system_prompt = "คุณเป็นผู้เชี่ยวชาญหมากหนีบ ตอบเฉพาะชื่อกลยุทธ์จาก 36 กลยุทธ์ที่มีในฐานข้อมูล"
        
        full_prompt = f"""<|im_start|>system
{system_prompt}
<|im_end|>
<|im_start|>user
{situation}

จากรายการกลยุทธ์: {strategies_text}

โปรดเลือกกลยุทธ์ที่เหมาะสมที่สุดสำหรับการเริ่มเกม
<|im_end|>
<|im_start|>assistant
กลยุทธ์: """
        
        try:
            if self.verbose:
                print("🧠 LLM กำลังเลือกกลยุทธ์สำหรับทั้งเกม...")
            
            # ปิด stderr เพื่อไม่ให้มี noise
            stderr_buffer = io.StringIO()
            with redirect_stderr(stderr_buffer):
                response = llm(
                    prompt=full_prompt,
                    max_tokens=30,
                    stop=["<|im_end|>", "\n", "###"],
                    echo=False,
                    temperature=0.7,
                    stream=False
                )
            
            result = response['choices'][0]['text'].strip()
            
            # ดึงชื่อกลยุทธ์
            strategy = None
            if result:
                # ลบคำว่า "กลยุทธ์:" ถ้ามี
                strategy = result.replace("กลยุทธ์:", "").strip()
                strategy = strategy.split('\n')[0].strip()
            
            if self.verbose:
                print(f"✅ LLM เลือกกลยุทธ์: {strategy}")
            
            # ดึง actions ทั้งหมดจากฐานข้อมูล
            if strategy:
                actions = db.get_strategy_actions(strategy)
                if actions:
                    if self.verbose:
                        print(f"📋 ดึงได้ {len(actions)} actions สำหรับกลยุทธ์ {strategy}")
                    return strategy, actions
                else:
                    if self.verbose:
                        print(f"⚠️ ไม่พบ actions สำหรับกลยุทธ์ {strategy}")
                    return strategy, []
            else:
                if self.verbose:
                    print("⚠️ LLM ไม่สามารถเลือกกลยุทธ์ได้")
                fallback = random.choice(['ปิดฟ้าข้ามทะเล', 'ล้อมเวยช่วยจ้าว'])
                return fallback, []
                
        except Exception as e:
            if self.verbose:
                print(f"❌ LLM Error: {e}")
            # Fallback
            strategy = random.choice(['ปิดฟ้าข้ามทะเล', 'ล้อมเวยช่วยจ้าว', 'ยืมดาบฆ่าคน'])
            return strategy, []
    
    def get_llm_move(self) -> str:
        """ใช้ actions จากกลยุทธ์ที่เลือกไว้"""
        if self.strategy_actions and self.action_index < len(self.strategy_actions):
            action = self.strategy_actions[self.action_index]
            self.action_index += 1
            if self.verbose:
                print(f"📋 LLM ใช้ action จากกลยุทธ์ {self.chosen_strategy}: {action} ({self.action_index}/{len(self.strategy_actions)})")
            return action
        else:
            # ถ้าหมด actions ให้สุ่ม
            action = str(random.randint(1, 4000))
            if self.verbose:
                print(f"🎲 LLM หมด actions แล้ว ใช้ action สุ่ม: {action}")
            return action
    
    def get_pth_move(self) -> str:
        """ใช้ .pth Model + MCTS จริง (โหมด medium)"""
        if not self.pth_ready:
            return str(random.randint(1, 4000))
        
        try:
            if self.verbose:
                print("🤖 .pth Model + MCTS (Medium - 50 simulations)")
            
            # สุ่ม board state เพื่อส่งให้ MCTS
            # ในการใช้งานจริงจะได้จาก game engine
            dummy_board = torch.zeros(8, 8, dtype=torch.float32).to(device)
            
            # ปิด stderr เพื่อไม่ให้มี noise จาก MCTS
            stderr_buffer = io.StringIO()
            with redirect_stderr(stderr_buffer):
                # ใช้ MCTS จริง (medium = 50 simulations)
                action = pth_mcts.get_action(dummy_board)
            
            # แปลง action เป็น action_id
            action_id = int(action) if isinstance(action, (int, float)) else random.randint(1, 4000)
            
            if self.verbose:
                print(f"🎯 .pth Model เลือก action: {action_id}")
            return str(action_id)
            
        except Exception as e:
            if self.verbose:
                print(f"❌ .pth Model Error: {e}")
            return str(random.randint(1, 4000))
    
    def simulate_capture(self) -> int:
        """จำลองการกินหมาก (ลดความน่าจะเป็นลงเพื่อให้เกมยาวขึ้น)"""
        if random.random() < 0.10:  # ลดจาก 15% เป็น 10%
            captured = random.choice([1, 1, 1, 2])  # เน้นกิน 1 ตัว
            self.turns_without_capture = 0
            return captured
        else:
            self.turns_without_capture += 1
            return 0
    
    def check_game_end(self) -> tuple:
        """ตรวจสอบว่าเกมจบหรือยัง"""
        if self.p1_pieces <= 0:
            return True, "P2", f"P1 หมากหมด ({self.p2_pieces} vs 0)"
        elif self.p2_pieces <= 0:
            return True, "P1", f"P2 หมากหมด ({self.p1_pieces} vs 0)"
        elif self.turns_without_capture >= self.max_turns_without_capture:
            if self.p1_pieces > self.p2_pieces:
                return True, "P1", f"เกมยาวเกินไป P1 มีหมากมากกว่า ({self.p1_pieces} vs {self.p2_pieces})"
            elif self.p2_pieces > self.p1_pieces:
                return True, "P2", f"เกมยาวเกินไป P2 มีหมากมากกว่า ({self.p1_pieces} vs {self.p2_pieces})"
            else:
                return True, "เสมอ", f"เกมยาวเกินไป หมากเท่ากัน ({self.p1_pieces} vs {self.p2_pieces})"
        elif self.turn_count >= self.max_game_turns:
            if self.p1_pieces > self.p2_pieces:
                return True, "P1", f"เกมเกิน {self.max_game_turns} ตา P1 มีหมากมากกว่า ({self.p1_pieces} vs {self.p2_pieces})"
            elif self.p2_pieces > self.p1_pieces:
                return True, "P2", f"เกมเกิน {self.max_game_turns} ตา P2 มีหมากมากกว่า ({self.p1_pieces} vs {self.p2_pieces})"
            else:
                return True, "เสมอ", f"เกมเกิน {self.max_game_turns} ตา หมากเท่ากัน ({self.p1_pieces} vs {self.p2_pieces})"
        
        return False, None, None
    
    def play_single_game(self) -> dict:
        """เล่นเกมเดียว - เร็วกว่าเดิม"""
        if self.verbose:
            print(f"🎮 เริ่มเกม Fast LLM vs .pth Model!")
        
        # รีเซ็ตเกม
        self.move_history = []
        self.turn_count = 0
        self.action_index = 0
        self.p1_pieces = 8
        self.p2_pieces = 8
        self.turns_without_capture = 0
        
        # เลือกกลยุทธ์ครั้งเดียวตอนเริ่มเกม
        self.chosen_strategy, self.strategy_actions = self.get_initial_strategy()
        if self.verbose:
            print(f"🎯 เลือกกลยุทธ์: {self.chosen_strategy} ({len(self.strategy_actions)} actions)")
        
        while True:
            self.turn_count += 1
            current_player = 1 if self.turn_count % 2 == 1 else 2
            
            if self.verbose and self.turn_count % 10 == 1:
                print(f"\\n🎲 Turn {self.turn_count} - P1: {self.p1_pieces} หมาก, P2: {self.p2_pieces} หมาก")
            
            try:
                if current_player == 1:  # LLM Turn
                    action = self.get_llm_move()
                    captured = self.simulate_capture()
                    if captured > 0:
                        self.p2_pieces -= captured
                        if self.p2_pieces < 0:
                            self.p2_pieces = 0
                        if self.verbose:
                            print(f"🎯 P1 กินหมาก {captured} ตัว! (P2 เหลือ {self.p2_pieces})")
                
                else:  # .pth Model Turn
                    action = self.get_pth_move()
                    captured = self.simulate_capture()
                    if captured > 0:
                        self.p1_pieces -= captured
                        if self.p1_pieces < 0:
                            self.p1_pieces = 0
                        if self.verbose:
                            print(f"🎯 P2 กินหมาก {captured} ตัว! (P1 เหลือ {self.p1_pieces})")
                
                # ตรวจสอบว่าเกมจบหรือยัง
                game_ended, winner, end_reason = self.check_game_end()
                if game_ended:
                    if self.verbose:
                        print(f"\\n🏁 เกมจบ! {end_reason}")
                    break
                
            except KeyboardInterrupt:
                if self.verbose:
                    print("\\n⏹️ เกมถูกหยุดโดยผู้ใช้")
                winner = "ยกเลิก"
                end_reason = "ผู้ใช้หยุดเกม"
                break
            except Exception as e:
                if self.verbose:
                    print(f"\\n❌ เกิดข้อผิดพลาด: {e}")
                winner = "ข้อผิดพลาด"
                end_reason = f"เกิดข้อผิดพลาด: {e}"
                break
        
        return {
            'total_turns': self.turn_count,
            'p1_final_pieces': self.p1_pieces,
            'p2_final_pieces': self.p2_pieces,
            'strategy_used': self.chosen_strategy,
            'actions_used': self.action_index,
            'total_actions': len(self.strategy_actions),
            'winner': winner,
            'end_reason': end_reason
        }

print("✅ FastGameSimulator พร้อมใช้งาน!")
print("⚡ ปรับปรุง:")
print("   • LLM เลือกกลยุทธ์ครั้งเดียวตอนเริ่มเกม")
print("   • ใช้ MCTS จริง (medium mode - 50 simulations)")
print("   • ปิด stderr เพื่อลด noise")
print("   • ลดโอกาสกินหมากเป็น 10%")

In [None]:
# ========== ทดสอบ FastGameSimulator ==========
print("🧪 ทดสอบ FastGameSimulator")
print("="*50)

import time

# สร้าง simulator
fast_sim = FastGameSimulator(verbose=True)

# ทดสอบเกมเดียว
print("\\n⏱️ เริ่มทดสอบเกมเดียว...")
start_time = time.time()

try:
    result = fast_sim.play_single_game()
    
    end_time = time.time()
    duration = end_time - start_time
    
    print(f"\\n📊 ผลลัพธ์:")
    print(f"   • ผู้ชนะ: {result['winner']}")
    print(f"   • จำนวนตา: {result['total_turns']}")
    print(f"   • P1 หมากเหลือ: {result['p1_final_pieces']}")
    print(f"   • P2 หมากเหลือ: {result['p2_final_pieces']}")
    print(f"   • กลยุทธ์ที่ใช้: {result['strategy_used']}")
    print(f"   • Actions ที่ใช้: {result['actions_used']}/{result['total_actions']}")
    print(f"   • เหตุผลจบเกม: {result['end_reason']}")
    print(f"   • ⏱️ เวลาที่ใช้: {duration:.2f} วินาที")
    
    # เปรียบเทียบกับเดิม
    if duration < 10:
        print(f"\\n🚀 เร็วมาก! ใช้เวลาแค่ {duration:.2f} วินาที")
    elif duration < 30:
        print(f"\\n✅ เร็วพอใช้ ใช้เวลา {duration:.2f} วินาที")
    else:
        print(f"\\n⚠️ ยังช้าอยู่ ใช้เวลา {duration:.2f} วินาที")
    
except Exception as e:
    print(f"❌ เกิดข้อผิดพลาด: {e}")
    import traceback
    traceback.print_exc()