In [2]:
import os
import cv2
import torch
import traceback
from ultralytics import YOLO

In [3]:
# --- --- 配置參數 --- ---
# 數據集設定檔路徑
DATASET_YAML_PATH = './datasets/data.yaml' # 請確保這個路徑指向您的 data.yaml
# 模型相關
BASE_MODEL = 'yolov8n.pt'      # 使用預訓練模型開始 ('yolov8n.pt', 'yolov8s.pt', ...)
# BASE_MODEL = 'yolov8n.yaml' # 或者從 YAML 結構檔開始訓練 (通常不推薦，除非數據量很大)
# 訓練參數
EPOCHS = 200                   # 訓練世代數
IMG_SIZE = 640                 # 圖片尺寸
BATCH_SIZE = 8                 # 批次大小 (依 GPU VRAM 調整，顯存不足請減小)
PATIENCE = 30                  # Early stopping 的耐心值 (多少個 epoch 沒有改善就停止)
TRAINING_NAME = 'capoo_yolov8_run_combined' # 本次訓練的名稱 (結果儲存資料夾)
DEVICE = 'cuda' if torch.cuda.is_available() else 'cpu' # 自動選擇 GPU 或 CPU
WORKERS = 4                    # 資料載入執行緒數 (依 CPU 核心數調整)

In [4]:
def train_capoo_model(data_yaml, base_model, epochs, imgsz, batch, patience, name, device, workers):
    """訓練 YOLOv8 模型"""
    model = YOLO(base_model)
    
    print("\n" + "="*30)
    print(" 開始模型訓練 ".center(30, "="))
    print("="*30)
    print(f"數據集設定檔: {data_yaml}")
    print(f"基礎模型: {base_model}")
    print(f"訓練世代數 (Epochs): {epochs}")
    print(f"圖片尺寸 (imgsz): {imgsz}")
    print(f"批次大小 (Batch): {batch}")
    print(f"Early Stopping 耐心值 (Patience): {patience}")
    print(f"訓練設備 (Device): {device}")
    print(f"資料載入執行緒數 (Workers): {workers}")
    print(f"訓練名稱 (Name): {name}")
    print("="*30 + "\n")

    best_model_path = None
    try:
        results = model.train(
            data=data_yaml,
            epochs=epochs,
            imgsz=imgsz,
            batch=batch,
            patience=patience,
            name=name,
            device=device,
            workers=workers,
            project='runs/detect', # 指定 runs 的根目錄 (預設就是 runs/detect)
            exist_ok=False,        # 如果實驗名稱已存在，不要覆蓋，避免意外 (設 True 可覆蓋)
            # 其他可選參數...
            # val=True,            # 預設即為 True，每個 epoch 後進行驗證
            # plots=True           # 預設即為 True，產生訓練曲線圖等
        )

        # 從 results 物件獲取最佳模型路徑 (適用於較新版本的 ultralytics)
        # 通常位於 results.save_dir / 'weights' / 'best.pt'
        save_dir = results.save_dir
        best_model_path_check = os.path.join(save_dir, 'weights', 'best.pt')

        if os.path.exists(best_model_path_check):
             best_model_path = best_model_path_check
             print("\n" + "="*30)
             print(" 訓練成功完成 ".center(30, "="))
             print(f"訓練結果儲存在: {save_dir}")
             print(f"最佳模型權重: {best_model_path}")
             print("="*30 + "\n")
        else:
             print("\n" + "="*30)
             print(" 訓練完成，但未找到 best.pt ".center(30, "="))
             print(f"請檢查儲存目錄: {save_dir}")
             print("="*30 + "\n")
             # Fallback or further checks needed

    except Exception as e:
        print(f"\n!!! 訓練過程中發生錯誤 !!!")
        print(f"錯誤訊息: {e}")
        traceback.print_exc()
        print("-" * 30)

    return best_model_path

In [5]:
print("--- 環境檢查 ---")
print(f"Python version: {os.sys.version.split()[0]}")
print(f"PyTorch version: {torch.__version__}")
print(f"CUDA available: {torch.cuda.is_available()}")
if torch.cuda.is_available():
    print(f"CUDA version: {torch.version.cuda}")
    print(f"Detected GPU: {torch.cuda.get_device_name(torch.cuda.current_device())}")
print("---------------")

# 1. 執行訓練
#    如果訓練成功，會返回最佳模型的路徑
# best_model_file = train_capoo_model(
#     data_yaml=DATASET_YAML_PATH,
#     base_model=BASE_MODEL,
#     epochs=EPOCHS,
#     imgsz=IMG_SIZE,
#     batch=BATCH_SIZE,
#     patience=PATIENCE,
#     name=TRAINING_NAME,
#     device=DEVICE,
#     workers=WORKERS
# )

--- 環境檢查 ---
Python version: 3.11.12
PyTorch version: 2.7.0+cu126
CUDA available: True
CUDA version: 12.6
Detected GPU: NVIDIA GeForce RTX 3090
---------------


In [6]:
# --- --- 推論函數 --- ---

def run_capoo_inference(model_path, source):
    """使用訓練好的模型進行推論，並將結果儲存為檔案"""
    if model_path is None:
        print("錯誤：未提供模型路徑，無法進行推論。")
        return
    if not os.path.exists(model_path):
        print(f"錯誤：找不到模型檔案 {model_path}")
        return
    if not os.path.exists(source):
        print(f"錯誤：找不到推論來源檔案/路徑 {source}")
        return

    print("\n" + "="*30)
    print(" 開始使用自訂模型進行推論 ".center(30, "="))
    print(f"使用模型: {model_path}")
    print(f"推論來源: {source}")
    print("="*30 + "\n")

    # 載入您訓練好的自訂模型
    model = YOLO(model_path)

    # 執行推論
    results = model(source, stream=True) # 對影片或大量圖片使用 stream=True

    output_filename = "inference_output.jpg"
    output_video_filename = "inference_output.mp4"
    is_video = source.lower().endswith(('.mp4', '.avi', '.mov', '.mkv'))
    
    processed_count = 0
    
    try:
        if is_video:
            print("處理影片中...")
            # (影片處理部分 - 如果您測試的是影片，也要確保移除 imshow/waitKey)
            # 獲取影片的基本信息以創建 VideoWriter
            cap = cv2.VideoCapture(source)
            if not cap.isOpened():
                 print(f"錯誤：無法開啟影片檔案 {source}")
                 return
            width = int(cap.get(cv2.CAP_PROP_FRAME_WIDTH))
            height = int(cap.get(cv2.CAP_PROP_FRAME_HEIGHT))
            fps = cap.get(cv2.CAP_PROP_FPS)
            cap.release() 

            fourcc = cv2.VideoWriter_fourcc(*'mp4v') 
            out_video = cv2.VideoWriter(output_video_filename, fourcc, fps, (width, height))
            
            for result in results:
                frame_annotated = result.plot() 
                # *** 不顯示，只寫入檔案 ***
                out_video.write(frame_annotated) 
                processed_count += 1
                if processed_count % 30 == 0: # 每處理 30 幀打印一次進度
                    print(f"  已處理 {processed_count} 幀...")

            out_video.release() 
            if processed_count > 0:
                 print(f"\n推論完成！已處理 {processed_count} 幀。")
                 print(f"標註後的影片已儲存為: {output_video_filename}")
            else:
                 print(f"\n未能處理任何影片幀，請檢查影片來源 {source}")

        else: # 處理單張圖片
            print("處理圖片中...")
            for result in results:
                print(f"  偵測到 {len(result.boxes)} 個物件。")
                img_annotated = result.plot()
                
                # *** 不顯示，只儲存檔案 ***
                success = cv2.imwrite(output_filename, img_annotated)
                if success:
                    print(f"推論完成！標註後的圖片已儲存為: {output_filename}")
                else:
                    print(f"錯誤：儲存圖片 {output_filename} 失敗。")

                processed_count += 1
                break # 單張圖片處理完就退出迴圈
            
            if processed_count == 0:
                 print("未能處理圖片。")

    except Exception as e:
         print(f"推論過程中發生錯誤: {e}")
         traceback.print_exc()
    finally:
         # 確保即使出錯也關閉所有可能的 OpenCV 視窗 (雖然我們已經註解掉了)
         cv2.destroyAllWindows()

    print("推論函數執行完畢。")

In [7]:
INFERENCE_SOURCE = './inference/a.jpg' # 例如: 'Capoo-Dataset/test/images/capoo_test_01.jpg'
best_model_file = "./runs/detect/capoo_yolov8_run_combined4/weights/best.pt"
print(f"{best_model_file}")
if best_model_file:
    run_capoo_inference(model_path=best_model_file, source=INFERENCE_SOURCE)
else:
    print("\n由於訓練未成功或未找到最佳模型，跳過推論步驟。")

print("\n腳本執行完畢。")

./runs/detect/capoo_yolov8_run_combined4/weights/best.pt

使用模型: ./runs/detect/capoo_yolov8_run_combined4/weights/best.pt
推論來源: ./inference/a.jpg

處理圖片中...

image 1/1 /home/davidteng/NCU/capoo/capoo-game-automation/inference/a.jpg: 640x320 4 capoos, 66.6ms
  偵測到 4 個物件。
推論完成！標註後的圖片已儲存為: inference_output.jpg
推論函數執行完畢。

腳本執行完畢。
