# PINNs MVP - 2000 Epoch 標準化訓練
## Google Colab A100 環境

---

### 📋 訓練配置
- **實驗名稱**: `normalization_main_2000epochs`
- **Epochs**: 2000
- **感測點**: K=50 (QR-Pivot)
- **優化器**: Adam (lr=1e-3)
- **預計時間**: 2-4 小時

### 🎯 目標
驗證標準化配置的長期訓練穩定性與收斂性能

---

## 步驟 1: 掛載 Google Drive 並解壓專案

In [None]:
# 掛載 Google Drive
from google.colab import drive
drive.mount('/content/drive')

# 列出 Drive 內容（確認文件位置）
!ls /content/drive/MyDrive/

In [None]:
# 解壓專案（假設打包檔案在 Drive 根目錄）
!cd /content && tar -xzf /content/drive/MyDrive/pinns-mvp.tar.gz

# 切換到專案目錄
%cd /content/pinns-mvp

# 驗證目錄結構
!ls -l

## 步驟 2: 環境檢查

In [None]:
# 運行完整環境檢查
!python scripts/colab_setup_check.py

## 步驟 3: 安裝依賴（如需要）

In [None]:
# 檢查 PyTorch 版本
import torch
print(f"PyTorch 版本: {torch.__version__}")
print(f"CUDA 可用: {torch.cuda.is_available()}")
if torch.cuda.is_available():
    print(f"GPU: {torch.cuda.get_device_name(0)}")

In [None]:
# 如果需要安裝依賴
# !pip install pyyaml h5py scipy matplotlib

# 驗證安裝
import yaml
import numpy as np
print("✅ 所有依賴已安裝")

## 步驟 4: 啟動訓練（背景運行）

In [None]:
# 創建輸出目錄
!mkdir -p checkpoints/normalization_main_2000epochs
!mkdir -p log/normalization_main_2000epochs
!mkdir -p results/normalization_main_2000epochs

In [None]:
# 啟動背景訓練
!nohup python scripts/train.py \
  --cfg configs/test_normalization_main_2000epochs.yml \
  > log/normalization_main_2000epochs_stdout.log 2>&1 &

# 等待幾秒讓進程啟動
import time
time.sleep(3)

# 檢查進程
!ps aux | grep train.py | grep -v grep

## 步驟 5: 監控訓練進度

In [None]:
# 查看最近 30 行日誌
!tail -n 30 log/normalization_main_2000epochs/training.log

In [None]:
# 實時監控日誌（運行此 cell 後會持續輸出，按停止按鈕中斷）
!tail -f log/normalization_main_2000epochs/training.log

In [None]:
# 檢查檢查點
!ls -lh checkpoints/normalization_main_2000epochs/

## 步驟 6: TensorBoard 可視化

In [None]:
# 載入 TensorBoard
%load_ext tensorboard
%tensorboard --logdir log/normalization_main_2000epochs/tensorboard

## 步驟 7: 下載結果

In [None]:
# 壓縮檢查點
!tar -czf checkpoints_main_2000epochs.tar.gz \
  checkpoints/normalization_main_2000epochs

# 壓縮日誌
!tar -czf logs_main_2000epochs.tar.gz \
  log/normalization_main_2000epochs

!ls -lh *.tar.gz

In [None]:
# 下載到本地
from google.colab import files

files.download('checkpoints_main_2000epochs.tar.gz')
files.download('logs_main_2000epochs.tar.gz')

## 📝 常用指令參考

### 訓練控制
```bash
# 停止訓練
!pkill -f train.py

# 從檢查點恢復
!python scripts/train.py \
  --cfg configs/test_normalization_main_2000epochs.yml \
  --resume checkpoints/normalization_main_2000epochs/latest.pth
```

### 監控與診斷
```bash
# 查看進程
!ps aux | grep train.py

# 查看 GPU 使用
!nvidia-smi

# 查看標準輸出日誌
!tail -n 50 log/normalization_main_2000epochs_stdout.log
```

---

**最後更新**: 2025-10-17  
**文檔**: [COLAB_A100_TRAINING_GUIDE.md](docs/COLAB_A100_TRAINING_GUIDE.md)
