In [None]:
#@title 检查GPU环境
import sys, torch, json, os
print(f"Python {sys.version.split()[0]}")
print(f"PyTorch {torch.__version__}")
print(f"CUDA available: {torch.cuda.is_available()}")
if torch.cuda.is_available():
    print(f"GPU: {torch.cuda.get_device_name(0)}")
    print(f"CUDA version: {torch.version.cuda}")
else:
    print("⚠️ GPU不可用，请检查Runtime设置")


In [None]:
#@title 克隆/更新项目代码
import os

# 🔧 你的GitHub仓库地址
REPO_URL = "https://github.com/SophieXueZhang/ai-ml-pipeline-.git"
PROJECT_DIR = "/content/ai"

# 切换到content目录
%cd /content

# 如果项目目录不存在，克隆仓库；否则更新代码
if not os.path.exists(PROJECT_DIR):
    print("🔄 首次克隆仓库...")
    !git clone $REPO_URL $PROJECT_DIR
else:
    print("🔄 更新代码...")
    %cd $PROJECT_DIR
    !git pull

# 切换到项目目录
%cd $PROJECT_DIR
print(f"✅ 当前目录: {os.getcwd()}")
!ls -la


In [None]:
#@title 安装依赖
%cd /content/ai

# 检查是否有requirements.txt
if os.path.exists("requirements.txt"):
    print("📦 安装项目依赖...")
    %pip install -q -r requirements.txt
    print("✅ 依赖安装完成")
else:
    print("⚠️ 未找到requirements.txt文件")

# 安装常用的深度学习库（如果requirements.txt中没有）
print("📦 确保基础库已安装...")
%pip install -q torch torchvision torchaudio transformers datasets
print("✅ 基础库检查完成")


In [None]:
#@title 挂载Google Drive（可选，用于存储大文件/数据集）
from google.colab import drive
drive.mount('/content/drive')
print("✅ Google Drive已挂载到 /content/drive")


In [None]:
#@title 运行医疗保险分类训练
%cd /content/ai/healthcare\ insurance/phase2_classification
!python train_dit.py


In [None]:
#@title 运行文档信息提取训练
%cd /content/ai/healthcare\ insurance/phase3_extraction
!python train_layoutlm.py


In [None]:
#@title 运行演示应用
%cd /content/ai/healthcare\ insurance/phase4_demo
!python app.py
