In [None]:
# 检查GPU可用性
import torch
import os
import sys
from google.colab import drive

print(f"PyTorch版本: {torch.__version__}")
print(f"CUDA可用: {torch.cuda.is_available()}")
if torch.cuda.is_available():
    print(f"GPU设备: {torch.cuda.get_device_name(0)}")
    print(f"GPU内存: {torch.cuda.get_device_properties(0).total_memory / 1024**3:.1f} GB")
else:
    print("⚠️ 没有检测到GPU！请检查运行时设置")


In [None]:
# 挂载Google Drive并创建工作目录
drive.mount('/content/drive')

work_dir = '/content/ai-ml-pipeline'
os.makedirs(work_dir, exist_ok=True)
os.chdir(work_dir)
print(f"工作目录: {os.getcwd()}")


In [None]:
# 一键设置整个环境
# 请将下面的GitHub仓库地址替换为您的仓库
GITHUB_REPO = ""  # 例如: "https://github.com/username/ai-ml-pipeline.git"

if GITHUB_REPO:
    import subprocess
    result = subprocess.run(['git', 'clone', GITHUB_REPO, '.'], capture_output=True, text=True)
    if result.returncode == 0:
        print("✅ 代码已从GitHub同步")
    else:
        print(f"⚠️ 克隆失败: {result.stderr}")
else:
    print("💡 请设置GITHUB_REPO变量或使用手动上传方式")


In [None]:
# 安装依赖和设置环境
import subprocess
packages = ['torch', 'torchvision', 'torchaudio', 'transformers', 'datasets', 'wandb', 'tqdm', 'matplotlib', 'seaborn', 'scikit-learn']

for package in packages:
    subprocess.run(['pip', 'install', '-q', package], capture_output=True)

# 添加项目路径到Python路径
import sys
sys.path.append('/content/ai-ml-pipeline/src')
sys.path.append('/content/ai-ml-pipeline/utils')

print("✅ 环境设置完成！")


In [None]:
# 示例：启动训练
print("🚀 准备开始训练...")

# 检查项目结构
import os
print("\n📁 项目文件:")
for root, dirs, files in os.walk('.'):
    dirs[:] = [d for d in dirs if not d.startswith('.') and d != '__pycache__']
    level = root.replace('.', '').count(os.sep)
    if level < 3:  # 限制显示深度
        indent = ' ' * 2 * level
        print(f"{indent}{os.path.basename(root)}/")

# 如果有训练脚本，可以这样运行：
# from src.training.train import main
# main()

print("\n💡 提示: 在src/目录下编写您的训练代码")
print("💡 提示: 使用configs/目录管理训练配置")
print("💡 提示: 训练完成后记得保存模型到Google Drive")
