In [1]:
# 传家之宝 - 模型下载控制中心
# 运行这个 notebook 即可下载您选择的内核模型（HF 格式）
# 支持多选下载，支持断点续传

from huggingface_hub import snapshot_download
import os

# ==================== 配置区（用户只需改这里） ====================
# 可用模型列表（直接复制 repo id）
MODELS = {
    "deepseek-r1-14b": "deepseek-ai/DeepSeek-R1-Distill-Qwen-14B",
    "qwen2.5-14b": "Qwen/Qwen2.5-14B-Instruct",  # 强烈推荐，中文情感最温暖
    # 以后加新模型只需在这里加一行
}

# 选择要下载的模型（改成 True 即可）
DOWNLOAD_LIST = {
    "deepseek-r1-14b": True,   # 改成 True 下载 DeepSeek
    "qwen2.5-14b": True,        # 改成 True 下载 Qwen（建议先下这个）
}

# 本地存储路径（自动创建子文件夹）
BASE_DIR = os.path.abspath(".")  # 当前目录：models/base/

# ==================== 下载核心代码（无需修改） ====================
for key, should_download in DOWNLOAD_LIST.items():
    if not should_download:
        print(f"跳过 {key}")
        continue
    
    repo_id = MODELS[key]
    local_dir = os.path.join(BASE_DIR, key)
    
    print(f"\n开始下载 {key} → {local_dir}")
    print(f"模型来源: {repo_id}")
    print("预计大小 ~28GB，视网速 1-3 小时，请耐心等待...\n")
    
    snapshot_download(
        repo_id=repo_id,
        local_dir=local_dir,
        local_dir_use_symlinks=False,  # 直接复制文件，便于管理
        resume_download=True,          # 支持断点续传
        max_workers=8                  # 加速下载
    )
    
    print(f"✅ {key} 下载完成！路径：{local_dir}")

print("\n所有选定模型下载完毕！")
print("下一步：修改 config/training_config.yaml 的 current 字段选择内核")

ModuleNotFoundError: No module named 'huggingface_hub'