v0.3.2 — VRAM 检测修复 + MoE partial 保护 + RTX PRO 支持
修复
- VRAM 虚高修复:Windows Resizable BAR / 共享 GPU 内存导致 nvidia-smi 报告虚假 VRAM(如 4070 显示 31GB 而非 12GB)。现在 XML 与 CSV 交叉校验,并用已知 GPU VRAM 上限表兜底
- MoE partial OOM 修复:当模型大小 > 1.2× 总 VRAM 时,强制走
moe_offload(全部 expert 放 CPU),不再尝试moe_partial导致必然 OOM - RTX PRO 带宽修复:新增 PRO 6000/5000/4500/4000/2000 到带宽枚举表,修复带宽=0 导致调参不准
新增
knownMaxVRAM()查找表:覆盖所有消费级/专业/数据中心 NVIDIA GPU 的已知 VRAM 上限,防止驱动误报
Full Changelog: v0.3.1...v0.3.2