optimize ram usage #1032

Open

opened

on Nov 14, 2025

with low_cpu_mem_usage, the max ram usage is still 7~8G to quantize 7B models, which is not expected. The target is <2G

Metadata

Assignees

No one assigned

Labels

No labels

No labels

Type

No type

Projects

No projects

Milestone

No milestone

Relationships

None yet

Development

No branches or pull requests