Fai305

Fai305

Popular repositories Loading

llm-optimizer llm-optimizer Public

Fit any LLM under a memory budget — an optimizer/planner that picks per-layer quantization, KV-cache precision, context length and GPU/CPU/disk offload to run large language models locally, then em…

Python 1