Lucien2468

Lucien2468

Pinned Loading

Ollama-TurboQuant-Integration Ollama-TurboQuant-Integration Public

TurboQuant: Native 3-Bit Quantization for Ollama - Achieve 25-28% better compression than Q4_0 while maintaining high-speed CPU inference. Experimentally integrated into Ollama with custom GGML ker…

Go 3