Error
Looks like something went wrong!

About

Quantize TinyLlama-1.1B-Chat from PyTorch to CoreML (float16, int8, int4) for efficient on-device inference on iOS 18+.

nlp mobile ai transformers pytorch llama quantization int8 coreml on-device huggingface apple-silicon int4 llm tinyllama ios18 mlpackage

Report repository

Releases

No releases published

Packages

No packages published

Contributors 2

Languages

Python 100.0%