Files

.binder
.ci
.docker
.github
licensing
notebooks
- 3D-pose-estimation-webcam
- 3D-segmentation-point-clouds
- action-recognition-webcam
- animate-anyone
- async-api
- auto-device
- bark-text-to-audio
- big-transfer-quantization
- blip-visual-language-processing
- catvton
- clip-language-saliency-map
- clip-zero-shot-image-classification
- controlnet-stable-diffusion
- convert-to-openvino
- ct-segmentation-quantize
- ddcolor-image-colorization
- deepseek-r1
- deepseek-vl2
- depth-anything
- detectron2-to-openvino
- distil-whisper-asr
- dynamicrafter-animating-images
- efficient-sam
- encodec-audio-compression
- explainable-ai-1-basic
- explainable-ai-2-deep-dive
- explainable-ai-3-map-interpretation
- fast-segment-anything
- film-slowmo
- florence2
- flux-fill
- flux.1-image-generation
- freevc-voice-conversion
- gemma3
- glm-edge-v
- glm4-v
- got-ocr2
- gpu-device
- grammar-correction
- grounded-segment-anything
- handwritten-ocr
- hello-detection
- hello-npu
- hello-segmentation
- hello-world
- hugging-face-hub
- hunyuan-dit-image-generation
- image-classification-quantization
- image-to-image-genai
- inpainting-genai
- instant-id
- instruct-pix2pix-image-editing
- internvl2
- janus-multimodal-generation
- jax-to-openvino
- jina-clip
- keras-with-openvino-backend
- knowledge-graphs-conve
- kosmos2-multimodal-large-language-model
- language-quantize-bert
- latent-consistency-models-image-generation
- llasa-speech-synthesis
- llava-multimodal-chatbot
- llava-next-multimodal-chatbot
- llm-agent-functioncall
- llm-agent-react
- llm-chatbot
- llm-question-answering
- llm-rag-langchain
- llm-rag-llamaindex
- localai
  - README.md
  - localai.ipynb
- ltx-video
- magika-content-type-recognition
- meter-reader
- minicpm-v-multimodal-chatbot
- mllama-3.2
- mms-massively-multilingual-speech
- mobileclip-video-search
- model-server
- modelscope-to-openvino
- multilora-image-generation
- multimodal-rag
- music-generation
- named-entity-recognition
- nano-llava-multimodal-chatbot
- nuextract-structure-extraction
- object-detection-webcam
- omnigen
- omniparser
- oneformer-segmentation
- openvino-api
- openvino-tokenizers
- openvoice
- optical-character-recognition
- optimize-preprocessing
- outetts-text-to-speech
- paddle-ocr-webcam
- paddle-to-openvino
- parler-tts-text-to-speech
- person-counting-webcam
- person-tracking-webcam
- phi-3-vision
- phi-4-multimodal
- photo-maker
- pix2struct-docvqa
- pixart
- pixtral
- pose-estimation-webcam
- prompt-lookup-decoding
- pytorch-post-training-quantization-nncf
- pytorch-quantization-aware-training
- pytorch-quantization-sparsity-aware-training
- pytorch-to-openvino
- qrcode-monster
- quantizing-model-with-accuracy-control
- qwen2-audio
- qwen2-vl
- qwen2.5-vl
- riffusion-text-to-music
- rmbg-background-removal
- s3d-mil-nce-text-to-video-retrieval
- sam2-image-segmentation
- sam2-video-segmentation
- sana-image-generation
- sdxl-turbo
- segment-anything
- siglip-zero-shot-image-classification
- sketch-to-image-pix2pix-turbo
- smoldocling
- smolvlm2
- sound-generation-audioldm2
- sparsity-optimization
- speculative-sampling
- speech-recognition-quantization
- speechbrain-emotion-recognition
- stable-audio
- stable-cascade-image-generation
- stable-diffusion-ip-adapter
- stable-diffusion-keras-cv
- stable-diffusion-text-to-image
- stable-diffusion-torchdynamo-backend
- stable-diffusion-v2
- stable-diffusion-v3
- stable-diffusion-xl
- stable-fast-3d
- stable-video-diffusion
- style-transfer-webcam
- surya-line-level-text-detection
- table-question-answering
- tensorflow-classification-to-openvino
- tensorflow-hub
- tensorflow-object-detection-to-openvino
- tensorflow-quantization-aware-training
- text-to-image-genai
- tflite-selfie-segmentation
- tflite-to-openvino
- tiny-sd-image-generation
- torchvision-zoo-to-openvino
- vehicle-detection-and-recognition
- vision-background-removal
- vision-monodepth
- wav2lip
- whisper-asr-genai
- whisper-subtitles-generation
- yolov10-optimization
- yolov11-optimization
- yolov12-optimization
- yolov8-optimization
- yolov9-optimization
- zeroscope-text2video
- README.md
selector
supplementary_materials
utils
.gitignore
CONTRIBUTING.md
Dockerfile
Jenkinsfile
LICENSE
Makefile
README.md
README_cn.md
README_ja.md
SECURITY.md
check_install.py
requirements.txt

localai

Name		Name	Last commit message	Last commit date
parent directory ..
README.md		README.md
localai.ipynb		localai.ipynb

README.md

LocalAI and OpenVINO

LocalAI is the free, Open Source OpenAI alternative. LocalAI act as a drop-in replacement REST API that’s compatible with OpenAI API specifications for local inferencing. It allows you to run LLMs, generate images, audio (and not only) locally or on-prem with consumer grade hardware, supporting multiple model families and architectures. Does not require GPU. It is created and maintained by Ettore Di Giacinto.

In this tutorial we show how to prepare a model config and launch an OpenVINO LLM model with LocalAI in docker container.

Notebook contents

Prepare Docker
Prepare a model
Run the server
Send a client request

Installation instructions

This is a self-contained example that relies solely on its own code.
We recommend running the notebook in a virtual environment. You only need a Jupyter server to start. For details, please refer to Installation Guide.

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Files

localai

localai

README.md

LocalAI and OpenVINO

Notebook contents

Installation instructions

Files

localai

Directory actions

More options

Directory actions

More options

Latest commit

History

localai

Folders and files

parent directory

README.md

LocalAI and OpenVINO

Notebook contents

Installation instructions