-
Notifications
You must be signed in to change notification settings - Fork 0
Models Native LLM tiny small
Mike edited this page May 28, 2026
·
1 revision
Режим: Native. Категория: LLM / чат и генерация текста.
Всего моделей: 21.
| Поле | Значение |
|---|---|
| Название | Qwen/Qwen2.5-0.5B-Instruct-GGUF |
| Label | Qwen2.5 0.5B Instruct |
| Категория | LLM / чат и генерация текста |
| Runtime/backend | native / llama.cpp / gguf |
| Вес | 0.21 GB catalog size, ~220 MB disk/cache |
| Параметры | 0.5B |
| Минимальные требования | tiny - очень слабое железо, CPU/WASM или небольшой GPU; disk >= 220 MB; memory/VRAM около 696 MB; CPU возможен; GPU ускоряет |
| Оптимальные требования | cuda, metal, vulkan, cpu; желательно 1208 MB+ свободной VRAM/RAM и 732 MB+ disk cache |
| HF link | Qwen/Qwen2.5-0.5B-Instruct-GGUF |
| Доступные quantizations |
fp16, fp32, q2, q3, q4, q5, q6, q8
|
| Краткое описание | Native GGUF chat model for llama.cpp. |
| Best in |
chat, local-assistant
|
| Поле | Значение |
|---|---|
| Название | Qwen3-0.6B-GGUF |
| Label | Qwen3 0.6B GGUF |
| Категория | LLM / чат и генерация текста |
| Runtime/backend | native / llama.cpp / gguf |
| Вес | 0.21 GB catalog size, ~220 MB disk/cache |
| Параметры | 0.6B |
| Минимальные требования | tiny - очень слабое железо, CPU/WASM или небольшой GPU; disk >= 220 MB; memory/VRAM около 696 MB; CPU возможен; GPU ускоряет |
| Оптимальные требования | cuda, metal, vulkan, cpu; желательно 1208 MB+ свободной VRAM/RAM и 732 MB+ disk cache |
| HF link | Qwen/Qwen3-0.6B-GGUF |
| Доступные quantizations |
fp16, fp32, q2, q3, q4, q5, q6, q8
|
| Краткое описание | Native GGUF reasoning model for llama.cpp. |
| Best in |
reasoning, agents, chat, local-assistant
|
| Поле | Значение |
|---|---|
| Название | unsloth/SmolLM2-135M-Instruct-GGUF |
| Label | SmolLM2 135M Instruct |
| Категория | LLM / чат и генерация текста |
| Runtime/backend | native / llama.cpp / gguf |
| Вес | 0.21 GB catalog size, ~220 MB disk/cache |
| Параметры | не указаны |
| Минимальные требования | tiny - очень слабое железо, CPU/WASM или небольшой GPU; disk >= 220 MB; memory/VRAM около 696 MB; CPU возможен; GPU ускоряет |
| Оптимальные требования | cuda, metal, vulkan, cpu; желательно 1208 MB+ свободной VRAM/RAM и 732 MB+ disk cache |
| HF link | unsloth/SmolLM2-135M-Instruct-GGUF |
| Доступные quantizations |
fp16, fp32, q2, q3, q4, q5, q6, q8
|
| Краткое описание | Native GGUF chat model for llama.cpp. |
| Best in |
chat, local-assistant
|
| Поле | Значение |
|---|---|
| Название | SmolLM2-360M-Instruct-GGUF |
| Label | SmolLM2 360M Instruct GGUF |
| Категория | LLM / чат и генерация текста |
| Runtime/backend | native / llama.cpp / gguf |
| Вес | 0.21 GB catalog size, ~220 MB disk/cache |
| Параметры | 0.36B |
| Минимальные требования | tiny - очень слабое железо, CPU/WASM или небольшой GPU; disk >= 220 MB; memory/VRAM около 696 MB; CPU возможен; GPU ускоряет |
| Оптимальные требования | cuda, metal, vulkan, cpu; желательно 1208 MB+ свободной VRAM/RAM и 732 MB+ disk cache |
| HF link | bartowski/SmolLM2-360M-Instruct-GGUF |
| Доступные quantizations |
fp16, fp32, q2, q3, q4, q5, q6, q8
|
| Краткое описание | Native GGUF chat model for llama.cpp. |
| Best in |
chat, local-assistant
|
| Поле | Значение |
|---|---|
| Название | Ralriki/multilingual-e5-large-instruct-GGUF |
| Label | multilingual e5 large instruct |
| Категория | LLM / чат и генерация текста |
| Runtime/backend | native / llama.cpp / gguf |
| Вес | 0.21 GB catalog size, ~220 MB disk/cache |
| Параметры | не указаны |
| Минимальные требования | tiny - очень слабое железо, CPU/WASM или небольшой GPU; disk >= 220 MB; memory/VRAM около 696 MB; CPU возможен; GPU ускоряет |
| Оптимальные требования | cuda, metal, vulkan, cpu; желательно 1208 MB+ свободной VRAM/RAM и 732 MB+ disk cache |
| HF link | Ralriki/multilingual-e5-large-instruct-GGUF |
| Доступные quantizations |
fp16, fp32, q2, q3, q4, q5, q6, q8
|
| Краткое описание | Native GGUF chat model for llama.cpp. |
| Best in |
chat, local-assistant
|
| Поле | Значение |
|---|---|
| Название | microsoft/Phi-3-mini-4k-instruct-gguf |
| Label | Phi 3 mini 4k instruct |
| Категория | LLM / чат и генерация текста |
| Runtime/backend | native / llama.cpp / gguf |
| Вес | 0.44 GB catalog size, ~455 MB disk/cache |
| Параметры | не указаны |
| Минимальные требования | tiny - очень слабое железо, CPU/WASM или небольшой GPU; disk >= 455 MB; memory/VRAM около 1119 MB; CPU возможен; GPU ускоряет |
| Оптимальные требования | cuda, metal, vulkan, cpu; желательно 1631 MB+ свободной VRAM/RAM и 967 MB+ disk cache |
| HF link | microsoft/Phi-3-mini-4k-instruct-gguf |
| Доступные quantizations |
fp16, fp32, q2, q3, q4, q5, q6, q8
|
| Краткое описание | Native GGUF chat model for llama.cpp. |
| Best in |
chat, local-assistant
|
| Поле | Значение |
|---|---|
| Название | MaziyarPanahi/Phi-3.5-mini-instruct-GGUF |
| Label | Phi 3.5 mini instruct |
| Категория | LLM / чат и генерация текста |
| Runtime/backend | native / llama.cpp / gguf |
| Вес | 0.44 GB catalog size, ~455 MB disk/cache |
| Параметры | не указаны |
| Минимальные требования | tiny - очень слабое железо, CPU/WASM или небольшой GPU; disk >= 455 MB; memory/VRAM около 1119 MB; CPU возможен; GPU ускоряет |
| Оптимальные требования | cuda, metal, vulkan, cpu; желательно 1631 MB+ свободной VRAM/RAM и 967 MB+ disk cache |
| HF link | MaziyarPanahi/Phi-3.5-mini-instruct-GGUF |
| Доступные quantizations |
fp16, fp32, q2, q3, q4, q5, q6, q8
|
| Краткое описание | Native GGUF chat model for llama.cpp. |
| Best in |
chat, local-assistant
|
| Поле | Значение |
|---|---|
| Название | MaziyarPanahi/Phi-4-mini-instruct-GGUF |
| Label | Phi 4 mini instruct |
| Категория | LLM / чат и генерация текста |
| Runtime/backend | native / llama.cpp / gguf |
| Вес | 0.45 GB catalog size, ~457 MB disk/cache |
| Параметры | не указаны |
| Минимальные требования | tiny - очень слабое железо, CPU/WASM или небольшой GPU; disk >= 457 MB; memory/VRAM около 1122 MB; CPU возможен; GPU ускоряет |
| Оптимальные требования | cuda, metal, vulkan, cpu; желательно 1634 MB+ свободной VRAM/RAM и 969 MB+ disk cache |
| HF link | MaziyarPanahi/Phi-4-mini-instruct-GGUF |
| Доступные quantizations |
fp16, fp32, q2, q3, q4, q5, q6, q8
|
| Краткое описание | Native GGUF chat model for llama.cpp. |
| Best in |
chat, local-assistant
|
| Поле | Значение |
|---|---|
| Название | unsloth/Phi-4-mini-instruct-GGUF |
| Label | Phi 4 mini instruct |
| Категория | LLM / чат и генерация текста |
| Runtime/backend | native / llama.cpp / gguf |
| Вес | 0.45 GB catalog size, ~457 MB disk/cache |
| Параметры | не указаны |
| Минимальные требования | tiny - очень слабое железо, CPU/WASM или небольшой GPU; disk >= 457 MB; memory/VRAM около 1122 MB; CPU возможен; GPU ускоряет |
| Оптимальные требования | cuda, metal, vulkan, cpu; желательно 1634 MB+ свободной VRAM/RAM и 969 MB+ disk cache |
| HF link | unsloth/Phi-4-mini-instruct-GGUF |
| Доступные quantizations |
fp16, fp32, q2, q3, q4, q5, q6, q8
|
| Краткое описание | Native GGUF chat model for llama.cpp. |
| Best in |
chat, local-assistant
|
| Поле | Значение |
|---|---|
| Название | rippertnt/HyperCLOVAX-SEED-Text-Instruct-1.5B-Q4_K_M-GGUF |
| Label | HyperCLOVAX SEED Text Instruct 1.5B Q4 K M |
| Категория | LLM / чат и генерация текста |
| Runtime/backend | native / llama.cpp / gguf |
| Вес | 0.21 GB catalog size, ~220 MB disk/cache |
| Параметры | 1.5B |
| Минимальные требования | small - ноутбук или небольшой GPU; disk >= 220 MB; memory/VRAM около 696 MB; CPU возможен; GPU ускоряет |
| Оптимальные требования | cuda, metal, vulkan, cpu; желательно 1208 MB+ свободной VRAM/RAM и 732 MB+ disk cache |
| HF link | rippertnt/HyperCLOVAX-SEED-Text-Instruct-1.5B-Q4_K_M-GGUF |
| Доступные quantizations |
fp16, fp32, q2, q3, q4, q5, q6, q8
|
| Краткое описание | Native GGUF chat model for llama.cpp. |
| Best in |
chat, local-assistant
|
| Поле | Значение |
|---|---|
| Название | LiquidAI/LFM2.5-1.2B-Instruct-GGUF |
| Label | LFM2.5 1.2B Instruct |
| Категория | LLM / чат и генерация текста |
| Runtime/backend | native / llama.cpp / gguf |
| Вес | 0.21 GB catalog size, ~220 MB disk/cache |
| Параметры | 1.2B |
| Минимальные требования | small - ноутбук или небольшой GPU; disk >= 220 MB; memory/VRAM около 696 MB; CPU возможен; GPU ускоряет |
| Оптимальные требования | cuda, metal, vulkan, cpu; желательно 1208 MB+ свободной VRAM/RAM и 732 MB+ disk cache |
| HF link | LiquidAI/LFM2.5-1.2B-Instruct-GGUF |
| Доступные quantizations |
fp16, fp32, q2, q3, q4, q5, q6, q8
|
| Краткое описание | Native GGUF chat model for llama.cpp. |
| Best in |
chat, local-assistant
|
| Поле | Значение |
|---|---|
| Название | MaziyarPanahi/Llama-3.2-1B-Instruct-GGUF |
| Label | Llama 3.2 1B Instruct |
| Категория | LLM / чат и генерация текста |
| Runtime/backend | native / llama.cpp / gguf |
| Вес | 0.21 GB catalog size, ~220 MB disk/cache |
| Параметры | 1B |
| Минимальные требования | small - ноутбук или небольшой GPU; disk >= 220 MB; memory/VRAM около 696 MB; CPU возможен; GPU ускоряет |
| Оптимальные требования | cuda, metal, vulkan, cpu; желательно 1208 MB+ свободной VRAM/RAM и 732 MB+ disk cache |
| HF link | MaziyarPanahi/Llama-3.2-1B-Instruct-GGUF |
| Доступные quantizations |
fp16, fp32, q2, q3, q4, q5, q6, q8
|
| Краткое описание | Native GGUF chat model for llama.cpp. |
| Best in |
chat, local-assistant
|
| Поле | Значение |
|---|---|
| Название | Llama-3.2-1B-Instruct-GGUF |
| Label | Llama 3.2 1B Instruct GGUF |
| Категория | LLM / чат и генерация текста |
| Runtime/backend | native / llama.cpp / gguf |
| Вес | 0.21 GB catalog size, ~220 MB disk/cache |
| Параметры | 1B |
| Минимальные требования | small - ноутбук или небольшой GPU; disk >= 220 MB; memory/VRAM около 696 MB; CPU возможен; GPU ускоряет |
| Оптимальные требования | cuda, metal, vulkan, cpu; желательно 1208 MB+ свободной VRAM/RAM и 732 MB+ disk cache |
| HF link | bartowski/Llama-3.2-1B-Instruct-GGUF |
| Доступные quantizations |
fp16, fp32, q2, q3, q4, q5, q6, q8
|
| Краткое описание | Native GGUF chat model for llama.cpp. |
| Best in |
chat, local-assistant
|
| Поле | Значение |
|---|---|
| Название | hugging-quants/Llama-3.2-1B-Instruct-Q4_K_M-GGUF |
| Label | Llama 3.2 1B Instruct Q4 K M |
| Категория | LLM / чат и генерация текста |
| Runtime/backend | native / llama.cpp / gguf |
| Вес | 0.21 GB catalog size, ~220 MB disk/cache |
| Параметры | 1B |
| Минимальные требования | small - ноутбук или небольшой GPU; disk >= 220 MB; memory/VRAM около 696 MB; CPU возможен; GPU ускоряет |
| Оптимальные требования | cuda, metal, vulkan, cpu; желательно 1208 MB+ свободной VRAM/RAM и 732 MB+ disk cache |
| HF link | hugging-quants/Llama-3.2-1B-Instruct-Q4_K_M-GGUF |
| Доступные quantizations |
fp16, fp32, q2, q3, q4, q5, q6, q8
|
| Краткое описание | Native GGUF chat model for llama.cpp. |
| Best in |
chat, local-assistant
|
| Поле | Значение |
|---|---|
| Название | hugging-quants/Llama-3.2-1B-Instruct-Q8_0-GGUF |
| Label | Llama 3.2 1B Instruct Q8 0 |
| Категория | LLM / чат и генерация текста |
| Runtime/backend | native / llama.cpp / gguf |
| Вес | 0.21 GB catalog size, ~220 MB disk/cache |
| Параметры | 1B |
| Минимальные требования | small - ноутбук или небольшой GPU; disk >= 220 MB; memory/VRAM около 696 MB; CPU возможен; GPU ускоряет |
| Оптимальные требования | cuda, metal, vulkan, cpu; желательно 1208 MB+ свободной VRAM/RAM и 732 MB+ disk cache |
| HF link | hugging-quants/Llama-3.2-1B-Instruct-Q8_0-GGUF |
| Доступные quantizations |
fp16, fp32, q2, q3, q4, q5, q6, q8
|
| Краткое описание | Native GGUF chat model for llama.cpp. |
| Best in |
chat, local-assistant
|
| Поле | Значение |
|---|---|
| Название | Qwen/Qwen2-1.5B-Instruct-GGUF |
| Label | Qwen2 1.5B Instruct |
| Категория | LLM / чат и генерация текста |
| Runtime/backend | native / llama.cpp / gguf |
| Вес | 0.21 GB catalog size, ~220 MB disk/cache |
| Параметры | 1.5B |
| Минимальные требования | small - ноутбук или небольшой GPU; disk >= 220 MB; memory/VRAM около 696 MB; CPU возможен; GPU ускоряет |
| Оптимальные требования | cuda, metal, vulkan, cpu; желательно 1208 MB+ свободной VRAM/RAM и 732 MB+ disk cache |
| HF link | Qwen/Qwen2-1.5B-Instruct-GGUF |
| Доступные quantizations |
fp16, fp32, q2, q3, q4, q5, q6, q8
|
| Краткое описание | Native GGUF chat model for llama.cpp. |
| Best in |
chat, local-assistant
|
| Поле | Значение |
|---|---|
| Название | Qwen/Qwen2.5-1.5B-Instruct-GGUF |
| Label | Qwen2.5 1.5B Instruct |
| Категория | LLM / чат и генерация текста |
| Runtime/backend | native / llama.cpp / gguf |
| Вес | 0.21 GB catalog size, ~220 MB disk/cache |
| Параметры | 1.5B |
| Минимальные требования | small - ноутбук или небольшой GPU; disk >= 220 MB; memory/VRAM около 696 MB; CPU возможен; GPU ускоряет |
| Оптимальные требования | cuda, metal, vulkan, cpu; желательно 1208 MB+ свободной VRAM/RAM и 732 MB+ disk cache |
| HF link | Qwen/Qwen2.5-1.5B-Instruct-GGUF |
| Доступные quantizations |
fp16, fp32, q2, q3, q4, q5, q6, q8
|
| Краткое описание | Native GGUF chat model for llama.cpp. |
| Best in |
chat, local-assistant
|
| Поле | Значение |
|---|---|
| Название | MaziyarPanahi/Qwen2.5-1.5B-Instruct-GGUF |
| Label | Qwen2.5 1.5B Instruct |
| Категория | LLM / чат и генерация текста |
| Runtime/backend | native / llama.cpp / gguf |
| Вес | 0.21 GB catalog size, ~220 MB disk/cache |
| Параметры | 1.5B |
| Минимальные требования | small - ноутбук или небольшой GPU; disk >= 220 MB; memory/VRAM около 696 MB; CPU возможен; GPU ускоряет |
| Оптимальные требования | cuda, metal, vulkan, cpu; желательно 1208 MB+ свободной VRAM/RAM и 732 MB+ disk cache |
| HF link | MaziyarPanahi/Qwen2.5-1.5B-Instruct-GGUF |
| Доступные quantizations |
fp16, fp32, q2, q3, q4, q5, q6, q8
|
| Краткое описание | Native GGUF chat model for llama.cpp. |
| Best in |
chat, local-assistant
|
| Поле | Значение |
|---|---|
| Название | Qwen/Qwen2.5-Coder-1.5B-Instruct-GGUF |
| Label | Qwen2.5 Coder 1.5B Instruct |
| Категория | LLM / чат и генерация текста |
| Runtime/backend | native / llama.cpp / gguf |
| Вес | 0.21 GB catalog size, ~220 MB disk/cache |
| Параметры | 1.5B |
| Минимальные требования | small - ноутбук или небольшой GPU; disk >= 220 MB; memory/VRAM около 696 MB; CPU возможен; GPU ускоряет |
| Оптимальные требования | cuda, metal, vulkan, cpu; желательно 1208 MB+ свободной VRAM/RAM и 732 MB+ disk cache |
| HF link | Qwen/Qwen2.5-Coder-1.5B-Instruct-GGUF |
| Доступные quantizations |
fp16, fp32, q2, q3, q4, q5, q6, q8
|
| Краткое описание | Native GGUF code model for llama.cpp. |
| Best in |
code, agents, chat, local-assistant
|
| Поле | Значение |
|---|---|
| Название | bartowski/SmolLM2-1.7B-Instruct-GGUF |
| Label | SmolLM2 1.7B Instruct |
| Категория | LLM / чат и генерация текста |
| Runtime/backend | native / llama.cpp / gguf |
| Вес | 0.21 GB catalog size, ~220 MB disk/cache |
| Параметры | 1.7B |
| Минимальные требования | small - ноутбук или небольшой GPU; disk >= 220 MB; memory/VRAM около 696 MB; CPU возможен; GPU ускоряет |
| Оптимальные требования | cuda, metal, vulkan, cpu; желательно 1208 MB+ свободной VRAM/RAM и 732 MB+ disk cache |
| HF link | bartowski/SmolLM2-1.7B-Instruct-GGUF |
| Доступные quantizations |
fp16, fp32, q2, q3, q4, q5, q6, q8
|
| Краткое описание | Native GGUF chat model for llama.cpp. |
| Best in |
chat, local-assistant
|
| Поле | Значение |
|---|---|
| Название | MaziyarPanahi/Mistral-Nemo-Instruct-2407-GGUF |
| Label | Mistral Nemo Instruct 2407 |
| Категория | LLM / чат и генерация текста |
| Runtime/backend | native / llama.cpp / gguf |
| Вес | 1.43 GB catalog size, ~1460 MB disk/cache |
| Параметры | не указаны |
| Минимальные требования | small - ноутбук или небольшой GPU; disk >= 1460 MB; memory/VRAM около 2928 MB; CPU возможен; GPU ускоряет |
| Оптимальные требования | cuda, metal, vulkan, cpu; желательно 3952 MB+ свободной VRAM/RAM и 1972 MB+ disk cache |
| HF link | MaziyarPanahi/Mistral-Nemo-Instruct-2407-GGUF |
| Доступные quantizations |
fp16, fp32, q2, q3, q4, q5, q6, q8
|
| Краткое описание | Native GGUF chat model for llama.cpp. |
| Best in |
chat, local-assistant
|
- xlocllm
- Quickstart
- About
- Functions Python
- Functions TypeScript
- Use cases
- Examples Python
- Examples TypeScript
- Shared GPU mode
-
Models catalog
- Models The best
- Models Full model list
- Models Use your model
- For native mode
- Models Native LLM tiny small
- Models Native LLM medium
- Models Native LLM large
- Models Native embedding
- Models Native reranker
- Models Native translator
- Models Native tts
- Models Native vlm
- Models Native asr
- Models Native ocr
- Models Native image-classification
- Models Native object-detection
- Models Native image-segmentation
- Models Native depth-estimation
- Models Native document-layout
- Models Native table-detection
- Models Native document-qa
- Models Native language-id
- Models Native audio-classification
- Models Native text-classification
- Models Native ner
- Models Native zero-shot-text
- Models Native summarization
- Models Native text2text
- Models Native code
- For webgpu mode
- For web mode
- Models Web LLM
- Models Web embedding
- Models Web reranker
- Models Web translator
- Models Web tts
- Models Web vlm
- Models Web asr
- Models Web ocr
- Models Web image-classification
- Models Web object-detection
- Models Web image-segmentation
- Models Web depth-estimation
- Models Web document-layout
- Models Web table-detection
- Models Web document-qa
- Models Web zero-shot-image
- Models Web language-id
- Models Web audio-classification
- Models Web text-classification
- Models Web ner
- Models Web zero-shot-text
- Models Web summarization
- Models Web text2text
- Models Web code
- Dev