-
Notifications
You must be signed in to change notification settings - Fork 0
Models Native LLM large
Mike edited this page May 28, 2026
·
1 revision
Режим: Native. Категория: LLM / чат и генерация текста.
Всего моделей: 20.
| Поле | Значение |
|---|---|
| Название | VlSav/Vikhr-Nemo-12B-Instruct-R-21-09-24-Q8_0-GGUF |
| Label | Vikhr Nemo 12B Instruct R 21 09 24 Q8 0 |
| Категория | LLM / чат и генерация текста |
| Runtime/backend | native / llama.cpp / gguf |
| Вес | 1.43 GB catalog size, ~1460 MB disk/cache |
| Параметры | 12B |
| Минимальные требования | large - мощная локальная машина/GPU; disk >= 1460 MB; memory/VRAM около 2928 MB; CPU возможен; GPU ускоряет |
| Оптимальные требования | cuda, metal, vulkan, cpu; желательно 3952 MB+ свободной VRAM/RAM и 1972 MB+ disk cache |
| HF link | VlSav/Vikhr-Nemo-12B-Instruct-R-21-09-24-Q8_0-GGUF |
| Доступные quantizations |
fp16, fp32, q2, q3, q4, q5, q6, q8
|
| Краткое описание | Native GGUF multilingual model for llama.cpp. |
| Best in |
multilingual-chat, translation-assist, chat
|
| Поле | Значение |
|---|---|
| Название | Qwen/Qwen2.5-14B-Instruct-GGUF |
| Label | Qwen2.5 14B Instruct |
| Категория | LLM / чат и генерация текста |
| Runtime/backend | native / llama.cpp / gguf |
| Вес | 1.72 GB catalog size, ~1760 MB disk/cache |
| Параметры | 14B |
| Минимальные требования | large - мощная локальная машина/GPU; disk >= 1760 MB; memory/VRAM около 3468 MB; CPU возможен; GPU ускоряет |
| Оптимальные требования | cuda, metal, vulkan, cpu; желательно 4681 MB+ свободной VRAM/RAM и 2272 MB+ disk cache |
| HF link | Qwen/Qwen2.5-14B-Instruct-GGUF |
| Доступные quantizations |
fp16, fp32, q2, q3, q4, q5, q6, q8
|
| Краткое описание | Native GGUF chat model for llama.cpp. |
| Best in |
chat, local-assistant
|
| Поле | Значение |
|---|---|
| Название | bartowski/Qwen2.5-14B-Instruct-GGUF |
| Label | Qwen2.5 14B Instruct |
| Категория | LLM / чат и генерация текста |
| Runtime/backend | native / llama.cpp / gguf |
| Вес | 1.72 GB catalog size, ~1760 MB disk/cache |
| Параметры | 14B |
| Минимальные требования | large - мощная локальная машина/GPU; disk >= 1760 MB; memory/VRAM около 3468 MB; CPU возможен; GPU ускоряет |
| Оптимальные требования | cuda, metal, vulkan, cpu; желательно 4681 MB+ свободной VRAM/RAM и 2272 MB+ disk cache |
| HF link | bartowski/Qwen2.5-14B-Instruct-GGUF |
| Доступные quantizations |
fp16, fp32, q2, q3, q4, q5, q6, q8
|
| Краткое описание | Native GGUF chat model for llama.cpp. |
| Best in |
chat, local-assistant
|
| Поле | Значение |
|---|---|
| Название | Qwen/Qwen2.5-Coder-14B-Instruct-GGUF |
| Label | Qwen2.5 Coder 14B Instruct |
| Категория | LLM / чат и генерация текста |
| Runtime/backend | native / llama.cpp / gguf |
| Вес | 1.72 GB catalog size, ~1760 MB disk/cache |
| Параметры | 14B |
| Минимальные требования | large - мощная локальная машина/GPU; disk >= 1760 MB; memory/VRAM около 3468 MB; CPU возможен; GPU ускоряет |
| Оптимальные требования | cuda, metal, vulkan, cpu; желательно 4681 MB+ свободной VRAM/RAM и 2272 MB+ disk cache |
| HF link | Qwen/Qwen2.5-Coder-14B-Instruct-GGUF |
| Доступные quantizations |
fp16, fp32, q2, q3, q4, q5, q6, q8
|
| Краткое описание | Native GGUF code model for llama.cpp. |
| Best in |
code, agents, chat, local-assistant
|
| Поле | Значение |
|---|---|
| Название | lmstudio-community/Qwen2.5-Coder-14B-Instruct-GGUF |
| Label | Qwen2.5 Coder 14B Instruct |
| Категория | LLM / чат и генерация текста |
| Runtime/backend | native / llama.cpp / gguf |
| Вес | 1.72 GB catalog size, ~1760 MB disk/cache |
| Параметры | 14B |
| Минимальные требования | large - мощная локальная машина/GPU; disk >= 1760 MB; memory/VRAM около 3468 MB; CPU возможен; GPU ускоряет |
| Оптимальные требования | cuda, metal, vulkan, cpu; желательно 4681 MB+ свободной VRAM/RAM и 2272 MB+ disk cache |
| HF link | lmstudio-community/Qwen2.5-Coder-14B-Instruct-GGUF |
| Доступные quantizations |
fp16, fp32, q2, q3, q4, q5, q6, q8
|
| Краткое описание | Native GGUF code model for llama.cpp. |
| Best in |
code, agents, chat, local-assistant
|
| Поле | Значение |
|---|---|
| Название | unsloth/Devstral-Small-2-24B-Instruct-2512-GGUF |
| Label | Devstral Small 2 24B Instruct 2512 |
| Категория | LLM / чат и генерация текста |
| Runtime/backend | native / llama.cpp / gguf |
| Вес | 2.74 GB catalog size, ~2810 MB disk/cache |
| Параметры | 24B |
| Минимальные требования | large - мощная локальная машина/GPU; disk >= 2810 MB; memory/VRAM около 5358 MB; CPU возможен; GPU ускоряет |
| Оптимальные требования | cuda, metal, vulkan, cpu; желательно 7233 MB+ свободной VRAM/RAM и 3512 MB+ disk cache |
| HF link | unsloth/Devstral-Small-2-24B-Instruct-2512-GGUF |
| Доступные quantizations |
fp16, fp32, q2, q3, q4, q5, q6, q8
|
| Краткое описание | Native GGUF chat model for llama.cpp. |
| Best in |
chat, local-assistant
|
| Поле | Значение |
|---|---|
| Название | MaziyarPanahi/Mistral-Small-24B-Instruct-2501-GGUF |
| Label | Mistral Small 24B Instruct 2501 |
| Категория | LLM / чат и генерация текста |
| Runtime/backend | native / llama.cpp / gguf |
| Вес | 2.74 GB catalog size, ~2810 MB disk/cache |
| Параметры | 24B |
| Минимальные требования | large - мощная локальная машина/GPU; disk >= 2810 MB; memory/VRAM около 5358 MB; CPU возможен; GPU ускоряет |
| Оптимальные требования | cuda, metal, vulkan, cpu; желательно 7233 MB+ свободной VRAM/RAM и 3512 MB+ disk cache |
| HF link | MaziyarPanahi/Mistral-Small-24B-Instruct-2501-GGUF |
| Доступные quantizations |
fp16, fp32, q2, q3, q4, q5, q6, q8
|
| Краткое описание | Native GGUF chat model for llama.cpp. |
| Best in |
chat, local-assistant
|
| Поле | Значение |
|---|---|
| Название | MaziyarPanahi/mistral-small-3.1-24b-instruct-2503-hf-GGUF |
| Label | mistral small 3.1 24b instruct 2503 hf |
| Категория | LLM / чат и генерация текста |
| Runtime/backend | native / llama.cpp / gguf |
| Вес | 2.74 GB catalog size, ~2810 MB disk/cache |
| Параметры | 24B |
| Минимальные требования | large - мощная локальная машина/GPU; disk >= 2810 MB; memory/VRAM около 5358 MB; CPU возможен; GPU ускоряет |
| Оптимальные требования | cuda, metal, vulkan, cpu; желательно 7233 MB+ свободной VRAM/RAM и 3512 MB+ disk cache |
| HF link | MaziyarPanahi/mistral-small-3.1-24b-instruct-2503-hf-GGUF |
| Доступные quantizations |
fp16, fp32, q2, q3, q4, q5, q6, q8
|
| Краткое описание | Native GGUF chat model for llama.cpp. |
| Best in |
chat, local-assistant
|
| Поле | Значение |
|---|---|
| Название | unsloth/Qwen3-30B-A3B-Instruct-2507-GGUF |
| Label | Qwen3 30B A3B Instruct 2507 |
| Категория | LLM / чат и генерация текста |
| Runtime/backend | native / llama.cpp / gguf |
| Вес | 3.55 GB catalog size, ~3639 MB disk/cache |
| Параметры | 30B |
| Минимальные требования | large - мощная локальная машина/GPU; disk >= 3639 MB; memory/VRAM около 6850 MB; CPU возможен; GPU ускоряет |
| Оптимальные требования | cuda, metal, vulkan, cpu; желательно 9247 MB+ свободной VRAM/RAM и 4548 MB+ disk cache |
| HF link | unsloth/Qwen3-30B-A3B-Instruct-2507-GGUF |
| Доступные quantizations |
fp16, fp32, q2, q3, q4, q5, q6, q8
|
| Краткое описание | Native GGUF reasoning model for llama.cpp. |
| Best in |
reasoning, agents, chat, local-assistant
|
| Поле | Значение |
|---|---|
| Название | MaziyarPanahi/Qwen3-30B-A3B-Instruct-2507-GGUF |
| Label | Qwen3 30B A3B Instruct 2507 |
| Категория | LLM / чат и генерация текста |
| Runtime/backend | native / llama.cpp / gguf |
| Вес | 3.55 GB catalog size, ~3639 MB disk/cache |
| Параметры | 30B |
| Минимальные требования | large - мощная локальная машина/GPU; disk >= 3639 MB; memory/VRAM около 6850 MB; CPU возможен; GPU ускоряет |
| Оптимальные требования | cuda, metal, vulkan, cpu; желательно 9247 MB+ свободной VRAM/RAM и 4548 MB+ disk cache |
| HF link | MaziyarPanahi/Qwen3-30B-A3B-Instruct-2507-GGUF |
| Доступные quantizations |
fp16, fp32, q2, q3, q4, q5, q6, q8
|
| Краткое описание | Native GGUF reasoning model for llama.cpp. |
| Best in |
reasoning, agents, chat, local-assistant
|
| Поле | Значение |
|---|---|
| Название | unsloth/Qwen3-Coder-30B-A3B-Instruct-GGUF |
| Label | Qwen3 Coder 30B A3B Instruct |
| Категория | LLM / чат и генерация текста |
| Runtime/backend | native / llama.cpp / gguf |
| Вес | 3.55 GB catalog size, ~3639 MB disk/cache |
| Параметры | 30B |
| Минимальные требования | large - мощная локальная машина/GPU; disk >= 3639 MB; memory/VRAM около 6850 MB; CPU возможен; GPU ускоряет |
| Оптимальные требования | cuda, metal, vulkan, cpu; желательно 9247 MB+ свободной VRAM/RAM и 4548 MB+ disk cache |
| HF link | unsloth/Qwen3-Coder-30B-A3B-Instruct-GGUF |
| Доступные quantizations |
fp16, fp32, q2, q3, q4, q5, q6, q8
|
| Краткое описание | Native GGUF code model for llama.cpp. |
| Best in |
code, agents, chat, local-assistant
|
| Поле | Значение |
|---|---|
| Название | lmstudio-community/Qwen3-Coder-30B-A3B-Instruct-GGUF |
| Label | Qwen3 Coder 30B A3B Instruct |
| Категория | LLM / чат и генерация текста |
| Runtime/backend | native / llama.cpp / gguf |
| Вес | 3.55 GB catalog size, ~3639 MB disk/cache |
| Параметры | 30B |
| Минимальные требования | large - мощная локальная машина/GPU; disk >= 3639 MB; memory/VRAM около 6850 MB; CPU возможен; GPU ускоряет |
| Оптимальные требования | cuda, metal, vulkan, cpu; желательно 9247 MB+ свободной VRAM/RAM и 4548 MB+ disk cache |
| HF link | lmstudio-community/Qwen3-Coder-30B-A3B-Instruct-GGUF |
| Доступные quantizations |
fp16, fp32, q2, q3, q4, q5, q6, q8
|
| Краткое описание | Native GGUF code model for llama.cpp. |
| Best in |
code, agents, chat, local-assistant
|
| Поле | Значение |
|---|---|
| Название | Qwen/Qwen2.5-32B-Instruct-GGUF |
| Label | Qwen2.5 32B Instruct |
| Категория | LLM / чат и генерация текста |
| Runtime/backend | native / llama.cpp / gguf |
| Вес | 3.81 GB catalog size, ~3905 MB disk/cache |
| Параметры | 32B |
| Минимальные требования | large - мощная локальная машина/GPU; disk >= 3905 MB; memory/VRAM около 7329 MB; CPU возможен; GPU ускоряет |
| Оптимальные требования | cuda, metal, vulkan, cpu; желательно 9894 MB+ свободной VRAM/RAM и 4881 MB+ disk cache |
| HF link | Qwen/Qwen2.5-32B-Instruct-GGUF |
| Доступные quantizations |
fp16, fp32, q2, q3, q4, q5, q6, q8
|
| Краткое описание | Native GGUF chat model for llama.cpp. |
| Best in |
chat, local-assistant
|
| Поле | Значение |
|---|---|
| Название | Qwen/Qwen2.5-Coder-32B-Instruct-GGUF |
| Label | Qwen2.5 Coder 32B Instruct |
| Категория | LLM / чат и генерация текста |
| Runtime/backend | native / llama.cpp / gguf |
| Вес | 3.81 GB catalog size, ~3905 MB disk/cache |
| Параметры | 32B |
| Минимальные требования | large - мощная локальная машина/GPU; disk >= 3905 MB; memory/VRAM около 7329 MB; CPU возможен; GPU ускоряет |
| Оптимальные требования | cuda, metal, vulkan, cpu; желательно 9894 MB+ свободной VRAM/RAM и 4881 MB+ disk cache |
| HF link | Qwen/Qwen2.5-Coder-32B-Instruct-GGUF |
| Доступные quantizations |
fp16, fp32, q2, q3, q4, q5, q6, q8
|
| Краткое описание | Native GGUF code model for llama.cpp. |
| Best in |
code, agents, chat, local-assistant
|
| Поле | Значение |
|---|---|
| Название | bartowski/Qwen2.5-Coder-32B-Instruct-GGUF |
| Label | Qwen2.5 Coder 32B Instruct |
| Категория | LLM / чат и генерация текста |
| Runtime/backend | native / llama.cpp / gguf |
| Вес | 3.81 GB catalog size, ~3905 MB disk/cache |
| Параметры | 32B |
| Минимальные требования | large - мощная локальная машина/GPU; disk >= 3905 MB; memory/VRAM около 7329 MB; CPU возможен; GPU ускоряет |
| Оптимальные требования | cuda, metal, vulkan, cpu; желательно 9894 MB+ свободной VRAM/RAM и 4881 MB+ disk cache |
| HF link | bartowski/Qwen2.5-Coder-32B-Instruct-GGUF |
| Доступные quantizations |
fp16, fp32, q2, q3, q4, q5, q6, q8
|
| Краткое описание | Native GGUF code model for llama.cpp. |
| Best in |
code, agents, chat, local-assistant
|
| Поле | Значение |
|---|---|
| Название | MaziyarPanahi/Llama-3.3-70B-Instruct-GGUF |
| Label | Llama 3.3 70B Instruct |
| Категория | LLM / чат и генерация текста |
| Runtime/backend | native / llama.cpp / gguf |
| Вес | 8.21 GB catalog size, ~8410 MB disk/cache |
| Параметры | 70B |
| Минимальные требования | large - мощная локальная машина/GPU; disk >= 8410 MB; memory/VRAM около 15438 MB; CPU возможен; GPU ускоряет |
| Оптимальные требования | cuda, metal, vulkan, cpu; желательно 20841 MB+ свободной VRAM/RAM и 10512 MB+ disk cache |
| HF link | MaziyarPanahi/Llama-3.3-70B-Instruct-GGUF |
| Доступные quantizations |
fp16, fp32, q2, q3, q4, q5, q6, q8
|
| Краткое описание | Native GGUF chat model for llama.cpp. |
| Best in |
chat, local-assistant
|
| Поле | Значение |
|---|---|
| Название | unsloth/Llama-3.3-70B-Instruct-GGUF |
| Label | Llama 3.3 70B Instruct |
| Категория | LLM / чат и генерация текста |
| Runtime/backend | native / llama.cpp / gguf |
| Вес | 8.21 GB catalog size, ~8410 MB disk/cache |
| Параметры | 70B |
| Минимальные требования | large - мощная локальная машина/GPU; disk >= 8410 MB; memory/VRAM около 15438 MB; CPU возможен; GPU ускоряет |
| Оптимальные требования | cuda, metal, vulkan, cpu; желательно 20841 MB+ свободной VRAM/RAM и 10512 MB+ disk cache |
| HF link | unsloth/Llama-3.3-70B-Instruct-GGUF |
| Доступные quantizations |
fp16, fp32, q2, q3, q4, q5, q6, q8
|
| Краткое описание | Native GGUF chat model for llama.cpp. |
| Best in |
chat, local-assistant
|
| Поле | Значение |
|---|---|
| Название | MaziyarPanahi/Meta-Llama-3.1-70B-Instruct-GGUF |
| Label | Meta Llama 3.1 70B Instruct |
| Категория | LLM / чат и генерация текста |
| Runtime/backend | native / llama.cpp / gguf |
| Вес | 8.21 GB catalog size, ~8410 MB disk/cache |
| Параметры | 70B |
| Минимальные требования | large - мощная локальная машина/GPU; disk >= 8410 MB; memory/VRAM около 15438 MB; CPU возможен; GPU ускоряет |
| Оптимальные требования | cuda, metal, vulkan, cpu; желательно 20841 MB+ свободной VRAM/RAM и 10512 MB+ disk cache |
| HF link | MaziyarPanahi/Meta-Llama-3.1-70B-Instruct-GGUF |
| Доступные quantizations |
fp16, fp32, q2, q3, q4, q5, q6, q8
|
| Краткое описание | Native GGUF chat model for llama.cpp. |
| Best in |
chat, local-assistant
|
| Поле | Значение |
|---|---|
| Название | MaziyarPanahi/Mistral-Large-Instruct-2411-GGUF |
| Label | Mistral Large Instruct 2411 |
| Категория | LLM / чат и генерация текста |
| Runtime/backend | native / llama.cpp / gguf |
| Вес | 14.27 GB catalog size, ~14616 MB disk/cache |
| Параметры | не указаны |
| Минимальные требования | large - мощная локальная машина/GPU; disk >= 14616 MB; memory/VRAM около 26608 MB; CPU возможен; GPU ускоряет |
| Оптимальные требования | cuda, metal, vulkan, cpu; желательно 35920 MB+ свободной VRAM/RAM и 18270 MB+ disk cache |
| HF link | MaziyarPanahi/Mistral-Large-Instruct-2411-GGUF |
| Доступные quantizations |
fp16, fp32, q2, q3, q4, q5, q6, q8
|
| Краткое описание | Native GGUF chat model for llama.cpp. |
| Best in |
chat, local-assistant
|
| Поле | Значение |
|---|---|
| Название | MaziyarPanahi/Meta-Llama-3.1-405B-Instruct-GGUF |
| Label | Meta Llama 3.1 405B Instruct |
| Категория | LLM / чат и генерация текста |
| Runtime/backend | native / llama.cpp / gguf |
| Вес | 47.74 GB catalog size, ~48885 MB disk/cache |
| Параметры | 405B |
| Минимальные требования | large - мощная локальная машина/GPU; disk >= 48885 MB; memory/VRAM около 88293 MB; CPU возможен; GPU ускоряет |
| Оптимальные требования | cuda, metal, vulkan, cpu; желательно 119195 MB+ свободной VRAM/RAM и 61106 MB+ disk cache |
| HF link | MaziyarPanahi/Meta-Llama-3.1-405B-Instruct-GGUF |
| Доступные quantizations |
fp16, fp32, q2, q3, q4, q5, q6, q8
|
| Краткое описание | Native GGUF chat model for llama.cpp. |
| Best in |
chat, local-assistant
|
- xlocllm
- Quickstart
- About
- Functions Python
- Functions TypeScript
- Use cases
- Examples Python
- Examples TypeScript
- Shared GPU mode
-
Models catalog
- Models The best
- Models Full model list
- Models Use your model
- For native mode
- Models Native LLM tiny small
- Models Native LLM medium
- Models Native LLM large
- Models Native embedding
- Models Native reranker
- Models Native translator
- Models Native tts
- Models Native vlm
- Models Native asr
- Models Native ocr
- Models Native image-classification
- Models Native object-detection
- Models Native image-segmentation
- Models Native depth-estimation
- Models Native document-layout
- Models Native table-detection
- Models Native document-qa
- Models Native language-id
- Models Native audio-classification
- Models Native text-classification
- Models Native ner
- Models Native zero-shot-text
- Models Native summarization
- Models Native text2text
- Models Native code
- For webgpu mode
- For web mode
- Models Web LLM
- Models Web embedding
- Models Web reranker
- Models Web translator
- Models Web tts
- Models Web vlm
- Models Web asr
- Models Web ocr
- Models Web image-classification
- Models Web object-detection
- Models Web image-segmentation
- Models Web depth-estimation
- Models Web document-layout
- Models Web table-detection
- Models Web document-qa
- Models Web zero-shot-image
- Models Web language-id
- Models Web audio-classification
- Models Web text-classification
- Models Web ner
- Models Web zero-shot-text
- Models Web summarization
- Models Web text2text
- Models Web code
- Dev