Skip to content

Models Native LLM large

Mike edited this page May 28, 2026 · 1 revision

Models Native LLM large

Режим: Native. Категория: LLM / чат и генерация текста.

Всего моделей: 20.

Vikhr Nemo 12B Instruct R 21 09 24 Q8 0

Поле Значение
Название VlSav/Vikhr-Nemo-12B-Instruct-R-21-09-24-Q8_0-GGUF
Label Vikhr Nemo 12B Instruct R 21 09 24 Q8 0
Категория LLM / чат и генерация текста
Runtime/backend native / llama.cpp / gguf
Вес 1.43 GB catalog size, ~1460 MB disk/cache
Параметры 12B
Минимальные требования large - мощная локальная машина/GPU; disk >= 1460 MB; memory/VRAM около 2928 MB; CPU возможен; GPU ускоряет
Оптимальные требования cuda, metal, vulkan, cpu; желательно 3952 MB+ свободной VRAM/RAM и 1972 MB+ disk cache
HF link VlSav/Vikhr-Nemo-12B-Instruct-R-21-09-24-Q8_0-GGUF
Доступные quantizations fp16, fp32, q2, q3, q4, q5, q6, q8
Краткое описание Native GGUF multilingual model for llama.cpp.
Best in multilingual-chat, translation-assist, chat

Qwen2.5 14B Instruct

Поле Значение
Название Qwen/Qwen2.5-14B-Instruct-GGUF
Label Qwen2.5 14B Instruct
Категория LLM / чат и генерация текста
Runtime/backend native / llama.cpp / gguf
Вес 1.72 GB catalog size, ~1760 MB disk/cache
Параметры 14B
Минимальные требования large - мощная локальная машина/GPU; disk >= 1760 MB; memory/VRAM около 3468 MB; CPU возможен; GPU ускоряет
Оптимальные требования cuda, metal, vulkan, cpu; желательно 4681 MB+ свободной VRAM/RAM и 2272 MB+ disk cache
HF link Qwen/Qwen2.5-14B-Instruct-GGUF
Доступные quantizations fp16, fp32, q2, q3, q4, q5, q6, q8
Краткое описание Native GGUF chat model for llama.cpp.
Best in chat, local-assistant

Qwen2.5 14B Instruct

Поле Значение
Название bartowski/Qwen2.5-14B-Instruct-GGUF
Label Qwen2.5 14B Instruct
Категория LLM / чат и генерация текста
Runtime/backend native / llama.cpp / gguf
Вес 1.72 GB catalog size, ~1760 MB disk/cache
Параметры 14B
Минимальные требования large - мощная локальная машина/GPU; disk >= 1760 MB; memory/VRAM около 3468 MB; CPU возможен; GPU ускоряет
Оптимальные требования cuda, metal, vulkan, cpu; желательно 4681 MB+ свободной VRAM/RAM и 2272 MB+ disk cache
HF link bartowski/Qwen2.5-14B-Instruct-GGUF
Доступные quantizations fp16, fp32, q2, q3, q4, q5, q6, q8
Краткое описание Native GGUF chat model for llama.cpp.
Best in chat, local-assistant

Qwen2.5 Coder 14B Instruct

Поле Значение
Название Qwen/Qwen2.5-Coder-14B-Instruct-GGUF
Label Qwen2.5 Coder 14B Instruct
Категория LLM / чат и генерация текста
Runtime/backend native / llama.cpp / gguf
Вес 1.72 GB catalog size, ~1760 MB disk/cache
Параметры 14B
Минимальные требования large - мощная локальная машина/GPU; disk >= 1760 MB; memory/VRAM около 3468 MB; CPU возможен; GPU ускоряет
Оптимальные требования cuda, metal, vulkan, cpu; желательно 4681 MB+ свободной VRAM/RAM и 2272 MB+ disk cache
HF link Qwen/Qwen2.5-Coder-14B-Instruct-GGUF
Доступные quantizations fp16, fp32, q2, q3, q4, q5, q6, q8
Краткое описание Native GGUF code model for llama.cpp.
Best in code, agents, chat, local-assistant

Qwen2.5 Coder 14B Instruct

Поле Значение
Название lmstudio-community/Qwen2.5-Coder-14B-Instruct-GGUF
Label Qwen2.5 Coder 14B Instruct
Категория LLM / чат и генерация текста
Runtime/backend native / llama.cpp / gguf
Вес 1.72 GB catalog size, ~1760 MB disk/cache
Параметры 14B
Минимальные требования large - мощная локальная машина/GPU; disk >= 1760 MB; memory/VRAM около 3468 MB; CPU возможен; GPU ускоряет
Оптимальные требования cuda, metal, vulkan, cpu; желательно 4681 MB+ свободной VRAM/RAM и 2272 MB+ disk cache
HF link lmstudio-community/Qwen2.5-Coder-14B-Instruct-GGUF
Доступные quantizations fp16, fp32, q2, q3, q4, q5, q6, q8
Краткое описание Native GGUF code model for llama.cpp.
Best in code, agents, chat, local-assistant

Devstral Small 2 24B Instruct 2512

Поле Значение
Название unsloth/Devstral-Small-2-24B-Instruct-2512-GGUF
Label Devstral Small 2 24B Instruct 2512
Категория LLM / чат и генерация текста
Runtime/backend native / llama.cpp / gguf
Вес 2.74 GB catalog size, ~2810 MB disk/cache
Параметры 24B
Минимальные требования large - мощная локальная машина/GPU; disk >= 2810 MB; memory/VRAM около 5358 MB; CPU возможен; GPU ускоряет
Оптимальные требования cuda, metal, vulkan, cpu; желательно 7233 MB+ свободной VRAM/RAM и 3512 MB+ disk cache
HF link unsloth/Devstral-Small-2-24B-Instruct-2512-GGUF
Доступные quantizations fp16, fp32, q2, q3, q4, q5, q6, q8
Краткое описание Native GGUF chat model for llama.cpp.
Best in chat, local-assistant

Mistral Small 24B Instruct 2501

Поле Значение
Название MaziyarPanahi/Mistral-Small-24B-Instruct-2501-GGUF
Label Mistral Small 24B Instruct 2501
Категория LLM / чат и генерация текста
Runtime/backend native / llama.cpp / gguf
Вес 2.74 GB catalog size, ~2810 MB disk/cache
Параметры 24B
Минимальные требования large - мощная локальная машина/GPU; disk >= 2810 MB; memory/VRAM около 5358 MB; CPU возможен; GPU ускоряет
Оптимальные требования cuda, metal, vulkan, cpu; желательно 7233 MB+ свободной VRAM/RAM и 3512 MB+ disk cache
HF link MaziyarPanahi/Mistral-Small-24B-Instruct-2501-GGUF
Доступные quantizations fp16, fp32, q2, q3, q4, q5, q6, q8
Краткое описание Native GGUF chat model for llama.cpp.
Best in chat, local-assistant

mistral small 3.1 24b instruct 2503 hf

Поле Значение
Название MaziyarPanahi/mistral-small-3.1-24b-instruct-2503-hf-GGUF
Label mistral small 3.1 24b instruct 2503 hf
Категория LLM / чат и генерация текста
Runtime/backend native / llama.cpp / gguf
Вес 2.74 GB catalog size, ~2810 MB disk/cache
Параметры 24B
Минимальные требования large - мощная локальная машина/GPU; disk >= 2810 MB; memory/VRAM около 5358 MB; CPU возможен; GPU ускоряет
Оптимальные требования cuda, metal, vulkan, cpu; желательно 7233 MB+ свободной VRAM/RAM и 3512 MB+ disk cache
HF link MaziyarPanahi/mistral-small-3.1-24b-instruct-2503-hf-GGUF
Доступные quantizations fp16, fp32, q2, q3, q4, q5, q6, q8
Краткое описание Native GGUF chat model for llama.cpp.
Best in chat, local-assistant

Qwen3 30B A3B Instruct 2507

Поле Значение
Название unsloth/Qwen3-30B-A3B-Instruct-2507-GGUF
Label Qwen3 30B A3B Instruct 2507
Категория LLM / чат и генерация текста
Runtime/backend native / llama.cpp / gguf
Вес 3.55 GB catalog size, ~3639 MB disk/cache
Параметры 30B
Минимальные требования large - мощная локальная машина/GPU; disk >= 3639 MB; memory/VRAM около 6850 MB; CPU возможен; GPU ускоряет
Оптимальные требования cuda, metal, vulkan, cpu; желательно 9247 MB+ свободной VRAM/RAM и 4548 MB+ disk cache
HF link unsloth/Qwen3-30B-A3B-Instruct-2507-GGUF
Доступные quantizations fp16, fp32, q2, q3, q4, q5, q6, q8
Краткое описание Native GGUF reasoning model for llama.cpp.
Best in reasoning, agents, chat, local-assistant

Qwen3 30B A3B Instruct 2507

Поле Значение
Название MaziyarPanahi/Qwen3-30B-A3B-Instruct-2507-GGUF
Label Qwen3 30B A3B Instruct 2507
Категория LLM / чат и генерация текста
Runtime/backend native / llama.cpp / gguf
Вес 3.55 GB catalog size, ~3639 MB disk/cache
Параметры 30B
Минимальные требования large - мощная локальная машина/GPU; disk >= 3639 MB; memory/VRAM около 6850 MB; CPU возможен; GPU ускоряет
Оптимальные требования cuda, metal, vulkan, cpu; желательно 9247 MB+ свободной VRAM/RAM и 4548 MB+ disk cache
HF link MaziyarPanahi/Qwen3-30B-A3B-Instruct-2507-GGUF
Доступные quantizations fp16, fp32, q2, q3, q4, q5, q6, q8
Краткое описание Native GGUF reasoning model for llama.cpp.
Best in reasoning, agents, chat, local-assistant

Qwen3 Coder 30B A3B Instruct

Поле Значение
Название unsloth/Qwen3-Coder-30B-A3B-Instruct-GGUF
Label Qwen3 Coder 30B A3B Instruct
Категория LLM / чат и генерация текста
Runtime/backend native / llama.cpp / gguf
Вес 3.55 GB catalog size, ~3639 MB disk/cache
Параметры 30B
Минимальные требования large - мощная локальная машина/GPU; disk >= 3639 MB; memory/VRAM около 6850 MB; CPU возможен; GPU ускоряет
Оптимальные требования cuda, metal, vulkan, cpu; желательно 9247 MB+ свободной VRAM/RAM и 4548 MB+ disk cache
HF link unsloth/Qwen3-Coder-30B-A3B-Instruct-GGUF
Доступные quantizations fp16, fp32, q2, q3, q4, q5, q6, q8
Краткое описание Native GGUF code model for llama.cpp.
Best in code, agents, chat, local-assistant

Qwen3 Coder 30B A3B Instruct

Поле Значение
Название lmstudio-community/Qwen3-Coder-30B-A3B-Instruct-GGUF
Label Qwen3 Coder 30B A3B Instruct
Категория LLM / чат и генерация текста
Runtime/backend native / llama.cpp / gguf
Вес 3.55 GB catalog size, ~3639 MB disk/cache
Параметры 30B
Минимальные требования large - мощная локальная машина/GPU; disk >= 3639 MB; memory/VRAM около 6850 MB; CPU возможен; GPU ускоряет
Оптимальные требования cuda, metal, vulkan, cpu; желательно 9247 MB+ свободной VRAM/RAM и 4548 MB+ disk cache
HF link lmstudio-community/Qwen3-Coder-30B-A3B-Instruct-GGUF
Доступные quantizations fp16, fp32, q2, q3, q4, q5, q6, q8
Краткое описание Native GGUF code model for llama.cpp.
Best in code, agents, chat, local-assistant

Qwen2.5 32B Instruct

Поле Значение
Название Qwen/Qwen2.5-32B-Instruct-GGUF
Label Qwen2.5 32B Instruct
Категория LLM / чат и генерация текста
Runtime/backend native / llama.cpp / gguf
Вес 3.81 GB catalog size, ~3905 MB disk/cache
Параметры 32B
Минимальные требования large - мощная локальная машина/GPU; disk >= 3905 MB; memory/VRAM около 7329 MB; CPU возможен; GPU ускоряет
Оптимальные требования cuda, metal, vulkan, cpu; желательно 9894 MB+ свободной VRAM/RAM и 4881 MB+ disk cache
HF link Qwen/Qwen2.5-32B-Instruct-GGUF
Доступные quantizations fp16, fp32, q2, q3, q4, q5, q6, q8
Краткое описание Native GGUF chat model for llama.cpp.
Best in chat, local-assistant

Qwen2.5 Coder 32B Instruct

Поле Значение
Название Qwen/Qwen2.5-Coder-32B-Instruct-GGUF
Label Qwen2.5 Coder 32B Instruct
Категория LLM / чат и генерация текста
Runtime/backend native / llama.cpp / gguf
Вес 3.81 GB catalog size, ~3905 MB disk/cache
Параметры 32B
Минимальные требования large - мощная локальная машина/GPU; disk >= 3905 MB; memory/VRAM около 7329 MB; CPU возможен; GPU ускоряет
Оптимальные требования cuda, metal, vulkan, cpu; желательно 9894 MB+ свободной VRAM/RAM и 4881 MB+ disk cache
HF link Qwen/Qwen2.5-Coder-32B-Instruct-GGUF
Доступные quantizations fp16, fp32, q2, q3, q4, q5, q6, q8
Краткое описание Native GGUF code model for llama.cpp.
Best in code, agents, chat, local-assistant

Qwen2.5 Coder 32B Instruct

Поле Значение
Название bartowski/Qwen2.5-Coder-32B-Instruct-GGUF
Label Qwen2.5 Coder 32B Instruct
Категория LLM / чат и генерация текста
Runtime/backend native / llama.cpp / gguf
Вес 3.81 GB catalog size, ~3905 MB disk/cache
Параметры 32B
Минимальные требования large - мощная локальная машина/GPU; disk >= 3905 MB; memory/VRAM около 7329 MB; CPU возможен; GPU ускоряет
Оптимальные требования cuda, metal, vulkan, cpu; желательно 9894 MB+ свободной VRAM/RAM и 4881 MB+ disk cache
HF link bartowski/Qwen2.5-Coder-32B-Instruct-GGUF
Доступные quantizations fp16, fp32, q2, q3, q4, q5, q6, q8
Краткое описание Native GGUF code model for llama.cpp.
Best in code, agents, chat, local-assistant

Llama 3.3 70B Instruct

Поле Значение
Название MaziyarPanahi/Llama-3.3-70B-Instruct-GGUF
Label Llama 3.3 70B Instruct
Категория LLM / чат и генерация текста
Runtime/backend native / llama.cpp / gguf
Вес 8.21 GB catalog size, ~8410 MB disk/cache
Параметры 70B
Минимальные требования large - мощная локальная машина/GPU; disk >= 8410 MB; memory/VRAM около 15438 MB; CPU возможен; GPU ускоряет
Оптимальные требования cuda, metal, vulkan, cpu; желательно 20841 MB+ свободной VRAM/RAM и 10512 MB+ disk cache
HF link MaziyarPanahi/Llama-3.3-70B-Instruct-GGUF
Доступные quantizations fp16, fp32, q2, q3, q4, q5, q6, q8
Краткое описание Native GGUF chat model for llama.cpp.
Best in chat, local-assistant

Llama 3.3 70B Instruct

Поле Значение
Название unsloth/Llama-3.3-70B-Instruct-GGUF
Label Llama 3.3 70B Instruct
Категория LLM / чат и генерация текста
Runtime/backend native / llama.cpp / gguf
Вес 8.21 GB catalog size, ~8410 MB disk/cache
Параметры 70B
Минимальные требования large - мощная локальная машина/GPU; disk >= 8410 MB; memory/VRAM около 15438 MB; CPU возможен; GPU ускоряет
Оптимальные требования cuda, metal, vulkan, cpu; желательно 20841 MB+ свободной VRAM/RAM и 10512 MB+ disk cache
HF link unsloth/Llama-3.3-70B-Instruct-GGUF
Доступные quantizations fp16, fp32, q2, q3, q4, q5, q6, q8
Краткое описание Native GGUF chat model for llama.cpp.
Best in chat, local-assistant

Meta Llama 3.1 70B Instruct

Поле Значение
Название MaziyarPanahi/Meta-Llama-3.1-70B-Instruct-GGUF
Label Meta Llama 3.1 70B Instruct
Категория LLM / чат и генерация текста
Runtime/backend native / llama.cpp / gguf
Вес 8.21 GB catalog size, ~8410 MB disk/cache
Параметры 70B
Минимальные требования large - мощная локальная машина/GPU; disk >= 8410 MB; memory/VRAM около 15438 MB; CPU возможен; GPU ускоряет
Оптимальные требования cuda, metal, vulkan, cpu; желательно 20841 MB+ свободной VRAM/RAM и 10512 MB+ disk cache
HF link MaziyarPanahi/Meta-Llama-3.1-70B-Instruct-GGUF
Доступные quantizations fp16, fp32, q2, q3, q4, q5, q6, q8
Краткое описание Native GGUF chat model for llama.cpp.
Best in chat, local-assistant

Mistral Large Instruct 2411

Поле Значение
Название MaziyarPanahi/Mistral-Large-Instruct-2411-GGUF
Label Mistral Large Instruct 2411
Категория LLM / чат и генерация текста
Runtime/backend native / llama.cpp / gguf
Вес 14.27 GB catalog size, ~14616 MB disk/cache
Параметры не указаны
Минимальные требования large - мощная локальная машина/GPU; disk >= 14616 MB; memory/VRAM около 26608 MB; CPU возможен; GPU ускоряет
Оптимальные требования cuda, metal, vulkan, cpu; желательно 35920 MB+ свободной VRAM/RAM и 18270 MB+ disk cache
HF link MaziyarPanahi/Mistral-Large-Instruct-2411-GGUF
Доступные quantizations fp16, fp32, q2, q3, q4, q5, q6, q8
Краткое описание Native GGUF chat model for llama.cpp.
Best in chat, local-assistant

Meta Llama 3.1 405B Instruct

Поле Значение
Название MaziyarPanahi/Meta-Llama-3.1-405B-Instruct-GGUF
Label Meta Llama 3.1 405B Instruct
Категория LLM / чат и генерация текста
Runtime/backend native / llama.cpp / gguf
Вес 47.74 GB catalog size, ~48885 MB disk/cache
Параметры 405B
Минимальные требования large - мощная локальная машина/GPU; disk >= 48885 MB; memory/VRAM около 88293 MB; CPU возможен; GPU ускоряет
Оптимальные требования cuda, metal, vulkan, cpu; желательно 119195 MB+ свободной VRAM/RAM и 61106 MB+ disk cache
HF link MaziyarPanahi/Meta-Llama-3.1-405B-Instruct-GGUF
Доступные quantizations fp16, fp32, q2, q3, q4, q5, q6, q8
Краткое описание Native GGUF chat model for llama.cpp.
Best in chat, local-assistant

Clone this wiki locally