Models Native LLM large

Режим: Native. Категория: LLM / чат и генерация текста.

Всего моделей: 20.

Vikhr Nemo 12B Instruct R 21 09 24 Q8 0

Поле	Значение
Название	`VlSav/Vikhr-Nemo-12B-Instruct-R-21-09-24-Q8_0-GGUF`
Label	Vikhr Nemo 12B Instruct R 21 09 24 Q8 0
Категория	LLM / чат и генерация текста
Runtime/backend	native / llama.cpp / gguf
Вес	1.43 GB catalog size, ~1460 MB disk/cache
Параметры	12B
Минимальные требования	large - мощная локальная машина/GPU; disk >= 1460 MB; memory/VRAM около 2928 MB; CPU возможен; GPU ускоряет
Оптимальные требования	cuda, metal, vulkan, cpu; желательно 3952 MB+ свободной VRAM/RAM и 1972 MB+ disk cache
HF link	VlSav/Vikhr-Nemo-12B-Instruct-R-21-09-24-Q8_0-GGUF
Доступные quantizations	`fp16`, `fp32`, `q2`, `q3`, `q4`, `q5`, `q6`, `q8`
Краткое описание	Native GGUF multilingual model for llama.cpp.
Best in	`multilingual-chat`, `translation-assist`, `chat`

Qwen2.5 14B Instruct

Поле	Значение
Название	`Qwen/Qwen2.5-14B-Instruct-GGUF`
Label	Qwen2.5 14B Instruct
Категория	LLM / чат и генерация текста
Runtime/backend	native / llama.cpp / gguf
Вес	1.72 GB catalog size, ~1760 MB disk/cache
Параметры	14B
Минимальные требования	large - мощная локальная машина/GPU; disk >= 1760 MB; memory/VRAM около 3468 MB; CPU возможен; GPU ускоряет
Оптимальные требования	cuda, metal, vulkan, cpu; желательно 4681 MB+ свободной VRAM/RAM и 2272 MB+ disk cache
HF link	Qwen/Qwen2.5-14B-Instruct-GGUF
Доступные quantizations	`fp16`, `fp32`, `q2`, `q3`, `q4`, `q5`, `q6`, `q8`
Краткое описание	Native GGUF chat model for llama.cpp.
Best in	`chat`, `local-assistant`

Qwen2.5 14B Instruct

Поле	Значение
Название	`bartowski/Qwen2.5-14B-Instruct-GGUF`
Label	Qwen2.5 14B Instruct
Категория	LLM / чат и генерация текста
Runtime/backend	native / llama.cpp / gguf
Вес	1.72 GB catalog size, ~1760 MB disk/cache
Параметры	14B
Минимальные требования	large - мощная локальная машина/GPU; disk >= 1760 MB; memory/VRAM около 3468 MB; CPU возможен; GPU ускоряет
Оптимальные требования	cuda, metal, vulkan, cpu; желательно 4681 MB+ свободной VRAM/RAM и 2272 MB+ disk cache
HF link	bartowski/Qwen2.5-14B-Instruct-GGUF
Доступные quantizations	`fp16`, `fp32`, `q2`, `q3`, `q4`, `q5`, `q6`, `q8`
Краткое описание	Native GGUF chat model for llama.cpp.
Best in	`chat`, `local-assistant`

Qwen2.5 Coder 14B Instruct

Поле	Значение
Название	`Qwen/Qwen2.5-Coder-14B-Instruct-GGUF`
Label	Qwen2.5 Coder 14B Instruct
Категория	LLM / чат и генерация текста
Runtime/backend	native / llama.cpp / gguf
Вес	1.72 GB catalog size, ~1760 MB disk/cache
Параметры	14B
Минимальные требования	large - мощная локальная машина/GPU; disk >= 1760 MB; memory/VRAM около 3468 MB; CPU возможен; GPU ускоряет
Оптимальные требования	cuda, metal, vulkan, cpu; желательно 4681 MB+ свободной VRAM/RAM и 2272 MB+ disk cache
HF link	Qwen/Qwen2.5-Coder-14B-Instruct-GGUF
Доступные quantizations	`fp16`, `fp32`, `q2`, `q3`, `q4`, `q5`, `q6`, `q8`
Краткое описание	Native GGUF code model for llama.cpp.
Best in	`code`, `agents`, `chat`, `local-assistant`

Qwen2.5 Coder 14B Instruct

Поле	Значение
Название	`lmstudio-community/Qwen2.5-Coder-14B-Instruct-GGUF`
Label	Qwen2.5 Coder 14B Instruct
Категория	LLM / чат и генерация текста
Runtime/backend	native / llama.cpp / gguf
Вес	1.72 GB catalog size, ~1760 MB disk/cache
Параметры	14B
Минимальные требования	large - мощная локальная машина/GPU; disk >= 1760 MB; memory/VRAM около 3468 MB; CPU возможен; GPU ускоряет
Оптимальные требования	cuda, metal, vulkan, cpu; желательно 4681 MB+ свободной VRAM/RAM и 2272 MB+ disk cache
HF link	lmstudio-community/Qwen2.5-Coder-14B-Instruct-GGUF
Доступные quantizations	`fp16`, `fp32`, `q2`, `q3`, `q4`, `q5`, `q6`, `q8`
Краткое описание	Native GGUF code model for llama.cpp.
Best in	`code`, `agents`, `chat`, `local-assistant`

Devstral Small 2 24B Instruct 2512

Поле	Значение
Название	`unsloth/Devstral-Small-2-24B-Instruct-2512-GGUF`
Label	Devstral Small 2 24B Instruct 2512
Категория	LLM / чат и генерация текста
Runtime/backend	native / llama.cpp / gguf
Вес	2.74 GB catalog size, ~2810 MB disk/cache
Параметры	24B
Минимальные требования	large - мощная локальная машина/GPU; disk >= 2810 MB; memory/VRAM около 5358 MB; CPU возможен; GPU ускоряет
Оптимальные требования	cuda, metal, vulkan, cpu; желательно 7233 MB+ свободной VRAM/RAM и 3512 MB+ disk cache
HF link	unsloth/Devstral-Small-2-24B-Instruct-2512-GGUF
Доступные quantizations	`fp16`, `fp32`, `q2`, `q3`, `q4`, `q5`, `q6`, `q8`
Краткое описание	Native GGUF chat model for llama.cpp.
Best in	`chat`, `local-assistant`

Mistral Small 24B Instruct 2501

Поле	Значение
Название	`MaziyarPanahi/Mistral-Small-24B-Instruct-2501-GGUF`
Label	Mistral Small 24B Instruct 2501
Категория	LLM / чат и генерация текста
Runtime/backend	native / llama.cpp / gguf
Вес	2.74 GB catalog size, ~2810 MB disk/cache
Параметры	24B
Минимальные требования	large - мощная локальная машина/GPU; disk >= 2810 MB; memory/VRAM около 5358 MB; CPU возможен; GPU ускоряет
Оптимальные требования	cuda, metal, vulkan, cpu; желательно 7233 MB+ свободной VRAM/RAM и 3512 MB+ disk cache
HF link	MaziyarPanahi/Mistral-Small-24B-Instruct-2501-GGUF
Доступные quantizations	`fp16`, `fp32`, `q2`, `q3`, `q4`, `q5`, `q6`, `q8`
Краткое описание	Native GGUF chat model for llama.cpp.
Best in	`chat`, `local-assistant`

mistral small 3.1 24b instruct 2503 hf

Поле	Значение
Название	`MaziyarPanahi/mistral-small-3.1-24b-instruct-2503-hf-GGUF`
Label	mistral small 3.1 24b instruct 2503 hf
Категория	LLM / чат и генерация текста
Runtime/backend	native / llama.cpp / gguf
Вес	2.74 GB catalog size, ~2810 MB disk/cache
Параметры	24B
Минимальные требования	large - мощная локальная машина/GPU; disk >= 2810 MB; memory/VRAM около 5358 MB; CPU возможен; GPU ускоряет
Оптимальные требования	cuda, metal, vulkan, cpu; желательно 7233 MB+ свободной VRAM/RAM и 3512 MB+ disk cache
HF link	MaziyarPanahi/mistral-small-3.1-24b-instruct-2503-hf-GGUF
Доступные quantizations	`fp16`, `fp32`, `q2`, `q3`, `q4`, `q5`, `q6`, `q8`
Краткое описание	Native GGUF chat model for llama.cpp.
Best in	`chat`, `local-assistant`

Qwen3 30B A3B Instruct 2507

Поле	Значение
Название	`unsloth/Qwen3-30B-A3B-Instruct-2507-GGUF`
Label	Qwen3 30B A3B Instruct 2507
Категория	LLM / чат и генерация текста
Runtime/backend	native / llama.cpp / gguf
Вес	3.55 GB catalog size, ~3639 MB disk/cache
Параметры	30B
Минимальные требования	large - мощная локальная машина/GPU; disk >= 3639 MB; memory/VRAM около 6850 MB; CPU возможен; GPU ускоряет
Оптимальные требования	cuda, metal, vulkan, cpu; желательно 9247 MB+ свободной VRAM/RAM и 4548 MB+ disk cache
HF link	unsloth/Qwen3-30B-A3B-Instruct-2507-GGUF
Доступные quantizations	`fp16`, `fp32`, `q2`, `q3`, `q4`, `q5`, `q6`, `q8`
Краткое описание	Native GGUF reasoning model for llama.cpp.
Best in	`reasoning`, `agents`, `chat`, `local-assistant`

Qwen3 30B A3B Instruct 2507

Поле	Значение
Название	`MaziyarPanahi/Qwen3-30B-A3B-Instruct-2507-GGUF`
Label	Qwen3 30B A3B Instruct 2507
Категория	LLM / чат и генерация текста
Runtime/backend	native / llama.cpp / gguf
Вес	3.55 GB catalog size, ~3639 MB disk/cache
Параметры	30B
Минимальные требования	large - мощная локальная машина/GPU; disk >= 3639 MB; memory/VRAM около 6850 MB; CPU возможен; GPU ускоряет
Оптимальные требования	cuda, metal, vulkan, cpu; желательно 9247 MB+ свободной VRAM/RAM и 4548 MB+ disk cache
HF link	MaziyarPanahi/Qwen3-30B-A3B-Instruct-2507-GGUF
Доступные quantizations	`fp16`, `fp32`, `q2`, `q3`, `q4`, `q5`, `q6`, `q8`
Краткое описание	Native GGUF reasoning model for llama.cpp.
Best in	`reasoning`, `agents`, `chat`, `local-assistant`

Qwen3 Coder 30B A3B Instruct

Поле	Значение
Название	`unsloth/Qwen3-Coder-30B-A3B-Instruct-GGUF`
Label	Qwen3 Coder 30B A3B Instruct
Категория	LLM / чат и генерация текста
Runtime/backend	native / llama.cpp / gguf
Вес	3.55 GB catalog size, ~3639 MB disk/cache
Параметры	30B
Минимальные требования	large - мощная локальная машина/GPU; disk >= 3639 MB; memory/VRAM около 6850 MB; CPU возможен; GPU ускоряет
Оптимальные требования	cuda, metal, vulkan, cpu; желательно 9247 MB+ свободной VRAM/RAM и 4548 MB+ disk cache
HF link	unsloth/Qwen3-Coder-30B-A3B-Instruct-GGUF
Доступные quantizations	`fp16`, `fp32`, `q2`, `q3`, `q4`, `q5`, `q6`, `q8`
Краткое описание	Native GGUF code model for llama.cpp.
Best in	`code`, `agents`, `chat`, `local-assistant`

Qwen3 Coder 30B A3B Instruct

Поле	Значение
Название	`lmstudio-community/Qwen3-Coder-30B-A3B-Instruct-GGUF`
Label	Qwen3 Coder 30B A3B Instruct
Категория	LLM / чат и генерация текста
Runtime/backend	native / llama.cpp / gguf
Вес	3.55 GB catalog size, ~3639 MB disk/cache
Параметры	30B
Минимальные требования	large - мощная локальная машина/GPU; disk >= 3639 MB; memory/VRAM около 6850 MB; CPU возможен; GPU ускоряет
Оптимальные требования	cuda, metal, vulkan, cpu; желательно 9247 MB+ свободной VRAM/RAM и 4548 MB+ disk cache
HF link	lmstudio-community/Qwen3-Coder-30B-A3B-Instruct-GGUF
Доступные quantizations	`fp16`, `fp32`, `q2`, `q3`, `q4`, `q5`, `q6`, `q8`
Краткое описание	Native GGUF code model for llama.cpp.
Best in	`code`, `agents`, `chat`, `local-assistant`

Qwen2.5 32B Instruct

Поле	Значение
Название	`Qwen/Qwen2.5-32B-Instruct-GGUF`
Label	Qwen2.5 32B Instruct
Категория	LLM / чат и генерация текста
Runtime/backend	native / llama.cpp / gguf
Вес	3.81 GB catalog size, ~3905 MB disk/cache
Параметры	32B
Минимальные требования	large - мощная локальная машина/GPU; disk >= 3905 MB; memory/VRAM около 7329 MB; CPU возможен; GPU ускоряет
Оптимальные требования	cuda, metal, vulkan, cpu; желательно 9894 MB+ свободной VRAM/RAM и 4881 MB+ disk cache
HF link	Qwen/Qwen2.5-32B-Instruct-GGUF
Доступные quantizations	`fp16`, `fp32`, `q2`, `q3`, `q4`, `q5`, `q6`, `q8`
Краткое описание	Native GGUF chat model for llama.cpp.
Best in	`chat`, `local-assistant`

Qwen2.5 Coder 32B Instruct

Поле	Значение
Название	`Qwen/Qwen2.5-Coder-32B-Instruct-GGUF`
Label	Qwen2.5 Coder 32B Instruct
Категория	LLM / чат и генерация текста
Runtime/backend	native / llama.cpp / gguf
Вес	3.81 GB catalog size, ~3905 MB disk/cache
Параметры	32B
Минимальные требования	large - мощная локальная машина/GPU; disk >= 3905 MB; memory/VRAM около 7329 MB; CPU возможен; GPU ускоряет
Оптимальные требования	cuda, metal, vulkan, cpu; желательно 9894 MB+ свободной VRAM/RAM и 4881 MB+ disk cache
HF link	Qwen/Qwen2.5-Coder-32B-Instruct-GGUF
Доступные quantizations	`fp16`, `fp32`, `q2`, `q3`, `q4`, `q5`, `q6`, `q8`
Краткое описание	Native GGUF code model for llama.cpp.
Best in	`code`, `agents`, `chat`, `local-assistant`

Qwen2.5 Coder 32B Instruct

Поле	Значение
Название	`bartowski/Qwen2.5-Coder-32B-Instruct-GGUF`
Label	Qwen2.5 Coder 32B Instruct
Категория	LLM / чат и генерация текста
Runtime/backend	native / llama.cpp / gguf
Вес	3.81 GB catalog size, ~3905 MB disk/cache
Параметры	32B
Минимальные требования	large - мощная локальная машина/GPU; disk >= 3905 MB; memory/VRAM около 7329 MB; CPU возможен; GPU ускоряет
Оптимальные требования	cuda, metal, vulkan, cpu; желательно 9894 MB+ свободной VRAM/RAM и 4881 MB+ disk cache
HF link	bartowski/Qwen2.5-Coder-32B-Instruct-GGUF
Доступные quantizations	`fp16`, `fp32`, `q2`, `q3`, `q4`, `q5`, `q6`, `q8`
Краткое описание	Native GGUF code model for llama.cpp.
Best in	`code`, `agents`, `chat`, `local-assistant`

Llama 3.3 70B Instruct

Поле	Значение
Название	`MaziyarPanahi/Llama-3.3-70B-Instruct-GGUF`
Label	Llama 3.3 70B Instruct
Категория	LLM / чат и генерация текста
Runtime/backend	native / llama.cpp / gguf
Вес	8.21 GB catalog size, ~8410 MB disk/cache
Параметры	70B
Минимальные требования	large - мощная локальная машина/GPU; disk >= 8410 MB; memory/VRAM около 15438 MB; CPU возможен; GPU ускоряет
Оптимальные требования	cuda, metal, vulkan, cpu; желательно 20841 MB+ свободной VRAM/RAM и 10512 MB+ disk cache
HF link	MaziyarPanahi/Llama-3.3-70B-Instruct-GGUF
Доступные quantizations	`fp16`, `fp32`, `q2`, `q3`, `q4`, `q5`, `q6`, `q8`
Краткое описание	Native GGUF chat model for llama.cpp.
Best in	`chat`, `local-assistant`

Llama 3.3 70B Instruct

Поле	Значение
Название	`unsloth/Llama-3.3-70B-Instruct-GGUF`
Label	Llama 3.3 70B Instruct
Категория	LLM / чат и генерация текста
Runtime/backend	native / llama.cpp / gguf
Вес	8.21 GB catalog size, ~8410 MB disk/cache
Параметры	70B
Минимальные требования	large - мощная локальная машина/GPU; disk >= 8410 MB; memory/VRAM около 15438 MB; CPU возможен; GPU ускоряет
Оптимальные требования	cuda, metal, vulkan, cpu; желательно 20841 MB+ свободной VRAM/RAM и 10512 MB+ disk cache
HF link	unsloth/Llama-3.3-70B-Instruct-GGUF
Доступные quantizations	`fp16`, `fp32`, `q2`, `q3`, `q4`, `q5`, `q6`, `q8`
Краткое описание	Native GGUF chat model for llama.cpp.
Best in	`chat`, `local-assistant`

Meta Llama 3.1 70B Instruct

Поле	Значение
Название	`MaziyarPanahi/Meta-Llama-3.1-70B-Instruct-GGUF`
Label	Meta Llama 3.1 70B Instruct
Категория	LLM / чат и генерация текста
Runtime/backend	native / llama.cpp / gguf
Вес	8.21 GB catalog size, ~8410 MB disk/cache
Параметры	70B
Минимальные требования	large - мощная локальная машина/GPU; disk >= 8410 MB; memory/VRAM около 15438 MB; CPU возможен; GPU ускоряет
Оптимальные требования	cuda, metal, vulkan, cpu; желательно 20841 MB+ свободной VRAM/RAM и 10512 MB+ disk cache
HF link	MaziyarPanahi/Meta-Llama-3.1-70B-Instruct-GGUF
Доступные quantizations	`fp16`, `fp32`, `q2`, `q3`, `q4`, `q5`, `q6`, `q8`
Краткое описание	Native GGUF chat model for llama.cpp.
Best in	`chat`, `local-assistant`

Mistral Large Instruct 2411

Поле	Значение
Название	`MaziyarPanahi/Mistral-Large-Instruct-2411-GGUF`
Label	Mistral Large Instruct 2411
Категория	LLM / чат и генерация текста
Runtime/backend	native / llama.cpp / gguf
Вес	14.27 GB catalog size, ~14616 MB disk/cache
Параметры	не указаны
Минимальные требования	large - мощная локальная машина/GPU; disk >= 14616 MB; memory/VRAM около 26608 MB; CPU возможен; GPU ускоряет
Оптимальные требования	cuda, metal, vulkan, cpu; желательно 35920 MB+ свободной VRAM/RAM и 18270 MB+ disk cache
HF link	MaziyarPanahi/Mistral-Large-Instruct-2411-GGUF
Доступные quantizations	`fp16`, `fp32`, `q2`, `q3`, `q4`, `q5`, `q6`, `q8`
Краткое описание	Native GGUF chat model for llama.cpp.
Best in	`chat`, `local-assistant`

Meta Llama 3.1 405B Instruct

Поле	Значение
Название	`MaziyarPanahi/Meta-Llama-3.1-405B-Instruct-GGUF`
Label	Meta Llama 3.1 405B Instruct
Категория	LLM / чат и генерация текста
Runtime/backend	native / llama.cpp / gguf
Вес	47.74 GB catalog size, ~48885 MB disk/cache
Параметры	405B
Минимальные требования	large - мощная локальная машина/GPU; disk >= 48885 MB; memory/VRAM около 88293 MB; CPU возможен; GPU ускоряет
Оптимальные требования	cuda, metal, vulkan, cpu; желательно 119195 MB+ свободной VRAM/RAM и 61106 MB+ disk cache
HF link	MaziyarPanahi/Meta-Llama-3.1-405B-Instruct-GGUF
Доступные quantizations	`fp16`, `fp32`, `q2`, `q3`, `q4`, `q5`, `q6`, `q8`
Краткое описание	Native GGUF chat model for llama.cpp.
Best in	`chat`, `local-assistant`

Models Native LLM large

Models Native LLM large

Vikhr Nemo 12B Instruct R 21 09 24 Q8 0

Qwen2.5 14B Instruct

Qwen2.5 14B Instruct

Qwen2.5 Coder 14B Instruct

Qwen2.5 Coder 14B Instruct

Devstral Small 2 24B Instruct 2512

Mistral Small 24B Instruct 2501

mistral small 3.1 24b instruct 2503 hf

Qwen3 30B A3B Instruct 2507

Qwen3 30B A3B Instruct 2507

Qwen3 Coder 30B A3B Instruct

Qwen3 Coder 30B A3B Instruct

Qwen2.5 32B Instruct

Qwen2.5 Coder 32B Instruct

Qwen2.5 Coder 32B Instruct

Llama 3.3 70B Instruct

Llama 3.3 70B Instruct

Meta Llama 3.1 70B Instruct

Mistral Large Instruct 2411

Meta Llama 3.1 405B Instruct

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!