Models Native LLM medium

Режим: Native. Категория: LLM / чат и генерация текста.

Всего моделей: 34.

Llama 3.2 3B Instruct

Поле	Значение
Название	`bartowski/Llama-3.2-3B-Instruct-GGUF`
Label	Llama 3.2 3B Instruct
Категория	LLM / чат и генерация текста
Runtime/backend	native / llama.cpp / gguf
Вес	0.37 GB catalog size, ~382 MB disk/cache
Параметры	3B
Минимальные требования	medium - рабочая станция или заметный GPU; disk >= 382 MB; memory/VRAM около 987 MB; CPU возможен; GPU ускоряет
Оптимальные требования	cuda, metal, vulkan, cpu; желательно 1499 MB+ свободной VRAM/RAM и 894 MB+ disk cache
HF link	bartowski/Llama-3.2-3B-Instruct-GGUF
Доступные quantizations	`fp16`, `fp32`, `q2`, `q3`, `q4`, `q5`, `q6`, `q8`
Краткое описание	Native GGUF chat model for llama.cpp.
Best in	`chat`, `local-assistant`

Llama 3.2 3B Instruct

Поле	Значение
Название	`MaziyarPanahi/Llama-3.2-3B-Instruct-GGUF`
Label	Llama 3.2 3B Instruct
Категория	LLM / чат и генерация текста
Runtime/backend	native / llama.cpp / gguf
Вес	0.37 GB catalog size, ~382 MB disk/cache
Параметры	3B
Минимальные требования	medium - рабочая станция или заметный GPU; disk >= 382 MB; memory/VRAM около 987 MB; CPU возможен; GPU ускоряет
Оптимальные требования	cuda, metal, vulkan, cpu; желательно 1499 MB+ свободной VRAM/RAM и 894 MB+ disk cache
HF link	MaziyarPanahi/Llama-3.2-3B-Instruct-GGUF
Доступные quantizations	`fp16`, `fp32`, `q2`, `q3`, `q4`, `q5`, `q6`, `q8`
Краткое описание	Native GGUF chat model for llama.cpp.
Best in	`chat`, `local-assistant`

Llama 3.2 3B Instruct

Поле	Значение
Название	`unsloth/Llama-3.2-3B-Instruct-GGUF`
Label	Llama 3.2 3B Instruct
Категория	LLM / чат и генерация текста
Runtime/backend	native / llama.cpp / gguf
Вес	0.37 GB catalog size, ~382 MB disk/cache
Параметры	3B
Минимальные требования	medium - рабочая станция или заметный GPU; disk >= 382 MB; memory/VRAM около 987 MB; CPU возможен; GPU ускоряет
Оптимальные требования	cuda, metal, vulkan, cpu; желательно 1499 MB+ свободной VRAM/RAM и 894 MB+ disk cache
HF link	unsloth/Llama-3.2-3B-Instruct-GGUF
Доступные quantizations	`fp16`, `fp32`, `q2`, `q3`, `q4`, `q5`, `q6`, `q8`
Краткое описание	Native GGUF chat model for llama.cpp.
Best in	`chat`, `local-assistant`

Qwen2.5 3B Instruct

Поле	Значение
Название	`Qwen/Qwen2.5-3B-Instruct-GGUF`
Label	Qwen2.5 3B Instruct
Категория	LLM / чат и генерация текста
Runtime/backend	native / llama.cpp / gguf
Вес	0.39 GB catalog size, ~404 MB disk/cache
Параметры	3B
Минимальные требования	medium - рабочая станция или заметный GPU; disk >= 404 MB; memory/VRAM около 1027 MB; CPU возможен; GPU ускоряет
Оптимальные требования	cuda, metal, vulkan, cpu; желательно 1539 MB+ свободной VRAM/RAM и 916 MB+ disk cache
HF link	Qwen/Qwen2.5-3B-Instruct-GGUF
Доступные quantizations	`fp16`, `fp32`, `q2`, `q3`, `q4`, `q5`, `q6`, `q8`
Краткое описание	Native GGUF chat model for llama.cpp.
Best in	`chat`, `local-assistant`

Qwen2.5 Coder 3B Instruct

Поле	Значение
Название	`Qwen/Qwen2.5-Coder-3B-Instruct-GGUF`
Label	Qwen2.5 Coder 3B Instruct
Категория	LLM / чат и генерация текста
Runtime/backend	native / llama.cpp / gguf
Вес	0.39 GB catalog size, ~404 MB disk/cache
Параметры	3B
Минимальные требования	medium - рабочая станция или заметный GPU; disk >= 404 MB; memory/VRAM около 1027 MB; CPU возможен; GPU ускоряет
Оптимальные требования	cuda, metal, vulkan, cpu; желательно 1539 MB+ свободной VRAM/RAM и 916 MB+ disk cache
HF link	Qwen/Qwen2.5-Coder-3B-Instruct-GGUF
Доступные quantizations	`fp16`, `fp32`, `q2`, `q3`, `q4`, `q5`, `q6`, `q8`
Краткое описание	Native GGUF code model for llama.cpp.
Best in	`code`, `agents`, `chat`, `local-assistant`

Ministral 3 3B Instruct 2512

Поле	Значение
Название	`lmstudio-community/Ministral-3-3B-Instruct-2512-GGUF`
Label	Ministral 3 3B Instruct 2512
Категория	LLM / чат и генерация текста
Runtime/backend	native / llama.cpp / gguf
Вес	0.40 GB catalog size, ~408 MB disk/cache
Параметры	3B
Минимальные требования	medium - рабочая станция или заметный GPU; disk >= 408 MB; memory/VRAM около 1034 MB; CPU возможен; GPU ускоряет
Оптимальные требования	cuda, metal, vulkan, cpu; желательно 1546 MB+ свободной VRAM/RAM и 920 MB+ disk cache
HF link	lmstudio-community/Ministral-3-3B-Instruct-2512-GGUF
Доступные quantizations	`fp16`, `fp32`, `q2`, `q3`, `q4`, `q5`, `q6`, `q8`
Краткое описание	Native GGUF chat model for llama.cpp.
Best in	`chat`, `local-assistant`

Phi 3.5 mini Instruct GGUF

Поле	Значение
Название	`Phi-3.5-mini-instruct-GGUF`
Label	Phi 3.5 mini Instruct GGUF
Категория	LLM / чат и генерация текста
Runtime/backend	native / llama.cpp / gguf
Вес	0.44 GB catalog size, ~455 MB disk/cache
Параметры	3.8B
Минимальные требования	medium - рабочая станция или заметный GPU; disk >= 455 MB; memory/VRAM около 1119 MB; CPU возможен; GPU ускоряет
Оптимальные требования	cuda, metal, vulkan, cpu; желательно 1631 MB+ свободной VRAM/RAM и 967 MB+ disk cache
HF link	bartowski/Phi-3.5-mini-instruct-GGUF
Доступные quantizations	`fp16`, `fp32`, `q2`, `q3`, `q4`, `q5`, `q6`, `q8`
Краткое описание	Native GGUF chat model for llama.cpp.
Best in	`chat`, `local-assistant`

Qwen3 4B Instruct 2507

Поле	Значение
Название	`MaziyarPanahi/Qwen3-4B-Instruct-2507-GGUF`
Label	Qwen3 4B Instruct 2507
Категория	LLM / чат и генерация текста
Runtime/backend	native / llama.cpp / gguf
Вес	0.47 GB catalog size, ~479 MB disk/cache
Параметры	4B
Минимальные требования	medium - рабочая станция или заметный GPU; disk >= 479 MB; memory/VRAM около 1162 MB; CPU возможен; GPU ускоряет
Оптимальные требования	cuda, metal, vulkan, cpu; желательно 1674 MB+ свободной VRAM/RAM и 991 MB+ disk cache
HF link	MaziyarPanahi/Qwen3-4B-Instruct-2507-GGUF
Доступные quantizations	`fp16`, `fp32`, `q2`, `q3`, `q4`, `q5`, `q6`, `q8`
Краткое описание	Native GGUF reasoning model for llama.cpp.
Best in	`reasoning`, `agents`, `chat`, `local-assistant`

Qwen3 4B Instruct 2507

Поле	Значение
Название	`unsloth/Qwen3-4B-Instruct-2507-GGUF`
Label	Qwen3 4B Instruct 2507
Категория	LLM / чат и генерация текста
Runtime/backend	native / llama.cpp / gguf
Вес	0.47 GB catalog size, ~479 MB disk/cache
Параметры	4B
Минимальные требования	medium - рабочая станция или заметный GPU; disk >= 479 MB; memory/VRAM около 1162 MB; CPU возможен; GPU ускоряет
Оптимальные требования	cuda, metal, vulkan, cpu; желательно 1674 MB+ свободной VRAM/RAM и 991 MB+ disk cache
HF link	unsloth/Qwen3-4B-Instruct-2507-GGUF
Доступные quantizations	`fp16`, `fp32`, `q2`, `q3`, `q4`, `q5`, `q6`, `q8`
Краткое описание	Native GGUF reasoning model for llama.cpp.
Best in	`reasoning`, `agents`, `chat`, `local-assistant`

deepseek coder 6.7B instruct

Поле	Значение
Название	`TheBloke/deepseek-coder-6.7B-instruct-GGUF`
Label	deepseek coder 6.7B instruct
Категория	LLM / чат и генерация текста
Runtime/backend	native / llama.cpp / gguf
Вес	0.78 GB catalog size, ~803 MB disk/cache
Параметры	6.7B
Минимальные требования	medium - рабочая станция или заметный GPU; disk >= 803 MB; memory/VRAM около 1745 MB; CPU возможен; GPU ускоряет
Оптимальные требования	cuda, metal, vulkan, cpu; желательно 2355 MB+ свободной VRAM/RAM и 1315 MB+ disk cache
HF link	TheBloke/deepseek-coder-6.7B-instruct-GGUF
Доступные quantizations	`fp16`, `fp32`, `q2`, `q3`, `q4`, `q5`, `q6`, `q8`
Краткое описание	Native GGUF code model for llama.cpp.
Best in	`code`, `agents`, `chat`, `local-assistant`

Mistral 7B Instruct v0.1

Поле	Значение
Название	`TheBloke/Mistral-7B-Instruct-v0.1-GGUF`
Label	Mistral 7B Instruct v0.1
Категория	LLM / чат и генерация текста
Runtime/backend	native / llama.cpp / gguf
Вес	0.84 GB catalog size, ~863 MB disk/cache
Параметры	7B
Минимальные требования	medium - рабочая станция или заметный GPU; disk >= 863 MB; memory/VRAM около 1853 MB; CPU возможен; GPU ускоряет
Оптимальные требования	cuda, metal, vulkan, cpu; желательно 2501 MB+ свободной VRAM/RAM и 1375 MB+ disk cache
HF link	TheBloke/Mistral-7B-Instruct-v0.1-GGUF
Доступные quantizations	`fp16`, `fp32`, `q2`, `q3`, `q4`, `q5`, `q6`, `q8`
Краткое описание	Native GGUF chat model for llama.cpp.
Best in	`chat`, `local-assistant`

Mistral 7B Instruct v0.2

Поле	Значение
Название	`TheBloke/Mistral-7B-Instruct-v0.2-GGUF`
Label	Mistral 7B Instruct v0.2
Категория	LLM / чат и генерация текста
Runtime/backend	native / llama.cpp / gguf
Вес	0.84 GB catalog size, ~863 MB disk/cache
Параметры	7B
Минимальные требования	medium - рабочая станция или заметный GPU; disk >= 863 MB; memory/VRAM около 1853 MB; CPU возможен; GPU ускоряет
Оптимальные требования	cuda, metal, vulkan, cpu; желательно 2501 MB+ свободной VRAM/RAM и 1375 MB+ disk cache
HF link	TheBloke/Mistral-7B-Instruct-v0.2-GGUF
Доступные quantizations	`fp16`, `fp32`, `q2`, `q3`, `q4`, `q5`, `q6`, `q8`
Краткое описание	Native GGUF chat model for llama.cpp.
Best in	`chat`, `local-assistant`

Mistral 7B Instruct v0.3

Поле	Значение
Название	`MaziyarPanahi/Mistral-7B-Instruct-v0.3-GGUF`
Label	Mistral 7B Instruct v0.3
Категория	LLM / чат и генерация текста
Runtime/backend	native / llama.cpp / gguf
Вес	0.84 GB catalog size, ~864 MB disk/cache
Параметры	7B
Минимальные требования	medium - рабочая станция или заметный GPU; disk >= 864 MB; memory/VRAM около 1855 MB; CPU возможен; GPU ускоряет
Оптимальные требования	cuda, metal, vulkan, cpu; желательно 2504 MB+ свободной VRAM/RAM и 1376 MB+ disk cache
HF link	MaziyarPanahi/Mistral-7B-Instruct-v0.3-GGUF
Доступные quantizations	`fp16`, `fp32`, `q2`, `q3`, `q4`, `q5`, `q6`, `q8`
Краткое описание	Native GGUF chat model for llama.cpp.
Best in	`chat`, `local-assistant`

Qwen2 7B Instruct

Поле	Значение
Название	`MaziyarPanahi/Qwen2-7B-Instruct-GGUF`
Label	Qwen2 7B Instruct
Категория	LLM / чат и генерация текста
Runtime/backend	native / llama.cpp / gguf
Вес	0.89 GB catalog size, ~907 MB disk/cache
Параметры	7B
Минимальные требования	medium - рабочая станция или заметный GPU; disk >= 907 MB; memory/VRAM около 1932 MB; CPU возможен; GPU ускоряет
Оптимальные требования	cuda, metal, vulkan, cpu; желательно 2608 MB+ свободной VRAM/RAM и 1419 MB+ disk cache
HF link	MaziyarPanahi/Qwen2-7B-Instruct-GGUF
Доступные quantizations	`fp16`, `fp32`, `q2`, `q3`, `q4`, `q5`, `q6`, `q8`
Краткое описание	Native GGUF chat model for llama.cpp.
Best in	`chat`, `local-assistant`

Qwen2.5 7B Instruct

Поле	Значение
Название	`Qwen/Qwen2.5-7B-Instruct-GGUF`
Label	Qwen2.5 7B Instruct
Категория	LLM / чат и генерация текста
Runtime/backend	native / llama.cpp / gguf
Вес	0.89 GB catalog size, ~907 MB disk/cache
Параметры	7B
Минимальные требования	medium - рабочая станция или заметный GPU; disk >= 907 MB; memory/VRAM около 1932 MB; CPU возможен; GPU ускоряет
Оптимальные требования	cuda, metal, vulkan, cpu; желательно 2608 MB+ свободной VRAM/RAM и 1419 MB+ disk cache
HF link	Qwen/Qwen2.5-7B-Instruct-GGUF
Доступные quantizations	`fp16`, `fp32`, `q2`, `q3`, `q4`, `q5`, `q6`, `q8`
Краткое описание	Native GGUF chat model for llama.cpp.
Best in	`chat`, `local-assistant`

Qwen2.5 7B Instruct

Поле	Значение
Название	`MaziyarPanahi/Qwen2.5-7B-Instruct-GGUF`
Label	Qwen2.5 7B Instruct
Категория	LLM / чат и генерация текста
Runtime/backend	native / llama.cpp / gguf
Вес	0.89 GB catalog size, ~907 MB disk/cache
Параметры	7B
Минимальные требования	medium - рабочая станция или заметный GPU; disk >= 907 MB; memory/VRAM около 1932 MB; CPU возможен; GPU ускоряет
Оптимальные требования	cuda, metal, vulkan, cpu; желательно 2608 MB+ свободной VRAM/RAM и 1419 MB+ disk cache
HF link	MaziyarPanahi/Qwen2.5-7B-Instruct-GGUF
Доступные quantizations	`fp16`, `fp32`, `q2`, `q3`, `q4`, `q5`, `q6`, `q8`
Краткое описание	Native GGUF chat model for llama.cpp.
Best in	`chat`, `local-assistant`

Qwen2.5 7B Instruct

Поле	Значение
Название	`bartowski/Qwen2.5-7B-Instruct-GGUF`
Label	Qwen2.5 7B Instruct
Категория	LLM / чат и генерация текста
Runtime/backend	native / llama.cpp / gguf
Вес	0.89 GB catalog size, ~907 MB disk/cache
Параметры	7B
Минимальные требования	medium - рабочая станция или заметный GPU; disk >= 907 MB; memory/VRAM около 1932 MB; CPU возможен; GPU ускоряет
Оптимальные требования	cuda, metal, vulkan, cpu; желательно 2608 MB+ свободной VRAM/RAM и 1419 MB+ disk cache
HF link	bartowski/Qwen2.5-7B-Instruct-GGUF
Доступные quantizations	`fp16`, `fp32`, `q2`, `q3`, `q4`, `q5`, `q6`, `q8`
Краткое описание	Native GGUF chat model for llama.cpp.
Best in	`chat`, `local-assistant`

Qwen2.5 Coder 7B Instruct

Поле	Значение
Название	`Qwen/Qwen2.5-Coder-7B-Instruct-GGUF`
Label	Qwen2.5 Coder 7B Instruct
Категория	LLM / чат и генерация текста
Runtime/backend	native / llama.cpp / gguf
Вес	0.89 GB catalog size, ~907 MB disk/cache
Параметры	7B
Минимальные требования	medium - рабочая станция или заметный GPU; disk >= 907 MB; memory/VRAM около 1932 MB; CPU возможен; GPU ускоряет
Оптимальные требования	cuda, metal, vulkan, cpu; желательно 2608 MB+ свободной VRAM/RAM и 1419 MB+ disk cache
HF link	Qwen/Qwen2.5-Coder-7B-Instruct-GGUF
Доступные quantizations	`fp16`, `fp32`, `q2`, `q3`, `q4`, `q5`, `q6`, `q8`
Краткое описание	Native GGUF code model for llama.cpp.
Best in	`code`, `agents`, `chat`, `local-assistant`

Qwen2.5 Coder 7B Instruct

Поле	Значение
Название	`bartowski/Qwen2.5-Coder-7B-Instruct-GGUF`
Label	Qwen2.5 Coder 7B Instruct
Категория	LLM / чат и генерация текста
Runtime/backend	native / llama.cpp / gguf
Вес	0.89 GB catalog size, ~907 MB disk/cache
Параметры	7B
Минимальные требования	medium - рабочая станция или заметный GPU; disk >= 907 MB; memory/VRAM около 1932 MB; CPU возможен; GPU ускоряет
Оптимальные требования	cuda, metal, vulkan, cpu; желательно 2608 MB+ свободной VRAM/RAM и 1419 MB+ disk cache
HF link	bartowski/Qwen2.5-Coder-7B-Instruct-GGUF
Доступные quantizations	`fp16`, `fp32`, `q2`, `q3`, `q4`, `q5`, `q6`, `q8`
Краткое описание	Native GGUF code model for llama.cpp.
Best in	`code`, `agents`, `chat`, `local-assistant`

Llama 3 8B Instruct 32k v0.1

Поле	Значение
Название	`MaziyarPanahi/Llama-3-8B-Instruct-32k-v0.1-GGUF`
Label	Llama 3 8B Instruct 32k v0.1
Категория	LLM / чат и генерация текста
Runtime/backend	native / llama.cpp / gguf
Вес	0.93 GB catalog size, ~957 MB disk/cache
Параметры	8B
Минимальные требования	medium - рабочая станция или заметный GPU; disk >= 957 MB; memory/VRAM около 2022 MB; CPU возможен; GPU ускоряет
Оптимальные требования	cuda, metal, vulkan, cpu; желательно 2729 MB+ свободной VRAM/RAM и 1469 MB+ disk cache
HF link	MaziyarPanahi/Llama-3-8B-Instruct-32k-v0.1-GGUF
Доступные quantizations	`fp16`, `fp32`, `q2`, `q3`, `q4`, `q5`, `q6`, `q8`
Краткое описание	Native GGUF chat model for llama.cpp.
Best in	`chat`, `local-assistant`

Llama 3 8B Instruct 64k

Поле	Значение
Название	`MaziyarPanahi/Llama-3-8B-Instruct-64k-GGUF`
Label	Llama 3 8B Instruct 64k
Категория	LLM / чат и генерация текста
Runtime/backend	native / llama.cpp / gguf
Вес	0.93 GB catalog size, ~957 MB disk/cache
Параметры	8B
Минимальные требования	medium - рабочая станция или заметный GPU; disk >= 957 MB; memory/VRAM около 2022 MB; CPU возможен; GPU ускоряет
Оптимальные требования	cuda, metal, vulkan, cpu; желательно 2729 MB+ свободной VRAM/RAM и 1469 MB+ disk cache
HF link	MaziyarPanahi/Llama-3-8B-Instruct-64k-GGUF
Доступные quantizations	`fp16`, `fp32`, `q2`, `q3`, `q4`, `q5`, `q6`, `q8`
Краткое описание	Native GGUF chat model for llama.cpp.
Best in	`chat`, `local-assistant`

Llama3.3 8B Instruct Thinking Heretic Uncensored Claude 4.5 Opus High Reasoning i1

Поле	Значение
Название	`mradermacher/Llama3.3-8B-Instruct-Thinking-Heretic-Uncensored-Claude-4.5-Opus-High-Reasoning-i1-GGUF`
Label	Llama3.3 8B Instruct Thinking Heretic Uncensored Claude 4.5 Opus High Reasoning i1
Категория	LLM / чат и генерация текста
Runtime/backend	native / llama.cpp / gguf
Вес	0.93 GB catalog size, ~957 MB disk/cache
Параметры	8B
Минимальные требования	medium - рабочая станция или заметный GPU; disk >= 957 MB; memory/VRAM около 2022 MB; CPU возможен; GPU ускоряет
Оптимальные требования	cuda, metal, vulkan, cpu; желательно 2729 MB+ свободной VRAM/RAM и 1469 MB+ disk cache
HF link	mradermacher/Llama3.3-8B-Instruct-Thinking-Heretic-Uncensored-Claude-4.5-Opus-High-Reasoning-i1-GGUF
Доступные quantizations	`fp16`, `fp32`, `q2`, `q3`, `q4`, `q5`, `q6`, `q8`
Краткое описание	Native GGUF reasoning model for llama.cpp.
Best in	`reasoning`, `agents`, `chat`, `local-assistant`

Meta Llama 3 8B Instruct

Поле	Значение
Название	`MaziyarPanahi/Meta-Llama-3-8B-Instruct-GGUF`
Label	Meta Llama 3 8B Instruct
Категория	LLM / чат и генерация текста
Runtime/backend	native / llama.cpp / gguf
Вес	0.93 GB catalog size, ~957 MB disk/cache
Параметры	8B
Минимальные требования	medium - рабочая станция или заметный GPU; disk >= 957 MB; memory/VRAM около 2022 MB; CPU возможен; GPU ускоряет
Оптимальные требования	cuda, metal, vulkan, cpu; желательно 2729 MB+ свободной VRAM/RAM и 1469 MB+ disk cache
HF link	MaziyarPanahi/Meta-Llama-3-8B-Instruct-GGUF
Доступные quantizations	`fp16`, `fp32`, `q2`, `q3`, `q4`, `q5`, `q6`, `q8`
Краткое описание	Native GGUF chat model for llama.cpp.
Best in	`chat`, `local-assistant`

Meta Llama 3 8B Instruct

Поле	Значение
Название	`lmstudio-community/Meta-Llama-3-8B-Instruct-GGUF`
Label	Meta Llama 3 8B Instruct
Категория	LLM / чат и генерация текста
Runtime/backend	native / llama.cpp / gguf
Вес	0.93 GB catalog size, ~957 MB disk/cache
Параметры	8B
Минимальные требования	medium - рабочая станция или заметный GPU; disk >= 957 MB; memory/VRAM около 2022 MB; CPU возможен; GPU ускоряет
Оптимальные требования	cuda, metal, vulkan, cpu; желательно 2729 MB+ свободной VRAM/RAM и 1469 MB+ disk cache
HF link	lmstudio-community/Meta-Llama-3-8B-Instruct-GGUF
Доступные quantizations	`fp16`, `fp32`, `q2`, `q3`, `q4`, `q5`, `q6`, `q8`
Краткое описание	Native GGUF chat model for llama.cpp.
Best in	`chat`, `local-assistant`

Meta Llama 3.1 8B Instruct

Поле	Значение
Название	`bartowski/Meta-Llama-3.1-8B-Instruct-GGUF`
Label	Meta Llama 3.1 8B Instruct
Категория	LLM / чат и генерация текста
Runtime/backend	native / llama.cpp / gguf
Вес	0.93 GB catalog size, ~957 MB disk/cache
Параметры	8B
Минимальные требования	medium - рабочая станция или заметный GPU; disk >= 957 MB; memory/VRAM около 2022 MB; CPU возможен; GPU ускоряет
Оптимальные требования	cuda, metal, vulkan, cpu; желательно 2729 MB+ свободной VRAM/RAM и 1469 MB+ disk cache
HF link	bartowski/Meta-Llama-3.1-8B-Instruct-GGUF
Доступные quantizations	`fp16`, `fp32`, `q2`, `q3`, `q4`, `q5`, `q6`, `q8`
Краткое описание	Native GGUF chat model for llama.cpp.
Best in	`chat`, `local-assistant`

Meta Llama 3.1 8B Instruct

Поле	Значение
Название	`MaziyarPanahi/Meta-Llama-3.1-8B-Instruct-GGUF`
Label	Meta Llama 3.1 8B Instruct
Категория	LLM / чат и генерация текста
Runtime/backend	native / llama.cpp / gguf
Вес	0.93 GB catalog size, ~957 MB disk/cache
Параметры	8B
Минимальные требования	medium - рабочая станция или заметный GPU; disk >= 957 MB; memory/VRAM около 2022 MB; CPU возможен; GPU ускоряет
Оптимальные требования	cuda, metal, vulkan, cpu; желательно 2729 MB+ свободной VRAM/RAM и 1469 MB+ disk cache
HF link	MaziyarPanahi/Meta-Llama-3.1-8B-Instruct-GGUF
Доступные quantizations	`fp16`, `fp32`, `q2`, `q3`, `q4`, `q5`, `q6`, `q8`
Краткое описание	Native GGUF chat model for llama.cpp.
Best in	`chat`, `local-assistant`

Meta Llama 3.1 8B Instruct

Поле	Значение
Название	`lmstudio-community/Meta-Llama-3.1-8B-Instruct-GGUF`
Label	Meta Llama 3.1 8B Instruct
Категория	LLM / чат и генерация текста
Runtime/backend	native / llama.cpp / gguf
Вес	0.93 GB catalog size, ~957 MB disk/cache
Параметры	8B
Минимальные требования	medium - рабочая станция или заметный GPU; disk >= 957 MB; memory/VRAM около 2022 MB; CPU возможен; GPU ускоряет
Оптимальные требования	cuda, metal, vulkan, cpu; желательно 2729 MB+ свободной VRAM/RAM и 1469 MB+ disk cache
HF link	lmstudio-community/Meta-Llama-3.1-8B-Instruct-GGUF
Доступные quantizations	`fp16`, `fp32`, `q2`, `q3`, `q4`, `q5`, `q6`, `q8`
Краткое описание	Native GGUF chat model for llama.cpp.
Best in	`chat`, `local-assistant`

Meta Llama 3.1 8B Instruct

Поле	Значение
Название	`QuantFactory/Meta-Llama-3.1-8B-Instruct-GGUF`
Label	Meta Llama 3.1 8B Instruct
Категория	LLM / чат и генерация текста
Runtime/backend	native / llama.cpp / gguf
Вес	0.93 GB catalog size, ~957 MB disk/cache
Параметры	8B
Минимальные требования	medium - рабочая станция или заметный GPU; disk >= 957 MB; memory/VRAM около 2022 MB; CPU возможен; GPU ускоряет
Оптимальные требования	cuda, metal, vulkan, cpu; желательно 2729 MB+ свободной VRAM/RAM и 1469 MB+ disk cache
HF link	QuantFactory/Meta-Llama-3.1-8B-Instruct-GGUF
Доступные quantizations	`fp16`, `fp32`, `q2`, `q3`, `q4`, `q5`, `q6`, `q8`
Краткое описание	Native GGUF chat model for llama.cpp.
Best in	`chat`, `local-assistant`

Meta Llama 3.1 8B Instruct

Поле	Значение
Название	`SanctumAI/Meta-Llama-3.1-8B-Instruct-GGUF`
Label	Meta Llama 3.1 8B Instruct
Категория	LLM / чат и генерация текста
Runtime/backend	native / llama.cpp / gguf
Вес	0.93 GB catalog size, ~957 MB disk/cache
Параметры	8B
Минимальные требования	medium - рабочая станция или заметный GPU; disk >= 957 MB; memory/VRAM около 2022 MB; CPU возможен; GPU ускоряет
Оптимальные требования	cuda, metal, vulkan, cpu; желательно 2729 MB+ свободной VRAM/RAM и 1469 MB+ disk cache
HF link	SanctumAI/Meta-Llama-3.1-8B-Instruct-GGUF
Доступные quantizations	`fp16`, `fp32`, `q2`, `q3`, `q4`, `q5`, `q6`, `q8`
Краткое описание	Native GGUF chat model for llama.cpp.
Best in	`chat`, `local-assistant`

Meta Llama 3.1 8B Instruct abliterated

Поле	Значение
Название	`mlabonne/Meta-Llama-3.1-8B-Instruct-abliterated-GGUF`
Label	Meta Llama 3.1 8B Instruct abliterated
Категория	LLM / чат и генерация текста
Runtime/backend	native / llama.cpp / gguf
Вес	0.93 GB catalog size, ~957 MB disk/cache
Параметры	8B
Минимальные требования	medium - рабочая станция или заметный GPU; disk >= 957 MB; memory/VRAM около 2022 MB; CPU возможен; GPU ускоряет
Оптимальные требования	cuda, metal, vulkan, cpu; желательно 2729 MB+ свободной VRAM/RAM и 1469 MB+ disk cache
HF link	mlabonne/Meta-Llama-3.1-8B-Instruct-abliterated-GGUF
Доступные quantizations	`fp16`, `fp32`, `q2`, `q3`, `q4`, `q5`, `q6`, `q8`
Краткое описание	Native GGUF chat model for llama.cpp.
Best in	`chat`, `local-assistant`

DeepSeek Coder V2 Lite Instruct

Поле	Значение
Название	`bartowski/DeepSeek-Coder-V2-Lite-Instruct-GGUF`
Label	DeepSeek Coder V2 Lite Instruct
Категория	LLM / чат и генерация текста
Runtime/backend	native / llama.cpp / gguf
Вес	1.83 GB catalog size, ~1872 MB disk/cache
Параметры	не указаны
Минимальные требования	medium - рабочая станция или заметный GPU; disk >= 1872 MB; memory/VRAM около 3669 MB; CPU возможен; GPU ускоряет
Оптимальные требования	cuda, metal, vulkan, cpu; желательно 4953 MB+ свободной VRAM/RAM и 2384 MB+ disk cache
HF link	bartowski/DeepSeek-Coder-V2-Lite-Instruct-GGUF
Доступные quantizations	`fp16`, `fp32`, `q2`, `q3`, `q4`, `q5`, `q6`, `q8`
Краткое описание	Native GGUF code model for llama.cpp.
Best in	`code`, `agents`, `chat`, `local-assistant`

Llama 3.2 8X3B MOE Dark Champion Instruct uncensored abliterated 18.4B

Поле	Значение
Название	`DavidAU/Llama-3.2-8X3B-MOE-Dark-Champion-Instruct-uncensored-abliterated-18.4B-GGUF`
Label	Llama 3.2 8X3B MOE Dark Champion Instruct uncensored abliterated 18.4B
Категория	LLM / чат и генерация текста
Runtime/backend	native / llama.cpp / gguf
Вес	2.14 GB catalog size, ~2194 MB disk/cache
Параметры	3B
Минимальные требования	medium - рабочая станция или заметный GPU; disk >= 2194 MB; memory/VRAM около 4249 MB; CPU возможен; GPU ускоряет
Оптимальные требования	cuda, metal, vulkan, cpu; желательно 5736 MB+ свободной VRAM/RAM и 2742 MB+ disk cache
HF link	DavidAU/Llama-3.2-8X3B-MOE-Dark-Champion-Instruct-uncensored-abliterated-18.4B-GGUF
Доступные quantizations	`fp16`, `fp32`, `q2`, `q3`, `q4`, `q5`, `q6`, `q8`
Краткое описание	Native GGUF chat model for llama.cpp.
Best in	`chat`, `local-assistant`

solar pro preview instruct

Поле	Значение
Название	`MaziyarPanahi/solar-pro-preview-instruct-GGUF`
Label	solar pro preview instruct
Категория	LLM / чат и генерация текста
Runtime/backend	native / llama.cpp / gguf
Вес	2.58 GB catalog size, ~2639 MB disk/cache
Параметры	не указаны
Минимальные требования	medium - рабочая станция или заметный GPU; disk >= 2639 MB; memory/VRAM около 5050 MB; CPU возможен; GPU ускоряет
Оптимальные требования	cuda, metal, vulkan, cpu; желательно 6817 MB+ свободной VRAM/RAM и 3298 MB+ disk cache
HF link	MaziyarPanahi/solar-pro-preview-instruct-GGUF
Доступные quantizations	`fp16`, `fp32`, `q2`, `q3`, `q4`, `q5`, `q6`, `q8`
Краткое описание	Native GGUF chat model for llama.cpp.
Best in	`chat`, `local-assistant`

Mistral Small Instruct 2409

Поле	Значение
Название	`MaziyarPanahi/Mistral-Small-Instruct-2409-GGUF`
Label	Mistral Small Instruct 2409
Категория	LLM / чат и генерация текста
Runtime/backend	native / llama.cpp / gguf
Вес	2.59 GB catalog size, ~2652 MB disk/cache
Параметры	не указаны
Минимальные требования	medium - рабочая станция или заметный GPU; disk >= 2652 MB; memory/VRAM около 5073 MB; CPU возможен; GPU ускоряет
Оптимальные требования	cuda, metal, vulkan, cpu; желательно 6848 MB+ свободной VRAM/RAM и 3315 MB+ disk cache
HF link	MaziyarPanahi/Mistral-Small-Instruct-2409-GGUF
Доступные quantizations	`fp16`, `fp32`, `q2`, `q3`, `q4`, `q5`, `q6`, `q8`
Краткое описание	Native GGUF chat model for llama.cpp.
Best in	`chat`, `local-assistant`

Models Native LLM medium

Models Native LLM medium

Llama 3.2 3B Instruct

Llama 3.2 3B Instruct

Llama 3.2 3B Instruct

Qwen2.5 3B Instruct

Qwen2.5 Coder 3B Instruct

Ministral 3 3B Instruct 2512

Phi 3.5 mini Instruct GGUF

Qwen3 4B Instruct 2507

Qwen3 4B Instruct 2507

deepseek coder 6.7B instruct

Mistral 7B Instruct v0.1

Mistral 7B Instruct v0.2

Mistral 7B Instruct v0.3

Qwen2 7B Instruct

Qwen2.5 7B Instruct

Qwen2.5 7B Instruct

Qwen2.5 7B Instruct

Qwen2.5 Coder 7B Instruct

Qwen2.5 Coder 7B Instruct

Llama 3 8B Instruct 32k v0.1

Llama 3 8B Instruct 64k

Llama3.3 8B Instruct Thinking Heretic Uncensored Claude 4.5 Opus High Reasoning i1

Meta Llama 3 8B Instruct

Meta Llama 3 8B Instruct

Meta Llama 3.1 8B Instruct

Meta Llama 3.1 8B Instruct

Meta Llama 3.1 8B Instruct

Meta Llama 3.1 8B Instruct

Meta Llama 3.1 8B Instruct

Meta Llama 3.1 8B Instruct abliterated

DeepSeek Coder V2 Lite Instruct

Llama 3.2 8X3B MOE Dark Champion Instruct uncensored abliterated 18.4B

solar pro preview instruct

Mistral Small Instruct 2409

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!