Skip to content

Models Native LLM medium

Mike edited this page May 28, 2026 · 1 revision

Models Native LLM medium

Режим: Native. Категория: LLM / чат и генерация текста.

Всего моделей: 34.

Llama 3.2 3B Instruct

Поле Значение
Название bartowski/Llama-3.2-3B-Instruct-GGUF
Label Llama 3.2 3B Instruct
Категория LLM / чат и генерация текста
Runtime/backend native / llama.cpp / gguf
Вес 0.37 GB catalog size, ~382 MB disk/cache
Параметры 3B
Минимальные требования medium - рабочая станция или заметный GPU; disk >= 382 MB; memory/VRAM около 987 MB; CPU возможен; GPU ускоряет
Оптимальные требования cuda, metal, vulkan, cpu; желательно 1499 MB+ свободной VRAM/RAM и 894 MB+ disk cache
HF link bartowski/Llama-3.2-3B-Instruct-GGUF
Доступные quantizations fp16, fp32, q2, q3, q4, q5, q6, q8
Краткое описание Native GGUF chat model for llama.cpp.
Best in chat, local-assistant

Llama 3.2 3B Instruct

Поле Значение
Название MaziyarPanahi/Llama-3.2-3B-Instruct-GGUF
Label Llama 3.2 3B Instruct
Категория LLM / чат и генерация текста
Runtime/backend native / llama.cpp / gguf
Вес 0.37 GB catalog size, ~382 MB disk/cache
Параметры 3B
Минимальные требования medium - рабочая станция или заметный GPU; disk >= 382 MB; memory/VRAM около 987 MB; CPU возможен; GPU ускоряет
Оптимальные требования cuda, metal, vulkan, cpu; желательно 1499 MB+ свободной VRAM/RAM и 894 MB+ disk cache
HF link MaziyarPanahi/Llama-3.2-3B-Instruct-GGUF
Доступные quantizations fp16, fp32, q2, q3, q4, q5, q6, q8
Краткое описание Native GGUF chat model for llama.cpp.
Best in chat, local-assistant

Llama 3.2 3B Instruct

Поле Значение
Название unsloth/Llama-3.2-3B-Instruct-GGUF
Label Llama 3.2 3B Instruct
Категория LLM / чат и генерация текста
Runtime/backend native / llama.cpp / gguf
Вес 0.37 GB catalog size, ~382 MB disk/cache
Параметры 3B
Минимальные требования medium - рабочая станция или заметный GPU; disk >= 382 MB; memory/VRAM около 987 MB; CPU возможен; GPU ускоряет
Оптимальные требования cuda, metal, vulkan, cpu; желательно 1499 MB+ свободной VRAM/RAM и 894 MB+ disk cache
HF link unsloth/Llama-3.2-3B-Instruct-GGUF
Доступные quantizations fp16, fp32, q2, q3, q4, q5, q6, q8
Краткое описание Native GGUF chat model for llama.cpp.
Best in chat, local-assistant

Qwen2.5 3B Instruct

Поле Значение
Название Qwen/Qwen2.5-3B-Instruct-GGUF
Label Qwen2.5 3B Instruct
Категория LLM / чат и генерация текста
Runtime/backend native / llama.cpp / gguf
Вес 0.39 GB catalog size, ~404 MB disk/cache
Параметры 3B
Минимальные требования medium - рабочая станция или заметный GPU; disk >= 404 MB; memory/VRAM около 1027 MB; CPU возможен; GPU ускоряет
Оптимальные требования cuda, metal, vulkan, cpu; желательно 1539 MB+ свободной VRAM/RAM и 916 MB+ disk cache
HF link Qwen/Qwen2.5-3B-Instruct-GGUF
Доступные quantizations fp16, fp32, q2, q3, q4, q5, q6, q8
Краткое описание Native GGUF chat model for llama.cpp.
Best in chat, local-assistant

Qwen2.5 Coder 3B Instruct

Поле Значение
Название Qwen/Qwen2.5-Coder-3B-Instruct-GGUF
Label Qwen2.5 Coder 3B Instruct
Категория LLM / чат и генерация текста
Runtime/backend native / llama.cpp / gguf
Вес 0.39 GB catalog size, ~404 MB disk/cache
Параметры 3B
Минимальные требования medium - рабочая станция или заметный GPU; disk >= 404 MB; memory/VRAM около 1027 MB; CPU возможен; GPU ускоряет
Оптимальные требования cuda, metal, vulkan, cpu; желательно 1539 MB+ свободной VRAM/RAM и 916 MB+ disk cache
HF link Qwen/Qwen2.5-Coder-3B-Instruct-GGUF
Доступные quantizations fp16, fp32, q2, q3, q4, q5, q6, q8
Краткое описание Native GGUF code model for llama.cpp.
Best in code, agents, chat, local-assistant

Ministral 3 3B Instruct 2512

Поле Значение
Название lmstudio-community/Ministral-3-3B-Instruct-2512-GGUF
Label Ministral 3 3B Instruct 2512
Категория LLM / чат и генерация текста
Runtime/backend native / llama.cpp / gguf
Вес 0.40 GB catalog size, ~408 MB disk/cache
Параметры 3B
Минимальные требования medium - рабочая станция или заметный GPU; disk >= 408 MB; memory/VRAM около 1034 MB; CPU возможен; GPU ускоряет
Оптимальные требования cuda, metal, vulkan, cpu; желательно 1546 MB+ свободной VRAM/RAM и 920 MB+ disk cache
HF link lmstudio-community/Ministral-3-3B-Instruct-2512-GGUF
Доступные quantizations fp16, fp32, q2, q3, q4, q5, q6, q8
Краткое описание Native GGUF chat model for llama.cpp.
Best in chat, local-assistant

Phi 3.5 mini Instruct GGUF

Поле Значение
Название Phi-3.5-mini-instruct-GGUF
Label Phi 3.5 mini Instruct GGUF
Категория LLM / чат и генерация текста
Runtime/backend native / llama.cpp / gguf
Вес 0.44 GB catalog size, ~455 MB disk/cache
Параметры 3.8B
Минимальные требования medium - рабочая станция или заметный GPU; disk >= 455 MB; memory/VRAM около 1119 MB; CPU возможен; GPU ускоряет
Оптимальные требования cuda, metal, vulkan, cpu; желательно 1631 MB+ свободной VRAM/RAM и 967 MB+ disk cache
HF link bartowski/Phi-3.5-mini-instruct-GGUF
Доступные quantizations fp16, fp32, q2, q3, q4, q5, q6, q8
Краткое описание Native GGUF chat model for llama.cpp.
Best in chat, local-assistant

Qwen3 4B Instruct 2507

Поле Значение
Название MaziyarPanahi/Qwen3-4B-Instruct-2507-GGUF
Label Qwen3 4B Instruct 2507
Категория LLM / чат и генерация текста
Runtime/backend native / llama.cpp / gguf
Вес 0.47 GB catalog size, ~479 MB disk/cache
Параметры 4B
Минимальные требования medium - рабочая станция или заметный GPU; disk >= 479 MB; memory/VRAM около 1162 MB; CPU возможен; GPU ускоряет
Оптимальные требования cuda, metal, vulkan, cpu; желательно 1674 MB+ свободной VRAM/RAM и 991 MB+ disk cache
HF link MaziyarPanahi/Qwen3-4B-Instruct-2507-GGUF
Доступные quantizations fp16, fp32, q2, q3, q4, q5, q6, q8
Краткое описание Native GGUF reasoning model for llama.cpp.
Best in reasoning, agents, chat, local-assistant

Qwen3 4B Instruct 2507

Поле Значение
Название unsloth/Qwen3-4B-Instruct-2507-GGUF
Label Qwen3 4B Instruct 2507
Категория LLM / чат и генерация текста
Runtime/backend native / llama.cpp / gguf
Вес 0.47 GB catalog size, ~479 MB disk/cache
Параметры 4B
Минимальные требования medium - рабочая станция или заметный GPU; disk >= 479 MB; memory/VRAM около 1162 MB; CPU возможен; GPU ускоряет
Оптимальные требования cuda, metal, vulkan, cpu; желательно 1674 MB+ свободной VRAM/RAM и 991 MB+ disk cache
HF link unsloth/Qwen3-4B-Instruct-2507-GGUF
Доступные quantizations fp16, fp32, q2, q3, q4, q5, q6, q8
Краткое описание Native GGUF reasoning model for llama.cpp.
Best in reasoning, agents, chat, local-assistant

deepseek coder 6.7B instruct

Поле Значение
Название TheBloke/deepseek-coder-6.7B-instruct-GGUF
Label deepseek coder 6.7B instruct
Категория LLM / чат и генерация текста
Runtime/backend native / llama.cpp / gguf
Вес 0.78 GB catalog size, ~803 MB disk/cache
Параметры 6.7B
Минимальные требования medium - рабочая станция или заметный GPU; disk >= 803 MB; memory/VRAM около 1745 MB; CPU возможен; GPU ускоряет
Оптимальные требования cuda, metal, vulkan, cpu; желательно 2355 MB+ свободной VRAM/RAM и 1315 MB+ disk cache
HF link TheBloke/deepseek-coder-6.7B-instruct-GGUF
Доступные quantizations fp16, fp32, q2, q3, q4, q5, q6, q8
Краткое описание Native GGUF code model for llama.cpp.
Best in code, agents, chat, local-assistant

Mistral 7B Instruct v0.1

Поле Значение
Название TheBloke/Mistral-7B-Instruct-v0.1-GGUF
Label Mistral 7B Instruct v0.1
Категория LLM / чат и генерация текста
Runtime/backend native / llama.cpp / gguf
Вес 0.84 GB catalog size, ~863 MB disk/cache
Параметры 7B
Минимальные требования medium - рабочая станция или заметный GPU; disk >= 863 MB; memory/VRAM около 1853 MB; CPU возможен; GPU ускоряет
Оптимальные требования cuda, metal, vulkan, cpu; желательно 2501 MB+ свободной VRAM/RAM и 1375 MB+ disk cache
HF link TheBloke/Mistral-7B-Instruct-v0.1-GGUF
Доступные quantizations fp16, fp32, q2, q3, q4, q5, q6, q8
Краткое описание Native GGUF chat model for llama.cpp.
Best in chat, local-assistant

Mistral 7B Instruct v0.2

Поле Значение
Название TheBloke/Mistral-7B-Instruct-v0.2-GGUF
Label Mistral 7B Instruct v0.2
Категория LLM / чат и генерация текста
Runtime/backend native / llama.cpp / gguf
Вес 0.84 GB catalog size, ~863 MB disk/cache
Параметры 7B
Минимальные требования medium - рабочая станция или заметный GPU; disk >= 863 MB; memory/VRAM около 1853 MB; CPU возможен; GPU ускоряет
Оптимальные требования cuda, metal, vulkan, cpu; желательно 2501 MB+ свободной VRAM/RAM и 1375 MB+ disk cache
HF link TheBloke/Mistral-7B-Instruct-v0.2-GGUF
Доступные quantizations fp16, fp32, q2, q3, q4, q5, q6, q8
Краткое описание Native GGUF chat model for llama.cpp.
Best in chat, local-assistant

Mistral 7B Instruct v0.3

Поле Значение
Название MaziyarPanahi/Mistral-7B-Instruct-v0.3-GGUF
Label Mistral 7B Instruct v0.3
Категория LLM / чат и генерация текста
Runtime/backend native / llama.cpp / gguf
Вес 0.84 GB catalog size, ~864 MB disk/cache
Параметры 7B
Минимальные требования medium - рабочая станция или заметный GPU; disk >= 864 MB; memory/VRAM около 1855 MB; CPU возможен; GPU ускоряет
Оптимальные требования cuda, metal, vulkan, cpu; желательно 2504 MB+ свободной VRAM/RAM и 1376 MB+ disk cache
HF link MaziyarPanahi/Mistral-7B-Instruct-v0.3-GGUF
Доступные quantizations fp16, fp32, q2, q3, q4, q5, q6, q8
Краткое описание Native GGUF chat model for llama.cpp.
Best in chat, local-assistant

Qwen2 7B Instruct

Поле Значение
Название MaziyarPanahi/Qwen2-7B-Instruct-GGUF
Label Qwen2 7B Instruct
Категория LLM / чат и генерация текста
Runtime/backend native / llama.cpp / gguf
Вес 0.89 GB catalog size, ~907 MB disk/cache
Параметры 7B
Минимальные требования medium - рабочая станция или заметный GPU; disk >= 907 MB; memory/VRAM около 1932 MB; CPU возможен; GPU ускоряет
Оптимальные требования cuda, metal, vulkan, cpu; желательно 2608 MB+ свободной VRAM/RAM и 1419 MB+ disk cache
HF link MaziyarPanahi/Qwen2-7B-Instruct-GGUF
Доступные quantizations fp16, fp32, q2, q3, q4, q5, q6, q8
Краткое описание Native GGUF chat model for llama.cpp.
Best in chat, local-assistant

Qwen2.5 7B Instruct

Поле Значение
Название Qwen/Qwen2.5-7B-Instruct-GGUF
Label Qwen2.5 7B Instruct
Категория LLM / чат и генерация текста
Runtime/backend native / llama.cpp / gguf
Вес 0.89 GB catalog size, ~907 MB disk/cache
Параметры 7B
Минимальные требования medium - рабочая станция или заметный GPU; disk >= 907 MB; memory/VRAM около 1932 MB; CPU возможен; GPU ускоряет
Оптимальные требования cuda, metal, vulkan, cpu; желательно 2608 MB+ свободной VRAM/RAM и 1419 MB+ disk cache
HF link Qwen/Qwen2.5-7B-Instruct-GGUF
Доступные quantizations fp16, fp32, q2, q3, q4, q5, q6, q8
Краткое описание Native GGUF chat model for llama.cpp.
Best in chat, local-assistant

Qwen2.5 7B Instruct

Поле Значение
Название MaziyarPanahi/Qwen2.5-7B-Instruct-GGUF
Label Qwen2.5 7B Instruct
Категория LLM / чат и генерация текста
Runtime/backend native / llama.cpp / gguf
Вес 0.89 GB catalog size, ~907 MB disk/cache
Параметры 7B
Минимальные требования medium - рабочая станция или заметный GPU; disk >= 907 MB; memory/VRAM около 1932 MB; CPU возможен; GPU ускоряет
Оптимальные требования cuda, metal, vulkan, cpu; желательно 2608 MB+ свободной VRAM/RAM и 1419 MB+ disk cache
HF link MaziyarPanahi/Qwen2.5-7B-Instruct-GGUF
Доступные quantizations fp16, fp32, q2, q3, q4, q5, q6, q8
Краткое описание Native GGUF chat model for llama.cpp.
Best in chat, local-assistant

Qwen2.5 7B Instruct

Поле Значение
Название bartowski/Qwen2.5-7B-Instruct-GGUF
Label Qwen2.5 7B Instruct
Категория LLM / чат и генерация текста
Runtime/backend native / llama.cpp / gguf
Вес 0.89 GB catalog size, ~907 MB disk/cache
Параметры 7B
Минимальные требования medium - рабочая станция или заметный GPU; disk >= 907 MB; memory/VRAM около 1932 MB; CPU возможен; GPU ускоряет
Оптимальные требования cuda, metal, vulkan, cpu; желательно 2608 MB+ свободной VRAM/RAM и 1419 MB+ disk cache
HF link bartowski/Qwen2.5-7B-Instruct-GGUF
Доступные quantizations fp16, fp32, q2, q3, q4, q5, q6, q8
Краткое описание Native GGUF chat model for llama.cpp.
Best in chat, local-assistant

Qwen2.5 Coder 7B Instruct

Поле Значение
Название Qwen/Qwen2.5-Coder-7B-Instruct-GGUF
Label Qwen2.5 Coder 7B Instruct
Категория LLM / чат и генерация текста
Runtime/backend native / llama.cpp / gguf
Вес 0.89 GB catalog size, ~907 MB disk/cache
Параметры 7B
Минимальные требования medium - рабочая станция или заметный GPU; disk >= 907 MB; memory/VRAM около 1932 MB; CPU возможен; GPU ускоряет
Оптимальные требования cuda, metal, vulkan, cpu; желательно 2608 MB+ свободной VRAM/RAM и 1419 MB+ disk cache
HF link Qwen/Qwen2.5-Coder-7B-Instruct-GGUF
Доступные quantizations fp16, fp32, q2, q3, q4, q5, q6, q8
Краткое описание Native GGUF code model for llama.cpp.
Best in code, agents, chat, local-assistant

Qwen2.5 Coder 7B Instruct

Поле Значение
Название bartowski/Qwen2.5-Coder-7B-Instruct-GGUF
Label Qwen2.5 Coder 7B Instruct
Категория LLM / чат и генерация текста
Runtime/backend native / llama.cpp / gguf
Вес 0.89 GB catalog size, ~907 MB disk/cache
Параметры 7B
Минимальные требования medium - рабочая станция или заметный GPU; disk >= 907 MB; memory/VRAM около 1932 MB; CPU возможен; GPU ускоряет
Оптимальные требования cuda, metal, vulkan, cpu; желательно 2608 MB+ свободной VRAM/RAM и 1419 MB+ disk cache
HF link bartowski/Qwen2.5-Coder-7B-Instruct-GGUF
Доступные quantizations fp16, fp32, q2, q3, q4, q5, q6, q8
Краткое описание Native GGUF code model for llama.cpp.
Best in code, agents, chat, local-assistant

Llama 3 8B Instruct 32k v0.1

Поле Значение
Название MaziyarPanahi/Llama-3-8B-Instruct-32k-v0.1-GGUF
Label Llama 3 8B Instruct 32k v0.1
Категория LLM / чат и генерация текста
Runtime/backend native / llama.cpp / gguf
Вес 0.93 GB catalog size, ~957 MB disk/cache
Параметры 8B
Минимальные требования medium - рабочая станция или заметный GPU; disk >= 957 MB; memory/VRAM около 2022 MB; CPU возможен; GPU ускоряет
Оптимальные требования cuda, metal, vulkan, cpu; желательно 2729 MB+ свободной VRAM/RAM и 1469 MB+ disk cache
HF link MaziyarPanahi/Llama-3-8B-Instruct-32k-v0.1-GGUF
Доступные quantizations fp16, fp32, q2, q3, q4, q5, q6, q8
Краткое описание Native GGUF chat model for llama.cpp.
Best in chat, local-assistant

Llama 3 8B Instruct 64k

Поле Значение
Название MaziyarPanahi/Llama-3-8B-Instruct-64k-GGUF
Label Llama 3 8B Instruct 64k
Категория LLM / чат и генерация текста
Runtime/backend native / llama.cpp / gguf
Вес 0.93 GB catalog size, ~957 MB disk/cache
Параметры 8B
Минимальные требования medium - рабочая станция или заметный GPU; disk >= 957 MB; memory/VRAM около 2022 MB; CPU возможен; GPU ускоряет
Оптимальные требования cuda, metal, vulkan, cpu; желательно 2729 MB+ свободной VRAM/RAM и 1469 MB+ disk cache
HF link MaziyarPanahi/Llama-3-8B-Instruct-64k-GGUF
Доступные quantizations fp16, fp32, q2, q3, q4, q5, q6, q8
Краткое описание Native GGUF chat model for llama.cpp.
Best in chat, local-assistant

Llama3.3 8B Instruct Thinking Heretic Uncensored Claude 4.5 Opus High Reasoning i1

Поле Значение
Название mradermacher/Llama3.3-8B-Instruct-Thinking-Heretic-Uncensored-Claude-4.5-Opus-High-Reasoning-i1-GGUF
Label Llama3.3 8B Instruct Thinking Heretic Uncensored Claude 4.5 Opus High Reasoning i1
Категория LLM / чат и генерация текста
Runtime/backend native / llama.cpp / gguf
Вес 0.93 GB catalog size, ~957 MB disk/cache
Параметры 8B
Минимальные требования medium - рабочая станция или заметный GPU; disk >= 957 MB; memory/VRAM около 2022 MB; CPU возможен; GPU ускоряет
Оптимальные требования cuda, metal, vulkan, cpu; желательно 2729 MB+ свободной VRAM/RAM и 1469 MB+ disk cache
HF link mradermacher/Llama3.3-8B-Instruct-Thinking-Heretic-Uncensored-Claude-4.5-Opus-High-Reasoning-i1-GGUF
Доступные quantizations fp16, fp32, q2, q3, q4, q5, q6, q8
Краткое описание Native GGUF reasoning model for llama.cpp.
Best in reasoning, agents, chat, local-assistant

Meta Llama 3 8B Instruct

Поле Значение
Название MaziyarPanahi/Meta-Llama-3-8B-Instruct-GGUF
Label Meta Llama 3 8B Instruct
Категория LLM / чат и генерация текста
Runtime/backend native / llama.cpp / gguf
Вес 0.93 GB catalog size, ~957 MB disk/cache
Параметры 8B
Минимальные требования medium - рабочая станция или заметный GPU; disk >= 957 MB; memory/VRAM около 2022 MB; CPU возможен; GPU ускоряет
Оптимальные требования cuda, metal, vulkan, cpu; желательно 2729 MB+ свободной VRAM/RAM и 1469 MB+ disk cache
HF link MaziyarPanahi/Meta-Llama-3-8B-Instruct-GGUF
Доступные quantizations fp16, fp32, q2, q3, q4, q5, q6, q8
Краткое описание Native GGUF chat model for llama.cpp.
Best in chat, local-assistant

Meta Llama 3 8B Instruct

Поле Значение
Название lmstudio-community/Meta-Llama-3-8B-Instruct-GGUF
Label Meta Llama 3 8B Instruct
Категория LLM / чат и генерация текста
Runtime/backend native / llama.cpp / gguf
Вес 0.93 GB catalog size, ~957 MB disk/cache
Параметры 8B
Минимальные требования medium - рабочая станция или заметный GPU; disk >= 957 MB; memory/VRAM около 2022 MB; CPU возможен; GPU ускоряет
Оптимальные требования cuda, metal, vulkan, cpu; желательно 2729 MB+ свободной VRAM/RAM и 1469 MB+ disk cache
HF link lmstudio-community/Meta-Llama-3-8B-Instruct-GGUF
Доступные quantizations fp16, fp32, q2, q3, q4, q5, q6, q8
Краткое описание Native GGUF chat model for llama.cpp.
Best in chat, local-assistant

Meta Llama 3.1 8B Instruct

Поле Значение
Название bartowski/Meta-Llama-3.1-8B-Instruct-GGUF
Label Meta Llama 3.1 8B Instruct
Категория LLM / чат и генерация текста
Runtime/backend native / llama.cpp / gguf
Вес 0.93 GB catalog size, ~957 MB disk/cache
Параметры 8B
Минимальные требования medium - рабочая станция или заметный GPU; disk >= 957 MB; memory/VRAM около 2022 MB; CPU возможен; GPU ускоряет
Оптимальные требования cuda, metal, vulkan, cpu; желательно 2729 MB+ свободной VRAM/RAM и 1469 MB+ disk cache
HF link bartowski/Meta-Llama-3.1-8B-Instruct-GGUF
Доступные quantizations fp16, fp32, q2, q3, q4, q5, q6, q8
Краткое описание Native GGUF chat model for llama.cpp.
Best in chat, local-assistant

Meta Llama 3.1 8B Instruct

Поле Значение
Название MaziyarPanahi/Meta-Llama-3.1-8B-Instruct-GGUF
Label Meta Llama 3.1 8B Instruct
Категория LLM / чат и генерация текста
Runtime/backend native / llama.cpp / gguf
Вес 0.93 GB catalog size, ~957 MB disk/cache
Параметры 8B
Минимальные требования medium - рабочая станция или заметный GPU; disk >= 957 MB; memory/VRAM около 2022 MB; CPU возможен; GPU ускоряет
Оптимальные требования cuda, metal, vulkan, cpu; желательно 2729 MB+ свободной VRAM/RAM и 1469 MB+ disk cache
HF link MaziyarPanahi/Meta-Llama-3.1-8B-Instruct-GGUF
Доступные quantizations fp16, fp32, q2, q3, q4, q5, q6, q8
Краткое описание Native GGUF chat model for llama.cpp.
Best in chat, local-assistant

Meta Llama 3.1 8B Instruct

Поле Значение
Название lmstudio-community/Meta-Llama-3.1-8B-Instruct-GGUF
Label Meta Llama 3.1 8B Instruct
Категория LLM / чат и генерация текста
Runtime/backend native / llama.cpp / gguf
Вес 0.93 GB catalog size, ~957 MB disk/cache
Параметры 8B
Минимальные требования medium - рабочая станция или заметный GPU; disk >= 957 MB; memory/VRAM около 2022 MB; CPU возможен; GPU ускоряет
Оптимальные требования cuda, metal, vulkan, cpu; желательно 2729 MB+ свободной VRAM/RAM и 1469 MB+ disk cache
HF link lmstudio-community/Meta-Llama-3.1-8B-Instruct-GGUF
Доступные quantizations fp16, fp32, q2, q3, q4, q5, q6, q8
Краткое описание Native GGUF chat model for llama.cpp.
Best in chat, local-assistant

Meta Llama 3.1 8B Instruct

Поле Значение
Название QuantFactory/Meta-Llama-3.1-8B-Instruct-GGUF
Label Meta Llama 3.1 8B Instruct
Категория LLM / чат и генерация текста
Runtime/backend native / llama.cpp / gguf
Вес 0.93 GB catalog size, ~957 MB disk/cache
Параметры 8B
Минимальные требования medium - рабочая станция или заметный GPU; disk >= 957 MB; memory/VRAM около 2022 MB; CPU возможен; GPU ускоряет
Оптимальные требования cuda, metal, vulkan, cpu; желательно 2729 MB+ свободной VRAM/RAM и 1469 MB+ disk cache
HF link QuantFactory/Meta-Llama-3.1-8B-Instruct-GGUF
Доступные quantizations fp16, fp32, q2, q3, q4, q5, q6, q8
Краткое описание Native GGUF chat model for llama.cpp.
Best in chat, local-assistant

Meta Llama 3.1 8B Instruct

Поле Значение
Название SanctumAI/Meta-Llama-3.1-8B-Instruct-GGUF
Label Meta Llama 3.1 8B Instruct
Категория LLM / чат и генерация текста
Runtime/backend native / llama.cpp / gguf
Вес 0.93 GB catalog size, ~957 MB disk/cache
Параметры 8B
Минимальные требования medium - рабочая станция или заметный GPU; disk >= 957 MB; memory/VRAM около 2022 MB; CPU возможен; GPU ускоряет
Оптимальные требования cuda, metal, vulkan, cpu; желательно 2729 MB+ свободной VRAM/RAM и 1469 MB+ disk cache
HF link SanctumAI/Meta-Llama-3.1-8B-Instruct-GGUF
Доступные quantizations fp16, fp32, q2, q3, q4, q5, q6, q8
Краткое описание Native GGUF chat model for llama.cpp.
Best in chat, local-assistant

Meta Llama 3.1 8B Instruct abliterated

Поле Значение
Название mlabonne/Meta-Llama-3.1-8B-Instruct-abliterated-GGUF
Label Meta Llama 3.1 8B Instruct abliterated
Категория LLM / чат и генерация текста
Runtime/backend native / llama.cpp / gguf
Вес 0.93 GB catalog size, ~957 MB disk/cache
Параметры 8B
Минимальные требования medium - рабочая станция или заметный GPU; disk >= 957 MB; memory/VRAM около 2022 MB; CPU возможен; GPU ускоряет
Оптимальные требования cuda, metal, vulkan, cpu; желательно 2729 MB+ свободной VRAM/RAM и 1469 MB+ disk cache
HF link mlabonne/Meta-Llama-3.1-8B-Instruct-abliterated-GGUF
Доступные quantizations fp16, fp32, q2, q3, q4, q5, q6, q8
Краткое описание Native GGUF chat model for llama.cpp.
Best in chat, local-assistant

DeepSeek Coder V2 Lite Instruct

Поле Значение
Название bartowski/DeepSeek-Coder-V2-Lite-Instruct-GGUF
Label DeepSeek Coder V2 Lite Instruct
Категория LLM / чат и генерация текста
Runtime/backend native / llama.cpp / gguf
Вес 1.83 GB catalog size, ~1872 MB disk/cache
Параметры не указаны
Минимальные требования medium - рабочая станция или заметный GPU; disk >= 1872 MB; memory/VRAM около 3669 MB; CPU возможен; GPU ускоряет
Оптимальные требования cuda, metal, vulkan, cpu; желательно 4953 MB+ свободной VRAM/RAM и 2384 MB+ disk cache
HF link bartowski/DeepSeek-Coder-V2-Lite-Instruct-GGUF
Доступные quantizations fp16, fp32, q2, q3, q4, q5, q6, q8
Краткое описание Native GGUF code model for llama.cpp.
Best in code, agents, chat, local-assistant

Llama 3.2 8X3B MOE Dark Champion Instruct uncensored abliterated 18.4B

Поле Значение
Название DavidAU/Llama-3.2-8X3B-MOE-Dark-Champion-Instruct-uncensored-abliterated-18.4B-GGUF
Label Llama 3.2 8X3B MOE Dark Champion Instruct uncensored abliterated 18.4B
Категория LLM / чат и генерация текста
Runtime/backend native / llama.cpp / gguf
Вес 2.14 GB catalog size, ~2194 MB disk/cache
Параметры 3B
Минимальные требования medium - рабочая станция или заметный GPU; disk >= 2194 MB; memory/VRAM около 4249 MB; CPU возможен; GPU ускоряет
Оптимальные требования cuda, metal, vulkan, cpu; желательно 5736 MB+ свободной VRAM/RAM и 2742 MB+ disk cache
HF link DavidAU/Llama-3.2-8X3B-MOE-Dark-Champion-Instruct-uncensored-abliterated-18.4B-GGUF
Доступные quantizations fp16, fp32, q2, q3, q4, q5, q6, q8
Краткое описание Native GGUF chat model for llama.cpp.
Best in chat, local-assistant

solar pro preview instruct

Поле Значение
Название MaziyarPanahi/solar-pro-preview-instruct-GGUF
Label solar pro preview instruct
Категория LLM / чат и генерация текста
Runtime/backend native / llama.cpp / gguf
Вес 2.58 GB catalog size, ~2639 MB disk/cache
Параметры не указаны
Минимальные требования medium - рабочая станция или заметный GPU; disk >= 2639 MB; memory/VRAM около 5050 MB; CPU возможен; GPU ускоряет
Оптимальные требования cuda, metal, vulkan, cpu; желательно 6817 MB+ свободной VRAM/RAM и 3298 MB+ disk cache
HF link MaziyarPanahi/solar-pro-preview-instruct-GGUF
Доступные quantizations fp16, fp32, q2, q3, q4, q5, q6, q8
Краткое описание Native GGUF chat model for llama.cpp.
Best in chat, local-assistant

Mistral Small Instruct 2409

Поле Значение
Название MaziyarPanahi/Mistral-Small-Instruct-2409-GGUF
Label Mistral Small Instruct 2409
Категория LLM / чат и генерация текста
Runtime/backend native / llama.cpp / gguf
Вес 2.59 GB catalog size, ~2652 MB disk/cache
Параметры не указаны
Минимальные требования medium - рабочая станция или заметный GPU; disk >= 2652 MB; memory/VRAM около 5073 MB; CPU возможен; GPU ускоряет
Оптимальные требования cuda, metal, vulkan, cpu; желательно 6848 MB+ свободной VRAM/RAM и 3315 MB+ disk cache
HF link MaziyarPanahi/Mistral-Small-Instruct-2409-GGUF
Доступные quantizations fp16, fp32, q2, q3, q4, q5, q6, q8
Краткое описание Native GGUF chat model for llama.cpp.
Best in chat, local-assistant

Clone this wiki locally