-
Notifications
You must be signed in to change notification settings - Fork 0
Models Native LLM medium
Mike edited this page May 28, 2026
·
1 revision
Режим: Native. Категория: LLM / чат и генерация текста.
Всего моделей: 34.
| Поле | Значение |
|---|---|
| Название | bartowski/Llama-3.2-3B-Instruct-GGUF |
| Label | Llama 3.2 3B Instruct |
| Категория | LLM / чат и генерация текста |
| Runtime/backend | native / llama.cpp / gguf |
| Вес | 0.37 GB catalog size, ~382 MB disk/cache |
| Параметры | 3B |
| Минимальные требования | medium - рабочая станция или заметный GPU; disk >= 382 MB; memory/VRAM около 987 MB; CPU возможен; GPU ускоряет |
| Оптимальные требования | cuda, metal, vulkan, cpu; желательно 1499 MB+ свободной VRAM/RAM и 894 MB+ disk cache |
| HF link | bartowski/Llama-3.2-3B-Instruct-GGUF |
| Доступные quantizations |
fp16, fp32, q2, q3, q4, q5, q6, q8
|
| Краткое описание | Native GGUF chat model for llama.cpp. |
| Best in |
chat, local-assistant
|
| Поле | Значение |
|---|---|
| Название | MaziyarPanahi/Llama-3.2-3B-Instruct-GGUF |
| Label | Llama 3.2 3B Instruct |
| Категория | LLM / чат и генерация текста |
| Runtime/backend | native / llama.cpp / gguf |
| Вес | 0.37 GB catalog size, ~382 MB disk/cache |
| Параметры | 3B |
| Минимальные требования | medium - рабочая станция или заметный GPU; disk >= 382 MB; memory/VRAM около 987 MB; CPU возможен; GPU ускоряет |
| Оптимальные требования | cuda, metal, vulkan, cpu; желательно 1499 MB+ свободной VRAM/RAM и 894 MB+ disk cache |
| HF link | MaziyarPanahi/Llama-3.2-3B-Instruct-GGUF |
| Доступные quantizations |
fp16, fp32, q2, q3, q4, q5, q6, q8
|
| Краткое описание | Native GGUF chat model for llama.cpp. |
| Best in |
chat, local-assistant
|
| Поле | Значение |
|---|---|
| Название | unsloth/Llama-3.2-3B-Instruct-GGUF |
| Label | Llama 3.2 3B Instruct |
| Категория | LLM / чат и генерация текста |
| Runtime/backend | native / llama.cpp / gguf |
| Вес | 0.37 GB catalog size, ~382 MB disk/cache |
| Параметры | 3B |
| Минимальные требования | medium - рабочая станция или заметный GPU; disk >= 382 MB; memory/VRAM около 987 MB; CPU возможен; GPU ускоряет |
| Оптимальные требования | cuda, metal, vulkan, cpu; желательно 1499 MB+ свободной VRAM/RAM и 894 MB+ disk cache |
| HF link | unsloth/Llama-3.2-3B-Instruct-GGUF |
| Доступные quantizations |
fp16, fp32, q2, q3, q4, q5, q6, q8
|
| Краткое описание | Native GGUF chat model for llama.cpp. |
| Best in |
chat, local-assistant
|
| Поле | Значение |
|---|---|
| Название | Qwen/Qwen2.5-3B-Instruct-GGUF |
| Label | Qwen2.5 3B Instruct |
| Категория | LLM / чат и генерация текста |
| Runtime/backend | native / llama.cpp / gguf |
| Вес | 0.39 GB catalog size, ~404 MB disk/cache |
| Параметры | 3B |
| Минимальные требования | medium - рабочая станция или заметный GPU; disk >= 404 MB; memory/VRAM около 1027 MB; CPU возможен; GPU ускоряет |
| Оптимальные требования | cuda, metal, vulkan, cpu; желательно 1539 MB+ свободной VRAM/RAM и 916 MB+ disk cache |
| HF link | Qwen/Qwen2.5-3B-Instruct-GGUF |
| Доступные quantizations |
fp16, fp32, q2, q3, q4, q5, q6, q8
|
| Краткое описание | Native GGUF chat model for llama.cpp. |
| Best in |
chat, local-assistant
|
| Поле | Значение |
|---|---|
| Название | Qwen/Qwen2.5-Coder-3B-Instruct-GGUF |
| Label | Qwen2.5 Coder 3B Instruct |
| Категория | LLM / чат и генерация текста |
| Runtime/backend | native / llama.cpp / gguf |
| Вес | 0.39 GB catalog size, ~404 MB disk/cache |
| Параметры | 3B |
| Минимальные требования | medium - рабочая станция или заметный GPU; disk >= 404 MB; memory/VRAM около 1027 MB; CPU возможен; GPU ускоряет |
| Оптимальные требования | cuda, metal, vulkan, cpu; желательно 1539 MB+ свободной VRAM/RAM и 916 MB+ disk cache |
| HF link | Qwen/Qwen2.5-Coder-3B-Instruct-GGUF |
| Доступные quantizations |
fp16, fp32, q2, q3, q4, q5, q6, q8
|
| Краткое описание | Native GGUF code model for llama.cpp. |
| Best in |
code, agents, chat, local-assistant
|
| Поле | Значение |
|---|---|
| Название | lmstudio-community/Ministral-3-3B-Instruct-2512-GGUF |
| Label | Ministral 3 3B Instruct 2512 |
| Категория | LLM / чат и генерация текста |
| Runtime/backend | native / llama.cpp / gguf |
| Вес | 0.40 GB catalog size, ~408 MB disk/cache |
| Параметры | 3B |
| Минимальные требования | medium - рабочая станция или заметный GPU; disk >= 408 MB; memory/VRAM около 1034 MB; CPU возможен; GPU ускоряет |
| Оптимальные требования | cuda, metal, vulkan, cpu; желательно 1546 MB+ свободной VRAM/RAM и 920 MB+ disk cache |
| HF link | lmstudio-community/Ministral-3-3B-Instruct-2512-GGUF |
| Доступные quantizations |
fp16, fp32, q2, q3, q4, q5, q6, q8
|
| Краткое описание | Native GGUF chat model for llama.cpp. |
| Best in |
chat, local-assistant
|
| Поле | Значение |
|---|---|
| Название | Phi-3.5-mini-instruct-GGUF |
| Label | Phi 3.5 mini Instruct GGUF |
| Категория | LLM / чат и генерация текста |
| Runtime/backend | native / llama.cpp / gguf |
| Вес | 0.44 GB catalog size, ~455 MB disk/cache |
| Параметры | 3.8B |
| Минимальные требования | medium - рабочая станция или заметный GPU; disk >= 455 MB; memory/VRAM около 1119 MB; CPU возможен; GPU ускоряет |
| Оптимальные требования | cuda, metal, vulkan, cpu; желательно 1631 MB+ свободной VRAM/RAM и 967 MB+ disk cache |
| HF link | bartowski/Phi-3.5-mini-instruct-GGUF |
| Доступные quantizations |
fp16, fp32, q2, q3, q4, q5, q6, q8
|
| Краткое описание | Native GGUF chat model for llama.cpp. |
| Best in |
chat, local-assistant
|
| Поле | Значение |
|---|---|
| Название | MaziyarPanahi/Qwen3-4B-Instruct-2507-GGUF |
| Label | Qwen3 4B Instruct 2507 |
| Категория | LLM / чат и генерация текста |
| Runtime/backend | native / llama.cpp / gguf |
| Вес | 0.47 GB catalog size, ~479 MB disk/cache |
| Параметры | 4B |
| Минимальные требования | medium - рабочая станция или заметный GPU; disk >= 479 MB; memory/VRAM около 1162 MB; CPU возможен; GPU ускоряет |
| Оптимальные требования | cuda, metal, vulkan, cpu; желательно 1674 MB+ свободной VRAM/RAM и 991 MB+ disk cache |
| HF link | MaziyarPanahi/Qwen3-4B-Instruct-2507-GGUF |
| Доступные quantizations |
fp16, fp32, q2, q3, q4, q5, q6, q8
|
| Краткое описание | Native GGUF reasoning model for llama.cpp. |
| Best in |
reasoning, agents, chat, local-assistant
|
| Поле | Значение |
|---|---|
| Название | unsloth/Qwen3-4B-Instruct-2507-GGUF |
| Label | Qwen3 4B Instruct 2507 |
| Категория | LLM / чат и генерация текста |
| Runtime/backend | native / llama.cpp / gguf |
| Вес | 0.47 GB catalog size, ~479 MB disk/cache |
| Параметры | 4B |
| Минимальные требования | medium - рабочая станция или заметный GPU; disk >= 479 MB; memory/VRAM около 1162 MB; CPU возможен; GPU ускоряет |
| Оптимальные требования | cuda, metal, vulkan, cpu; желательно 1674 MB+ свободной VRAM/RAM и 991 MB+ disk cache |
| HF link | unsloth/Qwen3-4B-Instruct-2507-GGUF |
| Доступные quantizations |
fp16, fp32, q2, q3, q4, q5, q6, q8
|
| Краткое описание | Native GGUF reasoning model for llama.cpp. |
| Best in |
reasoning, agents, chat, local-assistant
|
| Поле | Значение |
|---|---|
| Название | TheBloke/deepseek-coder-6.7B-instruct-GGUF |
| Label | deepseek coder 6.7B instruct |
| Категория | LLM / чат и генерация текста |
| Runtime/backend | native / llama.cpp / gguf |
| Вес | 0.78 GB catalog size, ~803 MB disk/cache |
| Параметры | 6.7B |
| Минимальные требования | medium - рабочая станция или заметный GPU; disk >= 803 MB; memory/VRAM около 1745 MB; CPU возможен; GPU ускоряет |
| Оптимальные требования | cuda, metal, vulkan, cpu; желательно 2355 MB+ свободной VRAM/RAM и 1315 MB+ disk cache |
| HF link | TheBloke/deepseek-coder-6.7B-instruct-GGUF |
| Доступные quantizations |
fp16, fp32, q2, q3, q4, q5, q6, q8
|
| Краткое описание | Native GGUF code model for llama.cpp. |
| Best in |
code, agents, chat, local-assistant
|
| Поле | Значение |
|---|---|
| Название | TheBloke/Mistral-7B-Instruct-v0.1-GGUF |
| Label | Mistral 7B Instruct v0.1 |
| Категория | LLM / чат и генерация текста |
| Runtime/backend | native / llama.cpp / gguf |
| Вес | 0.84 GB catalog size, ~863 MB disk/cache |
| Параметры | 7B |
| Минимальные требования | medium - рабочая станция или заметный GPU; disk >= 863 MB; memory/VRAM около 1853 MB; CPU возможен; GPU ускоряет |
| Оптимальные требования | cuda, metal, vulkan, cpu; желательно 2501 MB+ свободной VRAM/RAM и 1375 MB+ disk cache |
| HF link | TheBloke/Mistral-7B-Instruct-v0.1-GGUF |
| Доступные quantizations |
fp16, fp32, q2, q3, q4, q5, q6, q8
|
| Краткое описание | Native GGUF chat model for llama.cpp. |
| Best in |
chat, local-assistant
|
| Поле | Значение |
|---|---|
| Название | TheBloke/Mistral-7B-Instruct-v0.2-GGUF |
| Label | Mistral 7B Instruct v0.2 |
| Категория | LLM / чат и генерация текста |
| Runtime/backend | native / llama.cpp / gguf |
| Вес | 0.84 GB catalog size, ~863 MB disk/cache |
| Параметры | 7B |
| Минимальные требования | medium - рабочая станция или заметный GPU; disk >= 863 MB; memory/VRAM около 1853 MB; CPU возможен; GPU ускоряет |
| Оптимальные требования | cuda, metal, vulkan, cpu; желательно 2501 MB+ свободной VRAM/RAM и 1375 MB+ disk cache |
| HF link | TheBloke/Mistral-7B-Instruct-v0.2-GGUF |
| Доступные quantizations |
fp16, fp32, q2, q3, q4, q5, q6, q8
|
| Краткое описание | Native GGUF chat model for llama.cpp. |
| Best in |
chat, local-assistant
|
| Поле | Значение |
|---|---|
| Название | MaziyarPanahi/Mistral-7B-Instruct-v0.3-GGUF |
| Label | Mistral 7B Instruct v0.3 |
| Категория | LLM / чат и генерация текста |
| Runtime/backend | native / llama.cpp / gguf |
| Вес | 0.84 GB catalog size, ~864 MB disk/cache |
| Параметры | 7B |
| Минимальные требования | medium - рабочая станция или заметный GPU; disk >= 864 MB; memory/VRAM около 1855 MB; CPU возможен; GPU ускоряет |
| Оптимальные требования | cuda, metal, vulkan, cpu; желательно 2504 MB+ свободной VRAM/RAM и 1376 MB+ disk cache |
| HF link | MaziyarPanahi/Mistral-7B-Instruct-v0.3-GGUF |
| Доступные quantizations |
fp16, fp32, q2, q3, q4, q5, q6, q8
|
| Краткое описание | Native GGUF chat model for llama.cpp. |
| Best in |
chat, local-assistant
|
| Поле | Значение |
|---|---|
| Название | MaziyarPanahi/Qwen2-7B-Instruct-GGUF |
| Label | Qwen2 7B Instruct |
| Категория | LLM / чат и генерация текста |
| Runtime/backend | native / llama.cpp / gguf |
| Вес | 0.89 GB catalog size, ~907 MB disk/cache |
| Параметры | 7B |
| Минимальные требования | medium - рабочая станция или заметный GPU; disk >= 907 MB; memory/VRAM около 1932 MB; CPU возможен; GPU ускоряет |
| Оптимальные требования | cuda, metal, vulkan, cpu; желательно 2608 MB+ свободной VRAM/RAM и 1419 MB+ disk cache |
| HF link | MaziyarPanahi/Qwen2-7B-Instruct-GGUF |
| Доступные quantizations |
fp16, fp32, q2, q3, q4, q5, q6, q8
|
| Краткое описание | Native GGUF chat model for llama.cpp. |
| Best in |
chat, local-assistant
|
| Поле | Значение |
|---|---|
| Название | Qwen/Qwen2.5-7B-Instruct-GGUF |
| Label | Qwen2.5 7B Instruct |
| Категория | LLM / чат и генерация текста |
| Runtime/backend | native / llama.cpp / gguf |
| Вес | 0.89 GB catalog size, ~907 MB disk/cache |
| Параметры | 7B |
| Минимальные требования | medium - рабочая станция или заметный GPU; disk >= 907 MB; memory/VRAM около 1932 MB; CPU возможен; GPU ускоряет |
| Оптимальные требования | cuda, metal, vulkan, cpu; желательно 2608 MB+ свободной VRAM/RAM и 1419 MB+ disk cache |
| HF link | Qwen/Qwen2.5-7B-Instruct-GGUF |
| Доступные quantizations |
fp16, fp32, q2, q3, q4, q5, q6, q8
|
| Краткое описание | Native GGUF chat model for llama.cpp. |
| Best in |
chat, local-assistant
|
| Поле | Значение |
|---|---|
| Название | MaziyarPanahi/Qwen2.5-7B-Instruct-GGUF |
| Label | Qwen2.5 7B Instruct |
| Категория | LLM / чат и генерация текста |
| Runtime/backend | native / llama.cpp / gguf |
| Вес | 0.89 GB catalog size, ~907 MB disk/cache |
| Параметры | 7B |
| Минимальные требования | medium - рабочая станция или заметный GPU; disk >= 907 MB; memory/VRAM около 1932 MB; CPU возможен; GPU ускоряет |
| Оптимальные требования | cuda, metal, vulkan, cpu; желательно 2608 MB+ свободной VRAM/RAM и 1419 MB+ disk cache |
| HF link | MaziyarPanahi/Qwen2.5-7B-Instruct-GGUF |
| Доступные quantizations |
fp16, fp32, q2, q3, q4, q5, q6, q8
|
| Краткое описание | Native GGUF chat model for llama.cpp. |
| Best in |
chat, local-assistant
|
| Поле | Значение |
|---|---|
| Название | bartowski/Qwen2.5-7B-Instruct-GGUF |
| Label | Qwen2.5 7B Instruct |
| Категория | LLM / чат и генерация текста |
| Runtime/backend | native / llama.cpp / gguf |
| Вес | 0.89 GB catalog size, ~907 MB disk/cache |
| Параметры | 7B |
| Минимальные требования | medium - рабочая станция или заметный GPU; disk >= 907 MB; memory/VRAM около 1932 MB; CPU возможен; GPU ускоряет |
| Оптимальные требования | cuda, metal, vulkan, cpu; желательно 2608 MB+ свободной VRAM/RAM и 1419 MB+ disk cache |
| HF link | bartowski/Qwen2.5-7B-Instruct-GGUF |
| Доступные quantizations |
fp16, fp32, q2, q3, q4, q5, q6, q8
|
| Краткое описание | Native GGUF chat model for llama.cpp. |
| Best in |
chat, local-assistant
|
| Поле | Значение |
|---|---|
| Название | Qwen/Qwen2.5-Coder-7B-Instruct-GGUF |
| Label | Qwen2.5 Coder 7B Instruct |
| Категория | LLM / чат и генерация текста |
| Runtime/backend | native / llama.cpp / gguf |
| Вес | 0.89 GB catalog size, ~907 MB disk/cache |
| Параметры | 7B |
| Минимальные требования | medium - рабочая станция или заметный GPU; disk >= 907 MB; memory/VRAM около 1932 MB; CPU возможен; GPU ускоряет |
| Оптимальные требования | cuda, metal, vulkan, cpu; желательно 2608 MB+ свободной VRAM/RAM и 1419 MB+ disk cache |
| HF link | Qwen/Qwen2.5-Coder-7B-Instruct-GGUF |
| Доступные quantizations |
fp16, fp32, q2, q3, q4, q5, q6, q8
|
| Краткое описание | Native GGUF code model for llama.cpp. |
| Best in |
code, agents, chat, local-assistant
|
| Поле | Значение |
|---|---|
| Название | bartowski/Qwen2.5-Coder-7B-Instruct-GGUF |
| Label | Qwen2.5 Coder 7B Instruct |
| Категория | LLM / чат и генерация текста |
| Runtime/backend | native / llama.cpp / gguf |
| Вес | 0.89 GB catalog size, ~907 MB disk/cache |
| Параметры | 7B |
| Минимальные требования | medium - рабочая станция или заметный GPU; disk >= 907 MB; memory/VRAM около 1932 MB; CPU возможен; GPU ускоряет |
| Оптимальные требования | cuda, metal, vulkan, cpu; желательно 2608 MB+ свободной VRAM/RAM и 1419 MB+ disk cache |
| HF link | bartowski/Qwen2.5-Coder-7B-Instruct-GGUF |
| Доступные quantizations |
fp16, fp32, q2, q3, q4, q5, q6, q8
|
| Краткое описание | Native GGUF code model for llama.cpp. |
| Best in |
code, agents, chat, local-assistant
|
| Поле | Значение |
|---|---|
| Название | MaziyarPanahi/Llama-3-8B-Instruct-32k-v0.1-GGUF |
| Label | Llama 3 8B Instruct 32k v0.1 |
| Категория | LLM / чат и генерация текста |
| Runtime/backend | native / llama.cpp / gguf |
| Вес | 0.93 GB catalog size, ~957 MB disk/cache |
| Параметры | 8B |
| Минимальные требования | medium - рабочая станция или заметный GPU; disk >= 957 MB; memory/VRAM около 2022 MB; CPU возможен; GPU ускоряет |
| Оптимальные требования | cuda, metal, vulkan, cpu; желательно 2729 MB+ свободной VRAM/RAM и 1469 MB+ disk cache |
| HF link | MaziyarPanahi/Llama-3-8B-Instruct-32k-v0.1-GGUF |
| Доступные quantizations |
fp16, fp32, q2, q3, q4, q5, q6, q8
|
| Краткое описание | Native GGUF chat model for llama.cpp. |
| Best in |
chat, local-assistant
|
| Поле | Значение |
|---|---|
| Название | MaziyarPanahi/Llama-3-8B-Instruct-64k-GGUF |
| Label | Llama 3 8B Instruct 64k |
| Категория | LLM / чат и генерация текста |
| Runtime/backend | native / llama.cpp / gguf |
| Вес | 0.93 GB catalog size, ~957 MB disk/cache |
| Параметры | 8B |
| Минимальные требования | medium - рабочая станция или заметный GPU; disk >= 957 MB; memory/VRAM около 2022 MB; CPU возможен; GPU ускоряет |
| Оптимальные требования | cuda, metal, vulkan, cpu; желательно 2729 MB+ свободной VRAM/RAM и 1469 MB+ disk cache |
| HF link | MaziyarPanahi/Llama-3-8B-Instruct-64k-GGUF |
| Доступные quantizations |
fp16, fp32, q2, q3, q4, q5, q6, q8
|
| Краткое описание | Native GGUF chat model for llama.cpp. |
| Best in |
chat, local-assistant
|
| Поле | Значение |
|---|---|
| Название | mradermacher/Llama3.3-8B-Instruct-Thinking-Heretic-Uncensored-Claude-4.5-Opus-High-Reasoning-i1-GGUF |
| Label | Llama3.3 8B Instruct Thinking Heretic Uncensored Claude 4.5 Opus High Reasoning i1 |
| Категория | LLM / чат и генерация текста |
| Runtime/backend | native / llama.cpp / gguf |
| Вес | 0.93 GB catalog size, ~957 MB disk/cache |
| Параметры | 8B |
| Минимальные требования | medium - рабочая станция или заметный GPU; disk >= 957 MB; memory/VRAM около 2022 MB; CPU возможен; GPU ускоряет |
| Оптимальные требования | cuda, metal, vulkan, cpu; желательно 2729 MB+ свободной VRAM/RAM и 1469 MB+ disk cache |
| HF link | mradermacher/Llama3.3-8B-Instruct-Thinking-Heretic-Uncensored-Claude-4.5-Opus-High-Reasoning-i1-GGUF |
| Доступные quantizations |
fp16, fp32, q2, q3, q4, q5, q6, q8
|
| Краткое описание | Native GGUF reasoning model for llama.cpp. |
| Best in |
reasoning, agents, chat, local-assistant
|
| Поле | Значение |
|---|---|
| Название | MaziyarPanahi/Meta-Llama-3-8B-Instruct-GGUF |
| Label | Meta Llama 3 8B Instruct |
| Категория | LLM / чат и генерация текста |
| Runtime/backend | native / llama.cpp / gguf |
| Вес | 0.93 GB catalog size, ~957 MB disk/cache |
| Параметры | 8B |
| Минимальные требования | medium - рабочая станция или заметный GPU; disk >= 957 MB; memory/VRAM около 2022 MB; CPU возможен; GPU ускоряет |
| Оптимальные требования | cuda, metal, vulkan, cpu; желательно 2729 MB+ свободной VRAM/RAM и 1469 MB+ disk cache |
| HF link | MaziyarPanahi/Meta-Llama-3-8B-Instruct-GGUF |
| Доступные quantizations |
fp16, fp32, q2, q3, q4, q5, q6, q8
|
| Краткое описание | Native GGUF chat model for llama.cpp. |
| Best in |
chat, local-assistant
|
| Поле | Значение |
|---|---|
| Название | lmstudio-community/Meta-Llama-3-8B-Instruct-GGUF |
| Label | Meta Llama 3 8B Instruct |
| Категория | LLM / чат и генерация текста |
| Runtime/backend | native / llama.cpp / gguf |
| Вес | 0.93 GB catalog size, ~957 MB disk/cache |
| Параметры | 8B |
| Минимальные требования | medium - рабочая станция или заметный GPU; disk >= 957 MB; memory/VRAM около 2022 MB; CPU возможен; GPU ускоряет |
| Оптимальные требования | cuda, metal, vulkan, cpu; желательно 2729 MB+ свободной VRAM/RAM и 1469 MB+ disk cache |
| HF link | lmstudio-community/Meta-Llama-3-8B-Instruct-GGUF |
| Доступные quantizations |
fp16, fp32, q2, q3, q4, q5, q6, q8
|
| Краткое описание | Native GGUF chat model for llama.cpp. |
| Best in |
chat, local-assistant
|
| Поле | Значение |
|---|---|
| Название | bartowski/Meta-Llama-3.1-8B-Instruct-GGUF |
| Label | Meta Llama 3.1 8B Instruct |
| Категория | LLM / чат и генерация текста |
| Runtime/backend | native / llama.cpp / gguf |
| Вес | 0.93 GB catalog size, ~957 MB disk/cache |
| Параметры | 8B |
| Минимальные требования | medium - рабочая станция или заметный GPU; disk >= 957 MB; memory/VRAM около 2022 MB; CPU возможен; GPU ускоряет |
| Оптимальные требования | cuda, metal, vulkan, cpu; желательно 2729 MB+ свободной VRAM/RAM и 1469 MB+ disk cache |
| HF link | bartowski/Meta-Llama-3.1-8B-Instruct-GGUF |
| Доступные quantizations |
fp16, fp32, q2, q3, q4, q5, q6, q8
|
| Краткое описание | Native GGUF chat model for llama.cpp. |
| Best in |
chat, local-assistant
|
| Поле | Значение |
|---|---|
| Название | MaziyarPanahi/Meta-Llama-3.1-8B-Instruct-GGUF |
| Label | Meta Llama 3.1 8B Instruct |
| Категория | LLM / чат и генерация текста |
| Runtime/backend | native / llama.cpp / gguf |
| Вес | 0.93 GB catalog size, ~957 MB disk/cache |
| Параметры | 8B |
| Минимальные требования | medium - рабочая станция или заметный GPU; disk >= 957 MB; memory/VRAM около 2022 MB; CPU возможен; GPU ускоряет |
| Оптимальные требования | cuda, metal, vulkan, cpu; желательно 2729 MB+ свободной VRAM/RAM и 1469 MB+ disk cache |
| HF link | MaziyarPanahi/Meta-Llama-3.1-8B-Instruct-GGUF |
| Доступные quantizations |
fp16, fp32, q2, q3, q4, q5, q6, q8
|
| Краткое описание | Native GGUF chat model for llama.cpp. |
| Best in |
chat, local-assistant
|
| Поле | Значение |
|---|---|
| Название | lmstudio-community/Meta-Llama-3.1-8B-Instruct-GGUF |
| Label | Meta Llama 3.1 8B Instruct |
| Категория | LLM / чат и генерация текста |
| Runtime/backend | native / llama.cpp / gguf |
| Вес | 0.93 GB catalog size, ~957 MB disk/cache |
| Параметры | 8B |
| Минимальные требования | medium - рабочая станция или заметный GPU; disk >= 957 MB; memory/VRAM около 2022 MB; CPU возможен; GPU ускоряет |
| Оптимальные требования | cuda, metal, vulkan, cpu; желательно 2729 MB+ свободной VRAM/RAM и 1469 MB+ disk cache |
| HF link | lmstudio-community/Meta-Llama-3.1-8B-Instruct-GGUF |
| Доступные quantizations |
fp16, fp32, q2, q3, q4, q5, q6, q8
|
| Краткое описание | Native GGUF chat model for llama.cpp. |
| Best in |
chat, local-assistant
|
| Поле | Значение |
|---|---|
| Название | QuantFactory/Meta-Llama-3.1-8B-Instruct-GGUF |
| Label | Meta Llama 3.1 8B Instruct |
| Категория | LLM / чат и генерация текста |
| Runtime/backend | native / llama.cpp / gguf |
| Вес | 0.93 GB catalog size, ~957 MB disk/cache |
| Параметры | 8B |
| Минимальные требования | medium - рабочая станция или заметный GPU; disk >= 957 MB; memory/VRAM около 2022 MB; CPU возможен; GPU ускоряет |
| Оптимальные требования | cuda, metal, vulkan, cpu; желательно 2729 MB+ свободной VRAM/RAM и 1469 MB+ disk cache |
| HF link | QuantFactory/Meta-Llama-3.1-8B-Instruct-GGUF |
| Доступные quantizations |
fp16, fp32, q2, q3, q4, q5, q6, q8
|
| Краткое описание | Native GGUF chat model for llama.cpp. |
| Best in |
chat, local-assistant
|
| Поле | Значение |
|---|---|
| Название | SanctumAI/Meta-Llama-3.1-8B-Instruct-GGUF |
| Label | Meta Llama 3.1 8B Instruct |
| Категория | LLM / чат и генерация текста |
| Runtime/backend | native / llama.cpp / gguf |
| Вес | 0.93 GB catalog size, ~957 MB disk/cache |
| Параметры | 8B |
| Минимальные требования | medium - рабочая станция или заметный GPU; disk >= 957 MB; memory/VRAM около 2022 MB; CPU возможен; GPU ускоряет |
| Оптимальные требования | cuda, metal, vulkan, cpu; желательно 2729 MB+ свободной VRAM/RAM и 1469 MB+ disk cache |
| HF link | SanctumAI/Meta-Llama-3.1-8B-Instruct-GGUF |
| Доступные quantizations |
fp16, fp32, q2, q3, q4, q5, q6, q8
|
| Краткое описание | Native GGUF chat model for llama.cpp. |
| Best in |
chat, local-assistant
|
| Поле | Значение |
|---|---|
| Название | mlabonne/Meta-Llama-3.1-8B-Instruct-abliterated-GGUF |
| Label | Meta Llama 3.1 8B Instruct abliterated |
| Категория | LLM / чат и генерация текста |
| Runtime/backend | native / llama.cpp / gguf |
| Вес | 0.93 GB catalog size, ~957 MB disk/cache |
| Параметры | 8B |
| Минимальные требования | medium - рабочая станция или заметный GPU; disk >= 957 MB; memory/VRAM около 2022 MB; CPU возможен; GPU ускоряет |
| Оптимальные требования | cuda, metal, vulkan, cpu; желательно 2729 MB+ свободной VRAM/RAM и 1469 MB+ disk cache |
| HF link | mlabonne/Meta-Llama-3.1-8B-Instruct-abliterated-GGUF |
| Доступные quantizations |
fp16, fp32, q2, q3, q4, q5, q6, q8
|
| Краткое описание | Native GGUF chat model for llama.cpp. |
| Best in |
chat, local-assistant
|
| Поле | Значение |
|---|---|
| Название | bartowski/DeepSeek-Coder-V2-Lite-Instruct-GGUF |
| Label | DeepSeek Coder V2 Lite Instruct |
| Категория | LLM / чат и генерация текста |
| Runtime/backend | native / llama.cpp / gguf |
| Вес | 1.83 GB catalog size, ~1872 MB disk/cache |
| Параметры | не указаны |
| Минимальные требования | medium - рабочая станция или заметный GPU; disk >= 1872 MB; memory/VRAM около 3669 MB; CPU возможен; GPU ускоряет |
| Оптимальные требования | cuda, metal, vulkan, cpu; желательно 4953 MB+ свободной VRAM/RAM и 2384 MB+ disk cache |
| HF link | bartowski/DeepSeek-Coder-V2-Lite-Instruct-GGUF |
| Доступные quantizations |
fp16, fp32, q2, q3, q4, q5, q6, q8
|
| Краткое описание | Native GGUF code model for llama.cpp. |
| Best in |
code, agents, chat, local-assistant
|
| Поле | Значение |
|---|---|
| Название | DavidAU/Llama-3.2-8X3B-MOE-Dark-Champion-Instruct-uncensored-abliterated-18.4B-GGUF |
| Label | Llama 3.2 8X3B MOE Dark Champion Instruct uncensored abliterated 18.4B |
| Категория | LLM / чат и генерация текста |
| Runtime/backend | native / llama.cpp / gguf |
| Вес | 2.14 GB catalog size, ~2194 MB disk/cache |
| Параметры | 3B |
| Минимальные требования | medium - рабочая станция или заметный GPU; disk >= 2194 MB; memory/VRAM около 4249 MB; CPU возможен; GPU ускоряет |
| Оптимальные требования | cuda, metal, vulkan, cpu; желательно 5736 MB+ свободной VRAM/RAM и 2742 MB+ disk cache |
| HF link | DavidAU/Llama-3.2-8X3B-MOE-Dark-Champion-Instruct-uncensored-abliterated-18.4B-GGUF |
| Доступные quantizations |
fp16, fp32, q2, q3, q4, q5, q6, q8
|
| Краткое описание | Native GGUF chat model for llama.cpp. |
| Best in |
chat, local-assistant
|
| Поле | Значение |
|---|---|
| Название | MaziyarPanahi/solar-pro-preview-instruct-GGUF |
| Label | solar pro preview instruct |
| Категория | LLM / чат и генерация текста |
| Runtime/backend | native / llama.cpp / gguf |
| Вес | 2.58 GB catalog size, ~2639 MB disk/cache |
| Параметры | не указаны |
| Минимальные требования | medium - рабочая станция или заметный GPU; disk >= 2639 MB; memory/VRAM около 5050 MB; CPU возможен; GPU ускоряет |
| Оптимальные требования | cuda, metal, vulkan, cpu; желательно 6817 MB+ свободной VRAM/RAM и 3298 MB+ disk cache |
| HF link | MaziyarPanahi/solar-pro-preview-instruct-GGUF |
| Доступные quantizations |
fp16, fp32, q2, q3, q4, q5, q6, q8
|
| Краткое описание | Native GGUF chat model for llama.cpp. |
| Best in |
chat, local-assistant
|
| Поле | Значение |
|---|---|
| Название | MaziyarPanahi/Mistral-Small-Instruct-2409-GGUF |
| Label | Mistral Small Instruct 2409 |
| Категория | LLM / чат и генерация текста |
| Runtime/backend | native / llama.cpp / gguf |
| Вес | 2.59 GB catalog size, ~2652 MB disk/cache |
| Параметры | не указаны |
| Минимальные требования | medium - рабочая станция или заметный GPU; disk >= 2652 MB; memory/VRAM около 5073 MB; CPU возможен; GPU ускоряет |
| Оптимальные требования | cuda, metal, vulkan, cpu; желательно 6848 MB+ свободной VRAM/RAM и 3315 MB+ disk cache |
| HF link | MaziyarPanahi/Mistral-Small-Instruct-2409-GGUF |
| Доступные quantizations |
fp16, fp32, q2, q3, q4, q5, q6, q8
|
| Краткое описание | Native GGUF chat model for llama.cpp. |
| Best in |
chat, local-assistant
|
- xlocllm
- Quickstart
- About
- Functions Python
- Functions TypeScript
- Use cases
- Examples Python
- Examples TypeScript
- Shared GPU mode
-
Models catalog
- Models The best
- Models Full model list
- Models Use your model
- For native mode
- Models Native LLM tiny small
- Models Native LLM medium
- Models Native LLM large
- Models Native embedding
- Models Native reranker
- Models Native translator
- Models Native tts
- Models Native vlm
- Models Native asr
- Models Native ocr
- Models Native image-classification
- Models Native object-detection
- Models Native image-segmentation
- Models Native depth-estimation
- Models Native document-layout
- Models Native table-detection
- Models Native document-qa
- Models Native language-id
- Models Native audio-classification
- Models Native text-classification
- Models Native ner
- Models Native zero-shot-text
- Models Native summarization
- Models Native text2text
- Models Native code
- For webgpu mode
- For web mode
- Models Web LLM
- Models Web embedding
- Models Web reranker
- Models Web translator
- Models Web tts
- Models Web vlm
- Models Web asr
- Models Web ocr
- Models Web image-classification
- Models Web object-detection
- Models Web image-segmentation
- Models Web depth-estimation
- Models Web document-layout
- Models Web table-detection
- Models Web document-qa
- Models Web zero-shot-image
- Models Web language-id
- Models Web audio-classification
- Models Web text-classification
- Models Web ner
- Models Web zero-shot-text
- Models Web summarization
- Models Web text2text
- Models Web code
- Dev