Skip to content

Models Web LLM

Mike edited this page May 28, 2026 · 1 revision

Models Web LLM

Режим: Web. Категория: LLM / чат и генерация текста.

Всего моделей: 18.

SmolLM 135M

Поле Значение
Название onnx-community/SmolLM-135M-ONNX
Label SmolLM 135M
Категория LLM / чат и генерация текста
Runtime/backend transformers
Вес 0.12 GB catalog size, ~128 MB disk/cache
Параметры 0.135B
Минимальные требования tiny - очень слабое железо, CPU/WASM или небольшой GPU; disk >= 128 MB; memory/VRAM около 256 MB; браузер CPU/WASM; WebGPU полезен, если доступен
Оптимальные требования modern CPU plus WebGPU/NPU when available; желательно 768 MB+ свободной VRAM/RAM и 640 MB+ disk cache
HF link onnx-community/SmolLM-135M-ONNX
Доступные quantizations auto
Краткое описание known browser-ready provider
Best in локальный чат, агентные сценарии, OpenAI-compatible /v1/chat/completions

SmolLM 135M Instruct

Поле Значение
Название onnx-community/SmolLM-135M-Instruct-ONNX
Label SmolLM 135M Instruct
Категория LLM / чат и генерация текста
Runtime/backend transformers
Вес 0.12 GB catalog size, ~128 MB disk/cache
Параметры 0.135B
Минимальные требования tiny - очень слабое железо, CPU/WASM или небольшой GPU; disk >= 128 MB; memory/VRAM около 256 MB; браузер CPU/WASM; WebGPU полезен, если доступен
Оптимальные требования modern CPU plus WebGPU/NPU when available; желательно 768 MB+ свободной VRAM/RAM и 640 MB+ disk cache
HF link onnx-community/SmolLM-135M-Instruct-ONNX
Доступные quantizations auto
Краткое описание known browser-ready provider
Best in локальный чат, агентные сценарии, OpenAI-compatible /v1/chat/completions

SmolLM2 135M

Поле Значение
Название onnx-community/SmolLM2-135M-ONNX
Label SmolLM2 135M
Категория LLM / чат и генерация текста
Runtime/backend transformers
Вес 0.12 GB catalog size, ~128 MB disk/cache
Параметры 0.135B
Минимальные требования tiny - очень слабое железо, CPU/WASM или небольшой GPU; disk >= 128 MB; memory/VRAM около 256 MB; браузер CPU/WASM; WebGPU полезен, если доступен
Оптимальные требования modern CPU plus WebGPU/NPU when available; желательно 768 MB+ свободной VRAM/RAM и 640 MB+ disk cache
HF link onnx-community/SmolLM2-135M-ONNX
Доступные quantizations auto
Краткое описание known browser-ready provider
Best in локальный чат, агентные сценарии, OpenAI-compatible /v1/chat/completions

functiongemma 270m it

Поле Значение
Название onnx-community/functiongemma-270m-it-ONNX
Label functiongemma 270m it
Категория LLM / чат и генерация текста
Runtime/backend transformers
Вес 0.25 GB catalog size, ~256 MB disk/cache
Параметры 0.27B
Минимальные требования tiny - очень слабое железо, CPU/WASM или небольшой GPU; disk >= 256 MB; memory/VRAM около 460 MB; браузер CPU/WASM; WebGPU полезен, если доступен
Оптимальные требования modern CPU plus WebGPU/NPU when available; желательно 972 MB+ свободной VRAM/RAM и 768 MB+ disk cache
HF link onnx-community/functiongemma-270m-it-ONNX
Доступные quantizations auto
Краткое описание known browser-ready provider
Best in локальный чат, агентные сценарии, OpenAI-compatible /v1/chat/completions

gemma 3 270m it

Поле Значение
Название onnx-community/gemma-3-270m-it-ONNX
Label gemma 3 270m it
Категория LLM / чат и генерация текста
Runtime/backend transformers
Вес 0.25 GB catalog size, ~256 MB disk/cache
Параметры 0.27B
Минимальные требования tiny - очень слабое железо, CPU/WASM или небольшой GPU; disk >= 256 MB; memory/VRAM около 460 MB; браузер CPU/WASM; WebGPU полезен, если доступен
Оптимальные требования modern CPU plus WebGPU/NPU when available; желательно 972 MB+ свободной VRAM/RAM и 768 MB+ disk cache
HF link onnx-community/gemma-3-270m-it-ONNX
Доступные quantizations auto
Краткое описание known browser-ready provider
Best in локальный чат, агентные сценарии, OpenAI-compatible /v1/chat/completions

gemma 4 E2B it

Поле Значение
Название onnx-community/gemma-4-E2B-it-ONNX
Label gemma 4 E2B it
Категория LLM / чат и генерация текста
Runtime/backend transformers
Вес 0.29 GB catalog size, ~300 MB disk/cache
Параметры не указаны
Минимальные требования tiny - очень слабое железо, CPU/WASM или небольшой GPU; disk >= 300 MB; memory/VRAM около 540 MB; браузер CPU/WASM; WebGPU полезен, если доступен
Оптимальные требования modern CPU plus WebGPU/NPU when available; желательно 1052 MB+ свободной VRAM/RAM и 812 MB+ disk cache
HF link onnx-community/gemma-4-E2B-it-ONNX
Доступные quantizations auto
Краткое описание known browser-ready provider
Best in локальный чат, агентные сценарии, OpenAI-compatible /v1/chat/completions

gemma 4 E4B it

Поле Значение
Название onnx-community/gemma-4-E4B-it-ONNX
Label gemma 4 E4B it
Категория LLM / чат и генерация текста
Runtime/backend transformers
Вес 0.29 GB catalog size, ~300 MB disk/cache
Параметры не указаны
Минимальные требования tiny - очень слабое железо, CPU/WASM или небольшой GPU; disk >= 300 MB; memory/VRAM около 540 MB; браузер CPU/WASM; WebGPU полезен, если доступен
Оптимальные требования modern CPU plus WebGPU/NPU when available; желательно 1052 MB+ свободной VRAM/RAM и 812 MB+ disk cache
HF link onnx-community/gemma-4-E4B-it-ONNX
Доступные quantizations auto
Краткое описание known browser-ready provider
Best in локальный чат, агентные сценарии, OpenAI-compatible /v1/chat/completions

Qwen3 0.6B DQ

Поле Значение
Название onnx-community/Qwen3-0.6B-DQ-ONNX
Label Qwen3 0.6B DQ
Категория LLM / чат и генерация текста
Runtime/backend transformers
Вес 0.30 GB catalog size, ~312 MB disk/cache
Параметры 0.6B
Минимальные требования small - ноутбук или небольшой GPU; disk >= 312 MB; memory/VRAM около 561 MB; браузер CPU/WASM; WebGPU полезен, если доступен
Оптимальные требования modern CPU plus WebGPU/NPU when available; желательно 1073 MB+ свободной VRAM/RAM и 824 MB+ disk cache
HF link onnx-community/Qwen3-0.6B-DQ-ONNX
Доступные quantizations auto
Краткое описание known browser-ready provider
Best in локальный чат, агентные сценарии, OpenAI-compatible /v1/chat/completions

SmolLM2 360M

Поле Значение
Название onnx-community/SmolLM2-360M-ONNX
Label SmolLM2 360M
Категория LLM / чат и генерация текста
Runtime/backend transformers
Вес 0.33 GB catalog size, ~342 MB disk/cache
Параметры 0.36B
Минимальные требования small - ноутбук или небольшой GPU; disk >= 342 MB; memory/VRAM около 615 MB; браузер CPU/WASM; WebGPU полезен, если доступен
Оптимальные требования modern CPU plus WebGPU/NPU when available; желательно 1127 MB+ свободной VRAM/RAM и 854 MB+ disk cache
HF link onnx-community/SmolLM2-360M-ONNX
Доступные quantizations auto
Краткое описание known browser-ready provider
Best in локальный чат, агентные сценарии, OpenAI-compatible /v1/chat/completions

SmolLM2 360M Instruct

Поле Значение
Название HuggingFaceTB/SmolLM2-360M-Instruct
Label SmolLM2 360M Instruct
Категория LLM / чат и генерация текста
Runtime/backend transformers
Вес 0.33 GB catalog size, ~342 MB disk/cache
Параметры 0.36B
Минимальные требования small - ноутбук или небольшой GPU; disk >= 342 MB; memory/VRAM около 615 MB; браузер CPU/WASM; WebGPU полезен, если доступен
Оптимальные требования modern CPU plus WebGPU/NPU when available; желательно 1127 MB+ свободной VRAM/RAM и 854 MB+ disk cache
HF link HuggingFaceTB/SmolLM2-360M-Instruct
Доступные quantizations auto
Краткое описание ONNX/WebGPU artifact marker
Best in локальный чат, агентные сценарии, OpenAI-compatible /v1/chat/completions

Qwen2.5 0.5B Instruct

Поле Значение
Название asdgad/Qwen2.5-0.5B-Instruct-ONNX
Label Qwen2.5 0.5B Instruct
Категория LLM / чат и генерация текста
Runtime/backend transformers
Вес 0.46 GB catalog size, ~475 MB disk/cache
Параметры 0.5B
Минимальные требования small - ноутбук или небольшой GPU; disk >= 475 MB; memory/VRAM около 855 MB; браузер CPU/WASM; WebGPU полезен, если доступен
Оптимальные требования modern CPU plus WebGPU/NPU when available; желательно 1367 MB+ свободной VRAM/RAM и 987 MB+ disk cache
HF link asdgad/Qwen2.5-0.5B-Instruct-ONNX
Доступные quantizations auto
Краткое описание ONNX/WebGPU artifact marker
Best in локальный чат, агентные сценарии, OpenAI-compatible /v1/chat/completions

Qwen2.5 Coder 0.5B Instruct

Поле Значение
Название onnx-community/Qwen2.5-Coder-0.5B-Instruct
Label Qwen2.5 Coder 0.5B Instruct
Категория LLM / чат и генерация текста
Runtime/backend transformers
Вес 0.46 GB catalog size, ~475 MB disk/cache
Параметры 0.5B
Минимальные требования small - ноутбук или небольшой GPU; disk >= 475 MB; memory/VRAM около 855 MB; браузер CPU/WASM; WebGPU полезен, если доступен
Оптимальные требования modern CPU plus WebGPU/NPU when available; желательно 1367 MB+ свободной VRAM/RAM и 987 MB+ disk cache
HF link onnx-community/Qwen2.5-Coder-0.5B-Instruct
Доступные quantizations auto
Краткое описание known browser-ready provider
Best in локальный чат, агентные сценарии, OpenAI-compatible /v1/chat/completions

Llama 3.2 1B Instruct q4f16

Поле Значение
Название onnx-community/Llama-3.2-1B-Instruct-q4f16
Label Llama 3.2 1B Instruct q4f16
Категория LLM / чат и генерация текста
Runtime/backend transformers
Вес 0.51 GB catalog size, ~520 MB disk/cache
Параметры 1B
Минимальные требования small - ноутбук или небольшой GPU; disk >= 520 MB; memory/VRAM около 936 MB; браузер CPU/WASM; WebGPU полезен, если доступен
Оптимальные требования modern CPU plus WebGPU/NPU when available; желательно 1448 MB+ свободной VRAM/RAM и 1032 MB+ disk cache
HF link onnx-community/Llama-3.2-1B-Instruct-q4f16
Доступные quantizations auto
Краткое описание known browser-ready provider
Best in локальный чат, агентные сценарии, OpenAI-compatible /v1/chat/completions

Qwen3 0.6B ONNX

Поле Значение
Название onnx-community/Qwen3-0.6B-ONNX
Label Qwen3 0.6B ONNX
Категория LLM / чат и генерация текста
Runtime/backend transformers
Вес 0.49 GB catalog size, ~500 MB disk/cache
Параметры 0.6B
Минимальные требования small - ноутбук или небольшой GPU; disk >= 500 MB; memory/VRAM около 1100 MB; браузер CPU/WASM; WebGPU полезен, если доступен
Оптимальные требования modern CPU plus WebGPU/NPU when available; желательно 1612 MB+ свободной VRAM/RAM и 1012 MB+ disk cache
HF link onnx-community/Qwen3-0.6B-ONNX
Доступные quantizations q4
Краткое описание Catalog entry for LLM / чат и генерация текста.
Best in локальный чат, агентные сценарии, OpenAI-compatible /v1/chat/completions

Qwen3.5 0.8B

Поле Значение
Название onnx-community/Qwen3.5-0.8B-ONNX
Label Qwen3.5 0.8B
Категория LLM / чат и генерация текста
Runtime/backend transformers
Вес 0.74 GB catalog size, ~760 MB disk/cache
Параметры 0.8B
Минимальные требования small - ноутбук или небольшой GPU; disk >= 760 MB; memory/VRAM около 1368 MB; браузер CPU/WASM; WebGPU полезен, если доступен
Оптимальные требования modern CPU plus WebGPU/NPU when available; желательно 1880 MB+ свободной VRAM/RAM и 1272 MB+ disk cache
HF link onnx-community/Qwen3.5-0.8B-ONNX
Доступные quantizations auto
Краткое описание known browser-ready provider
Best in локальный чат, агентные сценарии, OpenAI-compatible /v1/chat/completions

Llama 3.2 1B Instruct

Поле Значение
Название onnx-community/Llama-3.2-1B-Instruct-ONNX
Label Llama 3.2 1B Instruct
Категория LLM / чат и генерация текста
Runtime/backend transformers
Вес 0.93 GB catalog size, ~950 MB disk/cache
Параметры 1B
Минимальные требования small - ноутбук или небольшой GPU; disk >= 950 MB; memory/VRAM около 1710 MB; браузер CPU/WASM; WebGPU полезен, если доступен
Оптимальные требования modern CPU plus WebGPU/NPU when available; желательно 2308 MB+ свободной VRAM/RAM и 1462 MB+ disk cache
HF link onnx-community/Llama-3.2-1B-Instruct-ONNX
Доступные quantizations auto
Краткое описание known browser-ready provider
Best in локальный чат, агентные сценарии, OpenAI-compatible /v1/chat/completions

gemma 3 1b it

Поле Значение
Название onnx-community/gemma-3-1b-it-ONNX
Label gemma 3 1b it
Категория LLM / чат и генерация текста
Runtime/backend transformers
Вес 0.93 GB catalog size, ~950 MB disk/cache
Параметры 1B
Минимальные требования small - ноутбук или небольшой GPU; disk >= 950 MB; memory/VRAM около 1710 MB; браузер CPU/WASM; WebGPU полезен, если доступен
Оптимальные требования modern CPU plus WebGPU/NPU when available; желательно 2308 MB+ свободной VRAM/RAM и 1462 MB+ disk cache
HF link onnx-community/gemma-3-1b-it-ONNX
Доступные quantizations auto
Краткое описание known browser-ready provider
Best in локальный чат, агентные сценарии, OpenAI-compatible /v1/chat/completions

gemma 3 1b it

Поле Значение
Название onnx-community/gemma-3-1b-it-ONNX-GQA
Label gemma 3 1b it
Категория LLM / чат и генерация текста
Runtime/backend transformers
Вес 0.93 GB catalog size, ~950 MB disk/cache
Параметры 1B
Минимальные требования small - ноутбук или небольшой GPU; disk >= 950 MB; memory/VRAM около 1710 MB; браузер CPU/WASM; WebGPU полезен, если доступен
Оптимальные требования modern CPU plus WebGPU/NPU when available; желательно 2308 MB+ свободной VRAM/RAM и 1462 MB+ disk cache
HF link onnx-community/gemma-3-1b-it-ONNX-GQA
Доступные quantizations auto
Краткое описание known browser-ready provider
Best in локальный чат, агентные сценарии, OpenAI-compatible /v1/chat/completions

Clone this wiki locally