Models Web LLM

Режим: Web. Категория: LLM / чат и генерация текста.

Всего моделей: 18.

SmolLM 135M

Поле	Значение
Название	`onnx-community/SmolLM-135M-ONNX`
Label	SmolLM 135M
Категория	LLM / чат и генерация текста
Runtime/backend	transformers
Вес	0.12 GB catalog size, ~128 MB disk/cache
Параметры	0.135B
Минимальные требования	tiny - очень слабое железо, CPU/WASM или небольшой GPU; disk >= 128 MB; memory/VRAM около 256 MB; браузер CPU/WASM; WebGPU полезен, если доступен
Оптимальные требования	modern CPU plus WebGPU/NPU when available; желательно 768 MB+ свободной VRAM/RAM и 640 MB+ disk cache
HF link	onnx-community/SmolLM-135M-ONNX
Доступные quantizations	`auto`
Краткое описание	known browser-ready provider
Best in	локальный чат, агентные сценарии, OpenAI-compatible `/v1/chat/completions`

SmolLM 135M Instruct

Поле	Значение
Название	`onnx-community/SmolLM-135M-Instruct-ONNX`
Label	SmolLM 135M Instruct
Категория	LLM / чат и генерация текста
Runtime/backend	transformers
Вес	0.12 GB catalog size, ~128 MB disk/cache
Параметры	0.135B
Минимальные требования	tiny - очень слабое железо, CPU/WASM или небольшой GPU; disk >= 128 MB; memory/VRAM около 256 MB; браузер CPU/WASM; WebGPU полезен, если доступен
Оптимальные требования	modern CPU plus WebGPU/NPU when available; желательно 768 MB+ свободной VRAM/RAM и 640 MB+ disk cache
HF link	onnx-community/SmolLM-135M-Instruct-ONNX
Доступные quantizations	`auto`
Краткое описание	known browser-ready provider
Best in	локальный чат, агентные сценарии, OpenAI-compatible `/v1/chat/completions`

SmolLM2 135M

Поле	Значение
Название	`onnx-community/SmolLM2-135M-ONNX`
Label	SmolLM2 135M
Категория	LLM / чат и генерация текста
Runtime/backend	transformers
Вес	0.12 GB catalog size, ~128 MB disk/cache
Параметры	0.135B
Минимальные требования	tiny - очень слабое железо, CPU/WASM или небольшой GPU; disk >= 128 MB; memory/VRAM около 256 MB; браузер CPU/WASM; WebGPU полезен, если доступен
Оптимальные требования	modern CPU plus WebGPU/NPU when available; желательно 768 MB+ свободной VRAM/RAM и 640 MB+ disk cache
HF link	onnx-community/SmolLM2-135M-ONNX
Доступные quantizations	`auto`
Краткое описание	known browser-ready provider
Best in	локальный чат, агентные сценарии, OpenAI-compatible `/v1/chat/completions`

functiongemma 270m it

Поле	Значение
Название	`onnx-community/functiongemma-270m-it-ONNX`
Label	functiongemma 270m it
Категория	LLM / чат и генерация текста
Runtime/backend	transformers
Вес	0.25 GB catalog size, ~256 MB disk/cache
Параметры	0.27B
Минимальные требования	tiny - очень слабое железо, CPU/WASM или небольшой GPU; disk >= 256 MB; memory/VRAM около 460 MB; браузер CPU/WASM; WebGPU полезен, если доступен
Оптимальные требования	modern CPU plus WebGPU/NPU when available; желательно 972 MB+ свободной VRAM/RAM и 768 MB+ disk cache
HF link	onnx-community/functiongemma-270m-it-ONNX
Доступные quantizations	`auto`
Краткое описание	known browser-ready provider
Best in	локальный чат, агентные сценарии, OpenAI-compatible `/v1/chat/completions`

gemma 3 270m it

Поле	Значение
Название	`onnx-community/gemma-3-270m-it-ONNX`
Label	gemma 3 270m it
Категория	LLM / чат и генерация текста
Runtime/backend	transformers
Вес	0.25 GB catalog size, ~256 MB disk/cache
Параметры	0.27B
Минимальные требования	tiny - очень слабое железо, CPU/WASM или небольшой GPU; disk >= 256 MB; memory/VRAM около 460 MB; браузер CPU/WASM; WebGPU полезен, если доступен
Оптимальные требования	modern CPU plus WebGPU/NPU when available; желательно 972 MB+ свободной VRAM/RAM и 768 MB+ disk cache
HF link	onnx-community/gemma-3-270m-it-ONNX
Доступные quantizations	`auto`
Краткое описание	known browser-ready provider
Best in	локальный чат, агентные сценарии, OpenAI-compatible `/v1/chat/completions`

gemma 4 E2B it

Поле	Значение
Название	`onnx-community/gemma-4-E2B-it-ONNX`
Label	gemma 4 E2B it
Категория	LLM / чат и генерация текста
Runtime/backend	transformers
Вес	0.29 GB catalog size, ~300 MB disk/cache
Параметры	не указаны
Минимальные требования	tiny - очень слабое железо, CPU/WASM или небольшой GPU; disk >= 300 MB; memory/VRAM около 540 MB; браузер CPU/WASM; WebGPU полезен, если доступен
Оптимальные требования	modern CPU plus WebGPU/NPU when available; желательно 1052 MB+ свободной VRAM/RAM и 812 MB+ disk cache
HF link	onnx-community/gemma-4-E2B-it-ONNX
Доступные quantizations	`auto`
Краткое описание	known browser-ready provider
Best in	локальный чат, агентные сценарии, OpenAI-compatible `/v1/chat/completions`

gemma 4 E4B it

Поле	Значение
Название	`onnx-community/gemma-4-E4B-it-ONNX`
Label	gemma 4 E4B it
Категория	LLM / чат и генерация текста
Runtime/backend	transformers
Вес	0.29 GB catalog size, ~300 MB disk/cache
Параметры	не указаны
Минимальные требования	tiny - очень слабое железо, CPU/WASM или небольшой GPU; disk >= 300 MB; memory/VRAM около 540 MB; браузер CPU/WASM; WebGPU полезен, если доступен
Оптимальные требования	modern CPU plus WebGPU/NPU when available; желательно 1052 MB+ свободной VRAM/RAM и 812 MB+ disk cache
HF link	onnx-community/gemma-4-E4B-it-ONNX
Доступные quantizations	`auto`
Краткое описание	known browser-ready provider
Best in	локальный чат, агентные сценарии, OpenAI-compatible `/v1/chat/completions`

Qwen3 0.6B DQ

Поле	Значение
Название	`onnx-community/Qwen3-0.6B-DQ-ONNX`
Label	Qwen3 0.6B DQ
Категория	LLM / чат и генерация текста
Runtime/backend	transformers
Вес	0.30 GB catalog size, ~312 MB disk/cache
Параметры	0.6B
Минимальные требования	small - ноутбук или небольшой GPU; disk >= 312 MB; memory/VRAM около 561 MB; браузер CPU/WASM; WebGPU полезен, если доступен
Оптимальные требования	modern CPU plus WebGPU/NPU when available; желательно 1073 MB+ свободной VRAM/RAM и 824 MB+ disk cache
HF link	onnx-community/Qwen3-0.6B-DQ-ONNX
Доступные quantizations	`auto`
Краткое описание	known browser-ready provider
Best in	локальный чат, агентные сценарии, OpenAI-compatible `/v1/chat/completions`

SmolLM2 360M

Поле	Значение
Название	`onnx-community/SmolLM2-360M-ONNX`
Label	SmolLM2 360M
Категория	LLM / чат и генерация текста
Runtime/backend	transformers
Вес	0.33 GB catalog size, ~342 MB disk/cache
Параметры	0.36B
Минимальные требования	small - ноутбук или небольшой GPU; disk >= 342 MB; memory/VRAM около 615 MB; браузер CPU/WASM; WebGPU полезен, если доступен
Оптимальные требования	modern CPU plus WebGPU/NPU when available; желательно 1127 MB+ свободной VRAM/RAM и 854 MB+ disk cache
HF link	onnx-community/SmolLM2-360M-ONNX
Доступные quantizations	`auto`
Краткое описание	known browser-ready provider
Best in	локальный чат, агентные сценарии, OpenAI-compatible `/v1/chat/completions`

SmolLM2 360M Instruct

Поле	Значение
Название	`HuggingFaceTB/SmolLM2-360M-Instruct`
Label	SmolLM2 360M Instruct
Категория	LLM / чат и генерация текста
Runtime/backend	transformers
Вес	0.33 GB catalog size, ~342 MB disk/cache
Параметры	0.36B
Минимальные требования	small - ноутбук или небольшой GPU; disk >= 342 MB; memory/VRAM около 615 MB; браузер CPU/WASM; WebGPU полезен, если доступен
Оптимальные требования	modern CPU plus WebGPU/NPU when available; желательно 1127 MB+ свободной VRAM/RAM и 854 MB+ disk cache
HF link	HuggingFaceTB/SmolLM2-360M-Instruct
Доступные quantizations	`auto`
Краткое описание	ONNX/WebGPU artifact marker
Best in	локальный чат, агентные сценарии, OpenAI-compatible `/v1/chat/completions`

Qwen2.5 0.5B Instruct

Поле	Значение
Название	`asdgad/Qwen2.5-0.5B-Instruct-ONNX`
Label	Qwen2.5 0.5B Instruct
Категория	LLM / чат и генерация текста
Runtime/backend	transformers
Вес	0.46 GB catalog size, ~475 MB disk/cache
Параметры	0.5B
Минимальные требования	small - ноутбук или небольшой GPU; disk >= 475 MB; memory/VRAM около 855 MB; браузер CPU/WASM; WebGPU полезен, если доступен
Оптимальные требования	modern CPU plus WebGPU/NPU when available; желательно 1367 MB+ свободной VRAM/RAM и 987 MB+ disk cache
HF link	asdgad/Qwen2.5-0.5B-Instruct-ONNX
Доступные quantizations	`auto`
Краткое описание	ONNX/WebGPU artifact marker
Best in	локальный чат, агентные сценарии, OpenAI-compatible `/v1/chat/completions`

Qwen2.5 Coder 0.5B Instruct

Поле	Значение
Название	`onnx-community/Qwen2.5-Coder-0.5B-Instruct`
Label	Qwen2.5 Coder 0.5B Instruct
Категория	LLM / чат и генерация текста
Runtime/backend	transformers
Вес	0.46 GB catalog size, ~475 MB disk/cache
Параметры	0.5B
Минимальные требования	small - ноутбук или небольшой GPU; disk >= 475 MB; memory/VRAM около 855 MB; браузер CPU/WASM; WebGPU полезен, если доступен
Оптимальные требования	modern CPU plus WebGPU/NPU when available; желательно 1367 MB+ свободной VRAM/RAM и 987 MB+ disk cache
HF link	onnx-community/Qwen2.5-Coder-0.5B-Instruct
Доступные quantizations	`auto`
Краткое описание	known browser-ready provider
Best in	локальный чат, агентные сценарии, OpenAI-compatible `/v1/chat/completions`

Llama 3.2 1B Instruct q4f16

Поле	Значение
Название	`onnx-community/Llama-3.2-1B-Instruct-q4f16`
Label	Llama 3.2 1B Instruct q4f16
Категория	LLM / чат и генерация текста
Runtime/backend	transformers
Вес	0.51 GB catalog size, ~520 MB disk/cache
Параметры	1B
Минимальные требования	small - ноутбук или небольшой GPU; disk >= 520 MB; memory/VRAM около 936 MB; браузер CPU/WASM; WebGPU полезен, если доступен
Оптимальные требования	modern CPU plus WebGPU/NPU when available; желательно 1448 MB+ свободной VRAM/RAM и 1032 MB+ disk cache
HF link	onnx-community/Llama-3.2-1B-Instruct-q4f16
Доступные quantizations	`auto`
Краткое описание	known browser-ready provider
Best in	локальный чат, агентные сценарии, OpenAI-compatible `/v1/chat/completions`

Qwen3 0.6B ONNX

Поле	Значение
Название	`onnx-community/Qwen3-0.6B-ONNX`
Label	Qwen3 0.6B ONNX
Категория	LLM / чат и генерация текста
Runtime/backend	transformers
Вес	0.49 GB catalog size, ~500 MB disk/cache
Параметры	0.6B
Минимальные требования	small - ноутбук или небольшой GPU; disk >= 500 MB; memory/VRAM около 1100 MB; браузер CPU/WASM; WebGPU полезен, если доступен
Оптимальные требования	modern CPU plus WebGPU/NPU when available; желательно 1612 MB+ свободной VRAM/RAM и 1012 MB+ disk cache
HF link	onnx-community/Qwen3-0.6B-ONNX
Доступные quantizations	`q4`
Краткое описание	Catalog entry for LLM / чат и генерация текста.
Best in	локальный чат, агентные сценарии, OpenAI-compatible `/v1/chat/completions`

Qwen3.5 0.8B

Поле	Значение
Название	`onnx-community/Qwen3.5-0.8B-ONNX`
Label	Qwen3.5 0.8B
Категория	LLM / чат и генерация текста
Runtime/backend	transformers
Вес	0.74 GB catalog size, ~760 MB disk/cache
Параметры	0.8B
Минимальные требования	small - ноутбук или небольшой GPU; disk >= 760 MB; memory/VRAM около 1368 MB; браузер CPU/WASM; WebGPU полезен, если доступен
Оптимальные требования	modern CPU plus WebGPU/NPU when available; желательно 1880 MB+ свободной VRAM/RAM и 1272 MB+ disk cache
HF link	onnx-community/Qwen3.5-0.8B-ONNX
Доступные quantizations	`auto`
Краткое описание	known browser-ready provider
Best in	локальный чат, агентные сценарии, OpenAI-compatible `/v1/chat/completions`

Llama 3.2 1B Instruct

Поле	Значение
Название	`onnx-community/Llama-3.2-1B-Instruct-ONNX`
Label	Llama 3.2 1B Instruct
Категория	LLM / чат и генерация текста
Runtime/backend	transformers
Вес	0.93 GB catalog size, ~950 MB disk/cache
Параметры	1B
Минимальные требования	small - ноутбук или небольшой GPU; disk >= 950 MB; memory/VRAM около 1710 MB; браузер CPU/WASM; WebGPU полезен, если доступен
Оптимальные требования	modern CPU plus WebGPU/NPU when available; желательно 2308 MB+ свободной VRAM/RAM и 1462 MB+ disk cache
HF link	onnx-community/Llama-3.2-1B-Instruct-ONNX
Доступные quantizations	`auto`
Краткое описание	known browser-ready provider
Best in	локальный чат, агентные сценарии, OpenAI-compatible `/v1/chat/completions`

gemma 3 1b it

Поле	Значение
Название	`onnx-community/gemma-3-1b-it-ONNX`
Label	gemma 3 1b it
Категория	LLM / чат и генерация текста
Runtime/backend	transformers
Вес	0.93 GB catalog size, ~950 MB disk/cache
Параметры	1B
Минимальные требования	small - ноутбук или небольшой GPU; disk >= 950 MB; memory/VRAM около 1710 MB; браузер CPU/WASM; WebGPU полезен, если доступен
Оптимальные требования	modern CPU plus WebGPU/NPU when available; желательно 2308 MB+ свободной VRAM/RAM и 1462 MB+ disk cache
HF link	onnx-community/gemma-3-1b-it-ONNX
Доступные quantizations	`auto`
Краткое описание	known browser-ready provider
Best in	локальный чат, агентные сценарии, OpenAI-compatible `/v1/chat/completions`

gemma 3 1b it

Поле	Значение
Название	`onnx-community/gemma-3-1b-it-ONNX-GQA`
Label	gemma 3 1b it
Категория	LLM / чат и генерация текста
Runtime/backend	transformers
Вес	0.93 GB catalog size, ~950 MB disk/cache
Параметры	1B
Минимальные требования	small - ноутбук или небольшой GPU; disk >= 950 MB; memory/VRAM около 1710 MB; браузер CPU/WASM; WebGPU полезен, если доступен
Оптимальные требования	modern CPU plus WebGPU/NPU when available; желательно 2308 MB+ свободной VRAM/RAM и 1462 MB+ disk cache
HF link	onnx-community/gemma-3-1b-it-ONNX-GQA
Доступные quantizations	`auto`
Краткое описание	known browser-ready provider
Best in	локальный чат, агентные сценарии, OpenAI-compatible `/v1/chat/completions`

Models Web LLM

Models Web LLM

SmolLM 135M

SmolLM 135M Instruct

SmolLM2 135M

functiongemma 270m it

gemma 3 270m it

gemma 4 E2B it

gemma 4 E4B it

Qwen3 0.6B DQ

SmolLM2 360M

SmolLM2 360M Instruct

Qwen2.5 0.5B Instruct

Qwen2.5 Coder 0.5B Instruct

Llama 3.2 1B Instruct q4f16

Qwen3 0.6B ONNX

Qwen3.5 0.8B

Llama 3.2 1B Instruct

gemma 3 1b it

gemma 3 1b it

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!