-
Notifications
You must be signed in to change notification settings - Fork 0
Models Web LLM
Mike edited this page May 28, 2026
·
1 revision
Режим: Web. Категория: LLM / чат и генерация текста.
Всего моделей: 18.
| Поле | Значение |
|---|---|
| Название | onnx-community/SmolLM-135M-ONNX |
| Label | SmolLM 135M |
| Категория | LLM / чат и генерация текста |
| Runtime/backend | transformers |
| Вес | 0.12 GB catalog size, ~128 MB disk/cache |
| Параметры | 0.135B |
| Минимальные требования | tiny - очень слабое железо, CPU/WASM или небольшой GPU; disk >= 128 MB; memory/VRAM около 256 MB; браузер CPU/WASM; WebGPU полезен, если доступен |
| Оптимальные требования | modern CPU plus WebGPU/NPU when available; желательно 768 MB+ свободной VRAM/RAM и 640 MB+ disk cache |
| HF link | onnx-community/SmolLM-135M-ONNX |
| Доступные quantizations | auto |
| Краткое описание | known browser-ready provider |
| Best in | локальный чат, агентные сценарии, OpenAI-compatible /v1/chat/completions
|
| Поле | Значение |
|---|---|
| Название | onnx-community/SmolLM-135M-Instruct-ONNX |
| Label | SmolLM 135M Instruct |
| Категория | LLM / чат и генерация текста |
| Runtime/backend | transformers |
| Вес | 0.12 GB catalog size, ~128 MB disk/cache |
| Параметры | 0.135B |
| Минимальные требования | tiny - очень слабое железо, CPU/WASM или небольшой GPU; disk >= 128 MB; memory/VRAM около 256 MB; браузер CPU/WASM; WebGPU полезен, если доступен |
| Оптимальные требования | modern CPU plus WebGPU/NPU when available; желательно 768 MB+ свободной VRAM/RAM и 640 MB+ disk cache |
| HF link | onnx-community/SmolLM-135M-Instruct-ONNX |
| Доступные quantizations | auto |
| Краткое описание | known browser-ready provider |
| Best in | локальный чат, агентные сценарии, OpenAI-compatible /v1/chat/completions
|
| Поле | Значение |
|---|---|
| Название | onnx-community/SmolLM2-135M-ONNX |
| Label | SmolLM2 135M |
| Категория | LLM / чат и генерация текста |
| Runtime/backend | transformers |
| Вес | 0.12 GB catalog size, ~128 MB disk/cache |
| Параметры | 0.135B |
| Минимальные требования | tiny - очень слабое железо, CPU/WASM или небольшой GPU; disk >= 128 MB; memory/VRAM около 256 MB; браузер CPU/WASM; WebGPU полезен, если доступен |
| Оптимальные требования | modern CPU plus WebGPU/NPU when available; желательно 768 MB+ свободной VRAM/RAM и 640 MB+ disk cache |
| HF link | onnx-community/SmolLM2-135M-ONNX |
| Доступные quantizations | auto |
| Краткое описание | known browser-ready provider |
| Best in | локальный чат, агентные сценарии, OpenAI-compatible /v1/chat/completions
|
| Поле | Значение |
|---|---|
| Название | onnx-community/functiongemma-270m-it-ONNX |
| Label | functiongemma 270m it |
| Категория | LLM / чат и генерация текста |
| Runtime/backend | transformers |
| Вес | 0.25 GB catalog size, ~256 MB disk/cache |
| Параметры | 0.27B |
| Минимальные требования | tiny - очень слабое железо, CPU/WASM или небольшой GPU; disk >= 256 MB; memory/VRAM около 460 MB; браузер CPU/WASM; WebGPU полезен, если доступен |
| Оптимальные требования | modern CPU plus WebGPU/NPU when available; желательно 972 MB+ свободной VRAM/RAM и 768 MB+ disk cache |
| HF link | onnx-community/functiongemma-270m-it-ONNX |
| Доступные quantizations | auto |
| Краткое описание | known browser-ready provider |
| Best in | локальный чат, агентные сценарии, OpenAI-compatible /v1/chat/completions
|
| Поле | Значение |
|---|---|
| Название | onnx-community/gemma-3-270m-it-ONNX |
| Label | gemma 3 270m it |
| Категория | LLM / чат и генерация текста |
| Runtime/backend | transformers |
| Вес | 0.25 GB catalog size, ~256 MB disk/cache |
| Параметры | 0.27B |
| Минимальные требования | tiny - очень слабое железо, CPU/WASM или небольшой GPU; disk >= 256 MB; memory/VRAM около 460 MB; браузер CPU/WASM; WebGPU полезен, если доступен |
| Оптимальные требования | modern CPU plus WebGPU/NPU when available; желательно 972 MB+ свободной VRAM/RAM и 768 MB+ disk cache |
| HF link | onnx-community/gemma-3-270m-it-ONNX |
| Доступные quantizations | auto |
| Краткое описание | known browser-ready provider |
| Best in | локальный чат, агентные сценарии, OpenAI-compatible /v1/chat/completions
|
| Поле | Значение |
|---|---|
| Название | onnx-community/gemma-4-E2B-it-ONNX |
| Label | gemma 4 E2B it |
| Категория | LLM / чат и генерация текста |
| Runtime/backend | transformers |
| Вес | 0.29 GB catalog size, ~300 MB disk/cache |
| Параметры | не указаны |
| Минимальные требования | tiny - очень слабое железо, CPU/WASM или небольшой GPU; disk >= 300 MB; memory/VRAM около 540 MB; браузер CPU/WASM; WebGPU полезен, если доступен |
| Оптимальные требования | modern CPU plus WebGPU/NPU when available; желательно 1052 MB+ свободной VRAM/RAM и 812 MB+ disk cache |
| HF link | onnx-community/gemma-4-E2B-it-ONNX |
| Доступные quantizations | auto |
| Краткое описание | known browser-ready provider |
| Best in | локальный чат, агентные сценарии, OpenAI-compatible /v1/chat/completions
|
| Поле | Значение |
|---|---|
| Название | onnx-community/gemma-4-E4B-it-ONNX |
| Label | gemma 4 E4B it |
| Категория | LLM / чат и генерация текста |
| Runtime/backend | transformers |
| Вес | 0.29 GB catalog size, ~300 MB disk/cache |
| Параметры | не указаны |
| Минимальные требования | tiny - очень слабое железо, CPU/WASM или небольшой GPU; disk >= 300 MB; memory/VRAM около 540 MB; браузер CPU/WASM; WebGPU полезен, если доступен |
| Оптимальные требования | modern CPU plus WebGPU/NPU when available; желательно 1052 MB+ свободной VRAM/RAM и 812 MB+ disk cache |
| HF link | onnx-community/gemma-4-E4B-it-ONNX |
| Доступные quantizations | auto |
| Краткое описание | known browser-ready provider |
| Best in | локальный чат, агентные сценарии, OpenAI-compatible /v1/chat/completions
|
| Поле | Значение |
|---|---|
| Название | onnx-community/Qwen3-0.6B-DQ-ONNX |
| Label | Qwen3 0.6B DQ |
| Категория | LLM / чат и генерация текста |
| Runtime/backend | transformers |
| Вес | 0.30 GB catalog size, ~312 MB disk/cache |
| Параметры | 0.6B |
| Минимальные требования | small - ноутбук или небольшой GPU; disk >= 312 MB; memory/VRAM около 561 MB; браузер CPU/WASM; WebGPU полезен, если доступен |
| Оптимальные требования | modern CPU plus WebGPU/NPU when available; желательно 1073 MB+ свободной VRAM/RAM и 824 MB+ disk cache |
| HF link | onnx-community/Qwen3-0.6B-DQ-ONNX |
| Доступные quantizations | auto |
| Краткое описание | known browser-ready provider |
| Best in | локальный чат, агентные сценарии, OpenAI-compatible /v1/chat/completions
|
| Поле | Значение |
|---|---|
| Название | onnx-community/SmolLM2-360M-ONNX |
| Label | SmolLM2 360M |
| Категория | LLM / чат и генерация текста |
| Runtime/backend | transformers |
| Вес | 0.33 GB catalog size, ~342 MB disk/cache |
| Параметры | 0.36B |
| Минимальные требования | small - ноутбук или небольшой GPU; disk >= 342 MB; memory/VRAM около 615 MB; браузер CPU/WASM; WebGPU полезен, если доступен |
| Оптимальные требования | modern CPU plus WebGPU/NPU when available; желательно 1127 MB+ свободной VRAM/RAM и 854 MB+ disk cache |
| HF link | onnx-community/SmolLM2-360M-ONNX |
| Доступные quantizations | auto |
| Краткое описание | known browser-ready provider |
| Best in | локальный чат, агентные сценарии, OpenAI-compatible /v1/chat/completions
|
| Поле | Значение |
|---|---|
| Название | HuggingFaceTB/SmolLM2-360M-Instruct |
| Label | SmolLM2 360M Instruct |
| Категория | LLM / чат и генерация текста |
| Runtime/backend | transformers |
| Вес | 0.33 GB catalog size, ~342 MB disk/cache |
| Параметры | 0.36B |
| Минимальные требования | small - ноутбук или небольшой GPU; disk >= 342 MB; memory/VRAM около 615 MB; браузер CPU/WASM; WebGPU полезен, если доступен |
| Оптимальные требования | modern CPU plus WebGPU/NPU when available; желательно 1127 MB+ свободной VRAM/RAM и 854 MB+ disk cache |
| HF link | HuggingFaceTB/SmolLM2-360M-Instruct |
| Доступные quantizations | auto |
| Краткое описание | ONNX/WebGPU artifact marker |
| Best in | локальный чат, агентные сценарии, OpenAI-compatible /v1/chat/completions
|
| Поле | Значение |
|---|---|
| Название | asdgad/Qwen2.5-0.5B-Instruct-ONNX |
| Label | Qwen2.5 0.5B Instruct |
| Категория | LLM / чат и генерация текста |
| Runtime/backend | transformers |
| Вес | 0.46 GB catalog size, ~475 MB disk/cache |
| Параметры | 0.5B |
| Минимальные требования | small - ноутбук или небольшой GPU; disk >= 475 MB; memory/VRAM около 855 MB; браузер CPU/WASM; WebGPU полезен, если доступен |
| Оптимальные требования | modern CPU plus WebGPU/NPU when available; желательно 1367 MB+ свободной VRAM/RAM и 987 MB+ disk cache |
| HF link | asdgad/Qwen2.5-0.5B-Instruct-ONNX |
| Доступные quantizations | auto |
| Краткое описание | ONNX/WebGPU artifact marker |
| Best in | локальный чат, агентные сценарии, OpenAI-compatible /v1/chat/completions
|
| Поле | Значение |
|---|---|
| Название | onnx-community/Qwen2.5-Coder-0.5B-Instruct |
| Label | Qwen2.5 Coder 0.5B Instruct |
| Категория | LLM / чат и генерация текста |
| Runtime/backend | transformers |
| Вес | 0.46 GB catalog size, ~475 MB disk/cache |
| Параметры | 0.5B |
| Минимальные требования | small - ноутбук или небольшой GPU; disk >= 475 MB; memory/VRAM около 855 MB; браузер CPU/WASM; WebGPU полезен, если доступен |
| Оптимальные требования | modern CPU plus WebGPU/NPU when available; желательно 1367 MB+ свободной VRAM/RAM и 987 MB+ disk cache |
| HF link | onnx-community/Qwen2.5-Coder-0.5B-Instruct |
| Доступные quantizations | auto |
| Краткое описание | known browser-ready provider |
| Best in | локальный чат, агентные сценарии, OpenAI-compatible /v1/chat/completions
|
| Поле | Значение |
|---|---|
| Название | onnx-community/Llama-3.2-1B-Instruct-q4f16 |
| Label | Llama 3.2 1B Instruct q4f16 |
| Категория | LLM / чат и генерация текста |
| Runtime/backend | transformers |
| Вес | 0.51 GB catalog size, ~520 MB disk/cache |
| Параметры | 1B |
| Минимальные требования | small - ноутбук или небольшой GPU; disk >= 520 MB; memory/VRAM около 936 MB; браузер CPU/WASM; WebGPU полезен, если доступен |
| Оптимальные требования | modern CPU plus WebGPU/NPU when available; желательно 1448 MB+ свободной VRAM/RAM и 1032 MB+ disk cache |
| HF link | onnx-community/Llama-3.2-1B-Instruct-q4f16 |
| Доступные quantizations | auto |
| Краткое описание | known browser-ready provider |
| Best in | локальный чат, агентные сценарии, OpenAI-compatible /v1/chat/completions
|
| Поле | Значение |
|---|---|
| Название | onnx-community/Qwen3-0.6B-ONNX |
| Label | Qwen3 0.6B ONNX |
| Категория | LLM / чат и генерация текста |
| Runtime/backend | transformers |
| Вес | 0.49 GB catalog size, ~500 MB disk/cache |
| Параметры | 0.6B |
| Минимальные требования | small - ноутбук или небольшой GPU; disk >= 500 MB; memory/VRAM около 1100 MB; браузер CPU/WASM; WebGPU полезен, если доступен |
| Оптимальные требования | modern CPU plus WebGPU/NPU when available; желательно 1612 MB+ свободной VRAM/RAM и 1012 MB+ disk cache |
| HF link | onnx-community/Qwen3-0.6B-ONNX |
| Доступные quantizations | q4 |
| Краткое описание | Catalog entry for LLM / чат и генерация текста. |
| Best in | локальный чат, агентные сценарии, OpenAI-compatible /v1/chat/completions
|
| Поле | Значение |
|---|---|
| Название | onnx-community/Qwen3.5-0.8B-ONNX |
| Label | Qwen3.5 0.8B |
| Категория | LLM / чат и генерация текста |
| Runtime/backend | transformers |
| Вес | 0.74 GB catalog size, ~760 MB disk/cache |
| Параметры | 0.8B |
| Минимальные требования | small - ноутбук или небольшой GPU; disk >= 760 MB; memory/VRAM около 1368 MB; браузер CPU/WASM; WebGPU полезен, если доступен |
| Оптимальные требования | modern CPU plus WebGPU/NPU when available; желательно 1880 MB+ свободной VRAM/RAM и 1272 MB+ disk cache |
| HF link | onnx-community/Qwen3.5-0.8B-ONNX |
| Доступные quantizations | auto |
| Краткое описание | known browser-ready provider |
| Best in | локальный чат, агентные сценарии, OpenAI-compatible /v1/chat/completions
|
| Поле | Значение |
|---|---|
| Название | onnx-community/Llama-3.2-1B-Instruct-ONNX |
| Label | Llama 3.2 1B Instruct |
| Категория | LLM / чат и генерация текста |
| Runtime/backend | transformers |
| Вес | 0.93 GB catalog size, ~950 MB disk/cache |
| Параметры | 1B |
| Минимальные требования | small - ноутбук или небольшой GPU; disk >= 950 MB; memory/VRAM около 1710 MB; браузер CPU/WASM; WebGPU полезен, если доступен |
| Оптимальные требования | modern CPU plus WebGPU/NPU when available; желательно 2308 MB+ свободной VRAM/RAM и 1462 MB+ disk cache |
| HF link | onnx-community/Llama-3.2-1B-Instruct-ONNX |
| Доступные quantizations | auto |
| Краткое описание | known browser-ready provider |
| Best in | локальный чат, агентные сценарии, OpenAI-compatible /v1/chat/completions
|
| Поле | Значение |
|---|---|
| Название | onnx-community/gemma-3-1b-it-ONNX |
| Label | gemma 3 1b it |
| Категория | LLM / чат и генерация текста |
| Runtime/backend | transformers |
| Вес | 0.93 GB catalog size, ~950 MB disk/cache |
| Параметры | 1B |
| Минимальные требования | small - ноутбук или небольшой GPU; disk >= 950 MB; memory/VRAM около 1710 MB; браузер CPU/WASM; WebGPU полезен, если доступен |
| Оптимальные требования | modern CPU plus WebGPU/NPU when available; желательно 2308 MB+ свободной VRAM/RAM и 1462 MB+ disk cache |
| HF link | onnx-community/gemma-3-1b-it-ONNX |
| Доступные quantizations | auto |
| Краткое описание | known browser-ready provider |
| Best in | локальный чат, агентные сценарии, OpenAI-compatible /v1/chat/completions
|
| Поле | Значение |
|---|---|
| Название | onnx-community/gemma-3-1b-it-ONNX-GQA |
| Label | gemma 3 1b it |
| Категория | LLM / чат и генерация текста |
| Runtime/backend | transformers |
| Вес | 0.93 GB catalog size, ~950 MB disk/cache |
| Параметры | 1B |
| Минимальные требования | small - ноутбук или небольшой GPU; disk >= 950 MB; memory/VRAM около 1710 MB; браузер CPU/WASM; WebGPU полезен, если доступен |
| Оптимальные требования | modern CPU plus WebGPU/NPU when available; желательно 2308 MB+ свободной VRAM/RAM и 1462 MB+ disk cache |
| HF link | onnx-community/gemma-3-1b-it-ONNX-GQA |
| Доступные quantizations | auto |
| Краткое описание | known browser-ready provider |
| Best in | локальный чат, агентные сценарии, OpenAI-compatible /v1/chat/completions
|
- xlocllm
- Quickstart
- About
- Functions Python
- Functions TypeScript
- Use cases
- Examples Python
- Examples TypeScript
- Shared GPU mode
-
Models catalog
- Models The best
- Models Full model list
- Models Use your model
- For native mode
- Models Native LLM tiny small
- Models Native LLM medium
- Models Native LLM large
- Models Native embedding
- Models Native reranker
- Models Native translator
- Models Native tts
- Models Native vlm
- Models Native asr
- Models Native ocr
- Models Native image-classification
- Models Native object-detection
- Models Native image-segmentation
- Models Native depth-estimation
- Models Native document-layout
- Models Native table-detection
- Models Native document-qa
- Models Native language-id
- Models Native audio-classification
- Models Native text-classification
- Models Native ner
- Models Native zero-shot-text
- Models Native summarization
- Models Native text2text
- Models Native code
- For webgpu mode
- For web mode
- Models Web LLM
- Models Web embedding
- Models Web reranker
- Models Web translator
- Models Web tts
- Models Web vlm
- Models Web asr
- Models Web ocr
- Models Web image-classification
- Models Web object-detection
- Models Web image-segmentation
- Models Web depth-estimation
- Models Web document-layout
- Models Web table-detection
- Models Web document-qa
- Models Web zero-shot-image
- Models Web language-id
- Models Web audio-classification
- Models Web text-classification
- Models Web ner
- Models Web zero-shot-text
- Models Web summarization
- Models Web text2text
- Models Web code
- Dev