-
Notifications
You must be signed in to change notification settings - Fork 0
Models Native embedding
Mike edited this page May 28, 2026
·
1 revision
Режим: Native. Категория: Embeddings / векторные представления.
Всего моделей: 45.
| Поле | Значение |
|---|---|
| Название | Xenova/all-MiniLM-L6-v2 |
| Label | all-MiniLM-L6-v2 |
| Категория | Embeddings / векторные представления |
| Runtime/backend | native / onnxruntime / onnx |
| Вес | 0.09 GB catalog size, ~90 MB disk/cache |
| Параметры | не указаны |
| Минимальные требования | tiny - очень слабое железо, CPU/WASM или небольшой GPU; disk >= 90 MB; memory/VRAM около 250 MB; CPU или доступный ONNX provider |
| Оптимальные требования | cuda, directml, coreml, cpu; желательно 762 MB+ свободной VRAM/RAM и 602 MB+ disk cache |
| HF link | Xenova/all-MiniLM-L6-v2 |
| Доступные quantizations | q8 |
| Краткое описание | Native ONNX Runtime pipeline candidate. |
| Best in |
rag, semantic-search, clustering
|
| Поле | Значение |
|---|---|
| Название | philipp-zettl/granite-embedding-97m-multilingual-r2-ONNX |
| Label | granite embedding 97m multilingual r2 |
| Категория | Embeddings / векторные представления |
| Runtime/backend | native / onnxruntime / onnx |
| Вес | 0.09 GB catalog size, ~92 MB disk/cache |
| Параметры | 0.097B |
| Минимальные требования | tiny - очень слабое железо, CPU/WASM или небольшой GPU; disk >= 92 MB; memory/VRAM около 256 MB; CPU или доступный ONNX provider |
| Оптимальные требования | cuda, directml, coreml, cpu; желательно 768 MB+ свободной VRAM/RAM и 604 MB+ disk cache |
| HF link | philipp-zettl/granite-embedding-97m-multilingual-r2-ONNX |
| Доступные quantizations | auto |
| Краткое описание | ONNX/WebGPU artifact marker |
| Best in |
rag, semantic-search, clustering
|
| Поле | Значение |
|---|---|
| Название | pelagos-ai/granite-embedding-107m-multilingual-ONNX |
| Label | granite embedding 107m multilingual |
| Категория | Embeddings / векторные представления |
| Runtime/backend | native / onnxruntime / onnx |
| Вес | 0.10 GB catalog size, ~101 MB disk/cache |
| Параметры | 0.107B |
| Минимальные требования | tiny - очень слабое железо, CPU/WASM или небольшой GPU; disk >= 101 MB; memory/VRAM около 256 MB; CPU или доступный ONNX provider |
| Оптимальные требования | cuda, directml, coreml, cpu; желательно 768 MB+ свободной VRAM/RAM и 613 MB+ disk cache |
| HF link | pelagos-ai/granite-embedding-107m-multilingual-ONNX |
| Доступные quantizations | auto |
| Краткое описание | ONNX/WebGPU artifact marker |
| Best in |
rag, semantic-search, clustering
|
| Поле | Значение |
|---|---|
| Название | tooape/embeddinggemma-300m-qat-q8-ONNX |
| Label | embeddinggemma 300m qat q8 |
| Категория | Embeddings / векторные представления |
| Runtime/backend | native / onnxruntime / onnx |
| Вес | 0.15 GB catalog size, ~156 MB disk/cache |
| Параметры | 0.3B |
| Минимальные требования | tiny - очень слабое железо, CPU/WASM или небольшой GPU; disk >= 156 MB; memory/VRAM около 256 MB; CPU или доступный ONNX provider |
| Оптимальные требования | cuda, directml, coreml, cpu; желательно 768 MB+ свободной VRAM/RAM и 668 MB+ disk cache |
| HF link | tooape/embeddinggemma-300m-qat-q8-ONNX |
| Доступные quantizations | auto |
| Краткое описание | ONNX/WebGPU artifact marker |
| Best in |
rag, semantic-search, clustering
|
| Поле | Значение |
|---|---|
| Название | yasserrmd/granite-embedding-r2-onnx |
| Label | granite embedding r2 |
| Категория | Embeddings / векторные представления |
| Runtime/backend | native / onnxruntime / onnx |
| Вес | 0.14 GB catalog size, ~142 MB disk/cache |
| Параметры | не указаны |
| Минимальные требования | tiny - очень слабое железо, CPU/WASM или небольшой GPU; disk >= 142 MB; memory/VRAM около 312 MB; CPU или доступный ONNX provider |
| Оптимальные требования | cuda, directml, coreml, cpu; желательно 824 MB+ свободной VRAM/RAM и 654 MB+ disk cache |
| HF link | yasserrmd/granite-embedding-r2-onnx |
| Доступные quantizations | auto |
| Краткое описание | Native ONNX Runtime embedding candidate validated for public ONNX artifacts. |
| Best in |
rag, semantic-search, clustering
|
| Поле | Значение |
|---|---|
| Название | Xenova/multilingual-e5-small |
| Label | Multilingual E5 small |
| Категория | Embeddings / векторные представления |
| Runtime/backend | native / onnxruntime / onnx |
| Вес | 0.12 GB catalog size, ~120 MB disk/cache |
| Параметры | не указаны |
| Минимальные требования | tiny - очень слабое железо, CPU/WASM или небольшой GPU; disk >= 120 MB; memory/VRAM около 350 MB; CPU или доступный ONNX provider |
| Оптимальные требования | cuda, directml, coreml, cpu; желательно 862 MB+ свободной VRAM/RAM и 632 MB+ disk cache |
| HF link | Xenova/multilingual-e5-small |
| Доступные quantizations | q8 |
| Краткое описание | Native ONNX Runtime pipeline candidate. |
| Best in |
rag, semantic-search, clustering
|
| Поле | Значение |
|---|---|
| Название | Xenova/all-MiniLM-L12-v2 |
| Label | all MiniLM L12 v2 |
| Категория | Embeddings / векторные представления |
| Runtime/backend | native / onnxruntime / onnx |
| Вес | 0.29 GB catalog size, ~300 MB disk/cache |
| Параметры | не указаны |
| Минимальные требования | tiny - очень слабое железо, CPU/WASM или небольшой GPU; disk >= 300 MB; memory/VRAM около 360 MB; CPU или доступный ONNX provider |
| Оптимальные требования | cuda, directml, coreml, cpu; желательно 872 MB+ свободной VRAM/RAM и 812 MB+ disk cache |
| HF link | Xenova/all-MiniLM-L12-v2 |
| Доступные quantizations | auto |
| Краткое описание | known browser-ready provider |
| Best in |
rag, semantic-search, clustering
|
| Поле | Значение |
|---|---|
| Название | sentence-transformers/all-MiniLM-L6-v2 |
| Label | all MiniLM L6 v2 |
| Категория | Embeddings / векторные представления |
| Runtime/backend | native / onnxruntime / onnx |
| Вес | 0.29 GB catalog size, ~300 MB disk/cache |
| Параметры | не указаны |
| Минимальные требования | tiny - очень слабое железо, CPU/WASM или небольшой GPU; disk >= 300 MB; memory/VRAM около 360 MB; CPU или доступный ONNX provider |
| Оптимальные требования | cuda, directml, coreml, cpu; желательно 872 MB+ свободной VRAM/RAM и 812 MB+ disk cache |
| HF link | sentence-transformers/all-MiniLM-L6-v2 |
| Доступные quantizations | auto |
| Краткое описание | ONNX/WebGPU artifact marker |
| Best in |
rag, semantic-search, clustering
|
| Поле | Значение |
|---|---|
| Название | onnx-community/bge-base-en-v1.5-ONNX |
| Label | bge base en v1.5 |
| Категория | Embeddings / векторные представления |
| Runtime/backend | native / onnxruntime / onnx |
| Вес | 0.29 GB catalog size, ~300 MB disk/cache |
| Параметры | не указаны |
| Минимальные требования | tiny - очень слабое железо, CPU/WASM или небольшой GPU; disk >= 300 MB; memory/VRAM около 360 MB; CPU или доступный ONNX provider |
| Оптимальные требования | cuda, directml, coreml, cpu; желательно 872 MB+ свободной VRAM/RAM и 812 MB+ disk cache |
| HF link | onnx-community/bge-base-en-v1.5-ONNX |
| Доступные quantizations | auto |
| Краткое описание | known browser-ready provider |
| Best in |
rag, semantic-search, clustering
|
| Поле | Значение |
|---|---|
| Название | Xenova/bge-base-en-v1.5 |
| Label | bge base en v1.5 |
| Категория | Embeddings / векторные представления |
| Runtime/backend | native / onnxruntime / onnx |
| Вес | 0.29 GB catalog size, ~300 MB disk/cache |
| Параметры | не указаны |
| Минимальные требования | tiny - очень слабое железо, CPU/WASM или небольшой GPU; disk >= 300 MB; memory/VRAM около 360 MB; CPU или доступный ONNX provider |
| Оптимальные требования | cuda, directml, coreml, cpu; желательно 872 MB+ свободной VRAM/RAM и 812 MB+ disk cache |
| HF link | Xenova/bge-base-en-v1.5 |
| Доступные quantizations | auto |
| Краткое описание | known browser-ready provider |
| Best in |
rag, semantic-search, clustering
|
| Поле | Значение |
|---|---|
| Название | Xenova/bge-large-en-v1.5 |
| Label | bge large en v1.5 |
| Категория | Embeddings / векторные представления |
| Runtime/backend | native / onnxruntime / onnx |
| Вес | 0.29 GB catalog size, ~300 MB disk/cache |
| Параметры | не указаны |
| Минимальные требования | tiny - очень слабое железо, CPU/WASM или небольшой GPU; disk >= 300 MB; memory/VRAM около 360 MB; CPU или доступный ONNX provider |
| Оптимальные требования | cuda, directml, coreml, cpu; желательно 872 MB+ свободной VRAM/RAM и 812 MB+ disk cache |
| HF link | Xenova/bge-large-en-v1.5 |
| Доступные quantizations | auto |
| Краткое описание | known browser-ready provider |
| Best in |
rag, semantic-search, clustering
|
| Поле | Значение |
|---|---|
| Название | baby2008/bge-large-zh-v1.5 |
| Label | bge large zh v1.5 |
| Категория | Embeddings / векторные представления |
| Runtime/backend | native / onnxruntime / onnx |
| Вес | 0.29 GB catalog size, ~300 MB disk/cache |
| Параметры | не указаны |
| Минимальные требования | tiny - очень слабое железо, CPU/WASM или небольшой GPU; disk >= 300 MB; memory/VRAM около 360 MB; CPU или доступный ONNX provider |
| Оптимальные требования | cuda, directml, coreml, cpu; желательно 872 MB+ свободной VRAM/RAM и 812 MB+ disk cache |
| HF link | baby2008/bge-large-zh-v1.5 |
| Доступные quantizations | auto |
| Краткое описание | ONNX/WebGPU artifact marker |
| Best in |
rag, semantic-search, clustering
|
| Поле | Значение |
|---|---|
| Название | Xenova/bge-m3 |
| Label | bge m3 |
| Категория | Embeddings / векторные представления |
| Runtime/backend | native / onnxruntime / onnx |
| Вес | 0.29 GB catalog size, ~300 MB disk/cache |
| Параметры | не указаны |
| Минимальные требования | tiny - очень слабое железо, CPU/WASM или небольшой GPU; disk >= 300 MB; memory/VRAM около 360 MB; CPU или доступный ONNX provider |
| Оптимальные требования | cuda, directml, coreml, cpu; желательно 872 MB+ свободной VRAM/RAM и 812 MB+ disk cache |
| HF link | Xenova/bge-m3 |
| Доступные quantizations | auto |
| Краткое описание | known browser-ready provider |
| Best in |
rag, semantic-search, clustering
|
| Поле | Значение |
|---|---|
| Название | onnx-community/bge-small-en-v1.5-ONNX |
| Label | bge small en v1.5 |
| Категория | Embeddings / векторные представления |
| Runtime/backend | native / onnxruntime / onnx |
| Вес | 0.29 GB catalog size, ~300 MB disk/cache |
| Параметры | не указаны |
| Минимальные требования | tiny - очень слабое железо, CPU/WASM или небольшой GPU; disk >= 300 MB; memory/VRAM около 360 MB; CPU или доступный ONNX provider |
| Оптимальные требования | cuda, directml, coreml, cpu; желательно 872 MB+ свободной VRAM/RAM и 812 MB+ disk cache |
| HF link | onnx-community/bge-small-en-v1.5-ONNX |
| Доступные quantizations | auto |
| Краткое описание | known browser-ready provider |
| Best in |
rag, semantic-search, clustering
|
| Поле | Значение |
|---|---|
| Название | vteaw/bge-small-zh-v1.5 |
| Label | bge small zh v1.5 |
| Категория | Embeddings / векторные представления |
| Runtime/backend | native / onnxruntime / onnx |
| Вес | 0.29 GB catalog size, ~300 MB disk/cache |
| Параметры | не указаны |
| Минимальные требования | tiny - очень слабое железо, CPU/WASM или небольшой GPU; disk >= 300 MB; memory/VRAM около 360 MB; CPU или доступный ONNX provider |
| Оптимальные требования | cuda, directml, coreml, cpu; желательно 872 MB+ свободной VRAM/RAM и 812 MB+ disk cache |
| HF link | vteaw/bge-small-zh-v1.5 |
| Доступные quantizations | auto |
| Краткое описание | ONNX/WebGPU artifact marker |
| Best in |
rag, semantic-search, clustering
|
| Поле | Значение |
|---|---|
| Название | baby2008/gte-multilingual-base |
| Label | gte multilingual base |
| Категория | Embeddings / векторные представления |
| Runtime/backend | native / onnxruntime / onnx |
| Вес | 0.29 GB catalog size, ~300 MB disk/cache |
| Параметры | не указаны |
| Минимальные требования | tiny - очень слабое железо, CPU/WASM или небольшой GPU; disk >= 300 MB; memory/VRAM около 360 MB; CPU или доступный ONNX provider |
| Оптимальные требования | cuda, directml, coreml, cpu; желательно 872 MB+ свободной VRAM/RAM и 812 MB+ disk cache |
| HF link | baby2008/gte-multilingual-base |
| Доступные quantizations | auto |
| Краткое описание | ONNX/WebGPU artifact marker |
| Best in |
rag, semantic-search, clustering
|
| Поле | Значение |
|---|---|
| Название | jinaai/jina-clip-v1 |
| Label | jina clip v1 |
| Категория | Embeddings / векторные представления |
| Runtime/backend | native / onnxruntime / onnx |
| Вес | 0.29 GB catalog size, ~300 MB disk/cache |
| Параметры | не указаны |
| Минимальные требования | tiny - очень слабое железо, CPU/WASM или небольшой GPU; disk >= 300 MB; memory/VRAM около 360 MB; CPU или доступный ONNX provider |
| Оптимальные требования | cuda, directml, coreml, cpu; желательно 872 MB+ свободной VRAM/RAM и 812 MB+ disk cache |
| HF link | jinaai/jina-clip-v1 |
| Доступные quantizations | auto |
| Краткое описание | ONNX/WebGPU artifact marker |
| Best in |
rag, semantic-search, clustering
|
| Поле | Значение |
|---|---|
| Название | jinaai/jina-clip-v2 |
| Label | jina clip v2 |
| Категория | Embeddings / векторные представления |
| Runtime/backend | native / onnxruntime / onnx |
| Вес | 0.29 GB catalog size, ~300 MB disk/cache |
| Параметры | не указаны |
| Минимальные требования | tiny - очень слабое железо, CPU/WASM или небольшой GPU; disk >= 300 MB; memory/VRAM около 360 MB; CPU или доступный ONNX provider |
| Оптимальные требования | cuda, directml, coreml, cpu; желательно 872 MB+ свободной VRAM/RAM и 812 MB+ disk cache |
| HF link | jinaai/jina-clip-v2 |
| Доступные quantizations | auto |
| Краткое описание | ONNX/WebGPU artifact marker |
| Best in |
rag, semantic-search, clustering
|
| Поле | Значение |
|---|---|
| Название | jinaai/jina-embeddings-v3 |
| Label | jina embeddings v3 |
| Категория | Embeddings / векторные представления |
| Runtime/backend | native / onnxruntime / onnx |
| Вес | 0.29 GB catalog size, ~300 MB disk/cache |
| Параметры | не указаны |
| Минимальные требования | tiny - очень слабое железо, CPU/WASM или небольшой GPU; disk >= 300 MB; memory/VRAM около 360 MB; CPU или доступный ONNX provider |
| Оптимальные требования | cuda, directml, coreml, cpu; желательно 872 MB+ свободной VRAM/RAM и 812 MB+ disk cache |
| HF link | jinaai/jina-embeddings-v3 |
| Доступные quantizations | auto |
| Краткое описание | ONNX/WebGPU artifact marker |
| Best in |
rag, semantic-search, clustering
|
| Поле | Значение |
|---|---|
| Название | onnx-community/jina-embeddings-v5-omni-nano-ONNX |
| Label | jina embeddings v5 omni nano |
| Категория | Embeddings / векторные представления |
| Runtime/backend | native / onnxruntime / onnx |
| Вес | 0.29 GB catalog size, ~300 MB disk/cache |
| Параметры | не указаны |
| Минимальные требования | tiny - очень слабое железо, CPU/WASM или небольшой GPU; disk >= 300 MB; memory/VRAM около 360 MB; CPU или доступный ONNX provider |
| Оптимальные требования | cuda, directml, coreml, cpu; желательно 872 MB+ свободной VRAM/RAM и 812 MB+ disk cache |
| HF link | onnx-community/jina-embeddings-v5-omni-nano-ONNX |
| Доступные quantizations | auto |
| Краткое описание | known browser-ready provider |
| Best in |
rag, semantic-search, clustering
|
| Поле | Значение |
|---|---|
| Название | Xenova/multilingual-e5-base |
| Label | multilingual e5 base |
| Категория | Embeddings / векторные представления |
| Runtime/backend | native / onnxruntime / onnx |
| Вес | 0.29 GB catalog size, ~300 MB disk/cache |
| Параметры | не указаны |
| Минимальные требования | tiny - очень слабое железо, CPU/WASM или небольшой GPU; disk >= 300 MB; memory/VRAM около 360 MB; CPU или доступный ONNX provider |
| Оптимальные требования | cuda, directml, coreml, cpu; желательно 872 MB+ свободной VRAM/RAM и 812 MB+ disk cache |
| HF link | Xenova/multilingual-e5-base |
| Доступные quantizations | auto |
| Краткое описание | known browser-ready provider |
| Best in |
rag, semantic-search, clustering
|
| Поле | Значение |
|---|---|
| Название | Xenova/multilingual-e5-large |
| Label | multilingual e5 large |
| Категория | Embeddings / векторные представления |
| Runtime/backend | native / onnxruntime / onnx |
| Вес | 0.29 GB catalog size, ~300 MB disk/cache |
| Параметры | не указаны |
| Минимальные требования | tiny - очень слабое железо, CPU/WASM или небольшой GPU; disk >= 300 MB; memory/VRAM около 360 MB; CPU или доступный ONNX provider |
| Оптимальные требования | cuda, directml, coreml, cpu; желательно 872 MB+ свободной VRAM/RAM и 812 MB+ disk cache |
| HF link | Xenova/multilingual-e5-large |
| Доступные quantizations | auto |
| Краткое описание | known browser-ready provider |
| Best in |
rag, semantic-search, clustering
|
| Поле | Значение |
|---|---|
| Название | mixedbread-ai/mxbai-embed-xsmall-v1 |
| Label | mxbai embed xsmall v1 |
| Категория | Embeddings / векторные представления |
| Runtime/backend | native / onnxruntime / onnx |
| Вес | 0.29 GB catalog size, ~300 MB disk/cache |
| Параметры | не указаны |
| Минимальные требования | tiny - очень слабое железо, CPU/WASM или небольшой GPU; disk >= 300 MB; memory/VRAM около 360 MB; CPU или доступный ONNX provider |
| Оптимальные требования | cuda, directml, coreml, cpu; желательно 872 MB+ свободной VRAM/RAM и 812 MB+ disk cache |
| HF link | mixedbread-ai/mxbai-embed-xsmall-v1 |
| Доступные quantizations | auto |
| Краткое описание | ONNX/WebGPU artifact marker |
| Best in |
rag, semantic-search, clustering
|
| Поле | Значение |
|---|---|
| Название | Xenova/nomic-embed-text-v1 |
| Label | nomic embed text v1 |
| Категория | Embeddings / векторные представления |
| Runtime/backend | native / onnxruntime / onnx |
| Вес | 0.29 GB catalog size, ~300 MB disk/cache |
| Параметры | не указаны |
| Минимальные требования | tiny - очень слабое железо, CPU/WASM или небольшой GPU; disk >= 300 MB; memory/VRAM около 360 MB; CPU или доступный ONNX provider |
| Оптимальные требования | cuda, directml, coreml, cpu; желательно 872 MB+ свободной VRAM/RAM и 812 MB+ disk cache |
| HF link | Xenova/nomic-embed-text-v1 |
| Доступные quantizations | auto |
| Краткое описание | known browser-ready provider |
| Best in |
rag, semantic-search, clustering
|
| Поле | Значение |
|---|---|
| Название | nomic-ai/nomic-embed-text-v1.5 |
| Label | nomic embed text v1.5 |
| Категория | Embeddings / векторные представления |
| Runtime/backend | native / onnxruntime / onnx |
| Вес | 0.29 GB catalog size, ~300 MB disk/cache |
| Параметры | не указаны |
| Минимальные требования | tiny - очень слабое железо, CPU/WASM или небольшой GPU; disk >= 300 MB; memory/VRAM около 360 MB; CPU или доступный ONNX provider |
| Оптимальные требования | cuda, directml, coreml, cpu; желательно 872 MB+ свободной VRAM/RAM и 812 MB+ disk cache |
| HF link | nomic-ai/nomic-embed-text-v1.5 |
| Доступные quantizations | auto |
| Краткое описание | ONNX/WebGPU artifact marker |
| Best in |
rag, semantic-search, clustering
|
| Поле | Значение |
|---|---|
| Название | Xenova/paraphrase-MiniLM-L6-v2 |
| Label | paraphrase MiniLM L6 v2 |
| Категория | Embeddings / векторные представления |
| Runtime/backend | native / onnxruntime / onnx |
| Вес | 0.29 GB catalog size, ~300 MB disk/cache |
| Параметры | не указаны |
| Минимальные требования | tiny - очень слабое железо, CPU/WASM или небольшой GPU; disk >= 300 MB; memory/VRAM около 360 MB; CPU или доступный ONNX provider |
| Оптимальные требования | cuda, directml, coreml, cpu; желательно 872 MB+ свободной VRAM/RAM и 812 MB+ disk cache |
| HF link | Xenova/paraphrase-MiniLM-L6-v2 |
| Доступные quantizations | auto |
| Краткое описание | known browser-ready provider |
| Best in |
rag, semantic-search, clustering
|
| Поле | Значение |
|---|---|
| Название | Xenova/paraphrase-multilingual-MiniLM-L12-v2 |
| Label | paraphrase multilingual MiniLM L12 v2 |
| Категория | Embeddings / векторные представления |
| Runtime/backend | native / onnxruntime / onnx |
| Вес | 0.29 GB catalog size, ~300 MB disk/cache |
| Параметры | не указаны |
| Минимальные требования | tiny - очень слабое железо, CPU/WASM или небольшой GPU; disk >= 300 MB; memory/VRAM около 360 MB; CPU или доступный ONNX provider |
| Оптимальные требования | cuda, directml, coreml, cpu; желательно 872 MB+ свободной VRAM/RAM и 812 MB+ disk cache |
| HF link | Xenova/paraphrase-multilingual-MiniLM-L12-v2 |
| Доступные quantizations | auto |
| Краткое описание | known browser-ready provider |
| Best in |
rag, semantic-search, clustering
|
| Поле | Значение |
|---|---|
| Название | Xenova/paraphrase-multilingual-mpnet-base-v2 |
| Label | paraphrase multilingual mpnet base v2 |
| Категория | Embeddings / векторные представления |
| Runtime/backend | native / onnxruntime / onnx |
| Вес | 0.29 GB catalog size, ~300 MB disk/cache |
| Параметры | не указаны |
| Минимальные требования | tiny - очень слабое железо, CPU/WASM или небольшой GPU; disk >= 300 MB; memory/VRAM около 360 MB; CPU или доступный ONNX provider |
| Оптимальные требования | cuda, directml, coreml, cpu; желательно 872 MB+ свободной VRAM/RAM и 812 MB+ disk cache |
| HF link | Xenova/paraphrase-multilingual-mpnet-base-v2 |
| Доступные quantizations | auto |
| Краткое описание | known browser-ready provider |
| Best in |
rag, semantic-search, clustering
|
| Поле | Значение |
|---|---|
| Название | electroglyph/Qwen3-Embedding-0.6B-onnx-int4 |
| Label | Qwen3 Embedding 0.6B onnx int4 |
| Категория | Embeddings / векторные представления |
| Runtime/backend | native / onnxruntime / onnx |
| Вес | 0.44 GB catalog size, ~446 MB disk/cache |
| Параметры | 0.6B |
| Минимальные требования | tiny - очень слабое железо, CPU/WASM или небольшой GPU; disk >= 446 MB; memory/VRAM около 707 MB; CPU или доступный ONNX provider |
| Оптимальные требования | cuda, directml, coreml, cpu; желательно 1219 MB+ свободной VRAM/RAM и 958 MB+ disk cache |
| HF link | electroglyph/Qwen3-Embedding-0.6B-onnx-int4 |
| Доступные quantizations | auto |
| Краткое описание | Native ONNX Runtime embedding candidate validated for public ONNX artifacts. |
| Best in |
rag, semantic-search, clustering
|
| Поле | Значение |
|---|---|
| Название | icosahedron10/qwen3-embedding-0.6b-onnx-fp16 |
| Label | qwen3 embedding 0.6b onnx fp16 |
| Категория | Embeddings / векторные представления |
| Runtime/backend | native / onnxruntime / onnx |
| Вес | 1.12 GB catalog size, ~1148 MB disk/cache |
| Параметры | 0.6B |
| Минимальные требования | tiny - очень слабое железо, CPU/WASM или небольшой GPU; disk >= 1148 MB; memory/VRAM около 1620 MB; CPU или доступный ONNX provider |
| Оптимальные требования | cuda, directml, coreml, cpu; желательно 2187 MB+ свободной VRAM/RAM и 1660 MB+ disk cache |
| HF link | icosahedron10/qwen3-embedding-0.6b-onnx-fp16 |
| Доступные quantizations | auto |
| Краткое описание | Native ONNX Runtime embedding candidate validated for public ONNX artifacts. |
| Best in |
rag, semantic-search, clustering
|
| Поле | Значение |
|---|---|
| Название | Svenni551/Qwen3-Embedding-0.6B-ONNX-INT8 |
| Label | Qwen3 Embedding 0.6B ONNX INT8 |
| Категория | Embeddings / векторные представления |
| Runtime/backend | native / onnxruntime / onnx |
| Вес | 1.13 GB catalog size, ~1154 MB disk/cache |
| Параметры | 0.6B |
| Минимальные требования | tiny - очень слабое железо, CPU/WASM или небольшой GPU; disk >= 1154 MB; memory/VRAM около 1628 MB; CPU или доступный ONNX provider |
| Оптимальные требования | cuda, directml, coreml, cpu; желательно 2197 MB+ свободной VRAM/RAM и 1666 MB+ disk cache |
| HF link | Svenni551/Qwen3-Embedding-0.6B-ONNX-INT8 |
| Доступные quantizations | auto |
| Краткое описание | Native ONNX Runtime embedding candidate validated for public ONNX artifacts. |
| Best in |
rag, semantic-search, clustering
|
| Поле | Значение |
|---|---|
| Название | electroglyph/Qwen3-Embedding-0.6B-onnx-uint8 |
| Label | Qwen3 Embedding 0.6B onnx uint8 |
| Категория | Embeddings / векторные представления |
| Runtime/backend | native / onnxruntime / onnx |
| Вес | 1.18 GB catalog size, ~1207 MB disk/cache |
| Параметры | 0.6B |
| Минимальные требования | tiny - очень слабое железо, CPU/WASM или небольшой GPU; disk >= 1207 MB; memory/VRAM около 1697 MB; CPU или доступный ONNX provider |
| Оптимальные требования | cuda, directml, coreml, cpu; желательно 2290 MB+ свободной VRAM/RAM и 1719 MB+ disk cache |
| HF link | electroglyph/Qwen3-Embedding-0.6B-onnx-uint8 |
| Доступные quantizations | auto |
| Краткое описание | Native ONNX Runtime embedding candidate validated for public ONNX artifacts. |
| Best in |
rag, semantic-search, clustering
|
| Поле | Значение |
|---|---|
| Название | n24q02m/Qwen3-Embedding-0.6B-ONNX |
| Label | Qwen3 Embedding 0.6B |
| Категория | Embeddings / векторные представления |
| Runtime/backend | native / onnxruntime / onnx |
| Вес | 2.51 GB catalog size, ~2567 MB disk/cache |
| Параметры | 0.6B |
| Минимальные требования | tiny - очень слабое железо, CPU/WASM или небольшой GPU; disk >= 2567 MB; memory/VRAM около 3465 MB; CPU или доступный ONNX provider |
| Оптимальные требования | cuda, directml, coreml, cpu; желательно 4677 MB+ свободной VRAM/RAM и 3208 MB+ disk cache |
| HF link | n24q02m/Qwen3-Embedding-0.6B-ONNX |
| Доступные quantizations | auto |
| Краткое описание | Native ONNX Runtime embedding candidate validated for public ONNX artifacts. |
| Best in |
rag, semantic-search, clustering
|
| Поле | Значение |
|---|---|
| Название | shawnw3i/Qwen3-Embedding-0.6B-ONNX |
| Label | Qwen3 Embedding 0.6B |
| Категория | Embeddings / векторные представления |
| Runtime/backend | native / onnxruntime / onnx |
| Вес | 3.35 GB catalog size, ~3433 MB disk/cache |
| Параметры | 0.6B |
| Минимальные требования | tiny - очень слабое железо, CPU/WASM или небольшой GPU; disk >= 3433 MB; memory/VRAM около 4590 MB; CPU или доступный ONNX provider |
| Оптимальные требования | cuda, directml, coreml, cpu; желательно 6196 MB+ свободной VRAM/RAM и 4291 MB+ disk cache |
| HF link | shawnw3i/Qwen3-Embedding-0.6B-ONNX |
| Доступные quantizations | auto |
| Краткое описание | Native ONNX Runtime embedding candidate validated for public ONNX artifacts. |
| Best in |
rag, semantic-search, clustering
|
| Поле | Значение |
|---|---|
| Название | onnx-community/granite-embedding-311m-multilingual-r2-ONNX |
| Label | granite embedding 311m multilingual r2 |
| Категория | Embeddings / векторные представления |
| Runtime/backend | native / onnxruntime / onnx |
| Вес | 0.29 GB catalog size, ~295 MB disk/cache |
| Параметры | 0.311B |
| Минимальные требования | small - ноутбук или небольшой GPU; disk >= 295 MB; memory/VRAM около 354 MB; CPU или доступный ONNX provider |
| Оптимальные требования | cuda, directml, coreml, cpu; желательно 866 MB+ свободной VRAM/RAM и 807 MB+ disk cache |
| HF link | onnx-community/granite-embedding-311m-multilingual-r2-ONNX |
| Доступные quantizations | auto |
| Краткое описание | known browser-ready provider |
| Best in |
rag, semantic-search, clustering
|
| Поле | Значение |
|---|---|
| Название | onnx-community/Qwen3-Embedding-0.6B-ONNX |
| Label | Qwen3 Embedding 0.6B |
| Категория | Embeddings / векторные представления |
| Runtime/backend | native / onnxruntime / onnx |
| Вес | 0.56 GB catalog size, ~570 MB disk/cache |
| Параметры | 0.6B |
| Минимальные требования | small - ноутбук или небольшой GPU; disk >= 570 MB; memory/VRAM около 684 MB; CPU или доступный ONNX provider |
| Оптимальные требования | cuda, directml, coreml, cpu; желательно 1196 MB+ свободной VRAM/RAM и 1082 MB+ disk cache |
| HF link | onnx-community/Qwen3-Embedding-0.6B-ONNX |
| Доступные quantizations | auto |
| Краткое описание | known browser-ready provider |
| Best in |
rag, semantic-search, clustering
|
| Поле | Значение |
|---|---|
| Название | EMA-Sakuraba-416/Qwen3-Embedding-0.6B-ONNX |
| Label | Qwen3 Embedding 0.6B |
| Категория | Embeddings / векторные представления |
| Runtime/backend | native / onnxruntime / onnx |
| Вес | 0.56 GB catalog size, ~570 MB disk/cache |
| Параметры | 0.6B |
| Минимальные требования | small - ноутбук или небольшой GPU; disk >= 570 MB; memory/VRAM около 684 MB; CPU или доступный ONNX provider |
| Оптимальные требования | cuda, directml, coreml, cpu; желательно 1196 MB+ свободной VRAM/RAM и 1082 MB+ disk cache |
| HF link | EMA-Sakuraba-416/Qwen3-Embedding-0.6B-ONNX |
| Доступные quantizations | auto |
| Краткое описание | ONNX/WebGPU artifact marker |
| Best in |
rag, semantic-search, clustering
|
| Поле | Значение |
|---|---|
| Название | s-lorin/jina-embeddings-v5-small-onnx |
| Label | jina embeddings v5 small |
| Категория | Embeddings / векторные представления |
| Runtime/backend | native / onnxruntime / onnx |
| Вес | 1.00 GB catalog size, ~1028 MB disk/cache |
| Параметры | не указаны |
| Минимальные требования | small - ноутбук или небольшой GPU; disk >= 1028 MB; memory/VRAM около 1464 MB; CPU или доступный ONNX provider |
| Оптимальные требования | cuda, directml, coreml, cpu; желательно 1976 MB+ свободной VRAM/RAM и 1540 MB+ disk cache |
| HF link | s-lorin/jina-embeddings-v5-small-onnx |
| Доступные quantizations | auto |
| Краткое описание | Native ONNX Runtime embedding candidate validated for public ONNX artifacts. |
| Best in |
rag, semantic-search, clustering
|
| Поле | Значение |
|---|---|
| Название | sirasagi62/granite-embedding-107m-multilingual-ONNX |
| Label | granite embedding 107m multilingual |
| Категория | Embeddings / векторные представления |
| Runtime/backend | native / onnxruntime / onnx |
| Вес | 1.73 GB catalog size, ~1768 MB disk/cache |
| Параметры | не указаны |
| Минимальные требования | small - ноутбук или небольшой GPU; disk >= 1768 MB; memory/VRAM около 2426 MB; CPU или доступный ONNX provider |
| Оптимальные требования | cuda, directml, coreml, cpu; желательно 3275 MB+ свободной VRAM/RAM и 2280 MB+ disk cache |
| HF link | sirasagi62/granite-embedding-107m-multilingual-ONNX |
| Доступные quantizations | auto |
| Краткое описание | Native ONNX Runtime embedding candidate validated for public ONNX artifacts. |
| Best in |
rag, semantic-search, clustering
|
| Поле | Значение |
|---|---|
| Название | jrc2139/embeddinggemma-300m-qat-q8_0-unquantized-ONNX |
| Label | embeddinggemma 300m qat q8 0 unquantized |
| Категория | Embeddings / векторные представления |
| Runtime/backend | native / onnxruntime / onnx |
| Вес | 3.62 GB catalog size, ~3703 MB disk/cache |
| Параметры | не указаны |
| Минимальные требования | medium - рабочая станция или заметный GPU; disk >= 3703 MB; memory/VRAM около 4941 MB; CPU или доступный ONNX provider |
| Оптимальные требования | cuda, directml, coreml, cpu; желательно 6670 MB+ свободной VRAM/RAM и 4628 MB+ disk cache |
| HF link | jrc2139/embeddinggemma-300m-qat-q8_0-unquantized-ONNX |
| Доступные quantizations | auto |
| Краткое описание | Native ONNX Runtime embedding candidate validated for public ONNX artifacts. |
| Best in |
rag, semantic-search, clustering
|
| Поле | Значение |
|---|---|
| Название | majentik/Qwen3-Embedding-4B-ONNX-INT8 |
| Label | Qwen3 Embedding 4B ONNX INT8 |
| Категория | Embeddings / векторные представления |
| Runtime/backend | native / onnxruntime / onnx |
| Вес | 3.76 GB catalog size, ~3854 MB disk/cache |
| Параметры | 4B |
| Минимальные требования | medium - рабочая станция или заметный GPU; disk >= 3854 MB; memory/VRAM около 5138 MB; CPU или доступный ONNX provider |
| Оптимальные требования | cuda, directml, coreml, cpu; желательно 6936 MB+ свободной VRAM/RAM и 4817 MB+ disk cache |
| HF link | majentik/Qwen3-Embedding-4B-ONNX-INT8 |
| Доступные quantizations | auto |
| Краткое описание | Native ONNX Runtime embedding candidate validated for public ONNX artifacts. |
| Best in |
rag, semantic-search, clustering
|
| Поле | Значение |
|---|---|
| Название | MaunikG/jina-embeddings-v5-text-small-clustering-ONNX |
| Label | jina embeddings v5 text small clustering |
| Категория | Embeddings / векторные представления |
| Runtime/backend | native / onnxruntime / onnx |
| Вес | 4.71 GB catalog size, ~4818 MB disk/cache |
| Параметры | не указаны |
| Минимальные требования | medium - рабочая станция или заметный GPU; disk >= 4818 MB; memory/VRAM около 6391 MB; CPU или доступный ONNX provider |
| Оптимальные требования | cuda, directml, coreml, cpu; желательно 8627 MB+ свободной VRAM/RAM и 6022 MB+ disk cache |
| HF link | MaunikG/jina-embeddings-v5-text-small-clustering-ONNX |
| Доступные quantizations | auto |
| Краткое описание | Native ONNX Runtime embedding candidate validated for public ONNX artifacts. |
| Best in |
rag, semantic-search, clustering
|
| Поле | Значение |
|---|---|
| Название | sigalr/Qwen3-Embedding-4B-ONNX-ST |
| Label | Qwen3 Embedding 4B ONNX ST |
| Категория | Embeddings / векторные представления |
| Runtime/backend | native / onnxruntime / onnx |
| Вес | 14.99 GB catalog size, ~15354 MB disk/cache |
| Параметры | 4B |
| Минимальные требования | medium - рабочая станция или заметный GPU; disk >= 15354 MB; memory/VRAM около 20088 MB; CPU или доступный ONNX provider |
| Оптимальные требования | cuda, directml, coreml, cpu; желательно 27118 MB+ свободной VRAM/RAM и 19192 MB+ disk cache |
| HF link | sigalr/Qwen3-Embedding-4B-ONNX-ST |
| Доступные quantizations | auto |
| Краткое описание | Native ONNX Runtime embedding candidate validated for public ONNX artifacts. |
| Best in |
rag, semantic-search, clustering
|
| Поле | Значение |
|---|---|
| Название | Snowflake/snowflake-arctic-embed-l-v2.0 |
| Label | Snowflake Arctic Embed L v2 |
| Категория | Embeddings / векторные представления |
| Runtime/backend | native / onnxruntime / onnx |
| Вес | 1.17 GB catalog size, ~1200 MB disk/cache |
| Параметры | не указаны |
| Минимальные требования | large - мощная локальная машина/GPU; disk >= 1200 MB; memory/VRAM около 2400 MB; CPU или доступный ONNX provider |
| Оптимальные требования | cuda, directml, coreml, cpu; желательно 3240 MB+ свободной VRAM/RAM и 1712 MB+ disk cache |
| HF link | Snowflake/snowflake-arctic-embed-l-v2.0 |
| Доступные quantizations | q8 |
| Краткое описание | Native ONNX Runtime pipeline candidate. |
| Best in |
rag, semantic-search, clustering
|
| Поле | Значение |
|---|---|
| Название | mixedbread-ai/mxbai-embed-large-v1 |
| Label | Mixedbread embed large |
| Категория | Embeddings / векторные представления |
| Runtime/backend | native / onnxruntime / onnx |
| Вес | 1.32 GB catalog size, ~1350 MB disk/cache |
| Параметры | не указаны |
| Минимальные требования | large - мощная локальная машина/GPU; disk >= 1350 MB; memory/VRAM около 2600 MB; CPU или доступный ONNX provider |
| Оптимальные требования | cuda, directml, coreml, cpu; желательно 3510 MB+ свободной VRAM/RAM и 1862 MB+ disk cache |
| HF link | mixedbread-ai/mxbai-embed-large-v1 |
| Доступные quantizations | q8 |
| Краткое описание | Native ONNX Runtime pipeline candidate. |
| Best in |
rag, semantic-search, clustering
|
- xlocllm
- Quickstart
- About
- Functions Python
- Functions TypeScript
- Use cases
- Examples Python
- Examples TypeScript
- Shared GPU mode
-
Models catalog
- Models The best
- Models Full model list
- Models Use your model
- For native mode
- Models Native LLM tiny small
- Models Native LLM medium
- Models Native LLM large
- Models Native embedding
- Models Native reranker
- Models Native translator
- Models Native tts
- Models Native vlm
- Models Native asr
- Models Native ocr
- Models Native image-classification
- Models Native object-detection
- Models Native image-segmentation
- Models Native depth-estimation
- Models Native document-layout
- Models Native table-detection
- Models Native document-qa
- Models Native language-id
- Models Native audio-classification
- Models Native text-classification
- Models Native ner
- Models Native zero-shot-text
- Models Native summarization
- Models Native text2text
- Models Native code
- For webgpu mode
- For web mode
- Models Web LLM
- Models Web embedding
- Models Web reranker
- Models Web translator
- Models Web tts
- Models Web vlm
- Models Web asr
- Models Web ocr
- Models Web image-classification
- Models Web object-detection
- Models Web image-segmentation
- Models Web depth-estimation
- Models Web document-layout
- Models Web table-detection
- Models Web document-qa
- Models Web zero-shot-image
- Models Web language-id
- Models Web audio-classification
- Models Web text-classification
- Models Web ner
- Models Web zero-shot-text
- Models Web summarization
- Models Web text2text
- Models Web code
- Dev