Skip to content

Models Native embedding

Mike edited this page May 28, 2026 · 1 revision

Models Native embedding

Режим: Native. Категория: Embeddings / векторные представления.

Всего моделей: 45.

all-MiniLM-L6-v2

Поле Значение
Название Xenova/all-MiniLM-L6-v2
Label all-MiniLM-L6-v2
Категория Embeddings / векторные представления
Runtime/backend native / onnxruntime / onnx
Вес 0.09 GB catalog size, ~90 MB disk/cache
Параметры не указаны
Минимальные требования tiny - очень слабое железо, CPU/WASM или небольшой GPU; disk >= 90 MB; memory/VRAM около 250 MB; CPU или доступный ONNX provider
Оптимальные требования cuda, directml, coreml, cpu; желательно 762 MB+ свободной VRAM/RAM и 602 MB+ disk cache
HF link Xenova/all-MiniLM-L6-v2
Доступные quantizations q8
Краткое описание Native ONNX Runtime pipeline candidate.
Best in rag, semantic-search, clustering

granite embedding 97m multilingual r2

Поле Значение
Название philipp-zettl/granite-embedding-97m-multilingual-r2-ONNX
Label granite embedding 97m multilingual r2
Категория Embeddings / векторные представления
Runtime/backend native / onnxruntime / onnx
Вес 0.09 GB catalog size, ~92 MB disk/cache
Параметры 0.097B
Минимальные требования tiny - очень слабое железо, CPU/WASM или небольшой GPU; disk >= 92 MB; memory/VRAM около 256 MB; CPU или доступный ONNX provider
Оптимальные требования cuda, directml, coreml, cpu; желательно 768 MB+ свободной VRAM/RAM и 604 MB+ disk cache
HF link philipp-zettl/granite-embedding-97m-multilingual-r2-ONNX
Доступные quantizations auto
Краткое описание ONNX/WebGPU artifact marker
Best in rag, semantic-search, clustering

granite embedding 107m multilingual

Поле Значение
Название pelagos-ai/granite-embedding-107m-multilingual-ONNX
Label granite embedding 107m multilingual
Категория Embeddings / векторные представления
Runtime/backend native / onnxruntime / onnx
Вес 0.10 GB catalog size, ~101 MB disk/cache
Параметры 0.107B
Минимальные требования tiny - очень слабое железо, CPU/WASM или небольшой GPU; disk >= 101 MB; memory/VRAM около 256 MB; CPU или доступный ONNX provider
Оптимальные требования cuda, directml, coreml, cpu; желательно 768 MB+ свободной VRAM/RAM и 613 MB+ disk cache
HF link pelagos-ai/granite-embedding-107m-multilingual-ONNX
Доступные quantizations auto
Краткое описание ONNX/WebGPU artifact marker
Best in rag, semantic-search, clustering

embeddinggemma 300m qat q8

Поле Значение
Название tooape/embeddinggemma-300m-qat-q8-ONNX
Label embeddinggemma 300m qat q8
Категория Embeddings / векторные представления
Runtime/backend native / onnxruntime / onnx
Вес 0.15 GB catalog size, ~156 MB disk/cache
Параметры 0.3B
Минимальные требования tiny - очень слабое железо, CPU/WASM или небольшой GPU; disk >= 156 MB; memory/VRAM около 256 MB; CPU или доступный ONNX provider
Оптимальные требования cuda, directml, coreml, cpu; желательно 768 MB+ свободной VRAM/RAM и 668 MB+ disk cache
HF link tooape/embeddinggemma-300m-qat-q8-ONNX
Доступные quantizations auto
Краткое описание ONNX/WebGPU artifact marker
Best in rag, semantic-search, clustering

granite embedding r2

Поле Значение
Название yasserrmd/granite-embedding-r2-onnx
Label granite embedding r2
Категория Embeddings / векторные представления
Runtime/backend native / onnxruntime / onnx
Вес 0.14 GB catalog size, ~142 MB disk/cache
Параметры не указаны
Минимальные требования tiny - очень слабое железо, CPU/WASM или небольшой GPU; disk >= 142 MB; memory/VRAM около 312 MB; CPU или доступный ONNX provider
Оптимальные требования cuda, directml, coreml, cpu; желательно 824 MB+ свободной VRAM/RAM и 654 MB+ disk cache
HF link yasserrmd/granite-embedding-r2-onnx
Доступные quantizations auto
Краткое описание Native ONNX Runtime embedding candidate validated for public ONNX artifacts.
Best in rag, semantic-search, clustering

Multilingual E5 small

Поле Значение
Название Xenova/multilingual-e5-small
Label Multilingual E5 small
Категория Embeddings / векторные представления
Runtime/backend native / onnxruntime / onnx
Вес 0.12 GB catalog size, ~120 MB disk/cache
Параметры не указаны
Минимальные требования tiny - очень слабое железо, CPU/WASM или небольшой GPU; disk >= 120 MB; memory/VRAM около 350 MB; CPU или доступный ONNX provider
Оптимальные требования cuda, directml, coreml, cpu; желательно 862 MB+ свободной VRAM/RAM и 632 MB+ disk cache
HF link Xenova/multilingual-e5-small
Доступные quantizations q8
Краткое описание Native ONNX Runtime pipeline candidate.
Best in rag, semantic-search, clustering

all MiniLM L12 v2

Поле Значение
Название Xenova/all-MiniLM-L12-v2
Label all MiniLM L12 v2
Категория Embeddings / векторные представления
Runtime/backend native / onnxruntime / onnx
Вес 0.29 GB catalog size, ~300 MB disk/cache
Параметры не указаны
Минимальные требования tiny - очень слабое железо, CPU/WASM или небольшой GPU; disk >= 300 MB; memory/VRAM около 360 MB; CPU или доступный ONNX provider
Оптимальные требования cuda, directml, coreml, cpu; желательно 872 MB+ свободной VRAM/RAM и 812 MB+ disk cache
HF link Xenova/all-MiniLM-L12-v2
Доступные quantizations auto
Краткое описание known browser-ready provider
Best in rag, semantic-search, clustering

all MiniLM L6 v2

Поле Значение
Название sentence-transformers/all-MiniLM-L6-v2
Label all MiniLM L6 v2
Категория Embeddings / векторные представления
Runtime/backend native / onnxruntime / onnx
Вес 0.29 GB catalog size, ~300 MB disk/cache
Параметры не указаны
Минимальные требования tiny - очень слабое железо, CPU/WASM или небольшой GPU; disk >= 300 MB; memory/VRAM около 360 MB; CPU или доступный ONNX provider
Оптимальные требования cuda, directml, coreml, cpu; желательно 872 MB+ свободной VRAM/RAM и 812 MB+ disk cache
HF link sentence-transformers/all-MiniLM-L6-v2
Доступные quantizations auto
Краткое описание ONNX/WebGPU artifact marker
Best in rag, semantic-search, clustering

bge base en v1.5

Поле Значение
Название onnx-community/bge-base-en-v1.5-ONNX
Label bge base en v1.5
Категория Embeddings / векторные представления
Runtime/backend native / onnxruntime / onnx
Вес 0.29 GB catalog size, ~300 MB disk/cache
Параметры не указаны
Минимальные требования tiny - очень слабое железо, CPU/WASM или небольшой GPU; disk >= 300 MB; memory/VRAM около 360 MB; CPU или доступный ONNX provider
Оптимальные требования cuda, directml, coreml, cpu; желательно 872 MB+ свободной VRAM/RAM и 812 MB+ disk cache
HF link onnx-community/bge-base-en-v1.5-ONNX
Доступные quantizations auto
Краткое описание known browser-ready provider
Best in rag, semantic-search, clustering

bge base en v1.5

Поле Значение
Название Xenova/bge-base-en-v1.5
Label bge base en v1.5
Категория Embeddings / векторные представления
Runtime/backend native / onnxruntime / onnx
Вес 0.29 GB catalog size, ~300 MB disk/cache
Параметры не указаны
Минимальные требования tiny - очень слабое железо, CPU/WASM или небольшой GPU; disk >= 300 MB; memory/VRAM около 360 MB; CPU или доступный ONNX provider
Оптимальные требования cuda, directml, coreml, cpu; желательно 872 MB+ свободной VRAM/RAM и 812 MB+ disk cache
HF link Xenova/bge-base-en-v1.5
Доступные quantizations auto
Краткое описание known browser-ready provider
Best in rag, semantic-search, clustering

bge large en v1.5

Поле Значение
Название Xenova/bge-large-en-v1.5
Label bge large en v1.5
Категория Embeddings / векторные представления
Runtime/backend native / onnxruntime / onnx
Вес 0.29 GB catalog size, ~300 MB disk/cache
Параметры не указаны
Минимальные требования tiny - очень слабое железо, CPU/WASM или небольшой GPU; disk >= 300 MB; memory/VRAM около 360 MB; CPU или доступный ONNX provider
Оптимальные требования cuda, directml, coreml, cpu; желательно 872 MB+ свободной VRAM/RAM и 812 MB+ disk cache
HF link Xenova/bge-large-en-v1.5
Доступные quantizations auto
Краткое описание known browser-ready provider
Best in rag, semantic-search, clustering

bge large zh v1.5

Поле Значение
Название baby2008/bge-large-zh-v1.5
Label bge large zh v1.5
Категория Embeddings / векторные представления
Runtime/backend native / onnxruntime / onnx
Вес 0.29 GB catalog size, ~300 MB disk/cache
Параметры не указаны
Минимальные требования tiny - очень слабое железо, CPU/WASM или небольшой GPU; disk >= 300 MB; memory/VRAM около 360 MB; CPU или доступный ONNX provider
Оптимальные требования cuda, directml, coreml, cpu; желательно 872 MB+ свободной VRAM/RAM и 812 MB+ disk cache
HF link baby2008/bge-large-zh-v1.5
Доступные quantizations auto
Краткое описание ONNX/WebGPU artifact marker
Best in rag, semantic-search, clustering

bge m3

Поле Значение
Название Xenova/bge-m3
Label bge m3
Категория Embeddings / векторные представления
Runtime/backend native / onnxruntime / onnx
Вес 0.29 GB catalog size, ~300 MB disk/cache
Параметры не указаны
Минимальные требования tiny - очень слабое железо, CPU/WASM или небольшой GPU; disk >= 300 MB; memory/VRAM около 360 MB; CPU или доступный ONNX provider
Оптимальные требования cuda, directml, coreml, cpu; желательно 872 MB+ свободной VRAM/RAM и 812 MB+ disk cache
HF link Xenova/bge-m3
Доступные quantizations auto
Краткое описание known browser-ready provider
Best in rag, semantic-search, clustering

bge small en v1.5

Поле Значение
Название onnx-community/bge-small-en-v1.5-ONNX
Label bge small en v1.5
Категория Embeddings / векторные представления
Runtime/backend native / onnxruntime / onnx
Вес 0.29 GB catalog size, ~300 MB disk/cache
Параметры не указаны
Минимальные требования tiny - очень слабое железо, CPU/WASM или небольшой GPU; disk >= 300 MB; memory/VRAM около 360 MB; CPU или доступный ONNX provider
Оптимальные требования cuda, directml, coreml, cpu; желательно 872 MB+ свободной VRAM/RAM и 812 MB+ disk cache
HF link onnx-community/bge-small-en-v1.5-ONNX
Доступные quantizations auto
Краткое описание known browser-ready provider
Best in rag, semantic-search, clustering

bge small zh v1.5

Поле Значение
Название vteaw/bge-small-zh-v1.5
Label bge small zh v1.5
Категория Embeddings / векторные представления
Runtime/backend native / onnxruntime / onnx
Вес 0.29 GB catalog size, ~300 MB disk/cache
Параметры не указаны
Минимальные требования tiny - очень слабое железо, CPU/WASM или небольшой GPU; disk >= 300 MB; memory/VRAM около 360 MB; CPU или доступный ONNX provider
Оптимальные требования cuda, directml, coreml, cpu; желательно 872 MB+ свободной VRAM/RAM и 812 MB+ disk cache
HF link vteaw/bge-small-zh-v1.5
Доступные quantizations auto
Краткое описание ONNX/WebGPU artifact marker
Best in rag, semantic-search, clustering

gte multilingual base

Поле Значение
Название baby2008/gte-multilingual-base
Label gte multilingual base
Категория Embeddings / векторные представления
Runtime/backend native / onnxruntime / onnx
Вес 0.29 GB catalog size, ~300 MB disk/cache
Параметры не указаны
Минимальные требования tiny - очень слабое железо, CPU/WASM или небольшой GPU; disk >= 300 MB; memory/VRAM около 360 MB; CPU или доступный ONNX provider
Оптимальные требования cuda, directml, coreml, cpu; желательно 872 MB+ свободной VRAM/RAM и 812 MB+ disk cache
HF link baby2008/gte-multilingual-base
Доступные quantizations auto
Краткое описание ONNX/WebGPU artifact marker
Best in rag, semantic-search, clustering

jina clip v1

Поле Значение
Название jinaai/jina-clip-v1
Label jina clip v1
Категория Embeddings / векторные представления
Runtime/backend native / onnxruntime / onnx
Вес 0.29 GB catalog size, ~300 MB disk/cache
Параметры не указаны
Минимальные требования tiny - очень слабое железо, CPU/WASM или небольшой GPU; disk >= 300 MB; memory/VRAM около 360 MB; CPU или доступный ONNX provider
Оптимальные требования cuda, directml, coreml, cpu; желательно 872 MB+ свободной VRAM/RAM и 812 MB+ disk cache
HF link jinaai/jina-clip-v1
Доступные quantizations auto
Краткое описание ONNX/WebGPU artifact marker
Best in rag, semantic-search, clustering

jina clip v2

Поле Значение
Название jinaai/jina-clip-v2
Label jina clip v2
Категория Embeddings / векторные представления
Runtime/backend native / onnxruntime / onnx
Вес 0.29 GB catalog size, ~300 MB disk/cache
Параметры не указаны
Минимальные требования tiny - очень слабое железо, CPU/WASM или небольшой GPU; disk >= 300 MB; memory/VRAM около 360 MB; CPU или доступный ONNX provider
Оптимальные требования cuda, directml, coreml, cpu; желательно 872 MB+ свободной VRAM/RAM и 812 MB+ disk cache
HF link jinaai/jina-clip-v2
Доступные quantizations auto
Краткое описание ONNX/WebGPU artifact marker
Best in rag, semantic-search, clustering

jina embeddings v3

Поле Значение
Название jinaai/jina-embeddings-v3
Label jina embeddings v3
Категория Embeddings / векторные представления
Runtime/backend native / onnxruntime / onnx
Вес 0.29 GB catalog size, ~300 MB disk/cache
Параметры не указаны
Минимальные требования tiny - очень слабое железо, CPU/WASM или небольшой GPU; disk >= 300 MB; memory/VRAM около 360 MB; CPU или доступный ONNX provider
Оптимальные требования cuda, directml, coreml, cpu; желательно 872 MB+ свободной VRAM/RAM и 812 MB+ disk cache
HF link jinaai/jina-embeddings-v3
Доступные quantizations auto
Краткое описание ONNX/WebGPU artifact marker
Best in rag, semantic-search, clustering

jina embeddings v5 omni nano

Поле Значение
Название onnx-community/jina-embeddings-v5-omni-nano-ONNX
Label jina embeddings v5 omni nano
Категория Embeddings / векторные представления
Runtime/backend native / onnxruntime / onnx
Вес 0.29 GB catalog size, ~300 MB disk/cache
Параметры не указаны
Минимальные требования tiny - очень слабое железо, CPU/WASM или небольшой GPU; disk >= 300 MB; memory/VRAM около 360 MB; CPU или доступный ONNX provider
Оптимальные требования cuda, directml, coreml, cpu; желательно 872 MB+ свободной VRAM/RAM и 812 MB+ disk cache
HF link onnx-community/jina-embeddings-v5-omni-nano-ONNX
Доступные quantizations auto
Краткое описание known browser-ready provider
Best in rag, semantic-search, clustering

multilingual e5 base

Поле Значение
Название Xenova/multilingual-e5-base
Label multilingual e5 base
Категория Embeddings / векторные представления
Runtime/backend native / onnxruntime / onnx
Вес 0.29 GB catalog size, ~300 MB disk/cache
Параметры не указаны
Минимальные требования tiny - очень слабое железо, CPU/WASM или небольшой GPU; disk >= 300 MB; memory/VRAM около 360 MB; CPU или доступный ONNX provider
Оптимальные требования cuda, directml, coreml, cpu; желательно 872 MB+ свободной VRAM/RAM и 812 MB+ disk cache
HF link Xenova/multilingual-e5-base
Доступные quantizations auto
Краткое описание known browser-ready provider
Best in rag, semantic-search, clustering

multilingual e5 large

Поле Значение
Название Xenova/multilingual-e5-large
Label multilingual e5 large
Категория Embeddings / векторные представления
Runtime/backend native / onnxruntime / onnx
Вес 0.29 GB catalog size, ~300 MB disk/cache
Параметры не указаны
Минимальные требования tiny - очень слабое железо, CPU/WASM или небольшой GPU; disk >= 300 MB; memory/VRAM около 360 MB; CPU или доступный ONNX provider
Оптимальные требования cuda, directml, coreml, cpu; желательно 872 MB+ свободной VRAM/RAM и 812 MB+ disk cache
HF link Xenova/multilingual-e5-large
Доступные quantizations auto
Краткое описание known browser-ready provider
Best in rag, semantic-search, clustering

mxbai embed xsmall v1

Поле Значение
Название mixedbread-ai/mxbai-embed-xsmall-v1
Label mxbai embed xsmall v1
Категория Embeddings / векторные представления
Runtime/backend native / onnxruntime / onnx
Вес 0.29 GB catalog size, ~300 MB disk/cache
Параметры не указаны
Минимальные требования tiny - очень слабое железо, CPU/WASM или небольшой GPU; disk >= 300 MB; memory/VRAM около 360 MB; CPU или доступный ONNX provider
Оптимальные требования cuda, directml, coreml, cpu; желательно 872 MB+ свободной VRAM/RAM и 812 MB+ disk cache
HF link mixedbread-ai/mxbai-embed-xsmall-v1
Доступные quantizations auto
Краткое описание ONNX/WebGPU artifact marker
Best in rag, semantic-search, clustering

nomic embed text v1

Поле Значение
Название Xenova/nomic-embed-text-v1
Label nomic embed text v1
Категория Embeddings / векторные представления
Runtime/backend native / onnxruntime / onnx
Вес 0.29 GB catalog size, ~300 MB disk/cache
Параметры не указаны
Минимальные требования tiny - очень слабое железо, CPU/WASM или небольшой GPU; disk >= 300 MB; memory/VRAM около 360 MB; CPU или доступный ONNX provider
Оптимальные требования cuda, directml, coreml, cpu; желательно 872 MB+ свободной VRAM/RAM и 812 MB+ disk cache
HF link Xenova/nomic-embed-text-v1
Доступные quantizations auto
Краткое описание known browser-ready provider
Best in rag, semantic-search, clustering

nomic embed text v1.5

Поле Значение
Название nomic-ai/nomic-embed-text-v1.5
Label nomic embed text v1.5
Категория Embeddings / векторные представления
Runtime/backend native / onnxruntime / onnx
Вес 0.29 GB catalog size, ~300 MB disk/cache
Параметры не указаны
Минимальные требования tiny - очень слабое железо, CPU/WASM или небольшой GPU; disk >= 300 MB; memory/VRAM около 360 MB; CPU или доступный ONNX provider
Оптимальные требования cuda, directml, coreml, cpu; желательно 872 MB+ свободной VRAM/RAM и 812 MB+ disk cache
HF link nomic-ai/nomic-embed-text-v1.5
Доступные quantizations auto
Краткое описание ONNX/WebGPU artifact marker
Best in rag, semantic-search, clustering

paraphrase MiniLM L6 v2

Поле Значение
Название Xenova/paraphrase-MiniLM-L6-v2
Label paraphrase MiniLM L6 v2
Категория Embeddings / векторные представления
Runtime/backend native / onnxruntime / onnx
Вес 0.29 GB catalog size, ~300 MB disk/cache
Параметры не указаны
Минимальные требования tiny - очень слабое железо, CPU/WASM или небольшой GPU; disk >= 300 MB; memory/VRAM около 360 MB; CPU или доступный ONNX provider
Оптимальные требования cuda, directml, coreml, cpu; желательно 872 MB+ свободной VRAM/RAM и 812 MB+ disk cache
HF link Xenova/paraphrase-MiniLM-L6-v2
Доступные quantizations auto
Краткое описание known browser-ready provider
Best in rag, semantic-search, clustering

paraphrase multilingual MiniLM L12 v2

Поле Значение
Название Xenova/paraphrase-multilingual-MiniLM-L12-v2
Label paraphrase multilingual MiniLM L12 v2
Категория Embeddings / векторные представления
Runtime/backend native / onnxruntime / onnx
Вес 0.29 GB catalog size, ~300 MB disk/cache
Параметры не указаны
Минимальные требования tiny - очень слабое железо, CPU/WASM или небольшой GPU; disk >= 300 MB; memory/VRAM около 360 MB; CPU или доступный ONNX provider
Оптимальные требования cuda, directml, coreml, cpu; желательно 872 MB+ свободной VRAM/RAM и 812 MB+ disk cache
HF link Xenova/paraphrase-multilingual-MiniLM-L12-v2
Доступные quantizations auto
Краткое описание known browser-ready provider
Best in rag, semantic-search, clustering

paraphrase multilingual mpnet base v2

Поле Значение
Название Xenova/paraphrase-multilingual-mpnet-base-v2
Label paraphrase multilingual mpnet base v2
Категория Embeddings / векторные представления
Runtime/backend native / onnxruntime / onnx
Вес 0.29 GB catalog size, ~300 MB disk/cache
Параметры не указаны
Минимальные требования tiny - очень слабое железо, CPU/WASM или небольшой GPU; disk >= 300 MB; memory/VRAM около 360 MB; CPU или доступный ONNX provider
Оптимальные требования cuda, directml, coreml, cpu; желательно 872 MB+ свободной VRAM/RAM и 812 MB+ disk cache
HF link Xenova/paraphrase-multilingual-mpnet-base-v2
Доступные quantizations auto
Краткое описание known browser-ready provider
Best in rag, semantic-search, clustering

Qwen3 Embedding 0.6B onnx int4

Поле Значение
Название electroglyph/Qwen3-Embedding-0.6B-onnx-int4
Label Qwen3 Embedding 0.6B onnx int4
Категория Embeddings / векторные представления
Runtime/backend native / onnxruntime / onnx
Вес 0.44 GB catalog size, ~446 MB disk/cache
Параметры 0.6B
Минимальные требования tiny - очень слабое железо, CPU/WASM или небольшой GPU; disk >= 446 MB; memory/VRAM около 707 MB; CPU или доступный ONNX provider
Оптимальные требования cuda, directml, coreml, cpu; желательно 1219 MB+ свободной VRAM/RAM и 958 MB+ disk cache
HF link electroglyph/Qwen3-Embedding-0.6B-onnx-int4
Доступные quantizations auto
Краткое описание Native ONNX Runtime embedding candidate validated for public ONNX artifacts.
Best in rag, semantic-search, clustering

qwen3 embedding 0.6b onnx fp16

Поле Значение
Название icosahedron10/qwen3-embedding-0.6b-onnx-fp16
Label qwen3 embedding 0.6b onnx fp16
Категория Embeddings / векторные представления
Runtime/backend native / onnxruntime / onnx
Вес 1.12 GB catalog size, ~1148 MB disk/cache
Параметры 0.6B
Минимальные требования tiny - очень слабое железо, CPU/WASM или небольшой GPU; disk >= 1148 MB; memory/VRAM около 1620 MB; CPU или доступный ONNX provider
Оптимальные требования cuda, directml, coreml, cpu; желательно 2187 MB+ свободной VRAM/RAM и 1660 MB+ disk cache
HF link icosahedron10/qwen3-embedding-0.6b-onnx-fp16
Доступные quantizations auto
Краткое описание Native ONNX Runtime embedding candidate validated for public ONNX artifacts.
Best in rag, semantic-search, clustering

Qwen3 Embedding 0.6B ONNX INT8

Поле Значение
Название Svenni551/Qwen3-Embedding-0.6B-ONNX-INT8
Label Qwen3 Embedding 0.6B ONNX INT8
Категория Embeddings / векторные представления
Runtime/backend native / onnxruntime / onnx
Вес 1.13 GB catalog size, ~1154 MB disk/cache
Параметры 0.6B
Минимальные требования tiny - очень слабое железо, CPU/WASM или небольшой GPU; disk >= 1154 MB; memory/VRAM около 1628 MB; CPU или доступный ONNX provider
Оптимальные требования cuda, directml, coreml, cpu; желательно 2197 MB+ свободной VRAM/RAM и 1666 MB+ disk cache
HF link Svenni551/Qwen3-Embedding-0.6B-ONNX-INT8
Доступные quantizations auto
Краткое описание Native ONNX Runtime embedding candidate validated for public ONNX artifacts.
Best in rag, semantic-search, clustering

Qwen3 Embedding 0.6B onnx uint8

Поле Значение
Название electroglyph/Qwen3-Embedding-0.6B-onnx-uint8
Label Qwen3 Embedding 0.6B onnx uint8
Категория Embeddings / векторные представления
Runtime/backend native / onnxruntime / onnx
Вес 1.18 GB catalog size, ~1207 MB disk/cache
Параметры 0.6B
Минимальные требования tiny - очень слабое железо, CPU/WASM или небольшой GPU; disk >= 1207 MB; memory/VRAM около 1697 MB; CPU или доступный ONNX provider
Оптимальные требования cuda, directml, coreml, cpu; желательно 2290 MB+ свободной VRAM/RAM и 1719 MB+ disk cache
HF link electroglyph/Qwen3-Embedding-0.6B-onnx-uint8
Доступные quantizations auto
Краткое описание Native ONNX Runtime embedding candidate validated for public ONNX artifacts.
Best in rag, semantic-search, clustering

Qwen3 Embedding 0.6B

Поле Значение
Название n24q02m/Qwen3-Embedding-0.6B-ONNX
Label Qwen3 Embedding 0.6B
Категория Embeddings / векторные представления
Runtime/backend native / onnxruntime / onnx
Вес 2.51 GB catalog size, ~2567 MB disk/cache
Параметры 0.6B
Минимальные требования tiny - очень слабое железо, CPU/WASM или небольшой GPU; disk >= 2567 MB; memory/VRAM около 3465 MB; CPU или доступный ONNX provider
Оптимальные требования cuda, directml, coreml, cpu; желательно 4677 MB+ свободной VRAM/RAM и 3208 MB+ disk cache
HF link n24q02m/Qwen3-Embedding-0.6B-ONNX
Доступные quantizations auto
Краткое описание Native ONNX Runtime embedding candidate validated for public ONNX artifacts.
Best in rag, semantic-search, clustering

Qwen3 Embedding 0.6B

Поле Значение
Название shawnw3i/Qwen3-Embedding-0.6B-ONNX
Label Qwen3 Embedding 0.6B
Категория Embeddings / векторные представления
Runtime/backend native / onnxruntime / onnx
Вес 3.35 GB catalog size, ~3433 MB disk/cache
Параметры 0.6B
Минимальные требования tiny - очень слабое железо, CPU/WASM или небольшой GPU; disk >= 3433 MB; memory/VRAM около 4590 MB; CPU или доступный ONNX provider
Оптимальные требования cuda, directml, coreml, cpu; желательно 6196 MB+ свободной VRAM/RAM и 4291 MB+ disk cache
HF link shawnw3i/Qwen3-Embedding-0.6B-ONNX
Доступные quantizations auto
Краткое описание Native ONNX Runtime embedding candidate validated for public ONNX artifacts.
Best in rag, semantic-search, clustering

granite embedding 311m multilingual r2

Поле Значение
Название onnx-community/granite-embedding-311m-multilingual-r2-ONNX
Label granite embedding 311m multilingual r2
Категория Embeddings / векторные представления
Runtime/backend native / onnxruntime / onnx
Вес 0.29 GB catalog size, ~295 MB disk/cache
Параметры 0.311B
Минимальные требования small - ноутбук или небольшой GPU; disk >= 295 MB; memory/VRAM около 354 MB; CPU или доступный ONNX provider
Оптимальные требования cuda, directml, coreml, cpu; желательно 866 MB+ свободной VRAM/RAM и 807 MB+ disk cache
HF link onnx-community/granite-embedding-311m-multilingual-r2-ONNX
Доступные quantizations auto
Краткое описание known browser-ready provider
Best in rag, semantic-search, clustering

Qwen3 Embedding 0.6B

Поле Значение
Название onnx-community/Qwen3-Embedding-0.6B-ONNX
Label Qwen3 Embedding 0.6B
Категория Embeddings / векторные представления
Runtime/backend native / onnxruntime / onnx
Вес 0.56 GB catalog size, ~570 MB disk/cache
Параметры 0.6B
Минимальные требования small - ноутбук или небольшой GPU; disk >= 570 MB; memory/VRAM около 684 MB; CPU или доступный ONNX provider
Оптимальные требования cuda, directml, coreml, cpu; желательно 1196 MB+ свободной VRAM/RAM и 1082 MB+ disk cache
HF link onnx-community/Qwen3-Embedding-0.6B-ONNX
Доступные quantizations auto
Краткое описание known browser-ready provider
Best in rag, semantic-search, clustering

Qwen3 Embedding 0.6B

Поле Значение
Название EMA-Sakuraba-416/Qwen3-Embedding-0.6B-ONNX
Label Qwen3 Embedding 0.6B
Категория Embeddings / векторные представления
Runtime/backend native / onnxruntime / onnx
Вес 0.56 GB catalog size, ~570 MB disk/cache
Параметры 0.6B
Минимальные требования small - ноутбук или небольшой GPU; disk >= 570 MB; memory/VRAM около 684 MB; CPU или доступный ONNX provider
Оптимальные требования cuda, directml, coreml, cpu; желательно 1196 MB+ свободной VRAM/RAM и 1082 MB+ disk cache
HF link EMA-Sakuraba-416/Qwen3-Embedding-0.6B-ONNX
Доступные quantizations auto
Краткое описание ONNX/WebGPU artifact marker
Best in rag, semantic-search, clustering

jina embeddings v5 small

Поле Значение
Название s-lorin/jina-embeddings-v5-small-onnx
Label jina embeddings v5 small
Категория Embeddings / векторные представления
Runtime/backend native / onnxruntime / onnx
Вес 1.00 GB catalog size, ~1028 MB disk/cache
Параметры не указаны
Минимальные требования small - ноутбук или небольшой GPU; disk >= 1028 MB; memory/VRAM около 1464 MB; CPU или доступный ONNX provider
Оптимальные требования cuda, directml, coreml, cpu; желательно 1976 MB+ свободной VRAM/RAM и 1540 MB+ disk cache
HF link s-lorin/jina-embeddings-v5-small-onnx
Доступные quantizations auto
Краткое описание Native ONNX Runtime embedding candidate validated for public ONNX artifacts.
Best in rag, semantic-search, clustering

granite embedding 107m multilingual

Поле Значение
Название sirasagi62/granite-embedding-107m-multilingual-ONNX
Label granite embedding 107m multilingual
Категория Embeddings / векторные представления
Runtime/backend native / onnxruntime / onnx
Вес 1.73 GB catalog size, ~1768 MB disk/cache
Параметры не указаны
Минимальные требования small - ноутбук или небольшой GPU; disk >= 1768 MB; memory/VRAM около 2426 MB; CPU или доступный ONNX provider
Оптимальные требования cuda, directml, coreml, cpu; желательно 3275 MB+ свободной VRAM/RAM и 2280 MB+ disk cache
HF link sirasagi62/granite-embedding-107m-multilingual-ONNX
Доступные quantizations auto
Краткое описание Native ONNX Runtime embedding candidate validated for public ONNX artifacts.
Best in rag, semantic-search, clustering

embeddinggemma 300m qat q8 0 unquantized

Поле Значение
Название jrc2139/embeddinggemma-300m-qat-q8_0-unquantized-ONNX
Label embeddinggemma 300m qat q8 0 unquantized
Категория Embeddings / векторные представления
Runtime/backend native / onnxruntime / onnx
Вес 3.62 GB catalog size, ~3703 MB disk/cache
Параметры не указаны
Минимальные требования medium - рабочая станция или заметный GPU; disk >= 3703 MB; memory/VRAM около 4941 MB; CPU или доступный ONNX provider
Оптимальные требования cuda, directml, coreml, cpu; желательно 6670 MB+ свободной VRAM/RAM и 4628 MB+ disk cache
HF link jrc2139/embeddinggemma-300m-qat-q8_0-unquantized-ONNX
Доступные quantizations auto
Краткое описание Native ONNX Runtime embedding candidate validated for public ONNX artifacts.
Best in rag, semantic-search, clustering

Qwen3 Embedding 4B ONNX INT8

Поле Значение
Название majentik/Qwen3-Embedding-4B-ONNX-INT8
Label Qwen3 Embedding 4B ONNX INT8
Категория Embeddings / векторные представления
Runtime/backend native / onnxruntime / onnx
Вес 3.76 GB catalog size, ~3854 MB disk/cache
Параметры 4B
Минимальные требования medium - рабочая станция или заметный GPU; disk >= 3854 MB; memory/VRAM около 5138 MB; CPU или доступный ONNX provider
Оптимальные требования cuda, directml, coreml, cpu; желательно 6936 MB+ свободной VRAM/RAM и 4817 MB+ disk cache
HF link majentik/Qwen3-Embedding-4B-ONNX-INT8
Доступные quantizations auto
Краткое описание Native ONNX Runtime embedding candidate validated for public ONNX artifacts.
Best in rag, semantic-search, clustering

jina embeddings v5 text small clustering

Поле Значение
Название MaunikG/jina-embeddings-v5-text-small-clustering-ONNX
Label jina embeddings v5 text small clustering
Категория Embeddings / векторные представления
Runtime/backend native / onnxruntime / onnx
Вес 4.71 GB catalog size, ~4818 MB disk/cache
Параметры не указаны
Минимальные требования medium - рабочая станция или заметный GPU; disk >= 4818 MB; memory/VRAM около 6391 MB; CPU или доступный ONNX provider
Оптимальные требования cuda, directml, coreml, cpu; желательно 8627 MB+ свободной VRAM/RAM и 6022 MB+ disk cache
HF link MaunikG/jina-embeddings-v5-text-small-clustering-ONNX
Доступные quantizations auto
Краткое описание Native ONNX Runtime embedding candidate validated for public ONNX artifacts.
Best in rag, semantic-search, clustering

Qwen3 Embedding 4B ONNX ST

Поле Значение
Название sigalr/Qwen3-Embedding-4B-ONNX-ST
Label Qwen3 Embedding 4B ONNX ST
Категория Embeddings / векторные представления
Runtime/backend native / onnxruntime / onnx
Вес 14.99 GB catalog size, ~15354 MB disk/cache
Параметры 4B
Минимальные требования medium - рабочая станция или заметный GPU; disk >= 15354 MB; memory/VRAM около 20088 MB; CPU или доступный ONNX provider
Оптимальные требования cuda, directml, coreml, cpu; желательно 27118 MB+ свободной VRAM/RAM и 19192 MB+ disk cache
HF link sigalr/Qwen3-Embedding-4B-ONNX-ST
Доступные quantizations auto
Краткое описание Native ONNX Runtime embedding candidate validated for public ONNX artifacts.
Best in rag, semantic-search, clustering

Snowflake Arctic Embed L v2

Поле Значение
Название Snowflake/snowflake-arctic-embed-l-v2.0
Label Snowflake Arctic Embed L v2
Категория Embeddings / векторные представления
Runtime/backend native / onnxruntime / onnx
Вес 1.17 GB catalog size, ~1200 MB disk/cache
Параметры не указаны
Минимальные требования large - мощная локальная машина/GPU; disk >= 1200 MB; memory/VRAM около 2400 MB; CPU или доступный ONNX provider
Оптимальные требования cuda, directml, coreml, cpu; желательно 3240 MB+ свободной VRAM/RAM и 1712 MB+ disk cache
HF link Snowflake/snowflake-arctic-embed-l-v2.0
Доступные quantizations q8
Краткое описание Native ONNX Runtime pipeline candidate.
Best in rag, semantic-search, clustering

Mixedbread embed large

Поле Значение
Название mixedbread-ai/mxbai-embed-large-v1
Label Mixedbread embed large
Категория Embeddings / векторные представления
Runtime/backend native / onnxruntime / onnx
Вес 1.32 GB catalog size, ~1350 MB disk/cache
Параметры не указаны
Минимальные требования large - мощная локальная машина/GPU; disk >= 1350 MB; memory/VRAM около 2600 MB; CPU или доступный ONNX provider
Оптимальные требования cuda, directml, coreml, cpu; желательно 3510 MB+ свободной VRAM/RAM и 1862 MB+ disk cache
HF link mixedbread-ai/mxbai-embed-large-v1
Доступные quantizations q8
Краткое описание Native ONNX Runtime pipeline candidate.
Best in rag, semantic-search, clustering

Clone this wiki locally