Models Native embedding

Режим: Native. Категория: Embeddings / векторные представления.

Всего моделей: 45.

all-MiniLM-L6-v2

Поле	Значение
Название	`Xenova/all-MiniLM-L6-v2`
Label	all-MiniLM-L6-v2
Категория	Embeddings / векторные представления
Runtime/backend	native / onnxruntime / onnx
Вес	0.09 GB catalog size, ~90 MB disk/cache
Параметры	не указаны
Минимальные требования	tiny - очень слабое железо, CPU/WASM или небольшой GPU; disk >= 90 MB; memory/VRAM около 250 MB; CPU или доступный ONNX provider
Оптимальные требования	cuda, directml, coreml, cpu; желательно 762 MB+ свободной VRAM/RAM и 602 MB+ disk cache
HF link	Xenova/all-MiniLM-L6-v2
Доступные quantizations	`q8`
Краткое описание	Native ONNX Runtime pipeline candidate.
Best in	`rag`, `semantic-search`, `clustering`

granite embedding 97m multilingual r2

Поле	Значение
Название	`philipp-zettl/granite-embedding-97m-multilingual-r2-ONNX`
Label	granite embedding 97m multilingual r2
Категория	Embeddings / векторные представления
Runtime/backend	native / onnxruntime / onnx
Вес	0.09 GB catalog size, ~92 MB disk/cache
Параметры	0.097B
Минимальные требования	tiny - очень слабое железо, CPU/WASM или небольшой GPU; disk >= 92 MB; memory/VRAM около 256 MB; CPU или доступный ONNX provider
Оптимальные требования	cuda, directml, coreml, cpu; желательно 768 MB+ свободной VRAM/RAM и 604 MB+ disk cache
HF link	philipp-zettl/granite-embedding-97m-multilingual-r2-ONNX
Доступные quantizations	`auto`
Краткое описание	ONNX/WebGPU artifact marker
Best in	`rag`, `semantic-search`, `clustering`

granite embedding 107m multilingual

Поле	Значение
Название	`pelagos-ai/granite-embedding-107m-multilingual-ONNX`
Label	granite embedding 107m multilingual
Категория	Embeddings / векторные представления
Runtime/backend	native / onnxruntime / onnx
Вес	0.10 GB catalog size, ~101 MB disk/cache
Параметры	0.107B
Минимальные требования	tiny - очень слабое железо, CPU/WASM или небольшой GPU; disk >= 101 MB; memory/VRAM около 256 MB; CPU или доступный ONNX provider
Оптимальные требования	cuda, directml, coreml, cpu; желательно 768 MB+ свободной VRAM/RAM и 613 MB+ disk cache
HF link	pelagos-ai/granite-embedding-107m-multilingual-ONNX
Доступные quantizations	`auto`
Краткое описание	ONNX/WebGPU artifact marker
Best in	`rag`, `semantic-search`, `clustering`

embeddinggemma 300m qat q8

Поле	Значение
Название	`tooape/embeddinggemma-300m-qat-q8-ONNX`
Label	embeddinggemma 300m qat q8
Категория	Embeddings / векторные представления
Runtime/backend	native / onnxruntime / onnx
Вес	0.15 GB catalog size, ~156 MB disk/cache
Параметры	0.3B
Минимальные требования	tiny - очень слабое железо, CPU/WASM или небольшой GPU; disk >= 156 MB; memory/VRAM около 256 MB; CPU или доступный ONNX provider
Оптимальные требования	cuda, directml, coreml, cpu; желательно 768 MB+ свободной VRAM/RAM и 668 MB+ disk cache
HF link	tooape/embeddinggemma-300m-qat-q8-ONNX
Доступные quantizations	`auto`
Краткое описание	ONNX/WebGPU artifact marker
Best in	`rag`, `semantic-search`, `clustering`

granite embedding r2

Поле	Значение
Название	`yasserrmd/granite-embedding-r2-onnx`
Label	granite embedding r2
Категория	Embeddings / векторные представления
Runtime/backend	native / onnxruntime / onnx
Вес	0.14 GB catalog size, ~142 MB disk/cache
Параметры	не указаны
Минимальные требования	tiny - очень слабое железо, CPU/WASM или небольшой GPU; disk >= 142 MB; memory/VRAM около 312 MB; CPU или доступный ONNX provider
Оптимальные требования	cuda, directml, coreml, cpu; желательно 824 MB+ свободной VRAM/RAM и 654 MB+ disk cache
HF link	yasserrmd/granite-embedding-r2-onnx
Доступные quantizations	`auto`
Краткое описание	Native ONNX Runtime embedding candidate validated for public ONNX artifacts.
Best in	`rag`, `semantic-search`, `clustering`

Multilingual E5 small

Поле	Значение
Название	`Xenova/multilingual-e5-small`
Label	Multilingual E5 small
Категория	Embeddings / векторные представления
Runtime/backend	native / onnxruntime / onnx
Вес	0.12 GB catalog size, ~120 MB disk/cache
Параметры	не указаны
Минимальные требования	tiny - очень слабое железо, CPU/WASM или небольшой GPU; disk >= 120 MB; memory/VRAM около 350 MB; CPU или доступный ONNX provider
Оптимальные требования	cuda, directml, coreml, cpu; желательно 862 MB+ свободной VRAM/RAM и 632 MB+ disk cache
HF link	Xenova/multilingual-e5-small
Доступные quantizations	`q8`
Краткое описание	Native ONNX Runtime pipeline candidate.
Best in	`rag`, `semantic-search`, `clustering`

all MiniLM L12 v2

Поле	Значение
Название	`Xenova/all-MiniLM-L12-v2`
Label	all MiniLM L12 v2
Категория	Embeddings / векторные представления
Runtime/backend	native / onnxruntime / onnx
Вес	0.29 GB catalog size, ~300 MB disk/cache
Параметры	не указаны
Минимальные требования	tiny - очень слабое железо, CPU/WASM или небольшой GPU; disk >= 300 MB; memory/VRAM около 360 MB; CPU или доступный ONNX provider
Оптимальные требования	cuda, directml, coreml, cpu; желательно 872 MB+ свободной VRAM/RAM и 812 MB+ disk cache
HF link	Xenova/all-MiniLM-L12-v2
Доступные quantizations	`auto`
Краткое описание	known browser-ready provider
Best in	`rag`, `semantic-search`, `clustering`

all MiniLM L6 v2

Поле	Значение
Название	`sentence-transformers/all-MiniLM-L6-v2`
Label	all MiniLM L6 v2
Категория	Embeddings / векторные представления
Runtime/backend	native / onnxruntime / onnx
Вес	0.29 GB catalog size, ~300 MB disk/cache
Параметры	не указаны
Минимальные требования	tiny - очень слабое железо, CPU/WASM или небольшой GPU; disk >= 300 MB; memory/VRAM около 360 MB; CPU или доступный ONNX provider
Оптимальные требования	cuda, directml, coreml, cpu; желательно 872 MB+ свободной VRAM/RAM и 812 MB+ disk cache
HF link	sentence-transformers/all-MiniLM-L6-v2
Доступные quantizations	`auto`
Краткое описание	ONNX/WebGPU artifact marker
Best in	`rag`, `semantic-search`, `clustering`

bge base en v1.5

Поле	Значение
Название	`onnx-community/bge-base-en-v1.5-ONNX`
Label	bge base en v1.5
Категория	Embeddings / векторные представления
Runtime/backend	native / onnxruntime / onnx
Вес	0.29 GB catalog size, ~300 MB disk/cache
Параметры	не указаны
Минимальные требования	tiny - очень слабое железо, CPU/WASM или небольшой GPU; disk >= 300 MB; memory/VRAM около 360 MB; CPU или доступный ONNX provider
Оптимальные требования	cuda, directml, coreml, cpu; желательно 872 MB+ свободной VRAM/RAM и 812 MB+ disk cache
HF link	onnx-community/bge-base-en-v1.5-ONNX
Доступные quantizations	`auto`
Краткое описание	known browser-ready provider
Best in	`rag`, `semantic-search`, `clustering`

bge base en v1.5

Поле	Значение
Название	`Xenova/bge-base-en-v1.5`
Label	bge base en v1.5
Категория	Embeddings / векторные представления
Runtime/backend	native / onnxruntime / onnx
Вес	0.29 GB catalog size, ~300 MB disk/cache
Параметры	не указаны
Минимальные требования	tiny - очень слабое железо, CPU/WASM или небольшой GPU; disk >= 300 MB; memory/VRAM около 360 MB; CPU или доступный ONNX provider
Оптимальные требования	cuda, directml, coreml, cpu; желательно 872 MB+ свободной VRAM/RAM и 812 MB+ disk cache
HF link	Xenova/bge-base-en-v1.5
Доступные quantizations	`auto`
Краткое описание	known browser-ready provider
Best in	`rag`, `semantic-search`, `clustering`

bge large en v1.5

Поле	Значение
Название	`Xenova/bge-large-en-v1.5`
Label	bge large en v1.5
Категория	Embeddings / векторные представления
Runtime/backend	native / onnxruntime / onnx
Вес	0.29 GB catalog size, ~300 MB disk/cache
Параметры	не указаны
Минимальные требования	tiny - очень слабое железо, CPU/WASM или небольшой GPU; disk >= 300 MB; memory/VRAM около 360 MB; CPU или доступный ONNX provider
Оптимальные требования	cuda, directml, coreml, cpu; желательно 872 MB+ свободной VRAM/RAM и 812 MB+ disk cache
HF link	Xenova/bge-large-en-v1.5
Доступные quantizations	`auto`
Краткое описание	known browser-ready provider
Best in	`rag`, `semantic-search`, `clustering`

bge large zh v1.5

Поле	Значение
Название	`baby2008/bge-large-zh-v1.5`
Label	bge large zh v1.5
Категория	Embeddings / векторные представления
Runtime/backend	native / onnxruntime / onnx
Вес	0.29 GB catalog size, ~300 MB disk/cache
Параметры	не указаны
Минимальные требования	tiny - очень слабое железо, CPU/WASM или небольшой GPU; disk >= 300 MB; memory/VRAM около 360 MB; CPU или доступный ONNX provider
Оптимальные требования	cuda, directml, coreml, cpu; желательно 872 MB+ свободной VRAM/RAM и 812 MB+ disk cache
HF link	baby2008/bge-large-zh-v1.5
Доступные quantizations	`auto`
Краткое описание	ONNX/WebGPU artifact marker
Best in	`rag`, `semantic-search`, `clustering`

bge m3

Поле	Значение
Название	`Xenova/bge-m3`
Label	bge m3
Категория	Embeddings / векторные представления
Runtime/backend	native / onnxruntime / onnx
Вес	0.29 GB catalog size, ~300 MB disk/cache
Параметры	не указаны
Минимальные требования	tiny - очень слабое железо, CPU/WASM или небольшой GPU; disk >= 300 MB; memory/VRAM около 360 MB; CPU или доступный ONNX provider
Оптимальные требования	cuda, directml, coreml, cpu; желательно 872 MB+ свободной VRAM/RAM и 812 MB+ disk cache
HF link	Xenova/bge-m3
Доступные quantizations	`auto`
Краткое описание	known browser-ready provider
Best in	`rag`, `semantic-search`, `clustering`

bge small en v1.5

Поле	Значение
Название	`onnx-community/bge-small-en-v1.5-ONNX`
Label	bge small en v1.5
Категория	Embeddings / векторные представления
Runtime/backend	native / onnxruntime / onnx
Вес	0.29 GB catalog size, ~300 MB disk/cache
Параметры	не указаны
Минимальные требования	tiny - очень слабое железо, CPU/WASM или небольшой GPU; disk >= 300 MB; memory/VRAM около 360 MB; CPU или доступный ONNX provider
Оптимальные требования	cuda, directml, coreml, cpu; желательно 872 MB+ свободной VRAM/RAM и 812 MB+ disk cache
HF link	onnx-community/bge-small-en-v1.5-ONNX
Доступные quantizations	`auto`
Краткое описание	known browser-ready provider
Best in	`rag`, `semantic-search`, `clustering`

bge small zh v1.5

Поле	Значение
Название	`vteaw/bge-small-zh-v1.5`
Label	bge small zh v1.5
Категория	Embeddings / векторные представления
Runtime/backend	native / onnxruntime / onnx
Вес	0.29 GB catalog size, ~300 MB disk/cache
Параметры	не указаны
Минимальные требования	tiny - очень слабое железо, CPU/WASM или небольшой GPU; disk >= 300 MB; memory/VRAM около 360 MB; CPU или доступный ONNX provider
Оптимальные требования	cuda, directml, coreml, cpu; желательно 872 MB+ свободной VRAM/RAM и 812 MB+ disk cache
HF link	vteaw/bge-small-zh-v1.5
Доступные quantizations	`auto`
Краткое описание	ONNX/WebGPU artifact marker
Best in	`rag`, `semantic-search`, `clustering`

gte multilingual base

Поле	Значение
Название	`baby2008/gte-multilingual-base`
Label	gte multilingual base
Категория	Embeddings / векторные представления
Runtime/backend	native / onnxruntime / onnx
Вес	0.29 GB catalog size, ~300 MB disk/cache
Параметры	не указаны
Минимальные требования	tiny - очень слабое железо, CPU/WASM или небольшой GPU; disk >= 300 MB; memory/VRAM около 360 MB; CPU или доступный ONNX provider
Оптимальные требования	cuda, directml, coreml, cpu; желательно 872 MB+ свободной VRAM/RAM и 812 MB+ disk cache
HF link	baby2008/gte-multilingual-base
Доступные quantizations	`auto`
Краткое описание	ONNX/WebGPU artifact marker
Best in	`rag`, `semantic-search`, `clustering`

jina clip v1

Поле	Значение
Название	`jinaai/jina-clip-v1`
Label	jina clip v1
Категория	Embeddings / векторные представления
Runtime/backend	native / onnxruntime / onnx
Вес	0.29 GB catalog size, ~300 MB disk/cache
Параметры	не указаны
Минимальные требования	tiny - очень слабое железо, CPU/WASM или небольшой GPU; disk >= 300 MB; memory/VRAM около 360 MB; CPU или доступный ONNX provider
Оптимальные требования	cuda, directml, coreml, cpu; желательно 872 MB+ свободной VRAM/RAM и 812 MB+ disk cache
HF link	jinaai/jina-clip-v1
Доступные quantizations	`auto`
Краткое описание	ONNX/WebGPU artifact marker
Best in	`rag`, `semantic-search`, `clustering`

jina clip v2

Поле	Значение
Название	`jinaai/jina-clip-v2`
Label	jina clip v2
Категория	Embeddings / векторные представления
Runtime/backend	native / onnxruntime / onnx
Вес	0.29 GB catalog size, ~300 MB disk/cache
Параметры	не указаны
Минимальные требования	tiny - очень слабое железо, CPU/WASM или небольшой GPU; disk >= 300 MB; memory/VRAM около 360 MB; CPU или доступный ONNX provider
Оптимальные требования	cuda, directml, coreml, cpu; желательно 872 MB+ свободной VRAM/RAM и 812 MB+ disk cache
HF link	jinaai/jina-clip-v2
Доступные quantizations	`auto`
Краткое описание	ONNX/WebGPU artifact marker
Best in	`rag`, `semantic-search`, `clustering`

jina embeddings v3

Поле	Значение
Название	`jinaai/jina-embeddings-v3`
Label	jina embeddings v3
Категория	Embeddings / векторные представления
Runtime/backend	native / onnxruntime / onnx
Вес	0.29 GB catalog size, ~300 MB disk/cache
Параметры	не указаны
Минимальные требования	tiny - очень слабое железо, CPU/WASM или небольшой GPU; disk >= 300 MB; memory/VRAM около 360 MB; CPU или доступный ONNX provider
Оптимальные требования	cuda, directml, coreml, cpu; желательно 872 MB+ свободной VRAM/RAM и 812 MB+ disk cache
HF link	jinaai/jina-embeddings-v3
Доступные quantizations	`auto`
Краткое описание	ONNX/WebGPU artifact marker
Best in	`rag`, `semantic-search`, `clustering`

jina embeddings v5 omni nano

Поле	Значение
Название	`onnx-community/jina-embeddings-v5-omni-nano-ONNX`
Label	jina embeddings v5 omni nano
Категория	Embeddings / векторные представления
Runtime/backend	native / onnxruntime / onnx
Вес	0.29 GB catalog size, ~300 MB disk/cache
Параметры	не указаны
Минимальные требования	tiny - очень слабое железо, CPU/WASM или небольшой GPU; disk >= 300 MB; memory/VRAM около 360 MB; CPU или доступный ONNX provider
Оптимальные требования	cuda, directml, coreml, cpu; желательно 872 MB+ свободной VRAM/RAM и 812 MB+ disk cache
HF link	onnx-community/jina-embeddings-v5-omni-nano-ONNX
Доступные quantizations	`auto`
Краткое описание	known browser-ready provider
Best in	`rag`, `semantic-search`, `clustering`

multilingual e5 base

Поле	Значение
Название	`Xenova/multilingual-e5-base`
Label	multilingual e5 base
Категория	Embeddings / векторные представления
Runtime/backend	native / onnxruntime / onnx
Вес	0.29 GB catalog size, ~300 MB disk/cache
Параметры	не указаны
Минимальные требования	tiny - очень слабое железо, CPU/WASM или небольшой GPU; disk >= 300 MB; memory/VRAM около 360 MB; CPU или доступный ONNX provider
Оптимальные требования	cuda, directml, coreml, cpu; желательно 872 MB+ свободной VRAM/RAM и 812 MB+ disk cache
HF link	Xenova/multilingual-e5-base
Доступные quantizations	`auto`
Краткое описание	known browser-ready provider
Best in	`rag`, `semantic-search`, `clustering`

multilingual e5 large

Поле	Значение
Название	`Xenova/multilingual-e5-large`
Label	multilingual e5 large
Категория	Embeddings / векторные представления
Runtime/backend	native / onnxruntime / onnx
Вес	0.29 GB catalog size, ~300 MB disk/cache
Параметры	не указаны
Минимальные требования	tiny - очень слабое железо, CPU/WASM или небольшой GPU; disk >= 300 MB; memory/VRAM около 360 MB; CPU или доступный ONNX provider
Оптимальные требования	cuda, directml, coreml, cpu; желательно 872 MB+ свободной VRAM/RAM и 812 MB+ disk cache
HF link	Xenova/multilingual-e5-large
Доступные quantizations	`auto`
Краткое описание	known browser-ready provider
Best in	`rag`, `semantic-search`, `clustering`

mxbai embed xsmall v1

Поле	Значение
Название	`mixedbread-ai/mxbai-embed-xsmall-v1`
Label	mxbai embed xsmall v1
Категория	Embeddings / векторные представления
Runtime/backend	native / onnxruntime / onnx
Вес	0.29 GB catalog size, ~300 MB disk/cache
Параметры	не указаны
Минимальные требования	tiny - очень слабое железо, CPU/WASM или небольшой GPU; disk >= 300 MB; memory/VRAM около 360 MB; CPU или доступный ONNX provider
Оптимальные требования	cuda, directml, coreml, cpu; желательно 872 MB+ свободной VRAM/RAM и 812 MB+ disk cache
HF link	mixedbread-ai/mxbai-embed-xsmall-v1
Доступные quantizations	`auto`
Краткое описание	ONNX/WebGPU artifact marker
Best in	`rag`, `semantic-search`, `clustering`

nomic embed text v1

Поле	Значение
Название	`Xenova/nomic-embed-text-v1`
Label	nomic embed text v1
Категория	Embeddings / векторные представления
Runtime/backend	native / onnxruntime / onnx
Вес	0.29 GB catalog size, ~300 MB disk/cache
Параметры	не указаны
Минимальные требования	tiny - очень слабое железо, CPU/WASM или небольшой GPU; disk >= 300 MB; memory/VRAM около 360 MB; CPU или доступный ONNX provider
Оптимальные требования	cuda, directml, coreml, cpu; желательно 872 MB+ свободной VRAM/RAM и 812 MB+ disk cache
HF link	Xenova/nomic-embed-text-v1
Доступные quantizations	`auto`
Краткое описание	known browser-ready provider
Best in	`rag`, `semantic-search`, `clustering`

nomic embed text v1.5

Поле	Значение
Название	`nomic-ai/nomic-embed-text-v1.5`
Label	nomic embed text v1.5
Категория	Embeddings / векторные представления
Runtime/backend	native / onnxruntime / onnx
Вес	0.29 GB catalog size, ~300 MB disk/cache
Параметры	не указаны
Минимальные требования	tiny - очень слабое железо, CPU/WASM или небольшой GPU; disk >= 300 MB; memory/VRAM около 360 MB; CPU или доступный ONNX provider
Оптимальные требования	cuda, directml, coreml, cpu; желательно 872 MB+ свободной VRAM/RAM и 812 MB+ disk cache
HF link	nomic-ai/nomic-embed-text-v1.5
Доступные quantizations	`auto`
Краткое описание	ONNX/WebGPU artifact marker
Best in	`rag`, `semantic-search`, `clustering`

paraphrase MiniLM L6 v2

Поле	Значение
Название	`Xenova/paraphrase-MiniLM-L6-v2`
Label	paraphrase MiniLM L6 v2
Категория	Embeddings / векторные представления
Runtime/backend	native / onnxruntime / onnx
Вес	0.29 GB catalog size, ~300 MB disk/cache
Параметры	не указаны
Минимальные требования	tiny - очень слабое железо, CPU/WASM или небольшой GPU; disk >= 300 MB; memory/VRAM около 360 MB; CPU или доступный ONNX provider
Оптимальные требования	cuda, directml, coreml, cpu; желательно 872 MB+ свободной VRAM/RAM и 812 MB+ disk cache
HF link	Xenova/paraphrase-MiniLM-L6-v2
Доступные quantizations	`auto`
Краткое описание	known browser-ready provider
Best in	`rag`, `semantic-search`, `clustering`

paraphrase multilingual MiniLM L12 v2

Поле	Значение
Название	`Xenova/paraphrase-multilingual-MiniLM-L12-v2`
Label	paraphrase multilingual MiniLM L12 v2
Категория	Embeddings / векторные представления
Runtime/backend	native / onnxruntime / onnx
Вес	0.29 GB catalog size, ~300 MB disk/cache
Параметры	не указаны
Минимальные требования	tiny - очень слабое железо, CPU/WASM или небольшой GPU; disk >= 300 MB; memory/VRAM около 360 MB; CPU или доступный ONNX provider
Оптимальные требования	cuda, directml, coreml, cpu; желательно 872 MB+ свободной VRAM/RAM и 812 MB+ disk cache
HF link	Xenova/paraphrase-multilingual-MiniLM-L12-v2
Доступные quantizations	`auto`
Краткое описание	known browser-ready provider
Best in	`rag`, `semantic-search`, `clustering`

paraphrase multilingual mpnet base v2

Поле	Значение
Название	`Xenova/paraphrase-multilingual-mpnet-base-v2`
Label	paraphrase multilingual mpnet base v2
Категория	Embeddings / векторные представления
Runtime/backend	native / onnxruntime / onnx
Вес	0.29 GB catalog size, ~300 MB disk/cache
Параметры	не указаны
Минимальные требования	tiny - очень слабое железо, CPU/WASM или небольшой GPU; disk >= 300 MB; memory/VRAM около 360 MB; CPU или доступный ONNX provider
Оптимальные требования	cuda, directml, coreml, cpu; желательно 872 MB+ свободной VRAM/RAM и 812 MB+ disk cache
HF link	Xenova/paraphrase-multilingual-mpnet-base-v2
Доступные quantizations	`auto`
Краткое описание	known browser-ready provider
Best in	`rag`, `semantic-search`, `clustering`

Qwen3 Embedding 0.6B onnx int4

Поле	Значение
Название	`electroglyph/Qwen3-Embedding-0.6B-onnx-int4`
Label	Qwen3 Embedding 0.6B onnx int4
Категория	Embeddings / векторные представления
Runtime/backend	native / onnxruntime / onnx
Вес	0.44 GB catalog size, ~446 MB disk/cache
Параметры	0.6B
Минимальные требования	tiny - очень слабое железо, CPU/WASM или небольшой GPU; disk >= 446 MB; memory/VRAM около 707 MB; CPU или доступный ONNX provider
Оптимальные требования	cuda, directml, coreml, cpu; желательно 1219 MB+ свободной VRAM/RAM и 958 MB+ disk cache
HF link	electroglyph/Qwen3-Embedding-0.6B-onnx-int4
Доступные quantizations	`auto`
Краткое описание	Native ONNX Runtime embedding candidate validated for public ONNX artifacts.
Best in	`rag`, `semantic-search`, `clustering`

qwen3 embedding 0.6b onnx fp16

Поле	Значение
Название	`icosahedron10/qwen3-embedding-0.6b-onnx-fp16`
Label	qwen3 embedding 0.6b onnx fp16
Категория	Embeddings / векторные представления
Runtime/backend	native / onnxruntime / onnx
Вес	1.12 GB catalog size, ~1148 MB disk/cache
Параметры	0.6B
Минимальные требования	tiny - очень слабое железо, CPU/WASM или небольшой GPU; disk >= 1148 MB; memory/VRAM около 1620 MB; CPU или доступный ONNX provider
Оптимальные требования	cuda, directml, coreml, cpu; желательно 2187 MB+ свободной VRAM/RAM и 1660 MB+ disk cache
HF link	icosahedron10/qwen3-embedding-0.6b-onnx-fp16
Доступные quantizations	`auto`
Краткое описание	Native ONNX Runtime embedding candidate validated for public ONNX artifacts.
Best in	`rag`, `semantic-search`, `clustering`

Qwen3 Embedding 0.6B ONNX INT8

Поле	Значение
Название	`Svenni551/Qwen3-Embedding-0.6B-ONNX-INT8`
Label	Qwen3 Embedding 0.6B ONNX INT8
Категория	Embeddings / векторные представления
Runtime/backend	native / onnxruntime / onnx
Вес	1.13 GB catalog size, ~1154 MB disk/cache
Параметры	0.6B
Минимальные требования	tiny - очень слабое железо, CPU/WASM или небольшой GPU; disk >= 1154 MB; memory/VRAM около 1628 MB; CPU или доступный ONNX provider
Оптимальные требования	cuda, directml, coreml, cpu; желательно 2197 MB+ свободной VRAM/RAM и 1666 MB+ disk cache
HF link	Svenni551/Qwen3-Embedding-0.6B-ONNX-INT8
Доступные quantizations	`auto`
Краткое описание	Native ONNX Runtime embedding candidate validated for public ONNX artifacts.
Best in	`rag`, `semantic-search`, `clustering`

Qwen3 Embedding 0.6B onnx uint8

Поле	Значение
Название	`electroglyph/Qwen3-Embedding-0.6B-onnx-uint8`
Label	Qwen3 Embedding 0.6B onnx uint8
Категория	Embeddings / векторные представления
Runtime/backend	native / onnxruntime / onnx
Вес	1.18 GB catalog size, ~1207 MB disk/cache
Параметры	0.6B
Минимальные требования	tiny - очень слабое железо, CPU/WASM или небольшой GPU; disk >= 1207 MB; memory/VRAM около 1697 MB; CPU или доступный ONNX provider
Оптимальные требования	cuda, directml, coreml, cpu; желательно 2290 MB+ свободной VRAM/RAM и 1719 MB+ disk cache
HF link	electroglyph/Qwen3-Embedding-0.6B-onnx-uint8
Доступные quantizations	`auto`
Краткое описание	Native ONNX Runtime embedding candidate validated for public ONNX artifacts.
Best in	`rag`, `semantic-search`, `clustering`

Qwen3 Embedding 0.6B

Поле	Значение
Название	`n24q02m/Qwen3-Embedding-0.6B-ONNX`
Label	Qwen3 Embedding 0.6B
Категория	Embeddings / векторные представления
Runtime/backend	native / onnxruntime / onnx
Вес	2.51 GB catalog size, ~2567 MB disk/cache
Параметры	0.6B
Минимальные требования	tiny - очень слабое железо, CPU/WASM или небольшой GPU; disk >= 2567 MB; memory/VRAM около 3465 MB; CPU или доступный ONNX provider
Оптимальные требования	cuda, directml, coreml, cpu; желательно 4677 MB+ свободной VRAM/RAM и 3208 MB+ disk cache
HF link	n24q02m/Qwen3-Embedding-0.6B-ONNX
Доступные quantizations	`auto`
Краткое описание	Native ONNX Runtime embedding candidate validated for public ONNX artifacts.
Best in	`rag`, `semantic-search`, `clustering`

Qwen3 Embedding 0.6B

Поле	Значение
Название	`shawnw3i/Qwen3-Embedding-0.6B-ONNX`
Label	Qwen3 Embedding 0.6B
Категория	Embeddings / векторные представления
Runtime/backend	native / onnxruntime / onnx
Вес	3.35 GB catalog size, ~3433 MB disk/cache
Параметры	0.6B
Минимальные требования	tiny - очень слабое железо, CPU/WASM или небольшой GPU; disk >= 3433 MB; memory/VRAM около 4590 MB; CPU или доступный ONNX provider
Оптимальные требования	cuda, directml, coreml, cpu; желательно 6196 MB+ свободной VRAM/RAM и 4291 MB+ disk cache
HF link	shawnw3i/Qwen3-Embedding-0.6B-ONNX
Доступные quantizations	`auto`
Краткое описание	Native ONNX Runtime embedding candidate validated for public ONNX artifacts.
Best in	`rag`, `semantic-search`, `clustering`

granite embedding 311m multilingual r2

Поле	Значение
Название	`onnx-community/granite-embedding-311m-multilingual-r2-ONNX`
Label	granite embedding 311m multilingual r2
Категория	Embeddings / векторные представления
Runtime/backend	native / onnxruntime / onnx
Вес	0.29 GB catalog size, ~295 MB disk/cache
Параметры	0.311B
Минимальные требования	small - ноутбук или небольшой GPU; disk >= 295 MB; memory/VRAM около 354 MB; CPU или доступный ONNX provider
Оптимальные требования	cuda, directml, coreml, cpu; желательно 866 MB+ свободной VRAM/RAM и 807 MB+ disk cache
HF link	onnx-community/granite-embedding-311m-multilingual-r2-ONNX
Доступные quantizations	`auto`
Краткое описание	known browser-ready provider
Best in	`rag`, `semantic-search`, `clustering`

Qwen3 Embedding 0.6B

Поле	Значение
Название	`onnx-community/Qwen3-Embedding-0.6B-ONNX`
Label	Qwen3 Embedding 0.6B
Категория	Embeddings / векторные представления
Runtime/backend	native / onnxruntime / onnx
Вес	0.56 GB catalog size, ~570 MB disk/cache
Параметры	0.6B
Минимальные требования	small - ноутбук или небольшой GPU; disk >= 570 MB; memory/VRAM около 684 MB; CPU или доступный ONNX provider
Оптимальные требования	cuda, directml, coreml, cpu; желательно 1196 MB+ свободной VRAM/RAM и 1082 MB+ disk cache
HF link	onnx-community/Qwen3-Embedding-0.6B-ONNX
Доступные quantizations	`auto`
Краткое описание	known browser-ready provider
Best in	`rag`, `semantic-search`, `clustering`

Qwen3 Embedding 0.6B

Поле	Значение
Название	`EMA-Sakuraba-416/Qwen3-Embedding-0.6B-ONNX`
Label	Qwen3 Embedding 0.6B
Категория	Embeddings / векторные представления
Runtime/backend	native / onnxruntime / onnx
Вес	0.56 GB catalog size, ~570 MB disk/cache
Параметры	0.6B
Минимальные требования	small - ноутбук или небольшой GPU; disk >= 570 MB; memory/VRAM около 684 MB; CPU или доступный ONNX provider
Оптимальные требования	cuda, directml, coreml, cpu; желательно 1196 MB+ свободной VRAM/RAM и 1082 MB+ disk cache
HF link	EMA-Sakuraba-416/Qwen3-Embedding-0.6B-ONNX
Доступные quantizations	`auto`
Краткое описание	ONNX/WebGPU artifact marker
Best in	`rag`, `semantic-search`, `clustering`

jina embeddings v5 small

Поле	Значение
Название	`s-lorin/jina-embeddings-v5-small-onnx`
Label	jina embeddings v5 small
Категория	Embeddings / векторные представления
Runtime/backend	native / onnxruntime / onnx
Вес	1.00 GB catalog size, ~1028 MB disk/cache
Параметры	не указаны
Минимальные требования	small - ноутбук или небольшой GPU; disk >= 1028 MB; memory/VRAM около 1464 MB; CPU или доступный ONNX provider
Оптимальные требования	cuda, directml, coreml, cpu; желательно 1976 MB+ свободной VRAM/RAM и 1540 MB+ disk cache
HF link	s-lorin/jina-embeddings-v5-small-onnx
Доступные quantizations	`auto`
Краткое описание	Native ONNX Runtime embedding candidate validated for public ONNX artifacts.
Best in	`rag`, `semantic-search`, `clustering`

granite embedding 107m multilingual

Поле	Значение
Название	`sirasagi62/granite-embedding-107m-multilingual-ONNX`
Label	granite embedding 107m multilingual
Категория	Embeddings / векторные представления
Runtime/backend	native / onnxruntime / onnx
Вес	1.73 GB catalog size, ~1768 MB disk/cache
Параметры	не указаны
Минимальные требования	small - ноутбук или небольшой GPU; disk >= 1768 MB; memory/VRAM около 2426 MB; CPU или доступный ONNX provider
Оптимальные требования	cuda, directml, coreml, cpu; желательно 3275 MB+ свободной VRAM/RAM и 2280 MB+ disk cache
HF link	sirasagi62/granite-embedding-107m-multilingual-ONNX
Доступные quantizations	`auto`
Краткое описание	Native ONNX Runtime embedding candidate validated for public ONNX artifacts.
Best in	`rag`, `semantic-search`, `clustering`

embeddinggemma 300m qat q8 0 unquantized

Поле	Значение
Название	`jrc2139/embeddinggemma-300m-qat-q8_0-unquantized-ONNX`
Label	embeddinggemma 300m qat q8 0 unquantized
Категория	Embeddings / векторные представления
Runtime/backend	native / onnxruntime / onnx
Вес	3.62 GB catalog size, ~3703 MB disk/cache
Параметры	не указаны
Минимальные требования	medium - рабочая станция или заметный GPU; disk >= 3703 MB; memory/VRAM около 4941 MB; CPU или доступный ONNX provider
Оптимальные требования	cuda, directml, coreml, cpu; желательно 6670 MB+ свободной VRAM/RAM и 4628 MB+ disk cache
HF link	jrc2139/embeddinggemma-300m-qat-q8_0-unquantized-ONNX
Доступные quantizations	`auto`
Краткое описание	Native ONNX Runtime embedding candidate validated for public ONNX artifacts.
Best in	`rag`, `semantic-search`, `clustering`

Qwen3 Embedding 4B ONNX INT8

Поле	Значение
Название	`majentik/Qwen3-Embedding-4B-ONNX-INT8`
Label	Qwen3 Embedding 4B ONNX INT8
Категория	Embeddings / векторные представления
Runtime/backend	native / onnxruntime / onnx
Вес	3.76 GB catalog size, ~3854 MB disk/cache
Параметры	4B
Минимальные требования	medium - рабочая станция или заметный GPU; disk >= 3854 MB; memory/VRAM около 5138 MB; CPU или доступный ONNX provider
Оптимальные требования	cuda, directml, coreml, cpu; желательно 6936 MB+ свободной VRAM/RAM и 4817 MB+ disk cache
HF link	majentik/Qwen3-Embedding-4B-ONNX-INT8
Доступные quantizations	`auto`
Краткое описание	Native ONNX Runtime embedding candidate validated for public ONNX artifacts.
Best in	`rag`, `semantic-search`, `clustering`

jina embeddings v5 text small clustering

Поле	Значение
Название	`MaunikG/jina-embeddings-v5-text-small-clustering-ONNX`
Label	jina embeddings v5 text small clustering
Категория	Embeddings / векторные представления
Runtime/backend	native / onnxruntime / onnx
Вес	4.71 GB catalog size, ~4818 MB disk/cache
Параметры	не указаны
Минимальные требования	medium - рабочая станция или заметный GPU; disk >= 4818 MB; memory/VRAM около 6391 MB; CPU или доступный ONNX provider
Оптимальные требования	cuda, directml, coreml, cpu; желательно 8627 MB+ свободной VRAM/RAM и 6022 MB+ disk cache
HF link	MaunikG/jina-embeddings-v5-text-small-clustering-ONNX
Доступные quantizations	`auto`
Краткое описание	Native ONNX Runtime embedding candidate validated for public ONNX artifacts.
Best in	`rag`, `semantic-search`, `clustering`

Qwen3 Embedding 4B ONNX ST

Поле	Значение
Название	`sigalr/Qwen3-Embedding-4B-ONNX-ST`
Label	Qwen3 Embedding 4B ONNX ST
Категория	Embeddings / векторные представления
Runtime/backend	native / onnxruntime / onnx
Вес	14.99 GB catalog size, ~15354 MB disk/cache
Параметры	4B
Минимальные требования	medium - рабочая станция или заметный GPU; disk >= 15354 MB; memory/VRAM около 20088 MB; CPU или доступный ONNX provider
Оптимальные требования	cuda, directml, coreml, cpu; желательно 27118 MB+ свободной VRAM/RAM и 19192 MB+ disk cache
HF link	sigalr/Qwen3-Embedding-4B-ONNX-ST
Доступные quantizations	`auto`
Краткое описание	Native ONNX Runtime embedding candidate validated for public ONNX artifacts.
Best in	`rag`, `semantic-search`, `clustering`

Snowflake Arctic Embed L v2

Поле	Значение
Название	`Snowflake/snowflake-arctic-embed-l-v2.0`
Label	Snowflake Arctic Embed L v2
Категория	Embeddings / векторные представления
Runtime/backend	native / onnxruntime / onnx
Вес	1.17 GB catalog size, ~1200 MB disk/cache
Параметры	не указаны
Минимальные требования	large - мощная локальная машина/GPU; disk >= 1200 MB; memory/VRAM около 2400 MB; CPU или доступный ONNX provider
Оптимальные требования	cuda, directml, coreml, cpu; желательно 3240 MB+ свободной VRAM/RAM и 1712 MB+ disk cache
HF link	Snowflake/snowflake-arctic-embed-l-v2.0
Доступные quantizations	`q8`
Краткое описание	Native ONNX Runtime pipeline candidate.
Best in	`rag`, `semantic-search`, `clustering`

Mixedbread embed large

Поле	Значение
Название	`mixedbread-ai/mxbai-embed-large-v1`
Label	Mixedbread embed large
Категория	Embeddings / векторные представления
Runtime/backend	native / onnxruntime / onnx
Вес	1.32 GB catalog size, ~1350 MB disk/cache
Параметры	не указаны
Минимальные требования	large - мощная локальная машина/GPU; disk >= 1350 MB; memory/VRAM около 2600 MB; CPU или доступный ONNX provider
Оптимальные требования	cuda, directml, coreml, cpu; желательно 3510 MB+ свободной VRAM/RAM и 1862 MB+ disk cache
HF link	mixedbread-ai/mxbai-embed-large-v1
Доступные quantizations	`q8`
Краткое описание	Native ONNX Runtime pipeline candidate.
Best in	`rag`, `semantic-search`, `clustering`

Models Native embedding

Models Native embedding

all-MiniLM-L6-v2

granite embedding 97m multilingual r2

granite embedding 107m multilingual

embeddinggemma 300m qat q8

granite embedding r2

Multilingual E5 small

all MiniLM L12 v2

all MiniLM L6 v2

bge base en v1.5

bge base en v1.5

bge large en v1.5

bge large zh v1.5

bge m3

bge small en v1.5

bge small zh v1.5

gte multilingual base

jina clip v1

jina clip v2

jina embeddings v3

jina embeddings v5 omni nano

multilingual e5 base

multilingual e5 large

mxbai embed xsmall v1

nomic embed text v1

nomic embed text v1.5

paraphrase MiniLM L6 v2

paraphrase multilingual MiniLM L12 v2

paraphrase multilingual mpnet base v2

Qwen3 Embedding 0.6B onnx int4

qwen3 embedding 0.6b onnx fp16

Qwen3 Embedding 0.6B ONNX INT8

Qwen3 Embedding 0.6B onnx uint8

Qwen3 Embedding 0.6B

Qwen3 Embedding 0.6B

granite embedding 311m multilingual r2

Qwen3 Embedding 0.6B

Qwen3 Embedding 0.6B

jina embeddings v5 small

granite embedding 107m multilingual

embeddinggemma 300m qat q8 0 unquantized

Qwen3 Embedding 4B ONNX INT8

jina embeddings v5 text small clustering

Qwen3 Embedding 4B ONNX ST

Snowflake Arctic Embed L v2

Mixedbread embed large

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!