Skip to content

Models Native vlm

Mike edited this page May 28, 2026 · 1 revision

Models Native vlm

Режим: Native. Категория: VLM / image-to-text.

Всего моделей: 30.

SmolVLM 256M Instruct

Поле Значение
Название HuggingFaceTB/SmolVLM-256M-Instruct
Label SmolVLM 256M Instruct
Категория VLM / image-to-text
Runtime/backend native / onnxruntime / onnx
Вес 0.24 GB catalog size, ~243 MB disk/cache
Параметры 0.256B
Минимальные требования tiny - очень слабое железо, CPU/WASM или небольшой GPU; disk >= 243 MB; memory/VRAM около 291 MB; CPU или доступный ONNX provider
Оптимальные требования cuda, directml, coreml, cpu; желательно 803 MB+ свободной VRAM/RAM и 755 MB+ disk cache
HF link HuggingFaceTB/SmolVLM-256M-Instruct
Доступные quantizations auto
Краткое описание ONNX/WebGPU artifact marker
Best in image-captioning, visual-question-answering, ocr

manga ocr 2025

Поле Значение
Название l0wgear/manga-ocr-2025-onnx
Label manga ocr 2025
Категория VLM / image-to-text
Runtime/backend native / onnxruntime / onnx
Вес 0.13 GB catalog size, ~133 MB disk/cache
Параметры не указаны
Минимальные требования tiny - очень слабое железо, CPU/WASM или небольшой GPU; disk >= 133 MB; memory/VRAM около 300 MB; CPU или доступный ONNX provider
Оптимальные требования cuda, directml, coreml, cpu; желательно 812 MB+ свободной VRAM/RAM и 645 MB+ disk cache
HF link l0wgear/manga-ocr-2025-onnx
Доступные quantizations auto
Краткое описание Native ONNX Runtime vlm candidate validated for public ONNX artifacts.
Best in image-captioning, visual-question-answering, ocr

florence 2 base ft quantized

Поле Значение
Название Heliosoph/florence-2-base-ft-quantized-onnx
Label florence 2 base ft quantized
Категория VLM / image-to-text
Runtime/backend native / onnxruntime / onnx
Вес 0.25 GB catalog size, ~261 MB disk/cache
Параметры не указаны
Минимальные требования tiny - очень слабое железо, CPU/WASM или небольшой GPU; disk >= 261 MB; memory/VRAM около 467 MB; CPU или доступный ONNX provider
Оптимальные требования cuda, directml, coreml, cpu; желательно 979 MB+ свободной VRAM/RAM и 773 MB+ disk cache
HF link Heliosoph/florence-2-base-ft-quantized-onnx
Доступные quantizations auto
Краткое описание Native ONNX Runtime vlm candidate validated for public ONNX artifacts.
Best in image-captioning, visual-question-answering, ocr

MixTex ZhEn Latex OCR

Поле Значение
Название malsuryc/MixTex-ZhEn-Latex-OCR-onnx
Label MixTex ZhEn Latex OCR
Категория VLM / image-to-text
Runtime/backend native / onnxruntime / onnx
Вес 0.40 GB catalog size, ~405 MB disk/cache
Параметры не указаны
Минимальные требования tiny - очень слабое железо, CPU/WASM или небольшой GPU; disk >= 405 MB; memory/VRAM около 654 MB; CPU или доступный ONNX provider
Оптимальные требования cuda, directml, coreml, cpu; желательно 1166 MB+ свободной VRAM/RAM и 917 MB+ disk cache
HF link malsuryc/MixTex-ZhEn-Latex-OCR-onnx
Доступные quantizations auto
Краткое описание Native ONNX Runtime vlm candidate validated for public ONNX artifacts.
Best in image-captioning, visual-question-answering, ocr

FastVLM 0.5B

Поле Значение
Название onnx-community/FastVLM-0.5B-ONNX
Label FastVLM 0.5B
Категория VLM / image-to-text
Runtime/backend native / onnxruntime / onnx
Вес 0.46 GB catalog size, ~475 MB disk/cache
Параметры 0.5B
Минимальные требования small - ноутбук или небольшой GPU; disk >= 475 MB; memory/VRAM около 570 MB; CPU или доступный ONNX provider
Оптимальные требования cuda, directml, coreml, cpu; желательно 1082 MB+ свободной VRAM/RAM и 987 MB+ disk cache
HF link onnx-community/FastVLM-0.5B-ONNX
Доступные quantizations auto
Краткое описание known browser-ready provider
Best in image-captioning, visual-question-answering, ocr

Florence 2 base

Поле Значение
Название onnx-community/Florence-2-base
Label Florence 2 base
Категория VLM / image-to-text
Runtime/backend native / onnxruntime / onnx
Вес 0.63 GB catalog size, ~650 MB disk/cache
Параметры не указаны
Минимальные требования small - ноутбук или небольшой GPU; disk >= 650 MB; memory/VRAM около 780 MB; CPU или доступный ONNX provider
Оптимальные требования cuda, directml, coreml, cpu; желательно 1292 MB+ свободной VRAM/RAM и 1162 MB+ disk cache
HF link onnx-community/Florence-2-base
Доступные quantizations auto
Краткое описание known browser-ready provider
Best in image-captioning, visual-question-answering, ocr

Florence 2 large

Поле Значение
Название onnx-community/Florence-2-large
Label Florence 2 large
Категория VLM / image-to-text
Runtime/backend native / onnxruntime / onnx
Вес 0.63 GB catalog size, ~650 MB disk/cache
Параметры не указаны
Минимальные требования small - ноутбук или небольшой GPU; disk >= 650 MB; memory/VRAM около 780 MB; CPU или доступный ONNX provider
Оптимальные требования cuda, directml, coreml, cpu; желательно 1292 MB+ свободной VRAM/RAM и 1162 MB+ disk cache
HF link onnx-community/Florence-2-large
Доступные quantizations auto
Краткое описание known browser-ready provider
Best in image-captioning, visual-question-answering, ocr

Florence 2 large ft

Поле Значение
Название onnx-community/Florence-2-large-ft
Label Florence 2 large ft
Категория VLM / image-to-text
Runtime/backend native / onnxruntime / onnx
Вес 0.63 GB catalog size, ~650 MB disk/cache
Параметры не указаны
Минимальные требования small - ноутбук или небольшой GPU; disk >= 650 MB; memory/VRAM около 780 MB; CPU или доступный ONNX provider
Оптимальные требования cuda, directml, coreml, cpu; желательно 1292 MB+ свободной VRAM/RAM и 1162 MB+ disk cache
HF link onnx-community/Florence-2-large-ft
Доступные quantizations auto
Краткое описание known browser-ready provider
Best in image-captioning, visual-question-answering, ocr

florence 2 base ft fp16

Поле Значение
Название Heliosoph/florence-2-base-ft-fp16-onnx
Label florence 2 base ft fp16
Категория VLM / image-to-text
Runtime/backend native / onnxruntime / onnx
Вес 0.51 GB catalog size, ~518 MB disk/cache
Параметры не указаны
Минимальные требования small - ноутбук или небольшой GPU; disk >= 518 MB; memory/VRAM около 801 MB; CPU или доступный ONNX provider
Оптимальные требования cuda, directml, coreml, cpu; желательно 1313 MB+ свободной VRAM/RAM и 1030 MB+ disk cache
HF link Heliosoph/florence-2-base-ft-fp16-onnx
Доступные quantizations auto
Краткое описание Native ONNX Runtime vlm candidate validated for public ONNX artifacts.
Best in image-captioning, visual-question-answering, ocr

ViT GPT-2 image captioning

Поле Значение
Название Xenova/vit-gpt2-image-captioning
Label ViT GPT-2 image captioning
Категория VLM / image-to-text
Runtime/backend native / onnxruntime / onnx
Вес 0.45 GB catalog size, ~460 MB disk/cache
Параметры не указаны
Минимальные требования small - ноутбук или небольшой GPU; disk >= 460 MB; memory/VRAM около 950 MB; CPU или доступный ONNX provider
Оптимальные требования cuda, directml, coreml, cpu; желательно 1462 MB+ свободной VRAM/RAM и 972 MB+ disk cache
HF link Xenova/vit-gpt2-image-captioning
Доступные quantizations q8
Краткое описание Native ONNX Runtime pipeline candidate.
Best in image-captioning, visual-question-answering, ocr

PP FormulaNet L

Поле Значение
Название ningpp/PP-FormulaNet-L-ONNX
Label PP FormulaNet L
Категория VLM / image-to-text
Runtime/backend native / onnxruntime / onnx
Вес 0.67 GB catalog size, ~691 MB disk/cache
Параметры не указаны
Минимальные требования small - ноутбук или небольшой GPU; disk >= 691 MB; memory/VRAM около 1026 MB; CPU или доступный ONNX provider
Оптимальные требования cuda, directml, coreml, cpu; желательно 1538 MB+ свободной VRAM/RAM и 1203 MB+ disk cache
HF link ningpp/PP-FormulaNet-L-ONNX
Доступные quantizations auto
Краткое описание Native ONNX Runtime vlm candidate validated for public ONNX artifacts.
Best in image-captioning, visual-question-answering, ocr

PP FormulaNet plus L

Поле Значение
Название ningpp/PP-FormulaNet_plus-L-ONNX
Label PP FormulaNet plus L
Категория VLM / image-to-text
Runtime/backend native / onnxruntime / onnx
Вес 0.68 GB catalog size, ~694 MB disk/cache
Параметры не указаны
Минимальные требования small - ноутбук или небольшой GPU; disk >= 694 MB; memory/VRAM около 1030 MB; CPU или доступный ONNX provider
Оптимальные требования cuda, directml, coreml, cpu; желательно 1542 MB+ свободной VRAM/RAM и 1206 MB+ disk cache
HF link ningpp/PP-FormulaNet_plus-L-ONNX
Доступные quantizations auto
Краткое описание Native ONNX Runtime vlm candidate validated for public ONNX artifacts.
Best in image-captioning, visual-question-answering, ocr

vit gpt2 image captioning

Поле Значение
Название Heliosoph/vit-gpt2-image-captioning-onnx
Label vit gpt2 image captioning
Категория VLM / image-to-text
Runtime/backend native / onnxruntime / onnx
Вес 0.89 GB catalog size, ~912 MB disk/cache
Параметры не указаны
Минимальные требования small - ноутбук или небольшой GPU; disk >= 912 MB; memory/VRAM около 1313 MB; CPU или доступный ONNX provider
Оптимальные требования cuda, directml, coreml, cpu; желательно 1825 MB+ свободной VRAM/RAM и 1424 MB+ disk cache
HF link Heliosoph/vit-gpt2-image-captioning-onnx
Доступные quantizations auto
Краткое описание Native ONNX Runtime vlm candidate validated for public ONNX artifacts.
Best in image-captioning, visual-question-answering, ocr

blip image captioning base

Поле Значение
Название ningpp/blip-image-captioning-base-ONNX
Label blip image captioning base
Категория VLM / image-to-text
Runtime/backend native / onnxruntime / onnx
Вес 0.92 GB catalog size, ~944 MB disk/cache
Параметры не указаны
Минимальные требования small - ноутбук или небольшой GPU; disk >= 944 MB; memory/VRAM около 1355 MB; CPU или доступный ONNX provider
Оптимальные требования cuda, directml, coreml, cpu; желательно 1867 MB+ свободной VRAM/RAM и 1456 MB+ disk cache
HF link ningpp/blip-image-captioning-base-ONNX
Доступные quantizations auto
Краткое описание Native ONNX Runtime vlm candidate validated for public ONNX artifacts.
Best in image-captioning, visual-question-answering, ocr

PaddleOCR VL 1.5

Поле Значение
Название lbm364dl/PaddleOCR-VL-1.5-ONNX
Label PaddleOCR VL 1.5
Категория VLM / image-to-text
Runtime/backend native / onnxruntime / onnx
Вес 0.98 GB catalog size, ~1001 MB disk/cache
Параметры не указаны
Минимальные требования small - ноутбук или небольшой GPU; disk >= 1001 MB; memory/VRAM около 1429 MB; CPU или доступный ONNX provider
Оптимальные требования cuda, directml, coreml, cpu; желательно 1941 MB+ свободной VRAM/RAM и 1513 MB+ disk cache
HF link lbm364dl/PaddleOCR-VL-1.5-ONNX
Доступные quantizations auto
Краткое описание Native ONNX Runtime vlm candidate validated for public ONNX artifacts.
Best in image-captioning, visual-question-answering, ocr

manga ocr base

Поле Значение
Название onnx-community/manga-ocr-base-ONNX
Label manga ocr base
Категория VLM / image-to-text
Runtime/backend native / onnxruntime / onnx
Вес 1.02 GB catalog size, ~1040 MB disk/cache
Параметры не указаны
Минимальные требования small - ноутбук или небольшой GPU; disk >= 1040 MB; memory/VRAM около 1480 MB; CPU или доступный ONNX provider
Оптимальные требования cuda, directml, coreml, cpu; желательно 1998 MB+ свободной VRAM/RAM и 1552 MB+ disk cache
HF link onnx-community/manga-ocr-base-ONNX
Доступные quantizations auto
Краткое описание Native ONNX Runtime vlm candidate validated for public ONNX artifacts.
Best in image-captioning, visual-question-answering, ocr

mgp str base

Поле Значение
Название onnx-community/mgp-str-base
Label mgp str base
Категория VLM / image-to-text
Runtime/backend native / onnxruntime / onnx
Вес 1.36 GB catalog size, ~1388 MB disk/cache
Параметры не указаны
Минимальные требования small - ноутбук или небольшой GPU; disk >= 1388 MB; memory/VRAM около 1932 MB; CPU или доступный ONNX provider
Оптимальные требования cuda, directml, coreml, cpu; желательно 2608 MB+ свободной VRAM/RAM и 1900 MB+ disk cache
HF link onnx-community/mgp-str-base
Доступные quantizations auto
Краткое описание Native ONNX Runtime vlm candidate validated for public ONNX artifacts.
Best in image-captioning, visual-question-answering, ocr

blip image captioning large

Поле Значение
Название ningpp/blip-image-captioning-large-ONNX
Label blip image captioning large
Категория VLM / image-to-text
Runtime/backend native / onnxruntime / onnx
Вес 1.75 GB catalog size, ~1792 MB disk/cache
Параметры не указаны
Минимальные требования small - ноутбук или небольшой GPU; disk >= 1792 MB; memory/VRAM около 2457 MB; CPU или доступный ONNX provider
Оптимальные требования cuda, directml, coreml, cpu; желательно 3316 MB+ свободной VRAM/RAM и 2304 MB+ disk cache
HF link ningpp/blip-image-captioning-large-ONNX
Доступные quantizations auto
Краткое описание Native ONNX Runtime vlm candidate validated for public ONNX artifacts.
Best in image-captioning, visual-question-answering, ocr

Florence 2 base finetuned

Поле Значение
Название onnx-community/Florence-2-base-ft
Label Florence 2 base finetuned
Категория VLM / image-to-text
Runtime/backend native / onnxruntime / onnx
Вес 0.76 GB catalog size, ~780 MB disk/cache
Параметры не указаны
Минимальные требования medium - рабочая станция или заметный GPU; disk >= 780 MB; memory/VRAM около 1500 MB; CPU или доступный ONNX provider
Оптимальные требования cuda, directml, coreml, cpu; желательно 2025 MB+ свободной VRAM/RAM и 1292 MB+ disk cache
HF link onnx-community/Florence-2-base-ft
Доступные quantizations q8
Краткое описание Native ONNX Runtime pipeline candidate.
Best in image-captioning, visual-question-answering, ocr

Qwen2 VL 2B Instruct

Поле Значение
Название onnx-community/Qwen2-VL-2B-Instruct
Label Qwen2 VL 2B Instruct
Категория VLM / image-to-text
Runtime/backend native / onnxruntime / onnx
Вес 1.86 GB catalog size, ~1900 MB disk/cache
Параметры 2B
Минимальные требования medium - рабочая станция или заметный GPU; disk >= 1900 MB; memory/VRAM около 2280 MB; CPU или доступный ONNX provider
Оптимальные требования cuda, directml, coreml, cpu; желательно 3078 MB+ свободной VRAM/RAM и 2412 MB+ disk cache
HF link onnx-community/Qwen2-VL-2B-Instruct
Доступные quantizations auto
Краткое описание known browser-ready provider
Best in image-captioning, visual-question-answering, ocr

moondream2 q4

Поле Значение
Название Nagafi/moondream2-q4-onnx
Label moondream2 q4
Категория VLM / image-to-text
Runtime/backend native / onnxruntime / onnx
Вес 2.11 GB catalog size, ~2159 MB disk/cache
Параметры не указаны
Минимальные требования medium - рабочая станция или заметный GPU; disk >= 2159 MB; memory/VRAM около 2934 MB; CPU или доступный ONNX provider
Оптимальные требования cuda, directml, coreml, cpu; желательно 3960 MB+ свободной VRAM/RAM и 2698 MB+ disk cache
HF link Nagafi/moondream2-q4-onnx
Доступные quantizations auto
Краткое описание Native ONNX Runtime vlm candidate validated for public ONNX artifacts.
Best in image-captioning, visual-question-answering, ocr

TexTeller

Поле Значение
Название onnx-community/TexTeller-ONNX
Label TexTeller
Категория VLM / image-to-text
Runtime/backend native / onnxruntime / onnx
Вес 2.99 GB catalog size, ~3057 MB disk/cache
Параметры не указаны
Минимальные требования medium - рабочая станция или заметный GPU; disk >= 3057 MB; memory/VRAM около 4102 MB; CPU или доступный ONNX provider
Оптимальные требования cuda, directml, coreml, cpu; желательно 5537 MB+ свободной VRAM/RAM и 3821 MB+ disk cache
HF link onnx-community/TexTeller-ONNX
Доступные quantizations auto
Краткое описание Native ONNX Runtime vlm candidate validated for public ONNX artifacts.
Best in image-captioning, visual-question-answering, ocr

tiny ZhEn for

Поле Значение
Название MixTex/tiny-ZhEn-for-onnx
Label tiny ZhEn for
Категория VLM / image-to-text
Runtime/backend native / onnxruntime / onnx
Вес 3.20 GB catalog size, ~3278 MB disk/cache
Параметры не указаны
Минимальные требования medium - рабочая станция или заметный GPU; disk >= 3278 MB; memory/VRAM около 4389 MB; CPU или доступный ONNX provider
Оптимальные требования cuda, directml, coreml, cpu; желательно 5925 MB+ свободной VRAM/RAM и 4097 MB+ disk cache
HF link MixTex/tiny-ZhEn-for-onnx
Доступные quantizations auto
Краткое описание Native ONNX Runtime vlm candidate validated for public ONNX artifacts.
Best in image-captioning, visual-question-answering, ocr

texify

Поле Значение
Название onnx-community/texify-ONNX
Label texify
Категория VLM / image-to-text
Runtime/backend native / onnxruntime / onnx
Вес 3.26 GB catalog size, ~3340 MB disk/cache
Параметры не указаны
Минимальные требования medium - рабочая станция или заметный GPU; disk >= 3340 MB; memory/VRAM около 4470 MB; CPU или доступный ONNX provider
Оптимальные требования cuda, directml, coreml, cpu; желательно 6034 MB+ свободной VRAM/RAM и 4175 MB+ disk cache
HF link onnx-community/texify-ONNX
Доступные quantizations auto
Краткое описание Native ONNX Runtime vlm candidate validated for public ONNX artifacts.
Best in image-captioning, visual-question-answering, ocr

cyrillic large handwritten

Поле Значение
Название Kansallisarkisto/cyrillic-large-handwritten-onnx
Label cyrillic large handwritten
Категория VLM / image-to-text
Runtime/backend native / onnxruntime / onnx
Вес 3.41 GB catalog size, ~3491 MB disk/cache
Параметры не указаны
Минимальные требования medium - рабочая станция или заметный GPU; disk >= 3491 MB; memory/VRAM около 4666 MB; CPU или доступный ONNX provider
Оптимальные требования cuda, directml, coreml, cpu; желательно 6299 MB+ свободной VRAM/RAM и 4363 MB+ disk cache
HF link Kansallisarkisto/cyrillic-large-handwritten-onnx
Доступные quantizations auto
Краткое описание Native ONNX Runtime vlm candidate validated for public ONNX artifacts.
Best in image-captioning, visual-question-answering, ocr

nougat latex base

Поле Значение
Название onnx-community/nougat-latex-base-ONNX
Label nougat latex base
Категория VLM / image-to-text
Runtime/backend native / onnxruntime / onnx
Вес 3.62 GB catalog size, ~3711 MB disk/cache
Параметры не указаны
Минимальные требования medium - рабочая станция или заметный GPU; disk >= 3711 MB; memory/VRAM около 4952 MB; CPU или доступный ONNX provider
Оптимальные требования cuda, directml, coreml, cpu; желательно 6685 MB+ свободной VRAM/RAM и 4638 MB+ disk cache
HF link onnx-community/nougat-latex-base-ONNX
Доступные quantizations auto
Краткое описание Native ONNX Runtime vlm candidate validated for public ONNX artifacts.
Best in image-captioning, visual-question-answering, ocr

TexTeller3

Поле Значение
Название onnx-community/TexTeller3-ONNX
Label TexTeller3
Категория VLM / image-to-text
Runtime/backend native / onnxruntime / onnx
Вес 7.21 GB catalog size, ~7379 MB disk/cache
Параметры не указаны
Минимальные требования large - мощная локальная машина/GPU; disk >= 7379 MB; memory/VRAM около 9720 MB; CPU или доступный ONNX provider
Оптимальные требования cuda, directml, coreml, cpu; желательно 13122 MB+ свободной VRAM/RAM и 9223 MB+ disk cache
HF link onnx-community/TexTeller3-ONNX
Доступные quantizations auto
Краткое описание Native ONNX Runtime vlm candidate validated for public ONNX artifacts.
Best in image-captioning, visual-question-answering, ocr

moondream2

Поле Значение
Название Heliosoph/moondream2-onnx
Label moondream2
Категория VLM / image-to-text
Runtime/backend native / onnxruntime / onnx
Вес 16.89 GB catalog size, ~17298 MB disk/cache
Параметры не указаны
Минимальные требования large - мощная локальная машина/GPU; disk >= 17298 MB; memory/VRAM около 22615 MB; CPU или доступный ONNX provider
Оптимальные требования cuda, directml, coreml, cpu; желательно 30530 MB+ свободной VRAM/RAM и 21622 MB+ disk cache
HF link Heliosoph/moondream2-onnx
Доступные quantizations auto
Краткое описание Native ONNX Runtime vlm candidate validated for public ONNX artifacts.
Best in image-captioning, visual-question-answering, ocr

glm ocr

Поле Значение
Название Ji-Ha/glm-ocr-onnx
Label glm ocr
Категория VLM / image-to-text
Runtime/backend native / onnxruntime / onnx
Вес 17.33 GB catalog size, ~17747 MB disk/cache
Параметры не указаны
Минимальные требования large - мощная локальная машина/GPU; disk >= 17747 MB; memory/VRAM около 23199 MB; CPU или доступный ONNX provider
Оптимальные требования cuda, directml, coreml, cpu; желательно 31318 MB+ свободной VRAM/RAM и 22183 MB+ disk cache
HF link Ji-Ha/glm-ocr-onnx
Доступные quantizations auto
Краткое описание Native ONNX Runtime vlm candidate validated for public ONNX artifacts.
Best in image-captioning, visual-question-answering, ocr

glm ocr

Поле Значение
Название psyche/glm-ocr-onnx
Label glm ocr
Категория VLM / image-to-text
Runtime/backend native / onnxruntime / onnx
Вес 17.33 GB catalog size, ~17747 MB disk/cache
Параметры не указаны
Минимальные требования large - мощная локальная машина/GPU; disk >= 17747 MB; memory/VRAM около 23199 MB; CPU или доступный ONNX provider
Оптимальные требования cuda, directml, coreml, cpu; желательно 31318 MB+ свободной VRAM/RAM и 22183 MB+ disk cache
HF link psyche/glm-ocr-onnx
Доступные quantizations auto
Краткое описание Native ONNX Runtime vlm candidate validated for public ONNX artifacts.
Best in image-captioning, visual-question-answering, ocr

Clone this wiki locally