Skip to content

Models Native audio classification

Mike edited this page May 28, 2026 · 1 revision

Models Native audio-classification

Режим: Native. Категория: Audio classification / классификация аудио.

Всего моделей: 3.

ast finetuned audioset 10 10 0.4593

Поле Значение
Название Xenova/ast-finetuned-audioset-10-10-0.4593
Label ast finetuned audioset 10 10 0.4593
Категория Audio classification / классификация аудио
Runtime/backend native / onnxruntime / onnx
Вес 0.18 GB catalog size, ~180 MB disk/cache
Параметры не указаны
Минимальные требования tiny - очень слабое железо, CPU/WASM или небольшой GPU; disk >= 180 MB; memory/VRAM около 256 MB; CPU или доступный ONNX provider
Оптимальные требования cuda, directml, coreml, cpu; желательно 768 MB+ свободной VRAM/RAM и 692 MB+ disk cache
HF link Xenova/ast-finetuned-audioset-10-10-0.4593
Доступные quantizations auto
Краткое описание known browser-ready provider
Best in audio-classification

clap htsat unfused

Поле Значение
Название Xenova/clap-htsat-unfused
Label clap htsat unfused
Категория Audio classification / классификация аудио
Runtime/backend native / onnxruntime / onnx
Вес 0.18 GB catalog size, ~180 MB disk/cache
Параметры не указаны
Минимальные требования tiny - очень слабое железо, CPU/WASM или небольшой GPU; disk >= 180 MB; memory/VRAM около 256 MB; CPU или доступный ONNX provider
Оптимальные требования cuda, directml, coreml, cpu; желательно 768 MB+ свободной VRAM/RAM и 692 MB+ disk cache
HF link Xenova/clap-htsat-unfused
Доступные quantizations auto
Краткое описание known browser-ready provider
Best in audio-classification

wav2vec2 large xlsr 53 gender recognition librispeech

Поле Значение
Название Xenova/wav2vec2-large-xlsr-53-gender-recognition-librispeech
Label wav2vec2 large xlsr 53 gender recognition librispeech
Категория Audio classification / классификация аудио
Runtime/backend native / onnxruntime / onnx
Вес 0.18 GB catalog size, ~180 MB disk/cache
Параметры не указаны
Минимальные требования tiny - очень слабое железо, CPU/WASM или небольшой GPU; disk >= 180 MB; memory/VRAM около 256 MB; CPU или доступный ONNX provider
Оптимальные требования cuda, directml, coreml, cpu; желательно 768 MB+ свободной VRAM/RAM и 692 MB+ disk cache
HF link Xenova/wav2vec2-large-xlsr-53-gender-recognition-librispeech
Доступные quantizations auto
Краткое описание known browser-ready provider
Best in audio-classification

Clone this wiki locally