Skip to content

Slavik993/Homework_IAV

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

4 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Поиск по видео (аннотирование)

Программа ищет в видео моменты по фотографии или текстовому запросу (например «человек») и выдаёт результат в виде плеера с гиперссылками на моменты — по клику плеер переходит к нужному времени.

Возможности

  • Загрузка видео (MP4, AVI, MOV, MKV, WebM)
  • Режим «семантика» (CLIP): фото и/или текст — общий визуально-текстовый поиск
  • Режим «лицо» (латент): эталон лица кодируется в латентное пространство (ArcFace / InsightFace); по видео ищутся кадры, близкие к эталону; попадания группируются во временные интервалы; длина каждого фрагмента не больше 1 с (настраивается параметром max_fragment_sec)
  • Результат: плеер + кликабельные таймкоды / интервалы

Установка

cd "c:\Users\Machcreator\Desktop\Дз ИАВ\Homework_IAV"
python -m venv venv
venv\Scripts\activate
pip install -r requirements.txt

При первом запуске скачаются модели: CLIP (~600 MB), для режима «лицо» — пакет InsightFace buffalo_l.

Запуск

python app.py

Откройте в браузере: http://localhost:5000

Как пользоваться

  1. Нажмите «Видео» и выберите файл — он загрузится на сервер.
  2. Выберите режим: семантика (CLIP) или лицо (латент).
  3. В режиме CLIP: фото и/или текст. В режиме «лицо»: только эталонное фото лица (чёткий портрет).
  4. Нажмите «Найти моменты». Первый запуск дольше (загрузка моделей).
  5. Клик по таймкоду или интервалу перематывает плеер к началу фрагмента.

Технологии

  • Backend: Flask, OpenCV (кадры), Transformers + CLIP; InsightFace (латентные эмбеддинги лиц, группировка интервалов)
  • Frontend: HTML/CSS/JS, нативный <video> с перемоткой по клику

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors