VHS · Video Harvester Service

Versión: 0.2.24

Servicio FastAPI que descarga, convierte y transcribe vídeos o audios mediante yt-dlp y perfiles rápidos de ffmpeg. Este directorio está listo para vivir como repositorio independiente y generar su propia imagen de Docker.

Requisitos

Python 3.11+
ffmpeg disponible en el sistema

Variables de entorno

Copia example.env a .env y ajusta las rutas o claves necesarias:

cp example.env .env

Las variables más relevantes son CACHE_DIR, USAGE_LOG_PATH y las opciones de TRANSCRIPTION_*/DIARIZATION_*.

Para evitar bloqueos de YouTube es posible ajustar:

YTDLP_USER_AGENT: agente de usuario enviado a YouTube.
YTDLP_BOT_PROTECTION_RETRIES: número de intentos con agentes nuevos ante un desafío de inicio de sesión (por defecto, 3).
YTDLP_BOT_PROTECTION_DELAY: segundos de espera entre intentos (por defecto, 6).
YTDLP_EXTRACTOR_ARGS: argumentos adicionales para yt-dlp en formato JSON. Por defecto se usa { "youtube": ["player_client=default"] } y se habilita el componente remoto ejs:github con Node.js para resolver desafíos JS.

Ejecución local

python -m venv .venv
source .venv/bin/activate
pip install -r requirements.txt
uvicorn vhs.main:app --reload --host 0.0.0.0 --port 8601

Construcción de la imagen

Para generar una imagen dedicada a VHS sin depender de repositorios previos:

docker build -t ghcr.io/successbyfailure/vhs:latest -f Dockerfile .
docker run --env-file .env -p 8601:8601 ghcr.io/successbyfailure/vhs:latest

El contenedor expone /api/health, /api/probe, /api/download, /api/cache, /api/transcribe/upload y /api/ffmpeg/upload.

Imagen con soporte NVIDIA (GPU)

Para acelerar ffmpeg con NVENC se incluye Dockerfile.gpu y una imagen específica:

docker build -t ghcr.io/successbyfailure/vhs-gpu:latest -f Dockerfile.gpu .
docker run --gpus all --env-file .env -p 8602:8601 ghcr.io/successbyfailure/vhs-gpu:latest

La variable FFMPEG_ENABLE_NVENC=1 se activa por defecto en esta imagen. Asegúrate de usar --gpus (o el runtime NVIDIA) y que el host tenga drivers recientes.

Ejecución con Docker Compose

El repositorio incluye un docker-compose.yml que prepara volúmenes separados para la configuración y la caché del servicio dentro del propio directorio de trabajo. Antes de levantar el stack, crea tu fichero .env (puedes partir de example.env). El servicio env_sync monta el .env local y añade automáticamente nuevas variables que aparezcan en example.env, manteniendo intactos los valores existentes.

docker compose up -d

El servicio quedará disponible en http://localhost:8601 y mantendrá los datos en los directorios locales ./config (por ejemplo, para YTDLP_COOKIES_FILE en /config) y ./data (caché y logs en /app/data). Un contenedor watchtower se encarga de actualizar solo el servicio vhs cuando aparezcan nuevas imágenes. Para GPU, usa el servicio vhs-gpu del compose (--gpus all) que expone http://localhost:8602 y habilita NVENC.

Integración continua

Un flujo de GitHub Actions construye la imagen Docker en cada pull request y la publica en GHCR (ghcr.io/<owner>/vhs) al hacer push a main. Esto garantiza que el servicio pueda desplegarse de forma independiente del repositorio original.

Ficheros clave

vhs/main.py: aplicación FastAPI principal.
templates/: vistas HTML (/ y /docs/api).
assets/: recursos estáticos utilizados por las plantillas.
versions.json: versión publicada del servicio.

Uso de la API (cuerpo JSON)

Descarga: POST /api/download con cuerpo {"url": "...", "format": "video_1080"}.
Descarga sin caché/metadatos: POST /api/no-cache con el mismo cuerpo y el mismo enrutado por formato (video_*, audio_*, ffmpeg_*, transcript_*).
Probe: POST /api/probe con {"url": "..."}.
Búsqueda: POST /api/search con {"query": "palabra", "limit": 8}.
Subidas: POST /api/ffmpeg/upload y POST /api/transcribe/upload siguen usando multipart/form-data.

El formato video_1080 descarga MP4 hasta 1080p; video_high mantiene la calidad máxima disponible.

Bot de Telegram

Hay un bot opcional (scripts/telegram_bot.py) que ofrece menú para descargar, transcribir, traducir o resumir.

Configura TELEGRAM_BOT_TOKEN (y opcionalmente TELEGRAM_AUTH_FILE).
El primer usuario que habla con el bot se convierte en admin; el resto requiere aprobación.
Ejecuta python scripts/telegram_bot.py en un entorno con las mismas variables que el servicio.
Si envías una URL o un archivo, el bot propone el menú y entrega el resultado (descarga, transcripción, traducción o resumen).

Name		Name	Last commit message	Last commit date
Latest commit History 66 Commits
.github/workflows		.github/workflows
assets		assets
scripts		scripts
templates		templates
vhs		vhs
.dockerignore		.dockerignore
.gitignore		.gitignore
AGENTS.md		AGENTS.md
API.md		API.md
DOCS.md		DOCS.md
Dockerfile		Dockerfile
Dockerfile.gpu		Dockerfile.gpu
LICENSE		LICENSE
README.md		README.md
docker-compose-gpu.yml		docker-compose-gpu.yml
docker-compose.yml		docker-compose.yml
example.env		example.env
requirements.txt		requirements.txt
versioning.py		versioning.py
versions.json		versions.json

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

VHS · Video Harvester Service

Requisitos

Variables de entorno

Ejecución local

Construcción de la imagen

Imagen con soporte NVIDIA (GPU)

Ejecución con Docker Compose

Integración continua

Ficheros clave

Uso de la API (cuerpo JSON)

Bot de Telegram

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

VHS · Video Harvester Service

Requisitos

Variables de entorno

Ejecución local

Construcción de la imagen

Imagen con soporte NVIDIA (GPU)

Ejecución con Docker Compose

Integración continua

Ficheros clave

Uso de la API (cuerpo JSON)

Bot de Telegram

About

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages