GitHub - timka/audio-transcriber: Simple idempotent audio transcriber using faster-whisper + yt-dlp + zsh-autoenv

Requirements

Usage

# Should be sourced manually or loaded via zsh-autoenv
source ./.autoenv.zsh

uv sync
source .venv/bin/activate

# Put some urls into data/urls
echo "https://rutube.ru/video/16bebfc371c4e2f4940fdc908f35993d/" > data/urls

# Run pipeline (idempotent)
cat data/urls | run-pipeline

# Or run separate steps 
cat data/urls | dl-audio
find-audio | transcribe
find-dafts | pipe-edit-drafts

# Override defaults
find-audio | MODEL_SIZE=large-v3 MODEL_LANGUAGE=ru transcribe

# Persist overrides
echo "MODEL_SIZE=large-v3" >> ./.env
echo "MODLE_LANGUAGE=ru" >> ./.env

Name		Name	Last commit message	Last commit date
Latest commit History 1 Commit
src		src
.autoenv.zsh		.autoenv.zsh
.autoenv_leave.zsh		.autoenv_leave.zsh
.gitignore		.gitignore
.python-version		.python-version
README.md		README.md
dl-audio		dl-audio
pyproject.toml		pyproject.toml
transcribe		transcribe
uv.lock		uv.lock

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Requirements

Usage

About

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

Requirements

Usage

About

Topics

Resources

Uh oh!

Stars

Watchers

Forks

Contributors

Uh oh!

Languages