Audiotag

Automatic .wav file audio tagging using VGGish. A simple POC.

Installation

Install requirements using:

pip install -r requiremnts.txt

Download VGGish model:

# Download data files into the audioset directory
cd audioset
curl -O https://storage.googleapis.com/audioset/vggish_model.ckpt
curl -O https://storage.googleapis.com/audioset/vggish_pca_params.npz

Dataset

Download dataset from this competition: https://www.kaggle.com/c/freesound-audio-tagging

Pre-compute vggish audio features

Use batch_inference.py to compute audio features from audio signals eg:

python batch_inference.py --wav_train [train files] --wav_csv [train csv file]

Train

Use train.py to train.py a model, choose a batch size and model to use

Inference

Use jupyter to run inference, open 'Sound tag.ipynb'

External code

Audioset used from here: https://github.com/tensorflow/models

Batched vggish inference used from here: https://github.com/knstmrd/vggish-batch

Name		Name	Last commit message	Last commit date
Latest commit History 19 Commits
audioset		audioset
models		models
test_files		test_files
.gitignore		.gitignore
.pep8		.pep8
README.md		README.md
Sound tag.ipynb		Sound tag.ipynb
batch_inference.py		batch_inference.py
inference.py		inference.py
requirements.txt		requirements.txt
train.py		train.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Audiotag

Installation

Dataset

Pre-compute vggish audio features

Train

Inference

External code

About

Releases

Packages

Languages

nikola-j/audio_tag

Folders and files

Latest commit

History

Repository files navigation

Audiotag

Installation

Dataset

Pre-compute vggish audio features

Train

Inference

External code

About

Topics

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages