GitHub - sophiadavis/recognizer: Use MFCCs to identify the language of audioclips

Language Recognizer

Sophia Davis Final Project for Carleton NLP, Fall 2013

For detailed information on methods and results, please see report.pdf

To train models:
codebook method: python train_recognizer_codebook.py language1.wav language1_name language2.wav language2_name ...
simple method:
python train_recognizer.py language1.wav language1_name language2.wav language2_name ...

To test sound recordings:
codebook method: python recognizer_codebook.py 'english_obama_clean_1.wav'
simple method: python recognizer.py 'english_obama_clean_1.wav'

The current languages.dat and languages_codebook.dat have been trained on the following:

english_obama_clean_1.wav
english_sweden_clean_2.wav
french_obama_clean_1.wav french_sweden_clean_3.wav
russian_obama_clean_2.wav
russian_sweden_clean_1.wav

The following scripts can be used to train and test many permutations of training and test sets: script_2speakers.py
script_3speakers.py (unfamiliar-speaker model)
script_4speakers.py

Sound files are clips of translations of speeches from the Sept. 24th, 2013 UN General Assembly.

Name		Name	Last commit message	Last commit date
Latest commit History 24 Commits
python_speech_features-master		python_speech_features-master
README.md		README.md
bowl.wav		bowl.wav
english_argentina_clean_1.wav		english_argentina_clean_1.wav
english_argentina_clean_2.wav		english_argentina_clean_2.wav
english_argentina_clean_3.wav		english_argentina_clean_3.wav
english_obama_clean_1.wav		english_obama_clean_1.wav
english_obama_clean_2.wav		english_obama_clean_2.wav
english_obama_clean_3.wav		english_obama_clean_3.wav
english_sweden_clean_1.wav		english_sweden_clean_1.wav
english_sweden_clean_2.wav		english_sweden_clean_2.wav
english_sweden_clean_3.wav		english_sweden_clean_3.wav
english_ukraine_clean_1.wav		english_ukraine_clean_1.wav
english_ukraine_clean_2.wav		english_ukraine_clean_2.wav
english_ukraine_clean_3.wav		english_ukraine_clean_3.wav
features.py		features.py
features.pyc		features.pyc
final project proposal, sophia davis.docx		final project proposal, sophia davis.docx
final project proposal, sophia davis.pdf		final project proposal, sophia davis.pdf
french_argentina_clean_1.wav		french_argentina_clean_1.wav
french_argentina_clean_2.wav		french_argentina_clean_2.wav
french_argentina_clean_3.wav		french_argentina_clean_3.wav
french_obama_clean_1.wav		french_obama_clean_1.wav
french_obama_clean_2.wav		french_obama_clean_2.wav
french_obama_clean_3.wav		french_obama_clean_3.wav
french_sweden_clean_1.wav		french_sweden_clean_1.wav
french_sweden_clean_2.wav		french_sweden_clean_2.wav
french_sweden_clean_3.wav		french_sweden_clean_3.wav
french_ukraine_clean_1.wav		french_ukraine_clean_1.wav
french_ukraine_clean_2.wav		french_ukraine_clean_2.wav
french_ukraine_clean_3.wav		french_ukraine_clean_3.wav
graphics.py		graphics.py
graphics.pyc		graphics.pyc
icelandic_basic.wav		icelandic_basic.wav
languages.dat		languages.dat
languages_codebook.dat		languages_codebook.dat
python_speech_features-master.zip		python_speech_features-master.zip
recognizer.py		recognizer.py
recognizer_codebook.py		recognizer_codebook.py
recognizer_cuts.txt		recognizer_cuts.txt
recognizer_util.py		recognizer_util.py
recognizer_util.pyc		recognizer_util.pyc
report.pdf		report.pdf
results.txt		results.txt
russian_argentina_clean_1.wav		russian_argentina_clean_1.wav
russian_argentina_clean_2.wav		russian_argentina_clean_2.wav
russian_argentina_clean_3.wav		russian_argentina_clean_3.wav
russian_obama_clean_1.wav		russian_obama_clean_1.wav
russian_obama_clean_2.wav		russian_obama_clean_2.wav
russian_obama_clean_3.wav		russian_obama_clean_3.wav
russian_short.wav		russian_short.wav
russian_sweden_clean_1.wav		russian_sweden_clean_1.wav
russian_sweden_clean_2.wav		russian_sweden_clean_2.wav
russian_sweden_clean_3.wav		russian_sweden_clean_3.wav
russian_ukraine_clean_1.wav		russian_ukraine_clean_1.wav
russian_ukraine_clean_2.wav		russian_ukraine_clean_2.wav
russian_ukraine_clean_3.wav		russian_ukraine_clean_3.wav
script_2speakers.py		script_2speakers.py
script_3speakers.py		script_3speakers.py
script_4speakers.py		script_4speakers.py
sigproc.py		sigproc.py
sigproc.pyc		sigproc.pyc
social_french.wav		social_french.wav
social_french_int.wav		social_french_int.wav
social_german.wav		social_german.wav
social_russian.wav		social_russian.wav
social_spanish.wav		social_spanish.wav
spectrum.py		spectrum.py
sure.wav		sure.wav
train_recognizer.py		train_recognizer.py
train_recognizer_codebook.py		train_recognizer_codebook.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

About

Releases

Packages

Languages

sophiadavis/recognizer

Folders and files

Latest commit

History

Repository files navigation

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages