salASR: Performing Legilimency using SALience on ASR models

This repository contains code for the project on extending common explainability approaches used in Deep Learning literature to the task of Automatic Speech Recognition. This project was done for the course CS 6966 Local Explanations for Deep Learning Models taught by Professor Ana Marasovic.

Contributors

Jacob Johnson
Gurunath Parasaram
Rishanth Rajendhran

Dataset

We use the librispeech_asr dataset for this project.

Data Format

{
    'chapter_id': int,
    'file': str,
    'audio': {
        'path': str,
        'array': array(float32),
        'sampling_rate': int
    },
    'id': str,
    'speaker_id': int,
    'text': str
}

Getting started

Clone the github repo:

git clone https://github.com/jacobkj314/salASR

Install conda if you don't have it already

wget https://repo.anaconda.com/miniconda/Miniconda3-py37_4.12.0-Linux-x86_64.sh
bash Miniconda3-py37_4.12.0-Linux-x86_64.sh

Once you have installed conda, use it to create and set up the conda environment

conda create -n salASR python=3.8
conda activate salASR
pip install -r requirements.txt

If you wish to finetune whisper, create and set up another conda environment

conda create -n finetuneWhisperEnv python=3.9
conda activate finetuneWhisperEnv
pip install -r requirementsFinetuneWhisper.txt

Name		Name	Last commit message	Last commit date
Latest commit History 105 Commits
audio_outputs_0_29		audio_outputs_0_29
audio_outputs_30_59		audio_outputs_30_59
dummy_op1		dummy_op1
model_scores		model_scores
mturk_files		mturk_files
notebooks		notebooks
old_outputs_dir		old_outputs_dir
output_audio		output_audio
plots		plots
transcriptions		transcriptions
visualize		visualize
.gitignore		.gitignore
EvalWhisper.py		EvalWhisper.py
Poster.pdf		Poster.pdf
README.md		README.md
eval.slurm		eval.slurm
eval_part.slurm		eval_part.slurm
eval_parts.sh		eval_parts.sh
finetune.sh		finetune.sh
finetuneWhisper.py		finetuneWhisper.py
generate_csv_for_mturk.py		generate_csv_for_mturk.py
main.py		main.py
requirements.txt		requirements.txt
requirementsFinetuneWhisper.txt		requirementsFinetuneWhisper.txt
scoreTranscriptions.py		scoreTranscriptions.py
script.sh		script.sh
sonify.py		sonify.py
sonify.slurm		sonify.slurm
todo.txt		todo.txt
train.slurm		train.slurm
utils.py		utils.py

jacobkj314/salASR

Folders and files

Latest commit

History

Repository files navigation

salASR: Performing Legilimency using SALience on ASR models

Contributors

Dataset

Data Format

Getting started

About

Resources

Stars

Watchers

Forks

Languages