How-to-measure-bias-in-automatic-speech-recognition-systems

Overview

This repository contains the implementation and results of an extensive analysis of bias metrics in Automatic Speech Recognition (ASR) systems for the Research Project 2024 at the TU Delft. The project aims to explore various bias metrics that do not rely on a reference group, providing insights into the fairness and performance disparities across different demographic groups.

Repository Structure

average.py: Script to calculate G2Average metric.
sum_of_groups.py: Script to calculate Sum of Group Error Differences metric
bias_metric.py: Script to caluclate my bias metric.
config.json: Configuration file with parameters for the scripts.
diff_baseline.py, rel_baseline.py: Scripts for setting baseline measures for different bias metrics.
wer_calculate.py: Script to calculate Word Error Rates (WER).
CSV Files: Contain raw data and results from the metrics calculations.
PNG Files: Visualization plots generated from the analysis.
asr_output: Error rates per demographic group

Results

average_metric_results.csv: Results from average metrics calculations.
bias_metric_results.csv: Detailed results from bias metrics.
relative_data.csv, diff_data.csv: Processed data files for relative and differential metrics.

Running the Scripts

Run the metric calculation scripts to generate new data:
```
python wer_calculate.py
python bias_metric.py
```
See the results in corresponding CSV files and plots in corresponding PNG files

Contact

For any queries regarding this project, please contact [t.lezovicova@student.tudelft.nl].

Name		Name	Last commit message	Last commit date
Latest commit History 4 Commits
README.md		README.md
average.py		average.py
average_metric_results.csv		average_metric_results.csv
average_metrics_plot.png		average_metrics_plot.png
bias_metric.py		bias_metric.py
bias_metric_results.csv		bias_metric_results.csv
bias_metric_sum_metrics_plot.png		bias_metric_sum_metrics_plot.png
bias_metrics_plot.png		bias_metrics_plot.png
config.json		config.json
diff_baseline.py		diff_baseline.py
diff_data.csv		diff_data.csv
diff_metrics_plot.png		diff_metrics_plot.png
rel_baseline.py		rel_baseline.py
relative_data.csv		relative_data.csv
relative_metrics_plot.png		relative_metrics_plot.png
sum_of_group_metric_results.csv		sum_of_group_metric_results.csv
sum_of_group_metrics_plot.png		sum_of_group_metrics_plot.png
sum_of_group_sum_metric_results.csv		sum_of_group_sum_metric_results.csv
sum_of_group_sum_metrics_plot.png		sum_of_group_sum_metrics_plot.png
sum_of_groups.py		sum_of_groups.py
sum_of_groups_error_sum.py		sum_of_groups_error_sum.py
wer_calculate.py		wer_calculate.py
wer_results.csv		wer_results.csv

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

How-to-measure-bias-in-automatic-speech-recognition-systems

Overview

Repository Structure

Results

Running the Scripts

Contact

About

Releases

Packages

Languages

tlezovicova/How-to-measure-bias-in-automatic-speech-recognition-systems

Folders and files

Latest commit

History

Repository files navigation

How-to-measure-bias-in-automatic-speech-recognition-systems

Overview

Repository Structure

Results

Running the Scripts

Contact

About

Topics

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages