# Installation

In [None]:
! pip install jiwer

! pip install SpeechRecognition



# Imports

## Google Drive

In [None]:
from google.colab import drive
drive.mount("/content/drive")

Drive already mounted at /content/drive; to attempt to forcibly remount, call drive.mount("/content/drive", force_remount=True).


## General

In [None]:
import json

import numpy as np
import pandas as pd
import speech_recognition as sr

from jiwer import wer
from random import randint

# Code

## Data

In [None]:
df = pd.read_csv('path/to/test_csv.csv')
df

## Google WER Result on Test Dataset

In [None]:
wer_list = []
print('-------------------------\n')
for i in range(len(df)):
  filename = df.iloc[i]['wav_filename']
  transcript = df.iloc[i]['transcript']
  r = sr.Recognizer()
  with sr.AudioFile(filename) as source:
    text = r.listen(source)
  try :
    predicted_transcript = r.recognize_google(text , language = "ta-IN")
    print('Audio File', str(i+1))
    print('Transcript:', transcript)
    print('Predicted Transcript: ' + predicted_transcript + '\n')
    wer_list.append(wer(transcript, predicted_transcript))
    print('-------------------------\n')
  except :
    print('Sorry.Try Again!\n')

In [None]:
print('Length:', len(wer_list))
average = sum(wer_list) / len(wer_list)
print('Average WER:', round(average, 3))

## WER of Models based on jiwer

In [None]:
def get_wer(json_data):
  wer_list = []
  print('-------------------------\n')
  for i in range(len(df)):
    ground_truth = data[i]['src']
    prediction = data[i]['res']
    print('Audio File', str(i+1))
    print('Ground Truth:', ground_truth)
    print('Model Prediction: ' + prediction + '\n')
    wer_list.append(wer(ground_truth, prediction))
    print('-------------------------\n')
  return wer_list

### Trained on Common Voice Train

#### Common Voice Train LM (LM1)

In [None]:
with open('path/to/output_json.json') as f :
  data = json.load(f)

In [None]:
wer_list = get_wer(data)

In [None]:
print('Length:', len(wer_list))
average = sum(wer_list) / len(wer_list)
print('Average WER:', round(average, 3))

#### News LM (LM2)

In [None]:
with open('path/to/output_json.json') as f :
  data = json.load(f)

In [None]:
wer_list = get_wer(data)

In [None]:
print('Length:', len(wer_list))
average = sum(wer_list) / len(wer_list)
print('Average WER:', round(average, 3))

#### Wiki LM (LM3)

In [None]:
with open('path/to/output_json.json') as f :
  data = json.load(f)

In [None]:
wer_list = get_wer(data)

In [None]:
print('Length:', len(wer_list))
average = sum(wer_list) / len(wer_list)
print('Average WER:', round(average, 3))

#### Wiki and News LM (LM4)

In [None]:
with open('path/to/output_json.json') as f :
  data = json.load(f)

In [None]:
wer_list = get_wer(data)

In [None]:
print('Length:', len(wer_list))
average = sum(wer_list) / len(wer_list)
print('Average WER:', round(average, 3))

### Trained on Common Voice Train and Open SLR


#### Common Voice Train and Open SLR LM (LM1)

In [None]:
with open('path/to/output_json.json') as f :
  data = json.load(f)

In [None]:
wer_list = get_wer(data)

In [None]:
print('Length:', len(wer_list))
average = sum(wer_list) / len(wer_list)
print('Average WER:', round(average, 3))

 #### News LM (LM2)

In [None]:
with open('path/to/output_json.json') as f :
  data = json.load(f)

In [None]:
wer_list = get_wer(data)

In [None]:
print('Length:', len(wer_list))
average = sum(wer_list) / len(wer_list)
print('Average WER:', round(average, 3))

#### Wiki LM (LM3)

In [None]:
with open('path/to/output_json.json') as f :
  data = json.load(f)

In [None]:
wer_list = get_wer(data)

In [None]:
print('Length:', len(wer_list))
average = sum(wer_list) / len(wer_list)
print('Average WER:', round(average, 3))

#### Wiki and News LM (LM4)

In [None]:
with open('path/to/output_json.json') as f :
  data = json.load(f)

In [None]:
wer_list = get_wer(data)

In [None]:
print('Length:', len(wer_list))
average = sum(wer_list) / len(wer_list)
print('Average WER:', round(average, 3))

## Examples

In [None]:
def get_index(data, filename) :
  for idx in range(len(data)) :
    if data[idx]['wav_filename'] == filename :
      return idx

In [None]:
def get_wer(filenames, flag = True) :
  count = 0
  print('---------------------------------------\n')
  if flag == True :
    print('Trained on Common Voice Train and Open SLR\n')
  else :
    print('Trained on Common Voice Train\n')
  index = randint(0, len(df) - 1)
  for lm, path in filenames.items() :
    data = json.load(open(path))
    print('LM:', lm)
    if count == 0 :
      filename = data[index]['wav_filename']
      filename_to_be_checked = filename
      count+= 1
    else :
      index = get_index(data, filename_to_be_checked)
      filename = data[index]['wav_filename']
    r = sr.Recognizer()
    with sr.AudioFile(filename) as source:
      text = r.listen(source)
    try :
      predicted_transcript = r.recognize_google(text , language = "ta-IN")
      ground_truth = data[index]['src']
      prediction = data[index]['res']
      print('Filename:', filename)
      print('Ground Truth:', ground_truth)
      print('Model Prediction: ' + prediction)
      print('Google Transcript: ' + predicted_transcript)
      print('Model Prediction WER:', wer(ground_truth, prediction))
      print('Google Prediction WER:', wer(ground_truth, predicted_transcript))
    except :
      print('Sorry.Try Again!\n')
    print('-------------------------\n')

### Trained on Common Voice Train

In [None]:
filenames = {}

filenames['Common Voice Train LM (LM1)'] = 'path/to/output_json.json' 
filenames['News LM (LM2)'] = 'path/to/output_json.json' 
filenames['Wiki LM (LM3)'] = 'path/to/output_json.json' 
filenames['Wiki and News LM (LM4)'] = 'path/to/output_json.json'

#### Example 1

In [None]:
get_wer(filenames, False)

---------------------------------------

Trained on Common Voice Train

LM: Common Voice Train LM (LM1)
Filename: /content/drive/My Drive/deepspeech/data/CommonVoiceTamil/Audio16000/common_voice_ta_20400627.wav
Ground Truth: யாராவது எடுத்துட்டு போயிட்டா என்ன பண்ணுவீங்க 
Model Prediction: யாராவது எடுத்துட்டு போயிட்டா என்ன பண்ணுவீங்க 
Google Transcript: யாராவது எடுத்துட்டு போயிட்டா என்ன பண்ணுவீங்க
Model Prediction WER: 0.0
Google Prediction WER: 0.0
-------------------------

LM: News LM (LM2)
Filename: /content/drive/My Drive/deepspeech/data/CommonVoiceTamil/Audio16000/common_voice_ta_20400627.wav
Ground Truth: யாராவது எடுத்துட்டு போயிட்டா என்ன பண்ணுவீங்க 
Model Prediction: யாராவது எடுத்துட்டு போயிட்டா என்ன பண்ணுவீங்க 
Google Transcript: யாராவது எடுத்துட்டு போயிட்டா என்ன பண்ணுவீங்க
Model Prediction WER: 0.0
Google Prediction WER: 0.0
-------------------------

LM: Wiki LM (LM3)
Filename: /content/drive/My Drive/deepspeech/data/CommonVoiceTamil/Audio16000/common_voice_ta_20400627.wav
Gro

#### Example 2

In [None]:
get_wer(filenames, False)

---------------------------------------

Trained on Common Voice Train

LM: Common Voice Train LM (LM1)
Filename: /content/drive/My Drive/deepspeech/data/CommonVoiceTamil/Audio16000/common_voice_ta_21279014.wav
Ground Truth: ஆட்ட நடைநடந்தே மண்ணை
Model Prediction: ஆட்ட நடைநடந்தே மண்ணை
Google Transcript: ஆட்ட நடைநடந்து மண்ணை
Model Prediction WER: 0.0
Google Prediction WER: 0.3333333333333333
-------------------------

LM: News LM (LM2)
Filename: /content/drive/My Drive/deepspeech/data/CommonVoiceTamil/Audio16000/common_voice_ta_21279014.wav
Ground Truth: ஆட்ட நடைநடந்தே மண்ணை
Model Prediction: ஆட்ட நடைநடந்தே மண்ணை
Google Transcript: ஆட்ட நடைநடந்து மண்ணை
Model Prediction WER: 0.0
Google Prediction WER: 0.3333333333333333
-------------------------

LM: Wiki LM (LM3)
Filename: /content/drive/My Drive/deepspeech/data/CommonVoiceTamil/Audio16000/common_voice_ta_21279014.wav
Ground Truth: ஆட்ட நடைநடந்தே மண்ணை
Model Prediction: ஆட்ட நடைநடந்தே மண்ணை
Google Transcript: ஆட்ட நடைநடந்து மண்ணை
Model P

#### Example 3

In [None]:
get_wer(filenames, False)

---------------------------------------

Trained on Common Voice Train

LM: Common Voice Train LM (LM1)
Filename: /content/drive/My Drive/deepspeech/data/CommonVoiceTamil/Audio16000/common_voice_ta_20529365.wav
Ground Truth: திருடனுக்கு அச்சம் தீர்ந்து போயிற்று 
Model Prediction: திருடனுக்கு அச்சம் தீர்ந்து போயிற்று 
Google Transcript: திருடனுக்கு அச்சம் தீர்ந்து போயிற்று
Model Prediction WER: 0.0
Google Prediction WER: 0.0
-------------------------

LM: News LM (LM2)
Filename: /content/drive/My Drive/deepspeech/data/CommonVoiceTamil/Audio16000/common_voice_ta_20529365.wav
Ground Truth: திருடனுக்கு அச்சம் தீர்ந்து போயிற்று 
Model Prediction: திருடனுக்கு அச்சம் தீர்ந்து போயிற்று 
Google Transcript: திருடனுக்கு அச்சம் தீர்ந்து போயிற்று
Model Prediction WER: 0.0
Google Prediction WER: 0.0
-------------------------

LM: Wiki LM (LM3)
Filename: /content/drive/My Drive/deepspeech/data/CommonVoiceTamil/Audio16000/common_voice_ta_20529365.wav
Ground Truth: திருடனுக்கு அச்சம் தீர்ந்து போயிற்று 

### Trained on Common Voice Train and Open SLR

In [None]:
filenames = {}

filenames['Common Voice Train and Open SLR LM (LM1)'] = 'path/to/output_json.json' 
filenames['News LM (LM2)'] = 'path/to/output_json.json' 
filenames['Wiki LM (LM3)'] = 'path/to/output_json.json' 
filenames['Wiki and News LM (LM4)'] = 'path/to/output_json.json' 

#### Example 1

In [None]:
get_wer(filenames)

---------------------------------------

Trained on Common Voice Train and Open SLR

LM: Common Voice Train and Open SLR LM (LM1)
Filename: /content/drive/My Drive/deepspeech/data/CommonVoiceTamil/Audio16000/common_voice_ta_19093663.wav
Ground Truth: முந்தஓர் பாட்டுரைத்தாள் அது
Model Prediction: முந்தஓர் பாட்டுரைத்தாள் அது 
Google Transcript: முந்தை ஓர் பாட்டு உரைத்தால் அது
Model Prediction WER: 0.0
Google Prediction WER: 1.3333333333333333
-------------------------

LM: News LM (LM2)
Filename: /content/drive/My Drive/deepspeech/data/CommonVoiceTamil/Audio16000/common_voice_ta_19093663.wav
Ground Truth: முந்தஓர் பாட்டுரைத்தாள் அது
Model Prediction: முந்தஓர் பாட்டுரைத்தாள் அது 
Google Transcript: முந்தை ஓர் பாட்டு உரைத்தால் அது
Model Prediction WER: 0.0
Google Prediction WER: 1.3333333333333333
-------------------------

LM: Wiki LM (LM3)
Filename: /content/drive/My Drive/deepspeech/data/CommonVoiceTamil/Audio16000/common_voice_ta_19093663.wav
Ground Truth: முந்தஓர் பாட்டுரைத்தாள் அது
M

#### Example 2

In [None]:
get_wer(filenames)

---------------------------------------

Trained on Common Voice Train and Open SLR

LM: Common Voice Train and Open SLR LM (LM1)
Filename: /content/drive/My Drive/deepspeech/data/CommonVoiceTamil/Audio16000/common_voice_ta_20591148.wav
Ground Truth: நமது வீட்டின் நாலாவது வீட்டுக் 
Model Prediction: நமது வீட்டின் நாலாவது வீட்டுக் 
Google Transcript: நமது வீட்டின் நாலாவது வீட்டு
Model Prediction WER: 0.0
Google Prediction WER: 0.25
-------------------------

LM: News LM (LM2)
Filename: /content/drive/My Drive/deepspeech/data/CommonVoiceTamil/Audio16000/common_voice_ta_20591148.wav
Ground Truth: நமது வீட்டின் நாலாவது வீட்டுக் 
Model Prediction: நமது வீட்டின் நாலாவது வீட்டுக் 
Google Transcript: நமது வீட்டின் நாலாவது வீட்டு
Model Prediction WER: 0.0
Google Prediction WER: 0.25
-------------------------

LM: Wiki LM (LM3)
Filename: /content/drive/My Drive/deepspeech/data/CommonVoiceTamil/Audio16000/common_voice_ta_20591148.wav
Ground Truth: நமது வீட்டின் நாலாவது வீட்டுக் 
Model Prediction:

#### Example 3

In [None]:
get_wer(filenames)

---------------------------------------

Trained on Common Voice Train and Open SLR

LM: Common Voice Train and Open SLR LM (LM1)
Filename: /content/drive/My Drive/deepspeech/data/CommonVoiceTamil/Audio16000/common_voice_ta_21281955.wav
Ground Truth: இலையிந்த நாட்டினிலே அவனை ஒப்பார் 
Model Prediction: இலைஎன்ன நாட்டினிலே அவனை ஒப்பார் 
Google Transcript: இலை இந்த நாட்டினிலே அவனை ஒப்பார்
Model Prediction WER: 0.25
Google Prediction WER: 0.5
-------------------------

LM: News LM (LM2)
Filename: /content/drive/My Drive/deepspeech/data/CommonVoiceTamil/Audio16000/common_voice_ta_21281955.wav
Ground Truth: இலையிந்த நாட்டினிலே அவனை ஒப்பார் 
Model Prediction: இலையிந்த நாட்டினிலே அவனை ஒப்பார் 
Google Transcript: இலை இந்த நாட்டினிலே அவனை ஒப்பார்
Model Prediction WER: 0.0
Google Prediction WER: 0.5
-------------------------

LM: Wiki LM (LM3)
Filename: /content/drive/My Drive/deepspeech/data/CommonVoiceTamil/Audio16000/common_voice_ta_21281955.wav
Ground Truth: இலையிந்த நாட்டினிலே அவனை ஒப்பார் 
M