In [45]:
import os
import subprocess
import speech_recognition as sr

In [46]:
# Function to transcribe audio file using the chosen tool
def transcribe_audio(audio_file, language):
    recognizer = sr.Recognizer()
    with sr.AudioFile(audio_file) as source:
        try:
            audio_data = recognizer.record(source)
        except sr.AudioFileError as e:
            print(f"Error reading audio file {audio_file}: {e}")
            return None
        except Exception as e:
            print(f"An error occurred while reading audio file {audio_file}: {e}")
            return None

    if language == 'hindi':
        text = recognizer.recognize_google(audio_data, language='hi-IN')
    elif language == 'english':
        text = recognizer.recognize_google(audio_data, language='en-US')
    elif language == 'hinglish':
        text = recognizer.recognize_google(audio_data, language='hi-IN,en-US')
    else:
        text = "Unsupported language"
    return text

In [47]:
# Function to convert MP3 files to WAV format using FFmpeg
def convert_mp3_to_wav(mp3_file, wav_file):
    command = f"ffmpeg -i {mp3_file} {wav_file}"
    subprocess.run(command, shell=True)


In [48]:
# Function to evaluate transcription accuracy with different algorithms
def evaluate_transcription_accuracy(audio_folder, language):
    # Iterate over all files in the folder
    for filename in os.listdir(audio_folder):
        if filename.endswith(".mp3"):
            mp3_file = os.path.join(audio_folder, filename)
            wav_file = os.path.join(audio_folder, filename.replace(".mp3", ".wav"))
            convert_mp3_to_wav(mp3_file, wav_file)
            print(f"Transcription for {filename}:")
            print("Using Google API:", transcribe_audio(wav_file, language))
            # Add other transcription algorithms for evaluation here
            print()


In [49]:
import os

# Importing 'drive' module
from google.colab import drive

# Mouting drive
path = '/content/drive'
drive.mount(path)

Drive already mounted at /content/drive; to attempt to forcibly remount, call drive.mount("/content/drive", force_remount=True).


In [50]:
# Main function
def main():
    # Specify the folder containing the audio files
    audio_folder = "/content/drive/My Drive/problem_stat3/"

    # Specify the language for transcription
    language = 'hinglish'  # Change this to 'english' or 'hindi' as needed

    # Check if the folder exists
    if not os.path.exists(audio_folder):
        print(f"The folder {audio_folder} does not exist.")
        return

    # Step 2: Evaluate the performance
    evaluate_transcription_accuracy(audio_folder, language)

if __name__ == "__main__":
    main()

Transcription for 9998961890.mp3:
Using Google API: नमस्कार मैं डिपार्टमेंट ऑफ़ एजुकेशन पब्लिक

Transcription for 9998974350.mp3:
Using Google API: नमस्कार में डिपार्टमेंट टू पुणे स्टेशन टू द होम्स इन पब्लिक ग्रीवांसेज की तरफ से विनीता बात करेंगे क्या हमारी बात नटवरलाल से हो रही है दिल्ली से बात करने नंबर 000017 की रिगार्डिंग आपका सर्टिफिकेट बनाने के लिए सर्वे कॉल की गई 28 में 2023 को कंप्लीट पीजी पोर्टल पर रिप्लाई डिपार्मेंट

Transcription for 9996051002.mp3:
Using Google API: नमस्कार में डिपार्टमेंट ऑफ़ एडमिनिस्ट्रेटिव रिफॉर्म्स इन पब्लिक प्रोविडेंट फंड हेलो एक्सीलेंट सक्सेस मई जून जुलाई अगस्त सितंबर सितंबर

Transcription for 9997203403.mp3:
Using Google API: हेलो नमस्कार मैं डिपार्टमेंट ऑफ़ एडमिनिस्ट्रेटिव रिक्वायरमेंट

