In [4]:
import os
import random
import shutil
from transformers import Wav2Vec2ForCTC, Wav2Vec2CTCTokenizer
from datasets import load_dataset
import speech_recognition as sr
import time
import pandas as pd  # Import pandas

audio_files_path = r"E:\AudioPalm_MODEL\formatted_voices"
output_excel_path = "transcriptions.xlsx"  # Path to the output Excel file

# Get the list of audio files
audio_files = os.listdir(audio_files_path)

print(f"Total number of audio files: {len(audio_files)}")

# Initialize a list to store transcriptions
transcriptions = []

# Transcribe audio to text for the audio files in groups of 14
group_size = 14
for i in range(0, len(audio_files), group_size):
    group = audio_files[i:i + group_size]
    print(f"\nProcessing Group {i // group_size + 1}: {group}")
    
    tokenizer = Wav2Vec2CTCTokenizer.from_pretrained("facebook/wav2vec2-base-960h")
    asr_model = Wav2Vec2ForCTC.from_pretrained("facebook/wav2vec2-base-960h")
    recognizer = sr.Recognizer()

    for j, file in enumerate(group, start=1):
        audio_path = os.path.join(audio_files_path, file)
        print(f"Transcribing audio {j}/{len(group)}: {file}")

        # Load the audio file
        with sr.AudioFile(audio_path) as source:
            audio = recognizer.record(source)
        try:
            transcription = recognizer.recognize_google(audio, language="hi-IN")  # Hindi language code
            print(f"Transcription {j}: {transcription}")
            transcriptions.append((file, transcription))  # Append to transcriptions list
        except sr.UnknownValueError:
            print(f"Speech Recognition could not understand the audio in {file}")
        except sr.RequestError as e:
            print(f"Could not request results from Google Speech Recognition service; {e}")

        # Wait for 10 seconds before processing the next audio
        time.sleep(10)

# Convert the transcriptions list to a pandas DataFrame
transcriptions_df = pd.DataFrame(transcriptions, columns=["Audio File", "Transcription"])

# Save the DataFrame to an Excel file
transcriptions_df.to_excel(output_excel_path, index=False)

print("Transcriptions saved to Excel.")


Total number of audio files: 420

Processing Group 1: ['common_voice_hi_23795238.wav', 'common_voice_hi_23795239.wav', 'common_voice_hi_23795240.wav', 'common_voice_hi_23795241.wav', 'common_voice_hi_23795242.wav', 'common_voice_hi_23795243.wav', 'common_voice_hi_23795244.wav', 'common_voice_hi_23795245.wav', 'common_voice_hi_23795246.wav', 'common_voice_hi_23795247.wav', 'common_voice_hi_23795248.wav', 'common_voice_hi_23795249.wav', 'common_voice_hi_23795250.wav', 'common_voice_hi_23795251.wav']


Some weights of Wav2Vec2ForCTC were not initialized from the model checkpoint at facebook/wav2vec2-base-960h and are newly initialized: ['wav2vec2.masked_spec_embed']
You should probably TRAIN this model on a down-stream task to be able to use it for predictions and inference.


Transcribing audio 1/14: common_voice_hi_23795238.wav
Transcription 1: तुम्हारे पास 3 महीने बच्चे हैं
Transcribing audio 2/14: common_voice_hi_23795239.wav
Transcription 2: मैं करती हूं
Transcribing audio 3/14: common_voice_hi_23795240.wav
Transcription 3: जब मैं छोटा था मैं हमेशा जल्दी सो कर उठता था
Transcribing audio 4/14: common_voice_hi_23795241.wav
Transcription 4: भाई और को एक गुप्त रास्ता है
Transcribing audio 5/14: common_voice_hi_23795242.wav
Transcription 5: मुझे इस लड़की से नफरत है
Transcribing audio 6/14: common_voice_hi_23795243.wav
Transcription 6: यह सही सबसे अच्छी है
Transcribing audio 7/14: common_voice_hi_23795244.wav
Transcription 7: डब्बा इतना भारी था कि मैं उसे हिला नहीं सका
Transcribing audio 8/14: common_voice_hi_23795245.wav
Transcription 8: वे कुछ करते क्यों नहीं
Transcribing audio 9/14: common_voice_hi_23795246.wav
Transcription 9: मैं पूरी रात राई
Transcribing audio 10/14: common_voice_hi_23795247.wav
Transcription 10: तुम गलत मंजिल पर हो
Transcribing audio 1

Some weights of Wav2Vec2ForCTC were not initialized from the model checkpoint at facebook/wav2vec2-base-960h and are newly initialized: ['wav2vec2.masked_spec_embed']
You should probably TRAIN this model on a down-stream task to be able to use it for predictions and inference.


Transcribing audio 1/14: common_voice_hi_23795252.wav
Transcription 1: उसने मेरे खिलाफ हथियार उठाया हूं
Transcribing audio 2/14: common_voice_hi_23795358.wav
Transcription 2: कांस्टेबल 1 मनोज बाजपेई दिखा रहे हैं तांडव
Transcribing audio 3/14: common_voice_hi_23795359.wav
Transcription 3: चाय वाय कुछ पी लेंगे आप
Transcribing audio 4/14: common_voice_hi_23795360.wav
Transcription 4: चाय पी रहा है
Transcribing audio 5/14: common_voice_hi_23795361.wav
Transcription 5: अब मच्छरों को मारेंगे मच्छर
Transcribing audio 6/14: common_voice_hi_23795362.wav
Transcription 6: मुझे मुझे 3 साल बाद है
Transcribing audio 7/14: common_voice_hi_23796043.wav
Transcription 7: एक पागल इंसान को अपने किए धरे के लिए जिम्मेदार नहीं ठहराया जा सकता
Transcribing audio 8/14: common_voice_hi_23796044.wav
Transcription 8: कौन ज्यादा तेज भागता है केन या टोनी
Transcribing audio 9/14: common_voice_hi_23796046.wav
Transcription 9: हमने उसे उम्मीदवार को अपना मत दिया
Transcribing audio 10/14: common_voice_hi_23796048.wav
Tra

Some weights of Wav2Vec2ForCTC were not initialized from the model checkpoint at facebook/wav2vec2-base-960h and are newly initialized: ['wav2vec2.masked_spec_embed']
You should probably TRAIN this model on a down-stream task to be able to use it for predictions and inference.


Transcribing audio 1/14: common_voice_hi_23796066.wav
Transcription 1: लोगों ने पुलिस टीम पर किया हमला वर्दी फाड़कर जी पर शीशे तोड़े
Transcribing audio 2/14: common_voice_hi_23796067.wav
Transcription 2: हमारे पास तो बस चाय है
Transcribing audio 3/14: common_voice_hi_23796151.wav
Transcription 3: तकनीकी क्रांति में कारोबार जगत में चुनौतियां साथ में नए अवसर भी अरुण पुरी
Transcribing audio 4/14: common_voice_hi_23796153.wav
Transcription 4: अपना खाना खाया
Transcribing audio 5/14: common_voice_hi_23796155.wav
Transcription 5: उसे अपना स्कूल बहुत पसंद है
Transcribing audio 6/14: common_voice_hi_23796156.wav
Transcription 6: पिछले कुछ सालों से मौसम बहुत अजीब है
Transcribing audio 7/14: common_voice_hi_23796157.wav
Transcription 7: बनाती जी के लिए बेचैन है
Transcribing audio 8/14: common_voice_hi_23801317.wav
Speech Recognition could not understand the audio in common_voice_hi_23801317.wav
Transcribing audio 9/14: common_voice_hi_23809699.wav
Transcription 9: लुई तुम्हारे दोस्त आ रहे हैं
Tra

Some weights of Wav2Vec2ForCTC were not initialized from the model checkpoint at facebook/wav2vec2-base-960h and are newly initialized: ['wav2vec2.masked_spec_embed']
You should probably TRAIN this model on a down-stream task to be able to use it for predictions and inference.


Transcribing audio 1/14: common_voice_hi_23809710.wav
Transcription 1: बच्चे बगीचे में खेल रहे हैं
Transcribing audio 2/14: common_voice_hi_23809711.wav
Transcription 2: इस 3 पर बहुत कम लोग रहते हैं
Transcribing audio 3/14: common_voice_hi_23809712.wav
Transcription 3: सज्जन सिंह रंगरूट का ट्रेलर रिलीज फौजी के रोल में दिखेंगे दिलजीत दोसांझ
Transcribing audio 4/14: common_voice_hi_23809713.wav
Transcription 4: तुम्हें थोड़ा ज्यादा समझदार होना चाहिए
Transcribing audio 5/14: common_voice_hi_23809719.wav
Transcription 5: तुम यहां सारे के सारे पेड़ काट डालोगे क्या
Transcribing audio 6/14: common_voice_hi_23809720.wav
Transcription 6: वह मुझ पर गुस्सा हो गया
Transcribing audio 7/14: common_voice_hi_23809721.wav
Transcription 7: उत्तर प्रदेश में चल रहे 9 फर्जी विश्वविद्यालय की जांच एसआईटी को
Transcribing audio 8/14: common_voice_hi_23809722.wav
Transcription 8: काला रंग तुम पर जचता है
Transcribing audio 9/14: common_voice_hi_23809723.wav
Transcription 9: वह शादीशुदा नहीं है
Transcribing audio

Some weights of Wav2Vec2ForCTC were not initialized from the model checkpoint at facebook/wav2vec2-base-960h and are newly initialized: ['wav2vec2.masked_spec_embed']
You should probably TRAIN this model on a down-stream task to be able to use it for predictions and inference.


Transcribing audio 1/14: common_voice_hi_23809929.wav
Transcription 1: मोमबत्ती अपने आप ही बुज्जी
Transcribing audio 2/14: common_voice_hi_23809930.wav
Transcription 2: स्वर्ण पर टिकी साइना नेहवाल की नजरे
Transcribing audio 3/14: common_voice_hi_23809931.wav
Transcription 3: तुम गाड़ी चला सकते हो क्या
Transcribing audio 4/14: common_voice_hi_23809932.wav
Transcription 4: राम इटली में है
Transcribing audio 5/14: common_voice_hi_23809936.wav
Transcription 5: क्लासरूम में घुसते समय अपनी टोपी उतार उतार करो
Transcribing audio 6/14: common_voice_hi_23824449.wav
Transcription 6: तुम अंधेरे में क्यों बैठी हो
Transcribing audio 7/14: common_voice_hi_23824450.wav
Transcription 7: वह मुझे 2 साल छोटी है
Transcribing audio 8/14: common_voice_hi_23824451.wav
Transcription 8: मेरी नजर इन दोनों कमजोर हो रही है
Transcribing audio 9/14: common_voice_hi_23824452.wav
Transcription 9: वह 3 घंटे में वापस आएगा
Transcribing audio 10/14: common_voice_hi_23824453.wav
Transcription 10: वह 5:00 बजे चाय पीती हैं
T

Some weights of Wav2Vec2ForCTC were not initialized from the model checkpoint at facebook/wav2vec2-base-960h and are newly initialized: ['wav2vec2.masked_spec_embed']
You should probably TRAIN this model on a down-stream task to be able to use it for predictions and inference.


Transcribing audio 1/14: common_voice_hi_23824460.wav
Transcription 1: यह आपका फैसला नहीं है
Transcribing audio 2/14: common_voice_hi_23824468.wav
Transcription 2: मैं सीरियस हूं
Transcribing audio 3/14: common_voice_hi_23824470.wav
Transcription 3: हम अंदर आ रहे हैं
Transcribing audio 4/14: common_voice_hi_23824471.wav
Transcription 4: आप किसके साथ खा रही हैं
Transcribing audio 5/14: common_voice_hi_23824472.wav
Transcription 5: वह टाइम मेरे सूट के साथ जमती नहीं है
Transcribing audio 6/14: common_voice_hi_23824473.wav
Transcription 6: वह बहुत पैसे वाली औरत है
Transcribing audio 7/14: common_voice_hi_23827473.wav
Transcription 7: यह कुर्सी आपकी है
Transcribing audio 8/14: common_voice_hi_23827474.wav
Transcription 8: मैं अभी छोड़ने वाली नहीं हूं
Transcribing audio 9/14: common_voice_hi_23827475.wav
Transcription 9: एक्टिनियम का खोज ऑन रेलवे द्वार ने साल 1899 में किया था
Transcribing audio 10/14: common_voice_hi_23827476.wav
Transcription 10: चाय वाय कुछ लगी
Transcribing audio 11/14: co

Some weights of Wav2Vec2ForCTC were not initialized from the model checkpoint at facebook/wav2vec2-base-960h and are newly initialized: ['wav2vec2.masked_spec_embed']
You should probably TRAIN this model on a down-stream task to be able to use it for predictions and inference.


Transcribing audio 1/14: common_voice_hi_23827788.wav
Transcription 1: अनवर जहां को तीन तलाक पर सुप्रीम कोर्ट के फैसले से मिली दोहरी खुशी
Transcribing audio 2/14: common_voice_hi_23827789.wav
Transcription 2: गुलदान को किसने तोड़ दिया
Transcribing audio 3/14: common_voice_hi_23827790.wav
Transcription 3: आईआईटी बॉम्बे के स्टूडेंट्स ने बनाई सबसे तेज फार्मूला रेसिंग कर
Transcribing audio 4/14: common_voice_hi_23827791.wav
Transcription 4: उसने अपने दुख को अपनी मुस्कुराहट के पीछे छिपा लिया
Transcribing audio 5/14: common_voice_hi_23827792.wav
Transcription 5: टॉम भाग
Transcribing audio 6/14: common_voice_hi_23827793.wav
Transcription 6: तुम कुछ ज्यादा ही शक्कर डालते हो
Transcribing audio 7/14: common_voice_hi_23827794.wav
Transcription 7: तुम्हें जैसे ही यह पत्र मिले मुझे लिखकर जवाब देना
Transcribing audio 8/14: common_voice_hi_23827795.wav
Transcription 8: टॉम मेरा चाचा लगता है
Transcribing audio 9/14: common_voice_hi_23827796.wav
Transcription 9: मथुरा में एक सनकी का सत्याग्रह
Transcrib

Some weights of Wav2Vec2ForCTC were not initialized from the model checkpoint at facebook/wav2vec2-base-960h and are newly initialized: ['wav2vec2.masked_spec_embed']
You should probably TRAIN this model on a down-stream task to be able to use it for predictions and inference.


Transcribing audio 1/14: common_voice_hi_23827802.wav
Transcription 1: केन्या अभी तक गाड़ी नहीं हुई है
Transcribing audio 2/14: common_voice_hi_23827803.wav
Transcription 2: अगर हमको स्टेशन समय पर पहुंचना है तो हमको जल्दी करनी होगी
Transcribing audio 3/14: common_voice_hi_23827804.wav
Transcription 3: मेरा फोन खराब है
Transcribing audio 4/14: common_voice_hi_23828667.wav
Transcription 4: लोरी अब एक पुस्तक पढ़ रही है
Transcribing audio 5/14: common_voice_hi_23828668.wav
Transcription 5: अप हथियारों की तस्करी करने वाले के रोग का भंडाफोड़
Transcribing audio 6/14: common_voice_hi_23828669.wav
Transcription 6: आप खुले कि देश विरोधी नारेबाजी की सच्चाई आर्य पहुंची फोरेंसिक टीम
Transcribing audio 7/14: common_voice_hi_23828670.wav
Transcription 7: यह मेरी का कुत्ता है
Transcribing audio 8/14: common_voice_hi_23828671.wav
Transcription 8: चुलबुल पांडे से प्रेरित हो सह बनेगी लेडी दबंग
Transcribing audio 9/14: common_voice_hi_23828682.wav
Transcription 9: तुम्हारी आंखें खराब है क्या
Transcribing 

Some weights of Wav2Vec2ForCTC were not initialized from the model checkpoint at facebook/wav2vec2-base-960h and are newly initialized: ['wav2vec2.masked_spec_embed']
You should probably TRAIN this model on a down-stream task to be able to use it for predictions and inference.


Transcribing audio 1/14: common_voice_hi_23828698.wav
Transcription 1: हम सब पागल हैं
Transcribing audio 2/14: common_voice_hi_23828699.wav
Transcription 2: वह घोड़ा नहीं वह तो गधा है
Transcribing audio 3/14: common_voice_hi_23828700.wav
Transcription 3: वह उसका दोस्त है
Transcribing audio 4/14: common_voice_hi_23828701.wav
Transcription 4: वह अभी तक यहां नहीं आई है
Transcribing audio 5/14: common_voice_hi_23828712.wav
Transcription 5: क्या तुम कह रहे हो कि मेरी जान खतरे में है
Transcribing audio 6/14: common_voice_hi_23828713.wav
Transcription 6: मैं चीन में 6 महीने रहा हूं
Transcribing audio 7/14: common_voice_hi_23828714.wav
Transcription 7: उसने तो शुक्रिया तक नहीं कहा
Transcribing audio 8/14: common_voice_hi_23828715.wav
Transcription 8: राज्यसभा के डिप्टी चेयरमैन के लिए संयुक्त उम्मीदवार खड़ा कर सकता है विपक्ष
Transcribing audio 9/14: common_voice_hi_23828716.wav
Transcription 9: ऑटो को महबूब जगह की तलाश
Transcribing audio 10/14: common_voice_hi_23828722.wav
Transcription 10: तुम

Some weights of Wav2Vec2ForCTC were not initialized from the model checkpoint at facebook/wav2vec2-base-960h and are newly initialized: ['wav2vec2.masked_spec_embed']
You should probably TRAIN this model on a down-stream task to be able to use it for predictions and inference.


Transcribing audio 1/14: common_voice_hi_23828747.wav
Transcription 1: कोलकाता एयरपोर्ट पर दो एनआरआई महिलाओं को हिरासत में लिया गया
Transcribing audio 2/14: common_voice_hi_23828748.wav
Transcription 2: तुम्हें जो अच्छा लगता है ले लो
Transcribing audio 3/14: common_voice_hi_23828749.wav
Transcription 3: हम टॉम की मदद करते हैं
Transcribing audio 4/14: common_voice_hi_23828750.wav
Transcription 4: कुछ तोड़ना मत
Transcribing audio 5/14: common_voice_hi_23828751.wav
Transcription 5: यह तो कभी खत्म ना होगा
Transcribing audio 6/14: common_voice_hi_23828802.wav
Transcription 6: मुझे भाभी प्रधानमंत्री न समझा जाए राहुल गांधी
Transcribing audio 7/14: common_voice_hi_23828803.wav
Transcription 7: जवान बेटे की आरती के पीछे गीत गाती चली मां जिसने देखा फफक पड़ा
Transcribing audio 8/14: common_voice_hi_23828804.wav
Transcription 8: जिम अपने पापा पर जाता है
Transcribing audio 9/14: common_voice_hi_23828805.wav
Transcription 9: मुंबई लोकल ट्रेन में लगेगा एक तैनात होंगे बाउंसर
Transcribing audio 10/14: 

Some weights of Wav2Vec2ForCTC were not initialized from the model checkpoint at facebook/wav2vec2-base-960h and are newly initialized: ['wav2vec2.masked_spec_embed']
You should probably TRAIN this model on a down-stream task to be able to use it for predictions and inference.


Transcribing audio 1/14: common_voice_hi_23830502.wav
Transcription 1: उड़ दुर्घटना में पूरे स्कूल को सदमा पहुंचा
Transcribing audio 2/14: common_voice_hi_23830508.wav
Transcription 2: तुम्हें मेरी मदद चाहिए क्या
Transcribing audio 3/14: common_voice_hi_23830509.wav
Transcription 3: मैं हल्का दो गया हुआ हूं
Transcribing audio 4/14: common_voice_hi_23830510.wav
Transcription 4: नीता अंबानी बनी रिलायंस इंडस्ट्रीज की पहली महिला डायरेक्टर
Transcribing audio 5/14: common_voice_hi_23830511.wav
Transcription 5: तुमने असली हीरा कभी देखा ही नहीं है
Transcribing audio 6/14: common_voice_hi_23830512.wav
Transcription 6: वह जहां भी जाए वह कुत्ता उसके पीछे पीछे जाता था
Transcribing audio 7/14: common_voice_hi_23830513.wav
Transcription 7: वह अमीर है वह है पर कंजूस भी है
Transcribing audio 8/14: common_voice_hi_23830514.wav
Transcription 8: गुजरात सरकार से नाराज आदिवासी समाज मंत्री की गाड़ी पर बरसाए पत्थर
Transcribing audio 9/14: common_voice_hi_23830515.wav
Transcription 9: मैं डरा हुआ था
Transcrib

Some weights of Wav2Vec2ForCTC were not initialized from the model checkpoint at facebook/wav2vec2-base-960h and are newly initialized: ['wav2vec2.masked_spec_embed']
You should probably TRAIN this model on a down-stream task to be able to use it for predictions and inference.


Transcribing audio 1/14: common_voice_hi_23830521.wav
Transcription 1: अगले साल में हवाई जा रहा हूं
Transcribing audio 2/14: common_voice_hi_23830522.wav
Transcription 2: उसने अपनी पत्नी को उसे सुबह 7:00 बजे उठाने की बात का याद दिलाया हूं
Transcribing audio 3/14: common_voice_hi_23830523.wav
Transcription 3: अनिल कपूर बॉबी देओल का ब्रोमस देख शर्मा के सलमान वीडियो वायरल
Transcribing audio 4/14: common_voice_hi_23830524.wav
Transcription 4: बीजेपी में आज शामिल होंगे भुवनेश्वर कलिता और जीव विवेकानंद
Transcribing audio 5/14: common_voice_hi_23830525.wav
Transcription 5: फिर कर बात मत करो सीधे सीधे बोलो
Transcribing audio 6/14: common_voice_hi_23830526.wav
Transcription 6: आप उसे रात कहां थे
Transcribing audio 7/14: common_voice_hi_23830527.wav
Transcription 7: जल्दी ही तेरा पर केवल तीन विशाल देश रह गए थे
Transcribing audio 8/14: common_voice_hi_23830779.wav
Transcription 8: अगर वह इस तरह मन लगाकर पढ़ना रहेगा तो परीक्षा में अवश्य पास होगा
Transcribing audio 9/14: common_voice_hi_23830780.wa

Some weights of Wav2Vec2ForCTC were not initialized from the model checkpoint at facebook/wav2vec2-base-960h and are newly initialized: ['wav2vec2.masked_spec_embed']
You should probably TRAIN this model on a down-stream task to be able to use it for predictions and inference.


Transcribing audio 1/14: common_voice_hi_23830800.wav
Transcription 1: मैं वहां क्यों पहनूंगी
Transcribing audio 2/14: common_voice_hi_23830801.wav
Transcription 2: तुम तो यह भी नहीं जानते कि मैं कौन हूं
Transcribing audio 3/14: common_voice_hi_23830802.wav
Transcription 3: मैंने उसे नियम समझाया
Transcribing audio 4/14: common_voice_hi_23830812.wav
Transcription 4: एयरपोर्ट के रास्ते पर गाड़ी खराब हो गई
Transcribing audio 5/14: common_voice_hi_23830813.wav
Transcription 5: क्या वह एक असली हीरा है
Transcribing audio 6/14: common_voice_hi_23830814.wav
Transcription 6: शत्रुघ्न सिन्हा ने छापे की टाइमिंग पर उठाए सवाल मोदी सरकार पर साधा निशाना
Transcribing audio 7/14: common_voice_hi_23830815.wav
Transcription 7: हमें लोगों के पीठ के पीछे उनके बुराई नहीं करनी चाहिए
Transcribing audio 8/14: common_voice_hi_23830816.wav
Transcription 8: तुम थक गए हो है ना
Transcribing audio 9/14: common_voice_hi_23832722.wav
Transcription 9: उसको तैरना नहीं आता
Transcribing audio 10/14: common_voice_hi_238327

Some weights of Wav2Vec2ForCTC were not initialized from the model checkpoint at facebook/wav2vec2-base-960h and are newly initialized: ['wav2vec2.masked_spec_embed']
You should probably TRAIN this model on a down-stream task to be able to use it for predictions and inference.


Transcribing audio 1/14: common_voice_hi_23832733.wav
Transcription 1: कई ऐतिहासिक फसलों के साक्षी रहे अरुण जेटली अब मंत्रिमंडल में खाली की कमी
Transcribing audio 2/14: common_voice_hi_23832734.wav
Transcription 2: तुमने नीले कपड़े पहन रखे थे
Transcribing audio 3/14: common_voice_hi_23832735.wav
Transcription 3: मुझे बच्चों को सुलाना है
Transcribing audio 4/14: common_voice_hi_23832736.wav
Transcription 4: लोग कहते हैं कि इस घर में भूत है
Transcribing audio 5/14: common_voice_hi_23832737.wav
Transcription 5: मैं तुमसे नहीं बोलता
Transcribing audio 6/14: common_voice_hi_23832738.wav
Transcription 6: मैं अपनी वर्तमान आमदनी से संतुष्ट हूं
Transcribing audio 7/14: common_voice_hi_23832739.wav
Transcription 7: सिगरेट के लिए एक व्यक्ति की हत्या करने वाले युवक को आजीवन कारावास
Transcribing audio 8/14: common_voice_hi_23832740.wav
Transcription 8: अग्रणी टैक्सी ऑटो सेवा रहेगी बंद
Transcribing audio 9/14: common_voice_hi_23832741.wav
Transcription 9: कूड़े का ढेर बना देहरादून सफाई कर्मियों की ह

Some weights of Wav2Vec2ForCTC were not initialized from the model checkpoint at facebook/wav2vec2-base-960h and are newly initialized: ['wav2vec2.masked_spec_embed']
You should probably TRAIN this model on a down-stream task to be able to use it for predictions and inference.


Transcribing audio 1/14: common_voice_hi_23833315.wav
Transcription 1: हम एक फिल्म देख रहे हैं
Transcribing audio 2/14: common_voice_hi_23833316.wav
Transcription 2: बोतल छोड़ दो
Transcribing audio 3/14: common_voice_hi_23833317.wav
Transcription 3: मुझे एक कप चाय चाहिए
Transcribing audio 4/14: common_voice_hi_23833318.wav
Transcription 4: हमें नहीं पता हम कहां हैं
Transcribing audio 5/14: common_voice_hi_23833319.wav
Transcription 5: पाकिस्तान में आतंकी हाफिज सईद के बेटे पर भी आतंकवादी हमले का खतरा
Transcribing audio 6/14: common_voice_hi_23833325.wav
Transcription 6: उज्जैन शहर बजरंग दल और भाजयुमो से जुड़े हुए थे इंस्पेक्टर सुबोध सिंह के हथियारों की
Transcribing audio 7/14: common_voice_hi_23833326.wav
Transcription 7: हां
Transcribing audio 8/14: common_voice_hi_23833327.wav
Transcription 8: मलयालम के आशीर्वाद पर अखिलेश बोल नेताजी जिंदाबाद शिवपाल नादर
Transcribing audio 9/14: common_voice_hi_23833328.wav
Transcription 9: मैं स्कूल जाना नहीं जाता हूं
Transcribing audio 10/14: common_

Some weights of Wav2Vec2ForCTC were not initialized from the model checkpoint at facebook/wav2vec2-base-960h and are newly initialized: ['wav2vec2.masked_spec_embed']
You should probably TRAIN this model on a down-stream task to be able to use it for predictions and inference.


Transcribing audio 1/14: common_voice_hi_23833334.wav
Transcription 1: हम सब टॉम को जानते हैं
Transcribing audio 2/14: common_voice_hi_23833600.wav
Transcription 2: अफ्रीका में कई शेर है
Transcribing audio 3/14: common_voice_hi_23833601.wav
Transcription 3: आज के युवाओं को नहीं मालूम पहले विश्व युद्ध की तारीख है
Transcribing audio 4/14: common_voice_hi_23833602.wav
Transcription 4: मुंबई भारतीय राज्य महाराष्ट्र की राजधानी है
Transcribing audio 5/14: common_voice_hi_23833603.wav
Transcription 5: उसने मुझे वह नियम समझाया
Transcribing audio 6/14: common_voice_hi_23833604.wav
Transcription 6: मेरे पापा आमतौर पर 6 बजे घर लौट कर आते हैं
Transcribing audio 7/14: common_voice_hi_23833605.wav
Transcription 7: सेंसेक्स और निफ्टी भारी गिरावट के साथ बंद
Transcribing audio 8/14: common_voice_hi_23833606.wav
Transcription 8: तूफान ने पूरे नगर को नष्ट कर दिया
Transcribing audio 9/14: common_voice_hi_23833607.wav
Transcription 9: हम तो बस दोस्त हैं
Transcribing audio 10/14: common_voice_hi_23833608.wa

Some weights of Wav2Vec2ForCTC were not initialized from the model checkpoint at facebook/wav2vec2-base-960h and are newly initialized: ['wav2vec2.masked_spec_embed']
You should probably TRAIN this model on a down-stream task to be able to use it for predictions and inference.


Transcribing audio 1/14: common_voice_hi_23833613.wav
Transcription 1: वाराणसी हिंसा कांग्रेस विधायक अजय राय गिरफ्तार
Transcribing audio 2/14: common_voice_hi_23833614.wav
Transcription 2: मुझे पता है कि तुम अभी भी मेरे लिए आंसू बहते हो कभी कभी
Transcribing audio 3/14: common_voice_hi_23834324.wav
Transcription 3: चाय वाय कुछ लेंगे आप
Transcribing audio 4/14: common_voice_hi_23834325.wav
Transcription 4: उसका दिल साफ है
Transcribing audio 5/14: common_voice_hi_23834326.wav
Transcription 5: महिलाएं दुनिया बदल देती है
Transcribing audio 6/14: common_voice_hi_23834327.wav
Transcription 6: द्वितीय हर एक संस्कृति का एक सुंदर भाग होता है
Transcribing audio 7/14: common_voice_hi_23834328.wav
Transcription 7: मुझे अंग्रेजी और संगीत पसंद है
Transcribing audio 8/14: common_voice_hi_23839863.wav
Transcription 8: तुमने तुम्हें क्या बताया
Transcribing audio 9/14: common_voice_hi_23839864.wav
Transcription 9: उन्होंने दरवाजा खोला
Transcribing audio 10/14: common_voice_hi_23839865.wav
Transcription 1

Some weights of Wav2Vec2ForCTC were not initialized from the model checkpoint at facebook/wav2vec2-base-960h and are newly initialized: ['wav2vec2.masked_spec_embed']
You should probably TRAIN this model on a down-stream task to be able to use it for predictions and inference.


Transcribing audio 1/14: common_voice_hi_23839870.wav
Transcription 1: काश मुझे तैरना आता हूं
Transcribing audio 2/14: common_voice_hi_23839871.wav
Transcription 2: विमान दुर्घटना ने 200 लोगों की जान ले ली
Transcribing audio 3/14: common_voice_hi_23839872.wav
Transcription 3: तुम पुर्तगाल में रहते हो या ब्राजील में
Transcribing audio 4/14: common_voice_hi_23844508.wav
Transcription 4: कहां गए हो
Transcribing audio 5/14: common_voice_hi_23844509.wav
Transcription 5: चाहे तो घर जा सकते हो
Transcribing audio 6/14: common_voice_hi_23844510.wav
Transcription 6: नीचे क्यों देख रही हो
Transcribing audio 7/14: common_voice_hi_23844511.wav
Transcription 7: अनंतनाग आतंकी हमले के बाद दिल्ली का जंतर मंतर राजनीतिक अखाड़े में तब्दील
Transcribing audio 8/14: common_voice_hi_23844512.wav
Transcription 8: सावधान दक्षिण दिल्ली का पानी बना जहर
Transcribing audio 9/14: common_voice_hi_23844513.wav
Transcription 9: अक्षय कुमार ने पकड़ा उल्टा तिरंगा ट्रोल होने पर मांगी माफी
Transcribing audio 10/14: common_

Some weights of Wav2Vec2ForCTC were not initialized from the model checkpoint at facebook/wav2vec2-base-960h and are newly initialized: ['wav2vec2.masked_spec_embed']
You should probably TRAIN this model on a down-stream task to be able to use it for predictions and inference.


Transcribing audio 1/14: common_voice_hi_23844529.wav
Transcription 1: वह कम से शहर के बाहर गए हुए हैं
Transcribing audio 2/14: common_voice_hi_23844530.wav
Transcription 2: भारी बारिश के साथ बढ़ भी आई और उसने बहुत नुकसान पहुंचा
Transcribing audio 3/14: common_voice_hi_23844531.wav
Transcription 3: देखो वह कितना तेज दौड़ता है
Transcribing audio 4/14: common_voice_hi_23844532.wav
Transcription 4: मुझे मत बताओ
Transcribing audio 5/14: common_voice_hi_23844533.wav
Transcription 5: हमें अगले हफ्ते ड्राइव पर ले जाओगे क्या
Transcribing audio 6/14: common_voice_hi_23844534.wav
Transcription 6: अबराज के निशाने पर टैक्सी और ऑटो चालक
Transcribing audio 7/14: common_voice_hi_23844535.wav
Transcription 7: बैडमिंटन टूर्नामेंट कश्यप क्वार्टर फाइनल में ज्वाला और अश्विनी हेयर
Transcribing audio 8/14: common_voice_hi_23844536.wav
Transcription 8: उसने अच्छा किया कि उसे नौकरी को हां कर दिया
Transcribing audio 9/14: common_voice_hi_23844537.wav
Transcription 9: वह चाल चलन में असाध्य है
Transcribing audio

Some weights of Wav2Vec2ForCTC were not initialized from the model checkpoint at facebook/wav2vec2-base-960h and are newly initialized: ['wav2vec2.masked_spec_embed']
You should probably TRAIN this model on a down-stream task to be able to use it for predictions and inference.


Transcribing audio 1/14: common_voice_hi_23847549.wav
Transcription 1: उसे तस्वीर को दिखा
Transcribing audio 2/14: common_voice_hi_23847550.wav
Transcription 2: क्या पहनने वाली हो
Transcribing audio 3/14: common_voice_hi_23847551.wav
Transcription 3: मैं अपने काम से थक चुका हूं
Transcribing audio 4/14: common_voice_hi_23847552.wav
Transcription 4: क्या मुझे बता सकती हो की मशीन को कब बंद करना है
Transcribing audio 5/14: common_voice_hi_23847553.wav
Transcription 5: वह सब के सब भूखे हैं
Transcribing audio 6/14: common_voice_hi_23847594.wav
Transcription 6: मैं तुम्हारी इतना लंबा हूं
Transcribing audio 7/14: common_voice_hi_23847595.wav
Transcription 7: आदमी 70% पानी का बना हुआ है
Transcribing audio 8/14: common_voice_hi_23847596.wav
Transcription 8: टॉम काफी बदसूरत है
Transcribing audio 9/14: common_voice_hi_23847597.wav
Transcription 9: चिली खदान में फंसे सभी श्रमिकों को निकाला गया
Transcribing audio 10/14: common_voice_hi_23847598.wav
Transcription 10: मैं वापस आऊंगा
Transcribing audio

Some weights of Wav2Vec2ForCTC were not initialized from the model checkpoint at facebook/wav2vec2-base-960h and are newly initialized: ['wav2vec2.masked_spec_embed']
You should probably TRAIN this model on a down-stream task to be able to use it for predictions and inference.


Transcribing audio 1/14: common_voice_hi_23849288.wav
Transcription 1: मंडे से बेहतर टेस्ट क्रिकेटर है कोहली कोच
Transcribing audio 2/14: common_voice_hi_23849294.wav
Transcription 2: टीवी चालू कीजिए
Transcribing audio 3/14: common_voice_hi_23849295.wav
Transcription 3: तीन तलाक बिल के बाद महिला आरक्षण विधायक पास होने का असर
Transcribing audio 4/14: common_voice_hi_23849296.wav
Transcription 4: घुटने की समस्या के कारण टेस्ट क्रिकेट से संन्यास पर विचार कर रहे हैं गुल
Transcribing audio 5/14: common_voice_hi_23849297.wav
Transcription 5: आखिर 8 जनवरी को ब्रिटिश ने हमला किया
Transcribing audio 6/14: common_voice_hi_23849298.wav
Transcription 6: मैंने रात भर काम किया
Transcribing audio 7/14: common_voice_hi_23849299.wav
Transcription 7: आराम से आओ
Transcribing audio 8/14: common_voice_hi_23849300.wav
Transcription 8: वह बीमारी की वजह से बाहर नहीं जा सका
Transcribing audio 9/14: common_voice_hi_23849301.wav
Transcription 9: ब्राजील का पुर्तगाली में ब्राजील कहते हैं
Transcribing audio 10/14:

Some weights of Wav2Vec2ForCTC were not initialized from the model checkpoint at facebook/wav2vec2-base-960h and are newly initialized: ['wav2vec2.masked_spec_embed']
You should probably TRAIN this model on a down-stream task to be able to use it for predictions and inference.


Transcribing audio 1/14: common_voice_hi_23849307.wav
Transcription 1: मेरी पार्टी में जो भी आना चाहता है आ सकता है
Transcribing audio 2/14: common_voice_hi_23849308.wav
Transcription 2: गौतम गंभीर बन कर के कप्तान
Transcribing audio 3/14: common_voice_hi_23849309.wav
Transcription 3: ट्रेन हल्के से आकर रुकी
Transcribing audio 4/14: common_voice_hi_23849310.wav
Transcription 4: तो तुमसे नगद मांगता कौन है भाई
Transcribing audio 5/14: common_voice_hi_23849311.wav
Transcription 5: अपने टॉम को कब बताया
Transcribing audio 6/14: common_voice_hi_23849312.wav
Transcription 6: मैं अंग्रेजी पढ़ सकता हूं
Transcribing audio 7/14: common_voice_hi_23849313.wav
Transcription 7: मेरा पिता ने अपने वसीयत में मुझे बहुत सारे पैसे छोड़े थे
Transcribing audio 8/14: common_voice_hi_23849314.wav
Transcription 8: पूरी तरह खत्म नहीं हुए वैश्विक मंदिर प्रणव
Transcribing audio 9/14: common_voice_hi_23849315.wav
Transcription 9: तुम फिर से चालू हो गए
Transcribing audio 10/14: common_voice_hi_23849316.wav
Transcript

Some weights of Wav2Vec2ForCTC were not initialized from the model checkpoint at facebook/wav2vec2-base-960h and are newly initialized: ['wav2vec2.masked_spec_embed']
You should probably TRAIN this model on a down-stream task to be able to use it for predictions and inference.


Transcribing audio 1/14: common_voice_hi_23849321.wav
Transcription 1: थोड़ी देर में वापस आ रहा है
Transcribing audio 2/14: common_voice_hi_23849322.wav
Transcription 2: टॉम की है
Transcribing audio 3/14: common_voice_hi_23849323.wav
Transcription 3: पर्वत नसीब वाला था
Transcribing audio 4/14: common_voice_hi_23849346.wav
Transcription 4: मनोर एक सोने की घड़ी दी
Transcribing audio 5/14: common_voice_hi_23849349.wav
Transcription 5: रसोईघर में
Transcribing audio 6/14: common_voice_hi_23849351.wav
Transcription 6: व चाय बना रही है
Transcribing audio 7/14: common_voice_hi_23849352.wav
Transcription 7: सिलिगुड़ी पुलिस ने नहीं दी राहुल गांधी के हेलीकॉप्टर को उतारने की इजाजत
Transcribing audio 8/14: common_voice_hi_23849353.wav
Transcription 8: तुम मुझे 500 यह उधार दे सकते हो क्या
Transcribing audio 9/14: common_voice_hi_23849359.wav
Transcription 9: बड़ी रात थी
Transcribing audio 10/14: common_voice_hi_23849360.wav
Transcription 10: अच्छा शब्द मुरैल है
Transcribing audio 11/14: common_voice

Some weights of Wav2Vec2ForCTC were not initialized from the model checkpoint at facebook/wav2vec2-base-960h and are newly initialized: ['wav2vec2.masked_spec_embed']
You should probably TRAIN this model on a down-stream task to be able to use it for predictions and inference.


Transcribing audio 1/14: common_voice_hi_23849377.wav
Transcription 1: रेलगाड़ी में 24 डब्बे हैं
Transcribing audio 2/14: common_voice_hi_23849378.wav
Transcription 2: गिरिराज मंत्री बोले जामिया हिंसा के पीछे विदेशी ताकत का साथ
Transcribing audio 3/14: common_voice_hi_23849379.wav
Transcription 3: मेरे पास पैसा नहीं है पर सपना है
Transcribing audio 4/14: common_voice_hi_23849380.wav
Transcription 4: मेरी प्यारी सी नन्ही सी बिल्ली एक हफ्ते से गायब है
Transcribing audio 5/14: common_voice_hi_23852746.wav
Transcription 5: शाम को क्या हुआ है
Transcribing audio 6/14: common_voice_hi_23852747.wav
Transcription 6: शनिवार हड्डी का आखिरी दिन होता है
Transcribing audio 7/14: common_voice_hi_23852748.wav
Transcription 7: हिंदू सरकार का ट्रेलर रिलीज नाम नितिन का अंदाज दिया दमदार
Transcribing audio 8/14: common_voice_hi_23852749.wav
Transcription 8: मेरा शौक किताब भजन है
Transcribing audio 9/14: common_voice_hi_23852750.wav
Transcription 9: टॉम अभी भी स्कूल में है
Transcribing audio 10/14: common_v

Some weights of Wav2Vec2ForCTC were not initialized from the model checkpoint at facebook/wav2vec2-base-960h and are newly initialized: ['wav2vec2.masked_spec_embed']
You should probably TRAIN this model on a down-stream task to be able to use it for predictions and inference.


Transcribing audio 1/14: common_voice_hi_23852756.wav
Transcription 1: गुजरात डायरी शौचालय बनवाने के लिए दोसा लौड़ा दलित परिवार
Transcribing audio 2/14: common_voice_hi_23852757.wav
Transcription 2: राज वाले बात है
Transcribing audio 3/14: common_voice_hi_23852758.wav
Transcription 3: मैं तुम्हें एक तोहफा दूंगा
Transcribing audio 4/14: common_voice_hi_23852759.wav
Transcription 4: मुजरा के इतिहास को बचाने की जादू जादू
Transcribing audio 5/14: common_voice_hi_23852760.wav
Transcription 5: इस चाय को हरी चाय कहते हैं
Transcribing audio 6/14: common_voice_hi_23852761.wav
Transcription 6: हमारे मुलाकात गलती से हो गई
Transcribing audio 7/14: common_voice_hi_23852762.wav
Transcription 7: 12:00 बजने वाले हैं
Transcribing audio 8/14: common_voice_hi_23852763.wav
Transcription 8: ऐसा दिखता है अमिताभ बच्चन के घर का मंदिर
Transcribing audio 9/14: common_voice_hi_23852764.wav
Transcription 9: सिद्धार्थ मेरा अच्छा दोस्त है और हमेशा रहेगा आलिया
Transcribing audio 10/14: common_voice_hi_23852765.wav
T

Some weights of Wav2Vec2ForCTC were not initialized from the model checkpoint at facebook/wav2vec2-base-960h and are newly initialized: ['wav2vec2.masked_spec_embed']
You should probably TRAIN this model on a down-stream task to be able to use it for predictions and inference.


Transcribing audio 1/14: common_voice_hi_23852770.wav
Transcription 1: बिहार में राहुल ने लालू से बनाई दूरी
Transcribing audio 2/14: common_voice_hi_23852771.wav
Transcription 2: गोल्फ मेरे बस की बात नहीं
Transcribing audio 3/14: common_voice_hi_23852772.wav
Transcription 3: आप अभी झूठ बोल रहे हो है ना
Transcribing audio 4/14: common_voice_hi_23852773.wav
Transcription 4: टॉम के पास एक अच्छा सा कैमरा है
Transcribing audio 5/14: common_voice_hi_23852774.wav
Transcription 5: मुझे बस घर ले चलो
Transcribing audio 6/14: common_voice_hi_23852775.wav
Transcription 6: इस बारिश में बाहर जाना एकदम सवाल के बाहर है
Transcribing audio 7/14: common_voice_hi_23852776.wav
Transcription 7: आप दोनों देख रहे हैं
Transcribing audio 8/14: common_voice_hi_23852777.wav
Transcription 8: मैं पिछले रविवार बाहर नहीं निकला था
Transcribing audio 9/14: common_voice_hi_23852778.wav
Transcription 9: बच्चे पतंग उड़ा रहे थे
Transcribing audio 10/14: common_voice_hi_23852779.wav
Transcription 10: व्हाट'एस थे फ्रांसीसी ज

Some weights of Wav2Vec2ForCTC were not initialized from the model checkpoint at facebook/wav2vec2-base-960h and are newly initialized: ['wav2vec2.masked_spec_embed']
You should probably TRAIN this model on a down-stream task to be able to use it for predictions and inference.


Transcribing audio 1/14: common_voice_hi_23852794.wav
Transcription 1: जो तुम को पता
Transcribing audio 2/14: common_voice_hi_23852795.wav
Transcription 2: तुम अभी झूठ बोल रही हो है ना
Transcribing audio 3/14: common_voice_hi_23852811.wav
Transcription 3: अच्छा वाला दे दो
Transcribing audio 4/14: common_voice_hi_23852812.wav
Transcription 4: वह भाग्यवंता
Transcribing audio 5/14: common_voice_hi_23852813.wav
Transcription 5: झारखंड गैंगरेप के बाद नाबालिक को जिंदा जलाया मौत
Transcribing audio 6/14: common_voice_hi_23852814.wav
Transcription 6: कागज का आविष्कार चीन में किया गया था
Transcribing audio 7/14: common_voice_hi_23852815.wav
Transcription 7: छठ पर्व संपन्न दिल्ली के घाटों पर फैली
Transcribing audio 8/14: common_voice_hi_23852883.wav
Transcription 8: तुम कब लौट कर आओगे
Transcribing audio 9/14: common_voice_hi_23852884.wav
Transcription 9: हमें सैनिकों की जरूरत है राक्षसों की नहीं
Transcribing audio 10/14: common_voice_hi_23852885.wav
Transcription 10: उसने मुझे जल्द से जल्द उत्तर 

Some weights of Wav2Vec2ForCTC were not initialized from the model checkpoint at facebook/wav2vec2-base-960h and are newly initialized: ['wav2vec2.masked_spec_embed']
You should probably TRAIN this model on a down-stream task to be able to use it for predictions and inference.


Transcribing audio 1/14: common_voice_hi_23901987.wav
Transcription 1: वह 10 साल का लड़का था
Transcribing audio 2/14: common_voice_hi_23901988.wav
Transcription 2: मेरे लिए तू ही जगह बनाओगे क्या
Transcribing audio 3/14: common_voice_hi_23901989.wav
Transcription 3: स्टोन को कुछ पिलाओ
Transcribing audio 4/14: common_voice_hi_23936419.wav
Transcription 4: कुछ कुछ लोचा है मैं सनी लियोन का बिकिनी लुक
Transcribing audio 5/14: common_voice_hi_23936421.wav
Transcription 5: यह रही आपकी चाबी
Transcribing audio 6/14: common_voice_hi_23936422.wav
Transcription 6: टॉम ने आकाश की तरफ देखा
Transcribing audio 7/14: common_voice_hi_23936423.wav
Transcription 7: मैं शहर का नक्शा खरीदना चाहता हूं
Transcribing audio 8/14: common_voice_hi_23936424.wav
Transcription 8: मेरी छड़ी कहां है
Transcribing audio 9/14: common_voice_hi_23937109.wav
Transcription 9: इस वजह से हुआ दावते इसकी रिलीज में फेरबदल
Transcribing audio 10/14: common_voice_hi_23937110.wav
Transcription 10: उसे संस्कृत में लोग रंग बिरंगी कपड़े 

Some weights of Wav2Vec2ForCTC were not initialized from the model checkpoint at facebook/wav2vec2-base-960h and are newly initialized: ['wav2vec2.masked_spec_embed']
You should probably TRAIN this model on a down-stream task to be able to use it for predictions and inference.


Transcribing audio 1/14: common_voice_hi_23937537.wav
Transcription 1: गुवाहाटी हाई कोर्ट में वैकेंसी
Transcribing audio 2/14: common_voice_hi_23937538.wav
Transcription 2: बकरी कहां है
Transcribing audio 3/14: common_voice_hi_23937539.wav
Transcription 3: इनके एक आइडिया ने बदल दी हिमाचल की किस्मत अमेरिका में आए थे इंडिया
Transcribing audio 4/14: common_voice_hi_23937540.wav
Transcription 4: पहली बार कैबिनेट विस्तार तरीका और सुरेश प्रभु होंगे मंत्रिमंडल में शामिल
Transcribing audio 5/14: common_voice_hi_23937551.wav
Transcription 5: एक बार फिर होगी आफत की बारिश अगले 2 दिन का अलर्ट
Transcribing audio 6/14: common_voice_hi_23937552.wav
Transcription 6: वह मेरी बात नहीं सुनेगा
Transcribing audio 7/14: common_voice_hi_23937553.wav
Transcription 7: मैं इस पास तू सीखूंगा
Transcribing audio 8/14: common_voice_hi_23937554.wav
Transcription 8: यदि मुझे आपकी राज चाहिए होगी तो मैं मैं मांग लूं
Transcribing audio 9/14: common_voice_hi_23937555.wav
Transcription 9: मैं इस चोर को और बर्दाश्त नहीं कर

Some weights of Wav2Vec2ForCTC were not initialized from the model checkpoint at facebook/wav2vec2-base-960h and are newly initialized: ['wav2vec2.masked_spec_embed']
You should probably TRAIN this model on a down-stream task to be able to use it for predictions and inference.


Transcribing audio 1/14: common_voice_hi_23937561.wav
Transcription 1: इससे मेरा कोई लेना देना नहीं है
Transcribing audio 2/14: common_voice_hi_23937562.wav
Transcription 2: तुम मरोगे
Transcribing audio 3/14: common_voice_hi_23937563.wav
Transcription 3: नीति मोहन की शादी में शामिल नहीं हो सके पिता यह थी वजह
Transcribing audio 4/14: common_voice_hi_23937564.wav
Transcription 4: बिना कपड़ों के दौड़ी रेप रेप पारित हाई टेंशन लो फिर मैं खुद कर दी जान
Transcribing audio 5/14: common_voice_hi_23937565.wav
Transcription 5: मैं इस जिंदगी को जीकर थक गया हूं
Transcribing audio 6/14: common_voice_hi_23937566.wav
Transcription 6: बालों का मक्खन लगाना बहुत जानता है
Transcribing audio 7/14: common_voice_hi_23937567.wav
Transcription 7: बाद में मिलेंगे
Transcribing audio 8/14: common_voice_hi_23937568.wav
Transcription 8: दुकान आज खुली नहीं है
Transcribing audio 9/14: common_voice_hi_23937569.wav
Transcription 9: एडिशनल फी ऑफ़ फ्रांसीसी
Transcribing audio 10/14: common_voice_hi_23937570.wav
Transcrip

In [1]:
pip install googletrans==4.0.0-rc1

Collecting googletrans==4.0.0-rc1
  Downloading googletrans-4.0.0rc1.tar.gz (20 kB)
  Preparing metadata (setup.py): started
  Preparing metadata (setup.py): finished with status 'done'
Collecting httpx==0.13.3 (from googletrans==4.0.0-rc1)
  Downloading httpx-0.13.3-py3-none-any.whl (55 kB)
                                              0.0/55.1 kB ? eta -:--:--
     -------                                  10.2/55.1 kB ? eta -:--:--
     ---------------------                  30.7/55.1 kB 445.2 kB/s eta 0:00:01
     ----------------------------           41.0/55.1 kB 330.3 kB/s eta 0:00:01
     ----------------------------           41.0/55.1 kB 330.3 kB/s eta 0:00:01
     ----------------------------           41.0/55.1 kB 330.3 kB/s eta 0:00:01
     ----------------------------           41.0/55.1 kB 330.3 kB/s eta 0:00:01
     ----------------------------           41.0/55.1 kB 330.3 kB/s eta 0:00:01
     ----------------------------           41.0/55.1 kB 330.3 kB/s eta 0:00:01
  

In [3]:
#Translation
import pandas as pd
from googletrans import Translator

# Load the Excel file into a DataFrame
excel_file_path = r"E:\AudioPalm_MODEL\transcriptions.xlsx"
df = pd.read_excel(excel_file_path)

# Initialize the translator
translator = Translator()

# Function to translate text and display progress
def translate_and_display_progress(text):
    translation = translator.translate(text, src='hi', dest='en')
    print(f"Hindi: {text}\nEnglish Translation: {translation.text}\n")
    return translation.text

# Apply the translation function to each row and create a new column
df['English Translation'] = df['Transcription'].apply(translate_and_display_progress)

# Save the translated data back to the Excel file
translated_excel_file_path = r"E:\AudioPalm_MODEL\TranslatedFile.xlsx"
df.to_excel(translated_excel_file_path, index=False)

print("Translation and saving complete.")


Hindi: तुम्हारे पास 3 महीने बच्चे हैं
English Translation: you have 3 months baby

Hindi: मैं करती हूं
English Translation: i do

Hindi: जब मैं छोटा था मैं हमेशा जल्दी सो कर उठता था
English Translation: When I was young I always woke up early

Hindi: भाई और को एक गुप्त रास्ता है
English Translation: brother and co have a secret passage

Hindi: मुझे इस लड़की से नफरत है
English Translation: i hate this girl

Hindi: यह सही सबसे अच्छी है
English Translation: that's right the best

Hindi: डब्बा इतना भारी था कि मैं उसे हिला नहीं सका
English Translation: The box was so heavy that I couldn't move it

Hindi: वे कुछ करते क्यों नहीं
English Translation: why don't they do anything

Hindi: मैं पूरी रात राई
English Translation: i cried all night

Hindi: तुम गलत मंजिल पर हो
English Translation: you are on the wrong floor

Hindi: अभय राठौर से जेल में मुलाकात की
English Translation: Met Abhay Rathore in jail

Hindi: उसने हमसे बहुत देर तक इंतजार करवाया हूं
English Translation: she's made us wait too lon

Text to Speech

In [6]:
import os
import pandas as pd
from gtts import gTTS

# Load the Excel file into a DataFrame
excel_file_path = r"E:\AudioPalm_MODEL\TranslatedFile.xlsx"
df = pd.read_excel(excel_file_path)

# Create the folder for saving audio files
output_folder = r"E:\AudioPalm_MODEL\TranslatedEnglish"
os.makedirs(output_folder, exist_ok=True)

# Iterate through each row and generate audio files
for index, row in df.iterrows():
    text = row['English Translation']
    audio_file_path = os.path.join(output_folder, f"audio_{index}.mp3")
    
    tts = gTTS(text, lang='en')
    tts.save(audio_file_path)
    
    print(f"Generated audio for index {index}: {audio_file_path}")

print("Audio file generation complete.")


Generated audio for index 0: E:\AudioPalm_MODEL\TranslatedEnglish\audio_0.mp3
Generated audio for index 1: E:\AudioPalm_MODEL\TranslatedEnglish\audio_1.mp3
Generated audio for index 2: E:\AudioPalm_MODEL\TranslatedEnglish\audio_2.mp3
Generated audio for index 3: E:\AudioPalm_MODEL\TranslatedEnglish\audio_3.mp3
Generated audio for index 4: E:\AudioPalm_MODEL\TranslatedEnglish\audio_4.mp3
Generated audio for index 5: E:\AudioPalm_MODEL\TranslatedEnglish\audio_5.mp3
Generated audio for index 6: E:\AudioPalm_MODEL\TranslatedEnglish\audio_6.mp3
Generated audio for index 7: E:\AudioPalm_MODEL\TranslatedEnglish\audio_7.mp3
Generated audio for index 8: E:\AudioPalm_MODEL\TranslatedEnglish\audio_8.mp3
Generated audio for index 9: E:\AudioPalm_MODEL\TranslatedEnglish\audio_9.mp3
Generated audio for index 10: E:\AudioPalm_MODEL\TranslatedEnglish\audio_10.mp3
Generated audio for index 11: E:\AudioPalm_MODEL\TranslatedEnglish\audio_11.mp3
Generated audio for index 12: E:\AudioPalm_MODEL\TranslatedE

In [5]:
pip install gTTS

Collecting gTTS
  Downloading gTTS-2.3.2-py3-none-any.whl (28 kB)
Installing collected packages: gTTS
Successfully installed gTTS-2.3.2
Note: you may need to restart the kernel to use updated packages.
