In [None]:
import os
import torch
from jiwer import wer, cer
from transformers import AutoModelForSpeechSeq2Seq, AutoProcessor, pipeline

# Define the device based on CUDA availability
device = "cuda:0" if torch.cuda.is_available() else "cpu"

# Set torch data type based on CUDA availability
torch_dtype = torch.float16 if torch.cuda.is_available() else torch.float32

# Specify the model ID and the directory containing audio file
model_id = "openai/whisper-large-v3"
audio_directory = '/content/drive/MyDrive/common_voice_test'  # Adjust the path as needed

def load_model_and_processor():
    # Load the pre-trained model and processor for transcription.
    # Load the model and processor for speech-to-text conversion
    model = AutoModelForSpeechSeq2Seq.from_pretrained(
        model_id, torch_dtype=torch_dtype, use_safetensors=True
    )
    model.to(device)
    processor = AutoProcessor.from_pretrained(model_id)
    return model, processor

def get_transcription(audio_file, model, processor):
    # Retrieve transcription for a given audio file using the provided model and processor.
    # Get the full path to the audio file
    audio_path = os.path.join(audio_directory, audio_file)

    # Use pipeline for automatic speech recognition
    pipe = pipeline(
        "automatic-speech-recognition",
        model=model,
        tokenizer=processor.tokenizer,
        feature_extractor=processor.feature_extractor,
        max_new_tokens=128,
        chunk_length_s=30,
        batch_size=16,
        return_timestamps=True,
        torch_dtype=torch_dtype,
        device=device,
    )
    result = pipe(audio_path)
    return result["text"]

def load_reference_transcriptions():
    # Load reference transcriptions from the provided file.
    # Read and process the reference transcriptions from the 'trans.txt' file
    transcriptions = {}
    with open(os.path.join(audio_directory, 'trans.txt'), 'r', encoding='utf-8') as file:
        trans_txt_content = file.readlines()

    for line in trans_txt_content:
        parts = line.strip().split('\t')
        if len(parts) == 2:
            transcriptions[parts[0]] = parts[1]
    return transcriptions

def evaluate_transcriptions():
    # Evaluate transcriptions and calculate Word Error Rate (WER) and Character Error Rate (CER).
    # Get a list of audio files from the specified directory
    audio_files = [
        file for file in os.listdir(audio_directory) if file.endswith(".wav")
    ]

    # Load reference transcriptions from 'trans.txt'
    transcriptions = load_reference_transcriptions()
    total_wer = total_cer = total_sentences = 0

    # Iterate through audio files for transcription evaluation
    for audio_name in audio_files:
        # Obtain the transcription for the current audio file
        transcription = get_transcription(audio_name, model, processor)
        reference = transcriptions.get(audio_name)

        if reference is not None:
            print(f"Audio File: {audio_name}")
            print("Transcribed text:", transcription)
            print("Reference text:", reference)

            # Calculate WER and CER for the reference and obtained transcriptions
            curr_wer = wer(reference, transcription)
            curr_cer = cer(reference, transcription)

            # Accumulate total WER, CER, and sentences for average calculation
            total_wer += curr_wer
            total_cer += curr_cer
            total_sentences += 1

            # Display information for each audio file
            print("WER:", curr_wer)
            print("CER:", curr_cer)
            print("--------------------------------------")

    # Calculate average WER and CER for the evaluated transcriptions
    avg_wer = total_wer / total_sentences
    avg_cer = total_cer / total_sentences

    print(f"Average WER: {avg_wer}")
    print(f"Average CER: {avg_cer}")

if __name__ == "__main__":
    # Load the model and processor, then evaluate transcriptions
    model, processor = load_model_and_processor()
    evaluate_transcriptions()

config.json:   0%|          | 0.00/1.27k [00:00<?, ?B/s]

model.safetensors:   0%|          | 0.00/3.09G [00:00<?, ?B/s]

generation_config.json:   0%|          | 0.00/3.87k [00:00<?, ?B/s]

preprocessor_config.json:   0%|          | 0.00/340 [00:00<?, ?B/s]

tokenizer_config.json:   0%|          | 0.00/283k [00:00<?, ?B/s]

vocab.json:   0%|          | 0.00/1.04M [00:00<?, ?B/s]

tokenizer.json:   0%|          | 0.00/2.48M [00:00<?, ?B/s]

merges.txt:   0%|          | 0.00/494k [00:00<?, ?B/s]

normalizer.json:   0%|          | 0.00/52.7k [00:00<?, ?B/s]

added_tokens.json:   0%|          | 0.00/34.6k [00:00<?, ?B/s]

special_tokens_map.json:   0%|          | 0.00/2.07k [00:00<?, ?B/s]

Special tokens have been added in the vocabulary, make sure the associated word embeddings are fine-tuned or trained.


Audio File: common_voice_mr_30773622.wav
Transcribed text:  किल्ले हे त्यांसे छोटे खानी पुस्तक दुर्ग प्रेमींचा मनाथ मानाचे स्थान मिलवुन आहे।
Reference text: किल्ले हे त्यांचे छोटेखानी पुस्तक दुर्गप्रेमींच्या मनात मानाचे स्थान मिळवून आहे
WER: 0.7272727272727273
CER: 0.11392405063291139
--------------------------------------
Audio File: common_voice_mr_30886889.wav
Transcribed text:  तैंची राजवाशा मल्यारी तमिर्ट मिश्री थोती।
Reference text: त्यांची राजभाषा मल्याळी तमिळ मिश्रित होती
WER: 1.0
CER: 0.3170731707317073
--------------------------------------
Audio File: common_voice_mr_30887755.wav
Transcribed text:  परिस्थिती आहे त्या पेक्षा जासत भयानक वाटू लागते
Reference text: परिस्थिती आहे त्यापेक्षा जास्त भयानक वाटू लागते
WER: 0.42857142857142855
CER: 0.0425531914893617
--------------------------------------
Audio File: common_voice_mr_30897226.wav
Transcribed text:  परन्तु रावणाने लंकेचे राज्य मागितले
Reference text: परंतु रावणाने लंकेचे राज्य मागितले
WER: 0.2
CER: 0.058823529411764705
-

Whisper did not predict an ending timestamp, which can happen if audio is cut off in the middle of a word. Also make sure WhisperTimeStampLogitsProcessor was used during generation.


Audio File: common_voice_mr_30860011.wav
Transcribed text:  आज ही कुंत्या युशुतकार्या अगोध जवरपास सर्वसमाजात पुलदेवते लाप्रस्वन्न वर्ण्या सटी गुंदल भालनाची परंपरा आह�
Reference text: आजही कोणत्याही शुभकार्याअगोदर जवळपास सर्व समाजात कुलदेवतेला प्रसन्न करण्यासाठी गोंधळ घालण्याची परंपरा आहे
WER: 1.0769230769230769
CER: 0.2857142857142857
--------------------------------------
Audio File: common_voice_mr_30773804.wav
Transcribed text:  भर्ती व ओहोटी पुछवी वरिल समुद्रान मधे होनारी भर्ती ओहोटीचे चक्र ये चंद्राज्या गुरुत्वाकर्षना मुले होते।
Reference text: भरती व ओहोटी पृथ्वीवरील समुद्रांमध्ये होणारे भरती ओहोटीचे चक्र हे चंद्राच्या गुरुत्वाकर्षणामुळे होते
WER: 0.9230769230769231
CER: 0.19
--------------------------------------
Audio File: common_voice_mr_30771865.wav
Transcribed text:  चैन्नई ही तामिल नाडू ची राजधानी असुन सरवात मोठे शहरा है।
Reference text: चेन्नई ही तामिळनाडूची राजधानी असून सर्वात मोठे शहर आहे
WER: 0.8888888888888888
CER: 0.18518518518518517
---------------------------------

Whisper did not predict an ending timestamp, which can happen if audio is cut off in the middle of a word. Also make sure WhisperTimeStampLogitsProcessor was used during generation.


Audio File: common_voice_mr_30709390.wav
Transcribed text:  लुनार प्रोस्पेक्टस गुरत्वाकर्षन अभ्यासा मदे काही ठिकानी विवरे नस्ताना सुधा जास्तीचे गुरत्वाकर्षन आडवन आलेले आह
Reference text: लुनार प्रोस्पेक्टर गुरुत्वाकर्षण अभ्यासामध्ये काही ठिकाणी विवरे नसताना सुद्धा जास्तीचे गुरुत्वाकर्षण आढळून आलेले आहे
WER: 0.7142857142857143
CER: 0.14655172413793102
--------------------------------------
Audio File: common_voice_mr_30667673.wav
Transcribed text:  तव्यावर मद्यम आच्छीवर तेल लाउन पोड़े भाजूंगीता
Reference text: तव्यावर मध्यम आचेवर तेल लावून पोळी भाजुन घेतात
WER: 0.75
CER: 0.32608695652173914
--------------------------------------
Audio File: common_voice_mr_30705095.wav
Transcribed text:  जवर जाओन पाहिल्यास शिखरा परिंत नजर्ट परूच शकत नहीं
Reference text: जवळ जाऊन पाहिल्यास शिखरापर्यंत नजर ठरूच शकत नाही
WER: 0.875
CER: 0.20833333333333334
--------------------------------------
Audio File: common_voice_mr_30705359.wav
Transcribed text:  त्यावे त्यांसे वैफ अक्त तेवीस वर्षांसे होते हैं।
Refe

Whisper did not predict an ending timestamp, which can happen if audio is cut off in the middle of a word. Also make sure WhisperTimeStampLogitsProcessor was used during generation.


Audio File: common_voice_mr_30705427.wav
Transcribed text:  పుస్తకే నతురాం గోడ్సే అంచావర్ మరాట్టి ఇంగ్రడీత్ అనేక్ పుస్తకే లేగల
Reference text: पुस्तके नथुराम गोडसे यांच्यावर मराठी इंग्रजीत अनेक पुस्तके लिहिली गेली
WER: 1.0
CER: 0.9285714285714286
--------------------------------------
Audio File: common_voice_mr_30724322.wav
Transcribed text:  Tid kjat ek vihir tjače nazrej spadli.
Reference text: तितक्यात एक विहीर त्याचे नजरेस पडली
WER: 1.1666666666666667
CER: 0.9714285714285714
--------------------------------------
Audio File: common_voice_mr_30724321.wav
Transcribed text:  મારા સરૂર આકારાને સાધારણ વર્તુળાકાર આહીં
Reference text: मानस सरोवर आकाराने साधारण वर्तुळाकार आहे
WER: 1.0
CER: 0.9
--------------------------------------
Audio File: common_voice_mr_30705523.wav
Transcribed text:  गंगा नदीचा उगम भारतातिल उत्तराखंडया राज्यात हिमालाय परवतात हुतो।
Reference text: गंगा नदीचा उगम भारतातील उत्तराखंड या राज्यात हिमालय पर्वतात होतो
WER: 0.6
CER: 0.09375
---------------------------------

Whisper did not predict an ending timestamp, which can happen if audio is cut off in the middle of a word. Also make sure WhisperTimeStampLogitsProcessor was used during generation.


Audio File: common_voice_mr_30709331.wav
Transcribed text:  દ્યુત પ્રસંગાત એકે ઠીકાણી ત્યાને દ્રવ્પદિલા આ�
Reference text: द्यूतप्रसंगात एके ठिकाणी त्याने द्रौपदीला आपली उघडी मांडी दाखवून लज्जित व अपमानित केले होते
WER: 1.0
CER: 0.9340659340659341
--------------------------------------
Audio File: common_voice_mr_30705098.wav
Transcribed text:  भुगुल बारमती तालु का दुशकाली प्रदेशा है।
Reference text: भूगोल बारामती तालुका दुष्काळी प्रदेश आहे
WER: 1.1666666666666667
CER: 0.275
--------------------------------------
Audio File: common_voice_mr_30677284.wav
Transcribed text:  या मुले यानाची कक्षा अधेक लंब वर तुलाकार बनली
Reference text: यामुळे यानाची कक्षा अधिकच लंबवर्तुळाकार बनली
WER: 1.0
CER: 0.1590909090909091
--------------------------------------
Audio File: common_voice_mr_30705579.wav
Transcribed text:  Vă ternă ce trangă dvă veci trăbiri i-i domnului în tăt.
Reference text: व त्यांना चित्रांगद व विचित्रवीर्य ही दोन मुले होतात
WER: 1.2222222222222223
CER: 0.9807692307692307
--------

Whisper did not predict an ending timestamp, which can happen if audio is cut off in the middle of a word. Also make sure WhisperTimeStampLogitsProcessor was used during generation.


Audio File: common_voice_mr_30666478.wav
Transcribed text:  शव्द इतिहास इतिहास महापरियतन पुरस्ती चाप परियतनाचा उदय परियतन मन्जे दैनदीन प्रवास वेक्तिरिक्त कीवा कामा वेक्तिरिक्त के
Reference text: शब्देतिहास इतिहास महापर्यटन फुरसतीच्या पर्यटनाचा उदय पर्यटन म्हणजे दैनंदिन प्रवासाव्यतिरिक्त किंवा कामाव्यतिरिक्त केलेला प्रवास
WER: 1.0714285714285714
CER: 0.3228346456692913
--------------------------------------
Audio File: common_voice_mr_30667696.wav
Transcribed text:  शाकेची सुर्वात भगवात द्वज उभारू तलब प्राराम करू होते।
Reference text: शाखेची सुरुवात भगवा ध्वज उभारून त्याला प्रणाम करून होते
WER: 1.0
CER: 0.23636363636363636
--------------------------------------
Audio File: common_voice_mr_30677272.wav
Transcribed text:  Panchank Festival of Maharashtra Sankalpana Mural Pawar
Reference text: पंचांग फेस्टिव्हल्स ऑफ महाराष्ट्र सकाळ प्रकाशन संकल्पना मृणाल पवार
WER: 1.0
CER: 0.9393939393939394
--------------------------------------
Audio File: common_voice_mr_30728061.wav
Transcribed text:  

Whisper did not predict an ending timestamp, which can happen if audio is cut off in the middle of a word. Also make sure WhisperTimeStampLogitsProcessor was used during generation.


Audio File: common_voice_mr_30709416.wav
Transcribed text:  ਹੈਸ ਆਫ ਰੀ ਪੇਸ਼ਨਟਿਟਿਵਸ ਨੀ ਜੇਫਰਸਨ ਲਾ ਰਾਸ਼ਰਾਧਿਖਸ਼ ਤਰ ਬਰ ਲਾ ਉਪਾਧਿਖਸ਼ ਕੇ
Reference text: हाउस ऑफ रिप्रेझेन्टेटिव्ह्सनी जेफरसनला राष्ट्राध्यक्ष तर बरला उपाध्यक्ष केले
WER: 1.4444444444444444
CER: 0.9078947368421053
--------------------------------------
Audio File: common_voice_mr_30693475.wav
Transcribed text:  कंचन गंगा छीही पूचा केली जाती
Reference text: कांचनगंगाचीही पूजा केली जाते
WER: 1.25
CER: 0.21428571428571427
--------------------------------------
Audio File: common_voice_mr_30737785.wav
Transcribed text:  ये थे नोंदवले गेलेले निउन तम तापमान एवडे आहे तर नोंदवले गेलेले अधिकम तापमान आहे।
Reference text: येथे नोंदवले गेलेले न्यूनतम तापमान एवढे आहे तर नोंदवले गेलेले अधिकतम तापमान आहे
WER: 0.5384615384615384
CER: 0.10126582278481013
--------------------------------------
Audio File: common_voice_mr_30709226.wav
Transcribed text:  उत्पादन अभियांतरी की रिकामी पाने
Reference text: उत्पादन अभियांत्रिकी रिकामी पाने
WER: 0.5
CER: 0.09

Whisper did not predict an ending timestamp, which can happen if audio is cut off in the middle of a word. Also make sure WhisperTimeStampLogitsProcessor was used during generation.


Audio File: common_voice_mr_30716311.wav
Transcribed text:  यादावादावादावादावादावादावादावादावादावादावादावादावादावादावादावादावादावादावादावादावाद
Reference text: हे चक्र अनंत काळापासून सतत चालू आहे आणि पुढे अनंत काळापर्यंत चालूच राहील
WER: 1.0
CER: 1.0416666666666667
--------------------------------------
Audio File: common_voice_mr_30705424.wav
Transcribed text:  ನರಯಂದಾಜಿ ನರಯಂದಾಜಿ ಲಾಣೆ
Reference text: नारायण दाजी नारायण दाजी लाड
WER: 1.0
CER: 0.9629629629629629
--------------------------------------
Audio File: common_voice_mr_30683303.wav
Transcribed text:  केसरी वृत्तपत्र आण इतर विशायन वरे लेखान साथी केसरी निशंदी यी करण पहा
Reference text: केसरी वृत्तपत्र आणि इतर विषयांवरील लेखांसाठी केसरी निसंदिग्धीकरण पहा
WER: 0.8888888888888888
CER: 0.23529411764705882
--------------------------------------
Audio File: common_voice_mr_30724317.wav
Transcribed text:  मिथिला नरेश राजर श्री जनक व अश्ठावक्र येंचातिल सववाद असेय गणीतेचे स्वरुक आएं।
Reference text: मिथिला नरेश राजर्षी जनक व अष्टावक्र यांच

Whisper did not predict an ending timestamp, which can happen if audio is cut off in the middle of a word. Also make sure WhisperTimeStampLogitsProcessor was used during generation.


Audio File: common_voice_mr_30705141.wav
Transcribed text:  ગેઓન ગેલી તરી આપલે એખાદે નાતેવાયકાલા અગુદર પઈસે
Reference text: घेऊन गेले तरी आपल्या एखाद्या नातेवाईकाला अगोदर पैसे देऊन ठेवून त्याला
WER: 1.0
CER: 0.8985507246376812
--------------------------------------
Audio File: common_voice_mr_30677352.wav
Transcribed text:  नंतर चा काला तेल संस्कृत काव्यां चा चंद रचना शैली वर रामायानाचा काला प्रभाव दिसुन येतो।
Reference text: नंतरच्या काळातील संस्कृत काव्यांच्या छंद रचनाशैलीवर रामायणाचा गाढा प्रभाव दिसून येतो
WER: 1.2727272727272727
CER: 0.21428571428571427
--------------------------------------
Audio File: common_voice_mr_30705397.wav
Transcribed text:  त्या विरोधात मुंबई तेल प्राधी करना कड़े अपील
Reference text: त्याविरोधात मुंबईतील प्राधिकरणाकडे अपील
WER: 1.75
CER: 0.20512820512820512
--------------------------------------
Audio File: common_voice_mr_30693477.wav
Transcribed text:  लेक प्रकाशित कराइचा आधी जा पानावर मुताथ त्याच पानावर जाल।
Reference text: लेख प्रकाशित करायच्या आधी ज्

Whisper did not predict an ending timestamp, which can happen if audio is cut off in the middle of a word. Also make sure WhisperTimeStampLogitsProcessor was used during generation.


Audio File: common_voice_mr_30737803.wav
Transcribed text:  पोशन मुल्य लोणी विरहीत ग्र तालुकाचे पोशन मुल्य महराश्टातिल खाद्य पदार्त दुग्द जन्य पदार्त लोणाचे हा महराश्टाति
Reference text: पोषणमूल्य लोणी विरहित ग्रॅ ताकाचे पोषणमूल्य महाराष्ट्रातील खाद्यपदार्थ दुग्धजन्य पदार्थलोणचे हा महाराष्ट्रातील खाद्यपदार्थ आहे
WER: 1.1428571428571428
CER: 0.36507936507936506
--------------------------------------


Whisper did not predict an ending timestamp, which can happen if audio is cut off in the middle of a word. Also make sure WhisperTimeStampLogitsProcessor was used during generation.


Audio File: common_voice_mr_30677264.wav
Transcribed text:  नयसर्गेक सवरक्षन खारफुटीची वरिव प्रवाल पेटे नयसर्गेक रित्यासुना मीचा तड़ाक्यां पल्पसुन बुरोकुष्टाचे सवरक
Reference text: नैसर्गिक संरक्षण खारफुटीची वने व प्रवाळ बेटे नैसर्गिकरित्या त्सुनामीच्या तडाख्यांपासून भूपृष्ठाचे संरक्षण करतात
WER: 0.9230769230769231
CER: 0.3783783783783784
--------------------------------------
Audio File: common_voice_mr_30709225.wav
Transcribed text:  द्रुतराश्र या जन्मताच नेत्रहीन हसल्याने तेला हस्तिनापूर्चे राज्य मिलु शकले नहीं।
Reference text: धृतराष्ट्र हा जन्मत चा नेत्रहीन असल्याने त्याला हस्तिनापूरचे राज्य मिळू शकले नाही
WER: 0.75
CER: 0.24691358024691357
--------------------------------------
Audio File: common_voice_mr_30677351.wav
Transcribed text:  जला सौंधारन घर्नांचे मोटे प्रकल्प वनुं त्या वर आदरे सिंचन करुं पान्याचे सप्रेशना सोडवला जातू
Reference text: जलसंधारण धरणांचे मोठे प्रकल्प बनवून त्यावर अधारीत सिंचन करून पाण्याचा प्रश्न सोडवला जातो
WER: 0.9230769230769231
CER: 0.3068181818181818
-

Whisper did not predict an ending timestamp, which can happen if audio is cut off in the middle of a word. Also make sure WhisperTimeStampLogitsProcessor was used during generation.


Audio File: common_voice_mr_30705396.wav
Transcribed text:  તે આય્કુન તસે હોયેલ તર ફારત સાંગલી હોયેલ અસે નાથ�
Reference text: ते ऐकून तसे होईल तर फारच चांगले होईल असे नाथाने उत्तर दिले
WER: 1.0
CER: 0.8793103448275862
--------------------------------------
Audio File: common_voice_mr_30677328.wav
Transcribed text:  रहस्या कतान मुएहते सुपर्ची ताहित।
Reference text: रहस्यकथांमुळे ते सुपरिचित आहेत
WER: 1.25
CER: 0.5
--------------------------------------
Audio File: common_voice_mr_30709229.wav
Transcribed text:  कर्नाटक राज्जाच्या इतिहासा प्रमाने मध्ययुगिन कर्नाटकाथ अनेक शक्तिशाली सामराजे होँ गेली।
Reference text: कर्नाटक राज्याचा इतिहासाप्रमाणे मध्ययुगीन कर्नाटकात अनेक शक्तिशाली साम्राज्ये होऊन गेली
WER: 0.8
CER: 0.14942528735632185
--------------------------------------
Audio File: common_voice_mr_30677324.wav
Transcribed text:  रावनाच्य संनिकाने तेला पुक्रुण रावना सुमूर उबे केलिव तेला चे शेप्टीला आगलवणी।
Reference text: रावणाच्या सैनिकांनी त्याला पकडून रावणासमोर उभे केले व त्याच्या शे

Whisper did not predict an ending timestamp, which can happen if audio is cut off in the middle of a word. Also make sure WhisperTimeStampLogitsProcessor was used during generation.


Audio File: common_voice_mr_30693648.wav
Transcribed text:  काहींच्या मत तेया घटने पासों ग्राह्मनांच्या राशाची शुरुवाच जाली, तर काहींच्या नी एकलव्याला वर्ण वेवस्तेचा बवी ठर
Reference text: काहींच्या मते या घटनेपासून ब्राम्हणांच्या ऱ्हासाची सुरवात झाली तर काहींनी एकलव्याला वर्णव्यवस्थेचा बळी ठरवले
WER: 1.0
CER: 0.2962962962962963
--------------------------------------
Audio File: common_voice_mr_30767328.wav
Transcribed text:  ಮಿಶಿಗಣ್ ಮಲ್ಲ ತಿಕ್ಷನ ಹರ್ಷೇಲ್ ಆಣಿ ಆಸ್ಟೆಂ ಸಿ ಮಾರ್ಗದರ್ಶಕ್
Reference text: मिशिगन मला तीक्ष्ण हर्शेल आणि ऑस्टिन सी मार्गदर्शक
WER: 1.0
CER: 0.94
--------------------------------------
Audio File: common_voice_mr_30709268.wav
Transcribed text:  चेन्नाई मदिल भुजलाचे साथे दिउसें दिवस खारे होता है।
Reference text: चेन्नईमधील भुजलाचे साठे दिवसेंदिवस खारे होत आहेत
WER: 1.0
CER: 0.22916666666666666
--------------------------------------
Audio File: common_voice_mr_30709029.wav
Transcribed text:  समझा संस्थेत अनेक संगनक व इतर यंत्रे आहित।
Reference text: समजा संस्थेत अनेक संगण

Whisper did not predict an ending timestamp, which can happen if audio is cut off in the middle of a word. Also make sure WhisperTimeStampLogitsProcessor was used during generation.


Audio File: common_voice_mr_30709265.wav
Transcribed text:  યા પયીકી મુખ્ય મન્જે પ્લુટો પેક્ષા આકારાને મોઠ�
Reference text: यापैकी मुख्य म्हणजे प्लूटोपेक्षा आकाराने मोठा असणारा एरिस
WER: 1.0
CER: 0.8947368421052632
--------------------------------------
Audio File: common_voice_mr_30698865.wav
Transcribed text:  क्रिष्टियन धर्म फारस थोड़या प्रमानात आहे।
Reference text: ख्रिश्चन धर्म फारच थोड्या प्रमाणात आहे
WER: 0.8333333333333334
CER: 0.23684210526315788
--------------------------------------
Audio File: common_voice_mr_30709498.wav
Transcribed text:  या लेनित गाभारा नहीं तसेच कुछल्याही प्रकारची मूर्ती अथवा प्रतिमा नहीं।
Reference text: या लेणीत गाभारा नाही तसेच कुठल्याही प्रकारची मूर्ती अथवा प्रतिमा नाही
WER: 0.36363636363636365
CER: 0.11594202898550725
--------------------------------------
Audio File: common_voice_mr_30728152.wav
Transcribed text:  येथे पड़न्यारा पाउसाचे प्रमाण अत्यलपा है।
Reference text: येथे पडणाऱ्या पावसाचे प्रमाण अत्यल्प आहे
WER: 0.6666666666666666
CER: 0.275
-

Whisper did not predict an ending timestamp, which can happen if audio is cut off in the middle of a word. Also make sure WhisperTimeStampLogitsProcessor was used during generation.


Audio File: common_voice_mr_30641413.wav
Transcribed text:  मुगलानी भारतीय स्थापत्या मधे परिवर्तन आनलेव आच्छा भारतीय स्थापत्याची उलक प्रमुख्याने मुगली स्थापत्या वरुन होते।
Reference text: मोगलांनी भारतीय स्थापत्यामध्ये परिवर्तन आणले व आजच्या भारतीय स्थापत्याची ओळख प्रामुख्याने मुघली स्थापत्यावरुन होते
WER: 0.8571428571428571
CER: 0.14035087719298245
--------------------------------------
Audio File: common_voice_mr_30627602.wav
Transcribed text:  पाण्डवान्ना हे समझ ताट्स त्याननी दूर अंतरावर गेलेलाय जयद्रथाला गाठले आणि त्याचाशे लड़ाई केले।
Reference text: पांडवांना हे समजताच त्यांनी दूर अंतरावर गेलेल्या जयद्रथाला गाठले आणि त्याच्याशी लढाई केली
WER: 0.6153846153846154
CER: 0.21348314606741572
--------------------------------------
Audio File: common_voice_mr_30630374.wav
Transcribed text:  আশ্যিন মহিনেত এনারি পুর্নিমাহি কোজাগ্রি পুর্নিমাস্তে।
Reference text: आश्विन महिन्यात येणारी पौर्णिमा ही कोजागरी पौर्णिमा असते
WER: 1.0
CER: 0.9285714285714286
--------------------------------------
Au

Whisper did not predict an ending timestamp, which can happen if audio is cut off in the middle of a word. Also make sure WhisperTimeStampLogitsProcessor was used during generation.


Audio File: common_voice_mr_30633844.wav
Transcribed text:  महराष्ट अतिल खद्य पदार्त काकडी, कांदाद, एही, टोमाटो, कुतिंबीर्याच्य मिश्रणास ताक आ दुग्द जन्य खद्य पदार्त आहे।
Reference text: महाराष्ट्रातील खाद्यपदार्थकाकडी कांदा दही टोमॅटो कोथिंबीर यांच्या मिश्रणास ताक ताक हा दुग्धजन्य खाद्यपदार्थ आहे
WER: 1.0714285714285714
CER: 0.2972972972972973
--------------------------------------
Audio File: common_voice_mr_30629421.wav
Transcribed text:  मनुष्य वधाचा खटला दोशी सिद्ध जाला मोले त्याने सोमसा सदस्यत्वाचा राजिनामा दिला।
Reference text: मनुष्यवधाच्या खटल्यात दोषी सिद्ध झाल्यामुळे त्याने संसदसदस्यत्वाचा राजीनामा दिला
WER: 1.1111111111111112
CER: 0.2375
--------------------------------------
Audio File: common_voice_mr_30628611.wav
Transcribed text:  गंगा, यमुना, रामगंगा ये थील प्रमुख नद्या है
Reference text: गंगा यमुना रामगंगा येथील प्रमुख नद्या आहेत
WER: 0.7142857142857143
CER: 0.14285714285714285
--------------------------------------
Audio File: common_voice_mr_30633883.wav
Transcribed

Whisper did not predict an ending timestamp, which can happen if audio is cut off in the middle of a word. Also make sure WhisperTimeStampLogitsProcessor was used during generation.


Audio File: common_voice_mr_30633848.wav
Transcribed text:  અમેરીકન સેન્ય ઇરાપ માંરે બરીસ વર્ષે રહીલે અને ત્�
Reference text: अमेरिकन सैन्य इराकमध्ये बरीच वर्षे राहिले आणि त्यामुळे तेथे आतंकवाद बळावला
WER: 1.0
CER: 0.9054054054054054
--------------------------------------
Audio File: common_voice_mr_30627630.wav
Transcribed text:  लखनम यह उत्तर प्रदेशाचे राजधाने तर कानपुर्थे सर्वात मोठे शहर आहे।
Reference text: लखनौ ही उत्तर प्रदेशाची राजधानी तर कानपूर हे सर्वात मोठे शहर आहे
WER: 0.5833333333333334
CER: 0.140625
--------------------------------------
Audio File: common_voice_mr_30662364.wav
Transcribed text:  ग्रंथाले विद्यापीटा चे स्वतंत्र ग्रंथाले असुन् त्याला जवाहारलाल नेरु ग्रंथाले असे नावा है।
Reference text: ग्रंथालय विद्यापीठाचे स्वतंत्र ग्रंथालय असून त्याला जवाहरलाल नेहरू ग्रंथालय असे नाव आहे
WER: 0.8333333333333334
CER: 0.16091954022988506
--------------------------------------
Audio File: common_voice_mr_30629420.wav
Transcribed text:  वरांडातिल स्तंभांची रचनाच उकोणी आहे।
Ref

Whisper did not predict an ending timestamp, which can happen if audio is cut off in the middle of a word. Also make sure WhisperTimeStampLogitsProcessor was used during generation.


Audio File: common_voice_mr_30630487.wav
Transcribed text:  બ્રીટિશાન ચાગમોના મધે અનેગ રચપુત સંસ્તાનાની બ્ર�
Reference text: ब्रिटिशांच्या आगमनामध्ये अनेक रजपूत संस्थांनानी ब्रिटिशांशी समझोत्याचे राजकारण केले
WER: 1.0
CER: 0.927710843373494
--------------------------------------
Audio File: common_voice_mr_30641292.wav
Transcribed text:  कारण पुर्थवी वरुं पान्याची वहातुक करने अतीशाय किचकट वम महागडे काम हैं।
Reference text: कारण पृथ्वीवरून पाण्याची वाहतूक करणे अतिशय किचकट व महागडे काम आहे
WER: 0.7272727272727273
CER: 0.27692307692307694
--------------------------------------
Audio File: common_voice_mr_30628463.wav
Transcribed text:  पण गांधीन ने बगस्यवाचा कृतिला अनुचित रुँजब कार्यवाही वनिध हस्तक शेपास नकाय दिला।
Reference text: पण गांधीनी भगतसिंहाच्या कृतीला अनुचित हिंसक कार्यवाही म्हणून हस्तक्षेपास नकार दिला
WER: 0.9090909090909091
CER: 0.3170731707317073
--------------------------------------
Audio File: common_voice_mr_30625671.wav
Transcribed text:  जुने वैर विसरून जैललितांच्या अभा

Whisper did not predict an ending timestamp, which can happen if audio is cut off in the middle of a word. Also make sure WhisperTimeStampLogitsProcessor was used during generation.


Audio File: common_voice_mr_30629892.wav
Transcribed text:  શીવાજી મહારાજાન છે ભોસ્લેલ ઘરેને છે નૂળ ગાવ વેર�
Reference text: शिवाजी महाराजांचे भोसले घराण्याचे मूळ गाव वेरूळ आहे
WER: 1.125
CER: 0.9215686274509803
--------------------------------------
Audio File: common_voice_mr_30629191.wav
Transcribed text:  सद्याचा हिंगोली जिल्यतित नरसी बामनी ये चंतनाम दिवांचे चन्मगाव होई।
Reference text: सध्याच्या हिंगोली जिल्ह्यातील नरसी बामणी हे संत नामदेवांचे जन्म गाव होय
WER: 0.8181818181818182
CER: 0.2535211267605634
--------------------------------------
Audio File: common_voice_mr_30641414.wav
Transcribed text:  वहावनी वा अदेलशाही स्थापत्याची सुनुक उत्तर करनाटकातिल शहरान मध्ये पहवयास मिलते हैं।
Reference text: बहामनी व आदिलशाही स्थापत्याची चुणूक उत्तर कर्नाटकातील शहरांमध्ये पहावयास मिळते
WER: 1.0
CER: 0.24358974358974358
--------------------------------------


Whisper did not predict an ending timestamp, which can happen if audio is cut off in the middle of a word. Also make sure WhisperTimeStampLogitsProcessor was used during generation.


Audio File: common_voice_mr_30628467.wav
Transcribed text:  પૂરાતત્વશાસ્ત્રીયાં પૂરાવ્યાનું સારીલેની દોન 
Reference text: पुरातत्त्वशास्त्रीय पुराव्यानुसार ही लेणी दोन वेगवेगळ्या कालखंडात निर्माण केली गेली
WER: 1.0
CER: 0.963855421686747
--------------------------------------
Audio File: common_voice_mr_30628465.wav
Transcribed text:  जट्किन्नी अपला राजोगिया कारोकिर दीचु सुरुवाद जबखंडी नगरपाली के पासं केल।
Reference text: जत्तींनी आपल्या राजकीय कारकीर्दीची सुरुवात जमखंडी नगरपालिकेपासून केली
WER: 1.375
CER: 0.34782608695652173
--------------------------------------
Audio File: common_voice_mr_30627629.wav
Transcribed text:  तो वस्यदेव वदेव की अनसापुत्र
Reference text: तो वसुदेव व देवकी यांचा पुत्र
WER: 0.8333333333333334
CER: 0.3103448275862069
--------------------------------------
Audio File: common_voice_mr_30629740.wav
Transcribed text:  या बरोबरज बारिक कोरिव काम वो चीत्रे ही या लेनेंची वैशिष्टे आहित।
Reference text: याबरोबरच बारीक कोरीव काम व चित्रे ही या लेण्यांची वैशिष्ट्ये आहेत


Whisper did not predict an ending timestamp, which can happen if audio is cut off in the middle of a word. Also make sure WhisperTimeStampLogitsProcessor was used during generation.


Audio File: common_voice_mr_30629602.wav
Transcribed text:  દુર્વાસ રુશિનની અંવરીશ રાજાને અની સર્વાની તન્ન વં
Reference text: दुर्वास ऋषींनी अंबरीष राजाने आणि सर्वांनी त्यांना वंदन केले
WER: 1.0
CER: 0.8983050847457628
--------------------------------------
Audio File: common_voice_mr_30627550.wav
Transcribed text:  पर्न मच्चिंद्राच्या हातातेल मुलाच पहाताच त्यालाही भीजी वाटली।
Reference text: पण मच्छिंद्राच्या हातातील मुलास पाहताच त्यालाहि भीति वाटली
WER: 1.0
CER: 0.20689655172413793
--------------------------------------
Audio File: common_voice_mr_30633811.wav
Transcribed text:  तसस पॉल डिरेक यांचे मार्गधर्शना खाली गनीताचा अभ्यासा ही करीत रहीले।
Reference text: तसेच पॉल डिरॅक यांच्या मार्गदर्शनाखाली गणिताचा अभ्यासही करीत राहिले
WER: 1.0
CER: 0.22388059701492538
--------------------------------------
Audio File: common_voice_mr_30627570.wav
Transcribed text:  तीने पहले साथ पुत्रा मारल्या नंतर शंतनूच्या विनंती वरूल आठ्रा पुत्राला जीवन दान दिले।
Reference text: तिने पहिले सात पुत्र मारल

Whisper did not predict an ending timestamp, which can happen if audio is cut off in the middle of a word. Also make sure WhisperTimeStampLogitsProcessor was used during generation.


Audio File: common_voice_mr_30629512.wav
Transcribed text:  કન્ણળ ભાશે ધુક્યાલા મંજુ મનત સ્લેને ગુરુ ગોરક્ષ
Reference text: कन्नड भाषेत धुक्याला मंजू म्हणत असल्याने गुरू गोरक्षनाथांना मंजूनाथ असेही म्हणतात
WER: 1.0
CER: 0.9135802469135802
--------------------------------------
Audio File: common_voice_mr_30647901.wav
Transcribed text:  স্রেক্রুষ্ণা আননেদানে অজ্ঞালা মিথিমার্তো
Reference text: श्रीकृष्ण आनंदाने अर्जुनाला मिठी मारतो
WER: 1.0
CER: 1.0263157894736843
--------------------------------------
Audio File: common_voice_mr_30629249.wav
Transcribed text:  तसेच या भागातील जन्मान साथ असलेला पशुपक्षान विशयी असलेला आसते मुरे वन्ने जीवन सहच पहावयास मिरते।
Reference text: तसेच या भागातील जनमानसांत असलेल्या पशुपक्ष्यांविषयी असलेल्या आस्थेमुळे वन्यजीवन सहज पहावयास मिळते
WER: 1.0
CER: 0.23711340206185566
--------------------------------------
Audio File: common_voice_mr_30629615.wav
Transcribed text:  नंतर ब्राम्भणाचा वेशात आलेला अर्जुनाने ओपन ज्रिंकला।
Reference text: नंतर ब्राह्मणाच्या वे

Whisper did not predict an ending timestamp, which can happen if audio is cut off in the middle of a word. Also make sure WhisperTimeStampLogitsProcessor was used during generation.


Audio File: common_voice_mr_30630298.wav
Transcribed text:  ਖੋਲੇ ਕੋਨੀਆਕ ਵਾ ਕੀਤੋਬੀ ਜੀਮੋਮੀ ਯਾ ਦੋਨ ਨੇਤੇਆਨ ਮਧੀਲ ਸਪਰਦੇ ਮੁਏ ਹ�
Reference text: खोले कोनयाक व कितोवी झिमोमी या दोन नेत्यांमधील स्पर्धेमुळे ही केके संघटना जन्माला आली
WER: 1.0
CER: 0.8823529411764706
--------------------------------------
Audio File: common_voice_mr_30633814.wav
Transcribed text:  रूफ ये पोलन देशा चा उत्तर भागाते बाल्टेक समुद्र किनार्या वर वसलेले पोलन चे एक महुप्रमुक शहर आही।
Reference text: रुफ हे पोलंड देशाच्या उत्तर भागातील बाल्टिक समुद्रकिनाऱ्यावर वसलेले पोलंडचे एक प्रमुख शहर आहे
WER: 1.0
CER: 0.22580645161290322
--------------------------------------
Audio File: common_voice_mr_30633842.wav
Transcribed text:  रंजन व प्रभूदन करत अस्थ पतीत सुमाजाला त्याने सद्मार्गावर आंडले माराश्ट्राच पुर्शार्थ राजागवीला।
Reference text: रंजन व प्रबोधन करत अध पतित समाजाला त्यांनी सन्मार्गावर आणले महाराष्ट्राचा पुरुषार्थ जागविला
WER: 0.7692307692307693
CER: 0.24175824175824176
--------------------------------------
Audio File: c

Whisper did not predict an ending timestamp, which can happen if audio is cut off in the middle of a word. Also make sure WhisperTimeStampLogitsProcessor was used during generation.


Audio File: common_voice_mr_30610967.wav
Transcribed text:  દેશો દેશી જે રાજે હરલે બં રામાને માત્ર એ આવાન પે�
Reference text: देशोदेशीचे राजे हरले पण रामाने मात्र हे आव्हान पेलले व सीतेने रामाला वरमाला घातली
WER: 1.0
CER: 0.8765432098765432
--------------------------------------
Audio File: common_voice_mr_30478808.wav
Transcribed text:  प्लास्टर लावलेल्या हातान नी तानी प्रमान पत्र आनी सुवर्ण बदक घेतले
Reference text: प्लास्टर लावलेल्या हातांनी त्यांनी प्रमाणपत्र आणि सुवर्णपदक घेतले
WER: 1.0
CER: 0.16923076923076924
--------------------------------------
Audio File: common_voice_mr_30623454.wav
Transcribed text:  पुर्वी चा काला त्रिकामा वेल सत्कार ने लागावा मने या भवुदां गुरवारी भजन करने चे पद्बत उती।
Reference text: पूर्वीच्या काळात रिकामा वेळ सत्कारणी लागावा म्हणून किंवा बहुधा गुरुवारी भजन करण्याची पद्धत होती
WER: 1.0714285714285714
CER: 0.35789473684210527
--------------------------------------
Audio File: common_voice_mr_30615383.wav
Transcribed text:  کھٹسڑی پچھنا سوپی وہ پوٹالہ ہ

Whisper did not predict an ending timestamp, which can happen if audio is cut off in the middle of a word. Also make sure WhisperTimeStampLogitsProcessor was used during generation.


Audio File: common_voice_mr_30625504.wav
Transcribed text:  मात्र कुंती चा तोंदोन अनवधानाने निगालेले शब्दान मुले द्रावपतीला अरुजुना सोबत इत्ता चार पांडवानना देखिल वरावे ल
Reference text: मात्र कुंतीच्या तोंडून अनवधानाने निघालेल्या शब्दांमुळे द्रौपदीला अर्जुनासोबत इतर चार पांडवांनादेखील वरावे लागले
WER: 1.0
CER: 0.24324324324324326
--------------------------------------
Audio File: common_voice_mr_30544778.wav
Transcribed text:  मग पान्याने कनीक आशा प्रकारे बिजवावी कि तजा तव्या वर गोला थापता आला पहले जाये।
Reference text: मग पाण्याने कणीक अशा प्रकारे भिजवावी की त्याचा तव्यावर गोळा थापता आला पाहिजे
WER: 0.8461538461538461
CER: 0.23684210526315788
--------------------------------------
Audio File: common_voice_mr_30617104.wav
Transcribed text:  कर्डेंचा संबंद पुनल उत्पत्ती शी आहे
Reference text: कवड्यांचा संबंध पुनरुत्पत्तीशी आहे
WER: 1.25
CER: 0.2647058823529412
--------------------------------------
Audio File: common_voice_mr_30584756.wav
Transcribed text:  खास करुण शिवाजी महाराजाने स्

Whisper did not predict an ending timestamp, which can happen if audio is cut off in the middle of a word. Also make sure WhisperTimeStampLogitsProcessor was used during generation.


Audio File: common_voice_mr_30567674.wav
Transcribed text:  આવેગ્વ વિરોધાભાસ યુક્ત આસે ગ્રામીન બંગાલાચે સ�
Reference text: आवेग व विरोधाभासयुक्त असे ग्रामीण बंगालचे सुरेख चित्र यात रवींद्रनाथांनी रेखाटले आहे
WER: 1.0
CER: 0.9285714285714286
--------------------------------------
Audio File: common_voice_mr_30478527.wav
Transcribed text:  यह धरणाच बांद कामाने ते बांदला गेलाचा वेलेचे आश्यातित सर्वात मूठे सरोवर निर्मान जाले।
Reference text: या धरणाचे बांधकामाने ते बांधल्या गेल्याच्या वेळचे आशियातील सर्वात मोठे सरोवर निर्माण झाले
WER: 0.8461538461538461
CER: 0.2247191011235955
--------------------------------------
Audio File: common_voice_mr_30620924.wav
Transcribed text:  भारताची सर्वादिक इर्वईने नकलेले राज्य मनुं केवलचा उल्लेक होतू।
Reference text: भारताचे सर्वाधिक हिरवाईने नटलेले राज्य म्हणून केरळचा उल्लेख होतो
WER: 0.8888888888888888
CER: 0.265625
--------------------------------------


Whisper did not predict an ending timestamp, which can happen if audio is cut off in the middle of a word. Also make sure WhisperTimeStampLogitsProcessor was used during generation.


Audio File: common_voice_mr_30623380.wav
Transcribed text:  તસેજ ગુણી તા કે પરીભ્રામ ઉશર છાયાં છેત્રકાર આની
Reference text: तसेच गो नी दा हे परिभ्रामक कुशल छायाचित्रकार आणि दुर्गप्रेमीसुद्धा होते
WER: 1.0
CER: 0.8873239436619719
--------------------------------------
Audio File: common_voice_mr_30478770.wav
Transcribed text:  त्या वेले तीचे तीन प्रवाह जाले।
Reference text: त्या वेळी तिचे तीन प्रवाह झाले
WER: 0.5
CER: 0.16666666666666666
--------------------------------------
Audio File: common_voice_mr_30478528.wav
Transcribed text:  Asam Radyat, Teviz Ciliye Ahit
Reference text: आसाम राज्यात तेवीस जिल्हे आहेत
WER: 1.0
CER: 0.8666666666666667
--------------------------------------
Audio File: common_voice_mr_30623421.wav
Transcribed text:  राजस्ताम मदे प्रामुक्याने शुशक वातावन्नाला सरावनारे वन्य जियो दिसुनियता।
Reference text: राजस्थानमध्ये प्रामुख्याने शुष्क वातावरणाला सरावणारे वन्यजीव दिसून येतात
WER: 1.125
CER: 0.2777777777777778
--------------------------------------
Audio File: co

Whisper did not predict an ending timestamp, which can happen if audio is cut off in the middle of a word. Also make sure WhisperTimeStampLogitsProcessor was used during generation.


Audio File: common_voice_mr_30605572.wav
Transcribed text:  ત્યાનપેકી કહી રચના ભીમસેન જોશી અન્ય અને ગાયકને ગા�
Reference text: त्यांपैकी काही रचना भीमसेन जोशी आणि अन्य अनेक गायकांनी गाऊन अजरामर केल्या आहेत
WER: 1.0
CER: 0.8974358974358975
--------------------------------------
Audio File: common_voice_mr_30623419.wav
Transcribed text:  विदर्भातील महत्वाचा शैशनिक दुरुष्ट्या प्रगतिशी जिल्ला मनु उयकिला जातुना।
Reference text: विदर्भातील महत्वाचा शैक्षणिकदृष्ट्या प्रगतिशील जिल्हा म्हणून ओळखल्या जातो
WER: 0.875
CER: 0.3424657534246575
--------------------------------------
Audio File: common_voice_mr_30625506.wav
Transcribed text:  चेन्नई संगमम या नावाने उलकला जानारा कलाम महोचव प्रतिक जानेवारी मधे चेन्नई मधे आयोजित होतो।
Reference text: चेन्नई संगमम् या नावाने ओळखला जाणारा कलामहोत्सव प्रत्येक जानेवारीमध्ये चेन्नईमध्ये आयोजित होतो
WER: 0.9166666666666666
CER: 0.2127659574468085
--------------------------------------
Audio File: common_voice_mr_30617119.wav
Transcribed text:  भारतात प्राथमिक 

Whisper did not predict an ending timestamp, which can happen if audio is cut off in the middle of a word. Also make sure WhisperTimeStampLogitsProcessor was used during generation.


Audio File: common_voice_mr_30620895.wav
Transcribed text:  ગંગા નદીલા પવિત્ર માંલ્યામાઈ અનેક કવીને ગંગેચી �
Reference text: गंगा नदीला पवित्र मानल्यामुळे अनेक कवींनी गंगेची स्तुती किंवा प्रार्थना करणारी काव्ये लिहिली आहेत
WER: 1.0
CER: 0.9278350515463918
--------------------------------------
Audio File: common_voice_mr_30586200.wav
Transcribed text:  संपूर्ण महाबारत विश्वास भिले
Reference text: संपूर्ण महाभारत विश्वास भिडे
WER: 0.5
CER: 0.07142857142857142
--------------------------------------
Audio File: common_voice_mr_30478631.wav
Transcribed text:  श्री कुरुष्ण बल्राम हे वासु देवाजे पुत्र परंतु सावत्र भाव होते।
Reference text: श्रीकृष्ण बलराम हे वासुदेवाचे पुत्र परंतु सावत्र भाऊ होते
WER: 0.7777777777777778
CER: 0.15789473684210525
--------------------------------------
Audio File: common_voice_mr_30625518.wav
Transcribed text:  पटाटे वड़ा हा तेला तल लेला खाद्य पदार्त अस्तो।
Reference text: बटाटेवडा हा तेलात तळलेला खाद्यपदर्थ असतो
WER: 1.3333333333333333
CER: 0.275
-------------

Whisper did not predict an ending timestamp, which can happen if audio is cut off in the middle of a word. Also make sure WhisperTimeStampLogitsProcessor was used during generation.


Audio File: common_voice_mr_30610954.wav
Transcribed text:  પ્રત્તેગ વસ્તું હી એકા લંબ વર્તુળાકાર કક્ષે ફી
Reference text: प्रत्येक वस्तू ही एका लंबवर्तुळाकार कक्षेत फिरते त्या कक्षेच्या एका केंद्रस्थानी सूर्य असतो
WER: 1.0
CER: 0.9230769230769231
--------------------------------------
Audio File: common_voice_mr_30486068.wav
Transcribed text:  માક તો રડુ લાગલા
Reference text: मग तो रडू लागला
WER: 1.0
CER: 0.8666666666666667
--------------------------------------
Audio File: common_voice_mr_30585415.wav
Transcribed text:  त्याच्या जोल्या भावाचे ना कुष असे होते।
Reference text: त्याच्या जुळ्या भावाचे नाव कुश असे होते
WER: 0.5714285714285714
CER: 0.1282051282051282
--------------------------------------
Audio File: common_voice_mr_30544782.wav
Transcribed text:  वय साहा ति चवदा वर्षा परंद प्राथमिक शिक्षन कालवधी मानला जातो।
Reference text: वय सहा ते चौदा वर्षापर्यंत प्राथमिक शिक्षण कालावधी मानला जातो
WER: 0.8
CER: 0.16393442622950818
--------------------------------------
Audio File: comm

Whisper did not predict an ending timestamp, which can happen if audio is cut off in the middle of a word. Also make sure WhisperTimeStampLogitsProcessor was used during generation.


Audio File: common_voice_mr_30623417.wav
Transcribed text:  ඒක්නේ දින්ටියි දුලාලාලා කිරීම ගන්නේ ගන්නේ ගන්නේ ගන්නේ ගන්නේ ගන්නේ ගන්නේ ග�
Reference text: एकनाथांनी देवगिरी दौलताबाद च्या जनार्दनस्वामींना त्यांनी गुरू मानले
WER: 1.5
CER: 1.0597014925373134
--------------------------------------
Audio File: common_voice_mr_30625503.wav
Transcribed text:  माग शुद्ध द्वाधशीला भीश्म द्वाधशी मटले साते।
Reference text: माघ शुद्ध द्वादशीला भीष्मद्वादशी म्हटले जाते
WER: 1.0
CER: 0.20454545454545456
--------------------------------------
Audio File: common_voice_mr_30586517.wav
Transcribed text:  तो सर्वान वर प्रेम करी।
Reference text: तो सर्वावर प्रेम करी
WER: 0.75
CER: 0.15
--------------------------------------
Audio File: common_voice_mr_30587603.wav
Transcribed text:  त्याना गोंधडास येनेचे आवाहन करतात।
Reference text: त्यांना गोंधळास येण्याचे आवाहन करतात
WER: 0.8
CER: 0.19444444444444445
--------------------------------------
Audio File: common_voice_mr_30564309.wav
Transcribed text:  वाहतुक कर

Whisper did not predict an ending timestamp, which can happen if audio is cut off in the middle of a word. Also make sure WhisperTimeStampLogitsProcessor was used during generation.


Audio File: common_voice_mr_30610970.wav
Transcribed text:  ભુકમપાંપાંછી તીવરતા માપ્નેચે એક વેગવે ઓગર્ણિત
Reference text: भूकंपाची तीव्रता मापण्याचे एक वेगळे अ गणिती स्केल आहे
WER: 1.0
CER: 0.9245283018867925
--------------------------------------
Audio File: common_voice_mr_30586754.wav
Transcribed text:  करन खरा कोण होता दाजी पणशिकर
Reference text: कर्ण खरा कोण होता दाजी पणशीकर
WER: 0.3333333333333333
CER: 0.10344827586206896
--------------------------------------
Audio File: common_voice_mr_30544791.wav
Transcribed text:  त्या मोले ग्रीश शी पूर्व किनार पट्टी खूप अच कोरडी असते
Reference text: त्यामुळे ग्रीसची पूर्व किनारपट्टी ही खूपच कोरडी असते
WER: 1.0
CER: 0.23076923076923078
--------------------------------------
Audio File: common_voice_mr_30544783.wav
Transcribed text:  आंद्र प्रदेश मते 23 जिल्ले आहेद।
Reference text: आंध्र प्रदेशमध्ये तेवीस जिल्हे आहेत
WER: 1.2
CER: 0.37142857142857144
--------------------------------------
Audio File: common_voice_mr_30586199.wav
Transcribed t

Whisper did not predict an ending timestamp, which can happen if audio is cut off in the middle of a word. Also make sure WhisperTimeStampLogitsProcessor was used during generation.


Audio File: common_voice_mr_29375091.wav
Transcribed text:  હા મનુષ્યા હે વતો નવ નારાયણાં પેકી એક નારાયણ જાત�
Reference text: हा मनुष्य आहे व तो नवनारायणापैकी एक नारायणाचा अवतार आहे
WER: 1.0
CER: 0.9090909090909091
--------------------------------------
Audio File: common_voice_mr_30474622.wav
Transcribed text:  ಇತ್ತಿಲ್ ಮಾವಾ ಪೇಡೆ ಇಕೆಕಳಿ ಪ್ರಸಿದ್ದ ಹೊತೆ.
Reference text: येथील मावा पेढे एके काळी प्रसिद्ध होते
WER: 1.0
CER: 0.9473684210526315
--------------------------------------
Audio File: common_voice_mr_27761847.wav
Transcribed text:  परन्तु त्याजाथी पृथ्वी वर मुनुष्य जन्म गेणे अनिवार्य होते।
Reference text: परंतु त्यासाठी पृथ्वीवर मनुष्यजन्म घेणे अनिवार्य होते
WER: 1.1428571428571428
CER: 0.16981132075471697
--------------------------------------
Audio File: common_voice_mr_30477557.wav
Transcribed text:  আইনে দেলা ছাহা করুন দিলা।
Reference text: आईने त्याला चहा करून दिला
WER: 1.0
CER: 0.92
--------------------------------------
Audio File: common_voice_mr_28710364.wav
Transcribed tex

Whisper did not predict an ending timestamp, which can happen if audio is cut off in the middle of a word. Also make sure WhisperTimeStampLogitsProcessor was used during generation.


Audio File: common_voice_mr_30474582.wav
Transcribed text:  సందర్వ మారశ్రతిల్ లోకకలా మారశ్రతిల్ లోకకలా మారశ్రతిల్ ఏక లోకు నిత్
Reference text: संदर्भ महाराष्ट्रातील लोककला महाराष्ट्रातील लोककलामहाराष्ट्रातील एक लोकनृत्य
WER: 1.2857142857142858
CER: 0.9342105263157895
--------------------------------------
Audio File: common_voice_mr_27593321.wav
Transcribed text:  پہلے دون کرمانکاور مہاراستو و گزرات آہت
Reference text: पहिल्या दोन क्रमांकांवर महाराष्ट्र व गुजरात आहेत
WER: 1.0
CER: 0.875
--------------------------------------
Audio File: common_voice_mr_30477680.wav
Transcribed text:  मात्र नतुराम कोडसेंचे ते निवेदन भारत चरकार ने प्रतिबंद गालून प्रसिद्ध करने आश मनाई केली होती
Reference text: मात्र नथुराम गोडसेंचे ते निवेदन भारत सरकारने प्रतिबंध घालून प्रसिद्ध करण्यास मनाई केली होती
WER: 0.5714285714285714
CER: 0.12087912087912088
--------------------------------------
Audio File: common_voice_mr_27703270.wav
Transcribed text:  तीज पुढे लोकमान टिलकान ना बावली वद्यानी गीता रहस्यमन जेचकर्म

Whisper did not predict an ending timestamp, which can happen if audio is cut off in the middle of a word. Also make sure WhisperTimeStampLogitsProcessor was used during generation.


Audio File: common_voice_mr_27762490.wav
Transcribed text:  ਆਸੇ ਤੁਨੀ ਮਾਲ ਚਲ ਪਰਸਰ ਲੇਲਿਆ ਯਾਦੇਸ਼ਾਦ ਸਾਂਸਕੁਰਤੀਕ ਏਕਤਾ ਨਿਰਮਾਣ ਹੋਸ਼ਕ
Reference text: आसेतू हिमाचलपसरलेल्या या देशात सांस्कृतिक एकता निर्माण होऊ शकली
WER: 1.2222222222222223
CER: 0.9682539682539683
--------------------------------------
Audio File: common_voice_mr_27749105.wav
Transcribed text:  درمان ترہ پروی تو کریشن درمان سے پالن کرائے ساوہ دیتے نام یوسف یوہانہ ہوتے
Reference text: धर्मांतरापूर्वी तो ख्रिश्चन धर्माचे पालन करायचा व त्याचे नाव युसुफ योहाना होते
WER: 1.25
CER: 0.8974358974358975
--------------------------------------
Audio File: common_voice_mr_27762918.wav
Transcribed text:  ساری اس کا آہے ازون ایک بہتر پر کلپ الوار جلیات آہے
Reference text: सारिस्का हे अजून एक व्याघ्रप्रकल्प अल्वार जिल्ह्यात आहे
WER: 1.5
CER: 0.9090909090909091
--------------------------------------
Audio File: common_voice_mr_27762415.wav
Transcribed text:  راشتہ کل پرشہ دیشہ صلی اللہ علیہ وسلم سے سارے آگرینی رام مدیسہ مویدانک ایک عادکار شاہی و س

Whisper did not predict an ending timestamp, which can happen if audio is cut off in the middle of a word. Also make sure WhisperTimeStampLogitsProcessor was used during generation.


Audio File: common_voice_mr_27592042.wav
Transcribed text:  रामा एंड महाभारत या ग्रंथातिल तत्वध्यानाने भारतिय संस्कृतिला नीति मुल्यांचे वो जीवनाच्या शाश्वत मुल्यांचे अधिष्�
Reference text: रामायण महाभारत या ग्रंथांतील तत्त्वज्ञानाने भारतीय संस्कृतीला नीतिमूल्यांचे जीवनाच्या शाश्वत मूल्यांचे अधिष्ठान मिळाले
WER: 0.9230769230769231
CER: 0.23728813559322035
--------------------------------------
Audio File: common_voice_mr_27684807.wav
Transcribed text:  बारतिय भाषान मधुन साहित्य निर्मिती के लिजाते हैं
Reference text: भारतीय भाषांमधून साहित्यनिर्मिती केली जाते
WER: 1.6
CER: 0.30952380952380953
--------------------------------------
Audio File: common_voice_mr_27762957.wav
Transcribed text:  चेन्नई महानगर, कांचीपुरम आणी थिरुवरलूर जिल्यांचे देखेल काही भाग अंतरबुत करते हैं।
Reference text: चेन्नई महानगर कांचिपुरम आणि थिरुवल्लुर जिल्हयांचेदेखिल काही भाग अंतर्भुत करते
WER: 0.8
CER: 0.2077922077922078
--------------------------------------
Audio File: common_voice_mr_29375008.wav
Transcribed te

Whisper did not predict an ending timestamp, which can happen if audio is cut off in the middle of a word. Also make sure WhisperTimeStampLogitsProcessor was used during generation.


Audio File: common_voice_mr_30474558.wav
Transcribed text:  ਸਾਹੀਤਿਆਤੀਲ ਉਲੇਕ ਰੁਕਮੀਨੀ ਸਵਾਯਂ ਬਰਾਵਰ ਯਾ ਵੀ਷ੇਵਰ ਅਨੇਕ ਕਾਵਿਯ ਨਾਟਕ�
Reference text: साहित्यातील उल्लेख रुक्मिणीस्वयंवर या विषयावर अनेक काव्ये नाटके आणि कादंबऱ्या लिहिल्या गेल्या आहेत
WER: 1.0
CER: 0.9183673469387755
--------------------------------------
Audio File: common_voice_mr_30474579.wav
Transcribed text:  चंद्रा वरिल विवरे चंद्राच्या पुष्ट भागा वर उल्का तसेज धुमकेतुन्चा धडकेने तयार दालेली अनेक विवरे दिस्तात।
Reference text: चंद्रावरील विवरे चंद्राच्या पृष्ठभागावर उल्का तसेच धूमकेतूंच्या धडकेने तयार झालेली अनेक विवरे दिसतात
WER: 0.6923076923076923
CER: 0.15
--------------------------------------
Audio File: common_voice_mr_27749110.wav
Transcribed text:  मनाली यह तेही डंबे चे एक मंदिर ही आहे
Reference text: मनाली येथे हिडिंबेचे एक मंदिरही आहे
WER: 1.0
CER: 0.2571428571428571
--------------------------------------
Audio File: common_voice_mr_27593254.wav
Transcribed text:  या परिणामाला प्रकाशीय विद्यूत परिणाम असे मठले जाते।
R

Whisper did not predict an ending timestamp, which can happen if audio is cut off in the middle of a word. Also make sure WhisperTimeStampLogitsProcessor was used during generation.


Audio File: common_voice_mr_27593330.wav
Transcribed text:  ਆਈ ਵਡਲਾਂ ਚੇ ਮੱਤੀਉ ਨਂਤਰ ਦ੍ਨਾਨੇਸ਼ਵਰ ਵੱ ਤੈਂਚੇ ਭਾਵਣ ਡਾਨਾ ਲੋਕਾਂ ਕਰੁ�
Reference text: आई वडिलांच्या मृत्यूनंतर ज्ञानेश्वर आणि त्यांच्या भावंडांना लोकांकडून फार त्रास दिला गेला
WER: 1.0
CER: 0.898876404494382
--------------------------------------
Audio File: common_voice_mr_27703240.wav
Transcribed text:  ओलिंपिक सर्क्या केला महोच सवांचा उदय जाला।
Reference text: ऑलिंपिकसारख्या खेळा महोत्सवांचा उदय झाला
WER: 1.2
CER: 0.275
--------------------------------------
Audio File: common_voice_mr_27591987.wav
Transcribed text:  અનેક રચ્ના, અભંગ, ગવળણી આસે સ્પૂટ લેખં તેંની કેલી
Reference text: अनेक रचना अभंग गवळणी असे स्फुट लेखन त्यांनी केले
WER: 1.0
CER: 0.8958333333333334
--------------------------------------
Audio File: common_voice_mr_27703201.wav
Transcribed text:  नाथवनी अथक परिश्रम करून गुरु सेवा केली अणि साक्षा दत्ता त्रियानी त्यानना दर्शन दिले असे वनतात।
Reference text: नाथांनी अथक परिश्रम करून गुरुसेवा केली आणि साक्षात दत्तात्रेया

Whisper did not predict an ending timestamp, which can happen if audio is cut off in the middle of a word. Also make sure WhisperTimeStampLogitsProcessor was used during generation.


Audio File: common_voice_mr_30474562.wav
Transcribed text:  યાનંતર રાજારામને સૂત્રગીતલી વધક્ષિનેત જિન્જી એ
Reference text: यानंतर राजारामने सुत्रे घेतली व दक्षिणेत जिंजी येथून औरंगजेब विरुद्ध लढा चालू ठेवला
WER: 1.0
CER: 0.9397590361445783
--------------------------------------
Audio File: common_voice_mr_27703243.wav
Transcribed text:  नोक्री आनी शिक्षानी आण्चा शी त्यानना जगडावे लागले।
Reference text: नोकरी आणि शिक्षण यांच्याशी त्यांना झगडावे लागले
WER: 1.1428571428571428
CER: 0.2978723404255319
--------------------------------------
Audio File: common_voice_mr_27762428.wav
Transcribed text:  ਯੈ ਦਰਮੈਆਨ ਯਾਨਾਵਰੇਲ ਇਂਜੇਨ ਅਡੀਚ ਕੀ ਮੀਨਟਾ ਸਾਥੀ ਸਾਲਵਨੇ ਤਾਲੇ।
Reference text: यादरम्यान यानावरील इंजीन अडीच मिनिटांसाठी चालविण्यात आले
WER: 1.4285714285714286
CER: 0.9285714285714286
--------------------------------------


Whisper did not predict an ending timestamp, which can happen if audio is cut off in the middle of a word. Also make sure WhisperTimeStampLogitsProcessor was used during generation.


Audio File: common_voice_mr_30474561.wav
Transcribed text:  बुगर्वशास्र, वनस्पतिशास्र, अर्थशास्र, समाश्चास्र, जनसंक्याद्याइनशास्र यांचा बुगराशी गनिष्ट असा अंतर संबंद
Reference text: भूगर्भशास्त्र वनस्पतीशास्त्र अर्थशास्त्र समाजशास्त्र जनसंख्याअध्ययनशास्त्र यांचा भूगोलाशी घनिष्ट असा आंतरसंबध आहे
WER: 0.8181818181818182
CER: 0.336283185840708
--------------------------------------
Audio File: common_voice_mr_27593311.wav
Transcribed text:  हिडिंबेचा भावु हिडिंब याला भीमाने ठार केले होते।
Reference text: हिडींबेचा भाऊ हिडींब याला भीमाने ठार केले होते
WER: 0.5
CER: 0.10869565217391304
--------------------------------------
Audio File: common_voice_mr_27703237.wav
Transcribed text:  یا کاکشیلہ الیپٹیکل ٹرانسور آربٹ ای ٹی او اسے منتھات
Reference text: या कक्षेला इलिप्टिकल ट्रांसफर ऑर्बिट इ टी ओ असे म्हणतात
WER: 1.0
CER: 0.8727272727272727
--------------------------------------
Audio File: common_voice_mr_27703214.wav
Transcribed text:  તે કવી અનેલીય ટોપણ નાવ આને પસે ધહોતે તો
Reference text: 

Whisper did not predict an ending timestamp, which can happen if audio is cut off in the middle of a word. Also make sure WhisperTimeStampLogitsProcessor was used during generation.


Audio File: common_voice_mr_31887358.wav
Transcribed text:  ముంబై దిల్లి జాయపూర్ ఉదోయపూరాన్య ఉరంగాబదియాశరన్ మదేజ్ సద్యవిమనంచి
Reference text: मुंबई दिल्ली जयपूर उदयपूर आणि औरंगाबाद ह्या शहरांमधे सध्या विमानांची येजा असते
WER: 1.0
CER: 0.9358974358974359
--------------------------------------
Audio File: common_voice_mr_31879447.wav
Transcribed text:  त्याचा सम्मंद भुकंपाने होनारा नुकसानी शी निगरित अस्तो उर्जेशी नस्तो
Reference text: त्याचा संबंध भूकंपाने होणाऱ्या नुकसानीशी निगडित असतो ऊर्जेशी नसतो
WER: 1.0
CER: 0.2153846153846154
--------------------------------------
Audio File: common_voice_mr_31883836.wav
Transcribed text:  जाडा वर भारतवाज बसला है।
Reference text: झाडावर भारद्वाज बसलाय
WER: 1.6666666666666667
CER: 0.38095238095238093
--------------------------------------


Whisper did not predict an ending timestamp, which can happen if audio is cut off in the middle of a word. Also make sure WhisperTimeStampLogitsProcessor was used during generation.


Audio File: common_voice_mr_31917739.wav
Transcribed text:  त्या नुसार कृषिव विद्यापितातील शिक्षन क्रम राभवले जातात।
Reference text: त्यानुसार कृषी विद्यापीठातील शिक्षणक्रम राबविले जातात
WER: 1.3333333333333333
CER: 0.18867924528301888
--------------------------------------
Audio File: common_voice_mr_31796642.wav
Transcribed text:  गाडगे बाबा नी संद तुकारामांचा नीमक्या अभंगांचा मुबलक वापर ही वेलो वेल केला।
Reference text: गाडगेबाबांनी संत तुकारामांच्या नेमक्या अभंगांचा मुबलक वापरही वेळोवेळी केला
WER: 1.2222222222222223
CER: 0.16216216216216217
--------------------------------------
Audio File: common_voice_mr_31883886.wav
Transcribed text:  తేవిల్లి నిర్మాను ఉనారే లాటంచే మాలికావుం
Reference text: त्यावेळी निर्माण होणाऱ्या लाटांची मालिका होय
WER: 1.0
CER: 0.9318181818181818
--------------------------------------
Audio File: common_voice_mr_31894161.wav
Transcribed text:  भारतिय अमेरिकन यूरोपिय वा इत्तर ही पताधीकार काईदा सर्वप्रकार चा बेकाईदेशी वापराला मनाई करतो।
Reference text: भारतीय 

Whisper did not predict an ending timestamp, which can happen if audio is cut off in the middle of a word. Also make sure WhisperTimeStampLogitsProcessor was used during generation.


Audio File: common_voice_mr_31879324.wav
Transcribed text:  કોંગ્રેસ અદિક્ષે સીતારામ કેસરી યાની પંતપ્રદાન �
Reference text: काँग्रेस अध्यक्ष सीताराम केसरी आणि पंतप्रधान गुजराल यांच्या दरम्यान या संदर्भात आठवडाभर पत्रव्यवहार झाला
WER: 1.0
CER: 0.9423076923076923
--------------------------------------
Audio File: common_voice_mr_31892821.wav
Transcribed text:  कोई हाँ गवापा सुन्तेयर के लेला खाद्य पदारता है।
Reference text: पोळी हा गव्हापासून तयार केलेला खाद्यपदार्थ आहे
WER: 1.2857142857142858
CER: 0.391304347826087
--------------------------------------
Audio File: common_voice_mr_31841781.wav
Transcribed text:  नरसरी उद्यापनां मध्ये ही राज्य अग्रेस राहे
Reference text: नर्सरी उत्पादनांमध्येही राज्य अग्रेसर आहे
WER: 1.2
CER: 0.21951219512195122
--------------------------------------
Audio File: common_voice_mr_31877235.wav
Transcribed text:  کرشنا نے جو یوجلے ہوتے تھے پار پڑھ لے
Reference text: कृष्णाने जे योजले होते ते पार पडले
WER: 1.2857142857142858
CER: 0.9117647058823529
-----------

Whisper did not predict an ending timestamp, which can happen if audio is cut off in the middle of a word. Also make sure WhisperTimeStampLogitsProcessor was used during generation.


Audio File: common_voice_mr_31883897.wav
Transcribed text:  મી થોડા બેલાને પોના આઈલા મંટલે આઈ તું લાન પણી ગોષ
Reference text: मी थोड्या वेळाने पुन्हा आईला म्हटले आई तू लहानपणी एक गोष्ट सांगत असे
WER: 1.0
CER: 0.8529411764705882
--------------------------------------
Audio File: common_voice_mr_31892382.wav
Transcribed text:  मनुं त्याने सुर्याचा दिशेने जेप गेतली।
Reference text: म्हणून त्याने सूर्याच्या दिशेने झेप घेतली
WER: 0.6666666666666666
CER: 0.2682926829268293
--------------------------------------
Audio File: common_voice_mr_31842090.wav
Transcribed text:  तसेच शिमला मिर्ची बद्दल माहिती द्यावी
Reference text: तसेच शिमला मिरचीबद्दल माहिती द्यावी
WER: 0.4
CER: 0.05714285714285714
--------------------------------------
Audio File: common_voice_mr_31842167.wav
Transcribed text:  सात वाहना नंतर कर्नाटक चा स्थानिक राज्यकर्त्याचा उदाई जाला
Reference text: सातवाहनांनंतर कर्नाटकच्या स्थानिक राज्य कर्त्याचा उदय झाला
WER: 1.2857142857142858
CER: 0.15517241379310345
-----------------------

Whisper did not predict an ending timestamp, which can happen if audio is cut off in the middle of a word. Also make sure WhisperTimeStampLogitsProcessor was used during generation.


Audio File: common_voice_mr_31928736.wav
Transcribed text:  મધ્ય ભાગતિલ પ્યુળ્યા રંગાવર વંદે માત્રમ આસે લી
Reference text: मध्य भागातील पिवळ्या रंगावर वंदे मातरम् असे लिहिले
WER: 1.0
CER: 0.88
--------------------------------------
Audio File: common_voice_mr_31671592.wav
Transcribed text:  बिहुच्या सहव्या दिवशी तरूनी हाता पायावर मेंजी कड़ुन गेतार।
Reference text: बिहूच्या सहाव्या दिवशी तरुणी हाता पायांवर मेंदी काढुन घेतात
WER: 0.7777777777777778
CER: 0.1864406779661017
--------------------------------------
Audio File: common_voice_mr_31476096.wav
Transcribed text:  करण सूत पुत्र मनुं हिनवला गेला आणि एक लव्य निशात पुत्र मनुं।
Reference text: कर्ण सूतपुत्र म्हणून हिणवला गेला आणि एकलव्य निषादपुत्र म्हणून
WER: 1.1111111111111112
CER: 0.2786885245901639
--------------------------------------
Audio File: common_voice_mr_31796180.wav
Transcribed text:  راج کرنیا مہنون جنمالہ علی
Reference text: राजकन्या म्हणून जन्माला आली
WER: 1.25
CER: 0.9259259259259259
-----------------------------------

Whisper did not predict an ending timestamp, which can happen if audio is cut off in the middle of a word. Also make sure WhisperTimeStampLogitsProcessor was used during generation.


Audio File: common_voice_mr_31484153.wav
Transcribed text:  યાં રસ્તેન્ચી બાંધની અને ડેખબાલ કેન્દ્ર સરકાર ક�
Reference text: या रस्त्यांची बांधणी आणि देखभाल केंद्र सरकार करते
WER: 1.0
CER: 0.8979591836734694
--------------------------------------
Audio File: common_voice_mr_31472437.wav
Transcribed text:  पाक कृती प्रथम उकडलेल्या बटाटेंचा लगदा केला जातो।
Reference text: पाककृती प्रथम उकडलेल्या बटाट्यांचा लगदा केला जातो
WER: 0.5714285714285714
CER: 0.10204081632653061
--------------------------------------
Audio File: common_voice_mr_31651393.wav
Transcribed text:  अम्चा राजू गेला वर्षी ग्राजवेट जाला है पण नोकरी मियोत नहीं है।
Reference text: आमचा राजू गेल्या वर्षी ग्रँँज्युएट झांलाय पण नोकरी मिळत नाहीये
WER: 0.8
CER: 0.3709677419354839
--------------------------------------
Audio File: common_voice_mr_31476499.wav
Transcribed text:  ते उपदेश केलेले ठिकान मन्जे अनुपाम शिला होई।
Reference text: ते उपदेश केलेले ठिकाण म्हणजे अनुपम शिळा होय
WER: 0.625
CER: 0.18604651162790697
--------------

Whisper did not predict an ending timestamp, which can happen if audio is cut off in the middle of a word. Also make sure WhisperTimeStampLogitsProcessor was used during generation.


Audio File: common_voice_mr_31474878.wav
Transcribed text:  જી આદી વર્ગેકર્નાત ઉપલવદાહે તીસ પૂના ઠેવને અવશક 
Reference text: जी यादी वर्गीकरणात उपलब्ध आहे तीच पुन्हा ठेवणे आवश्यक असेल तर तसे प्रयोजन हवे
WER: 1.0
CER: 0.9090909090909091
--------------------------------------
Audio File: common_voice_mr_31483989.wav
Transcribed text:  रामालत जाऊन मेयाला
Reference text: रामाला तो जाऊन मिळाला
WER: 0.75
CER: 0.23809523809523808
--------------------------------------
Audio File: common_voice_mr_31671589.wav
Transcribed text:  अध्यापन शास्त्रिय दुरुष्टि कोणातुन यह एक महत्वाचा बदल है।
Reference text: अध्यापनशास्त्रीय दृष्टिकोनातून हा महत्त्वाचा बदल आहे
WER: 1.3333333333333333
CER: 0.3269230769230769
--------------------------------------
Audio File: common_voice_mr_31474813.wav
Transcribed text:  अमेरिकेट कायम स्वर्पी यूरोपियन वसाथ निर्मान करना रही पहली टोय होती
Reference text: अमेरिकेत कायमस्वरूपी युरोपियन वसाहत निर्माण करणारी ही पहिली टोळी होती
WER: 1.0
CER: 0.2028985507246377
--------------

Whisper did not predict an ending timestamp, which can happen if audio is cut off in the middle of a word. Also make sure WhisperTimeStampLogitsProcessor was used during generation.


Audio File: common_voice_mr_31475416.wav
Transcribed text:  अभियांत्र के महाविद्धले। पुने पुरुवीचे सास्किया अभियांत्र के महाविद्धले। पुने हे महाराष्ट्रतिल पहले अभियांत्र के म
Reference text: अभियांत्रिकी महाविद्यालय पुणे पूर्वीचे शासकीय अभियांत्रिकी महाविद्यालय पुणे हे महाराष्ट्रातील पहिले अभियांत्रिकी महाविद्यालय आहे
WER: 1.0714285714285714
CER: 0.3046875
--------------------------------------


Whisper did not predict an ending timestamp, which can happen if audio is cut off in the middle of a word. Also make sure WhisperTimeStampLogitsProcessor was used during generation.


Audio File: common_voice_mr_31841834.wav
Transcribed text:  वैशाख वद्य दश्मी मुक्ता बाईंचा स्मृति प्रत्यत्य जडगाव जिल्याती एदलाबाद तालुक्याचे नाव बदलों मुक्ताई नगर केल
Reference text: वैशाख वद्य दशमी मुक्ताबाईंच्या स्मृतिप्रीत्यर्थ जळगाव जिल्ह्यातील एदलाबाद तालुक्याचे नाव बदलून मुक्ताईनगर केले आहे
WER: 0.7857142857142857
CER: 0.17543859649122806
--------------------------------------
Audio File: common_voice_mr_31477091.wav
Transcribed text:  अपना मृत पूर्वजानना जीवनत करना साथी बगीराथानी गंगेला पुरुथ्यी वर आणले।
Reference text: आपल्या मृत पूर्वजांना जीवंत करण्यासाठी भगीरथाने गंगेला पृथ्विवर आणले
WER: 1.0
CER: 0.3088235294117647
--------------------------------------
Audio File: common_voice_mr_31496892.wav
Transcribed text:  यह तारिक अन्यकांला मन्य नहीं
Reference text: ही तारीख अनेकांना मान्य नाही
WER: 1.0
CER: 0.35714285714285715
--------------------------------------
Audio File: common_voice_mr_31461951.wav
Transcribed text:  मनोगता वरिल इप्तर तांत्रिक माहिती
Reference text: मनोगतावर

Whisper did not predict an ending timestamp, which can happen if audio is cut off in the middle of a word. Also make sure WhisperTimeStampLogitsProcessor was used during generation.


Audio File: common_voice_mr_31476644.wav
Transcribed text:  પ્રાવર્ણા ખાલી બ્રમ્મ ગાભા ઓ ત્યાં ખાલી અંતર ગા
Reference text: प्रावरणाखाली ब्रह्यगाभा व त्याखाली अंतर्गाभा असतो
WER: 1.5
CER: 0.9591836734693877
--------------------------------------
Audio File: common_voice_mr_31472590.wav
Transcribed text:  संत न्यानिश्वरांचे आलंदी येथिल समाधी स्थराचा शोध।
Reference text: संत ज्ञानेश्वरांचे आळंदी येथील समाधिस्थळाचा शोध
WER: 1.0
CER: 0.19148936170212766
--------------------------------------
Audio File: common_voice_mr_31487173.wav
Transcribed text:  लवकर चामी घरी जाओ
Reference text: लवकरच आम्ही घरी जाऊ
WER: 0.75
CER: 0.3157894736842105
--------------------------------------
Audio File: common_voice_mr_31483985.wav
Transcribed text:  हिडिम्बाही महाभारतात वर्णिलेली एक राक्षसी होती।
Reference text: हिडिंबा ही महाभारतात वर्णिलेली एक राक्षसी होती
WER: 0.42857142857142855
CER: 0.08695652173913043
--------------------------------------
Audio File: common_voice_mr_31475459.wav
Transcribed text:  

Whisper did not predict an ending timestamp, which can happen if audio is cut off in the middle of a word. Also make sure WhisperTimeStampLogitsProcessor was used during generation.


Audio File: common_voice_mr_31461816.wav
Transcribed text:  యా ప్రసంగాన అంతర సంత దాం దేవాన్న విష్వబా కేసర్ కే అధ్యాద్మిక గురు మ�
Reference text: या प्रसंगानंतरच संत नामदेवांना विसोबा खेचर हे आध्यात्मिक गुरू म्हणून लाभले
WER: 1.0909090909090908
CER: 0.9324324324324325
--------------------------------------
Audio File: common_voice_mr_31474893.wav
Transcribed text:  પુરે દુસર્યા મહાયુદ્ધને જગ ગ્રાસું ટાકલે
Reference text: पुढे दुसऱ्या महायुद्धाने जग ग्रासून टाकले
WER: 1.0
CER: 0.8780487804878049
--------------------------------------
Audio File: common_voice_mr_31496818.wav
Transcribed text:  परिणामी पच्चिम भागात कमी पाउस पड़लेने या भागात सातत्याने शुश का हवा मान रहते।
Reference text: परिणामी पश्चिम भागात कमी पाऊस पडल्याने या भागात सातत्याने शुष्क हवामान राहते
WER: 0.6666666666666666
CER: 0.15789473684210525
--------------------------------------
Audio File: common_voice_mr_31487167.wav
Transcribed text:  वारकरी केर्तन हे आजन दी यथे वारकरी महाविद्यालाय चीकवले जाते।
Reference text: वारकरी

Whisper did not predict an ending timestamp, which can happen if audio is cut off in the middle of a word. Also make sure WhisperTimeStampLogitsProcessor was used during generation.


Audio File: common_voice_mr_31209612.wav
Transcribed text:  ਉਡੁਪੀ ਵੱ ਦੱਕਸਿਨ ਕਣ ਨਡ ਯਾ ਕੀਨਾਰ ਪਟੀ ਚਾ ਚੀਲੇਨ ਭਾਰਤਾ ਤੀਲ ਬਾਂਕਾਂ ਚੇ 
Reference text: उडुपी व दक्षिण कन्नड या किनारपट्टीच्या जिल्ह्यांत भारतातील बँकांचे सर्वात मोठे जाळे आहे
WER: 1.0769230769230769
CER: 0.8850574712643678
--------------------------------------
Audio File: common_voice_mr_31321293.wav
Transcribed text:  रुणमो चन ये थे तैनी लक्ष्मि नाराणाचे मंदिर बानले।
Reference text: ऋणमोचन येथे त्यांनी लक्ष्मीनारायणाचे मंदिर बांधले
WER: 1.3333333333333333
CER: 0.2857142857142857
--------------------------------------
Audio File: common_voice_mr_31321324.wav
Transcribed text:  बिहार उत्तर भारताती राज्या है।
Reference text: बिहार उत्तर भारतातील राज्य आहे
WER: 0.6
CER: 0.16666666666666666
--------------------------------------
Audio File: common_voice_mr_31412731.wav
Transcribed text:  चिन्नै पूर्वी चिनाव मद्रास ये सर्वात मोठे शहर तसेच राज्याची राजधानी आहे।
Reference text: चेन्नई पूर्वीचे नाव मद्रास हे सर्वात मोठे शहर तसेच राज्याची र

Whisper did not predict an ending timestamp, which can happen if audio is cut off in the middle of a word. Also make sure WhisperTimeStampLogitsProcessor was used during generation.


Audio File: common_voice_mr_31433293.wav
Transcribed text:  તેથે ત્યાને એકા શેવર સર્વરુશેન નબસવૂલ ઉપદેશ દીલ
Reference text: तेथे त्यांनी एका शिळेवर सर्व ऋषींना बसवून उपदेश दिला
WER: 1.0
CER: 0.8846153846153846
--------------------------------------
Audio File: common_voice_mr_31274907.wav
Transcribed text:  अब्बासी खलिफांचा सर्वभर शिक्षन, व्यापार, तंत्रद्ञान और सामाजिक सुधारणा वर होता।
Reference text: अब्बासी खलिफांचा सर्व भर शिक्षण व्यापार तंत्रज्ञान आणि सामाजिक सुधारणा यांवर होता
WER: 0.6666666666666666
CER: 0.14814814814814814
--------------------------------------
Audio File: common_voice_mr_31329527.wav
Transcribed text:  प्रारंभ कालाथ लावुनी गेयस्वरुपात न्यातुती।
Reference text: प्रारंभकाळात लावणी गेय स्वरूपात ज्ञात होती
WER: 1.0
CER: 0.30952380952380953
--------------------------------------
Audio File: common_voice_mr_31383822.wav
Transcribed text:  एक प्रचंड समुदाय असा आहे कि जो रावनाला देवत्व देनार आहे।
Reference text: एक प्रचंड समुदाय असा आहे की जो रावणाला देवत्व देणारा आहे


Whisper did not predict an ending timestamp, which can happen if audio is cut off in the middle of a word. Also make sure WhisperTimeStampLogitsProcessor was used during generation.


Audio File: common_voice_mr_31209700.wav
Transcribed text:  ਅੱਜਾਮੇਰ ਏਥੀਲ ਦਾਰਗਿਆਸ ਫੇਟ ਦੇਨਾਸ ਕਿਆਲ ਮੁਸਲਮਾਨ ਸਨਵੇ ਤਰ ਹੀਂਦੋ ਧਰਮੀ
Reference text: अजमेर येथील दर्ग्यास भेट देण्यास केवळ मुसलमानच नव्हे तर हिंदू धर्मीयही भेट देतात
WER: 1.0
CER: 0.9
--------------------------------------
Audio File: common_voice_mr_31384516.wav
Transcribed text:  शुवसेना गीत आमी शिवाचे सैनी वेडे करू जिवाचे रान।
Reference text: शिवसेना गीत आम्ही शिवाचे सैनिक वेडे करू जिवाचे रान ।
WER: 0.5
CER: 0.11538461538461539
--------------------------------------
Audio File: common_voice_mr_31450906.wav
Transcribed text:  Mithru Amati, Mithru Samadhi Selok, Aos Mkhene Ata.
Reference text: मिझोरम मध्ये मिझो जमातीचे लोक बहुसंख्येने राहतात
WER: 1.1428571428571428
CER: 0.9791666666666666
--------------------------------------
Audio File: common_voice_mr_31384354.wav
Transcribed text:  त्यानंतर त्या गाय बैलनची पूजा केली जाते।
Reference text: त्यानंतर त्या गाय बैलांची पुजा केली जाते
WER: 0.42857142857142855
CER: 0.1
----------------

Whisper did not predict an ending timestamp, which can happen if audio is cut off in the middle of a word. Also make sure WhisperTimeStampLogitsProcessor was used during generation.


Audio File: common_voice_mr_31412786.wav
Transcribed text:  ಬಿಶ್ಮಾನೆ ನಿಕ್ಷನ್ ಸಂಗಿತ್ಲೆ ಮೊಳೆ ಅಖಿರ ತ್ರುತರಾಶ್ಟ್ರಾನೆ ಪಾಣ್ಡವಾನ್ನ ಅರಧೆ ರಾಜ್ಯದೇ�
Reference text: भीष्माने निक्षून सांगितल्यामुळे अखेर धृतराष्ट्राने पांडवाना अर्धे राज्य देऊन इंद्रप्रस्थाला पाठवले
WER: 1.0
CER: 0.9285714285714286
--------------------------------------
Audio File: common_voice_mr_31384199.wav
Transcribed text:  ये गाभे उप्टुन कड़ुन टाकवेत काई?
Reference text: हे गाभे उपटून काढून टाकावेत काय
WER: 0.8333333333333334
CER: 0.2903225806451613
--------------------------------------
Audio File: common_voice_mr_31372914.wav
Transcribed text:  मधुरेजा राज्यकर्ता आणि कवंसाचे वडिंग।
Reference text: मथुरेचा राज्यकर्ता आणि कंसाचे वडिल
WER: 0.6
CER: 0.17647058823529413
--------------------------------------
Audio File: common_voice_mr_31274995.wav
Transcribed text:  पूरु वाउंशात शांतनु पासन दुर्योधना परियंत अनेक पीडियांची त्यानी कालजी घेतली।
Reference text: कुरुवंशातील शंतनुपासून दुर्योधनापर्यंत अनेक पिढ्यांची त्यांनी काळजी घेतली

Whisper did not predict an ending timestamp, which can happen if audio is cut off in the middle of a word. Also make sure WhisperTimeStampLogitsProcessor was used during generation.


Audio File: common_voice_mr_31311359.wav
Transcribed text:  ભુકમ પછે નોન ઘેનારે યંતરા સેસ્મોગ્રાફ અથવા સેસ્�
Reference text: भूकंपाची नोंद घेणाऱ्या यंत्रास सेस्मोग्राफ अथवा सेस्मॉमीटर असे नाव आहे
WER: 1.0
CER: 0.9142857142857143
--------------------------------------
Audio File: common_voice_mr_31432871.wav
Transcribed text:  या लेने आथ माखचा बाजुला गर्भग रूहा आहे।
Reference text: या लेण्यात मागच्या बाजूला गर्भगृह आहे
WER: 1.1666666666666667
CER: 0.3783783783783784
--------------------------------------
Audio File: common_voice_mr_31321258.wav
Transcribed text:  चंदराचा प्रकाशाला चांदने किवा कवमुधी मन्तार।
Reference text: चंद्राच्या प्रकाशाला चांदणे किंवा कौमुदी म्हणतात
WER: 0.8333333333333334
CER: 0.25
--------------------------------------
Audio File: common_voice_mr_31321256.wav
Transcribed text:  सिमेंट उत्पदनात ही राजस्थान्चा देशाद दुसरा क्रमांका है।
Reference text: सिमेंट उप्तादनातही राजस्थानचा देशात दुसरा क्रमांक आहे
WER: 0.8571428571428571
CER: 0.18867924528301888
-------------

Whisper did not predict an ending timestamp, which can happen if audio is cut off in the middle of a word. Also make sure WhisperTimeStampLogitsProcessor was used during generation.


Audio File: common_voice_mr_31209655.wav
Transcribed text:  पुरुवीच्या संत्ता परंपर्यतिल नामदेव एकनाथ तुकाराम्पुरुवीच्या संत्ता परंपर्यतिल नामदेव एकनाथ तुकाराम्पुरु
Reference text: पूर्वीच्या संतपरंपरेतील नामदेव एकनाथ तुकाराम चोखामेळा इत्यादि संतांनी अनेक भजने तयार केली आहेत
WER: 0.9230769230769231
CER: 0.574468085106383
--------------------------------------
Audio File: common_voice_mr_31209699.wav
Transcribed text:  त्यांच्या अथ्यानात पृथ्वी व आवकाश यांच्या मानवाशी युनारा संभंदाचा अभ्यास करने इत्यादिन्चा समाविश अस्तो
Reference text: त्यांच्या अध्ययनात पृथ्वी व अवकाश यांच्या मानवाशी येण्याऱ्या संबधांचा अभ्यास करणे इत्यादींचा समावेश असतो
WER: 0.5714285714285714
CER: 0.19230769230769232
--------------------------------------
Audio File: common_voice_mr_31433162.wav
Transcribed text:  तो इंद्राचे कुरुपे ने पंडूची पत्मी मुंती ना धालेला उत्र होता।
Reference text: तो इंद्राच्या कृपेने पंडूची पत् नी कुंती हिला झालेला पुत्र होता
WER: 0.9090909090909091
CER: 0.2698412698412698
----------------

Whisper did not predict an ending timestamp, which can happen if audio is cut off in the middle of a word. Also make sure WhisperTimeStampLogitsProcessor was used during generation.


Audio File: common_voice_mr_31383825.wav
Transcribed text:  નેશકામ બુધીને પ્રયત્ન કષ્ટ કામ મંજેચ કર્મ કેલે �
Reference text: निष्काम बुद्धीने प्रयत् न कष्ट काम म्हणजेच कर्म केले पाहिजे
WER: 1.0
CER: 0.864406779661017
--------------------------------------
Audio File: common_voice_mr_31311360.wav
Transcribed text:  विशेश मेंजे अपलाज देशात नवे तर अनेक देशात केलाची दिस्ते।
Reference text: विशेष म्हणजे आपल्याच देशांत नव्हे तर अनेक देशांत केल्याचे दिसते
WER: 0.8
CER: 0.2698412698412698
--------------------------------------
Audio File: common_voice_mr_31384201.wav
Transcribed text:  या जिल्याचे प्रशासकीय केंद्र अखुला हे आहे।
Reference text: या जिल्ह्याचे प्रशासकीय केंद्र अकोला हे आहे
WER: 0.42857142857142855
CER: 0.11627906976744186
--------------------------------------
Audio File: common_voice_mr_31209616.wav
Transcribed text:  ರಚ್ಯನ ಸೂರಿಯ ಮಾದೆತಿಲ್ ಪ್ರಮುಕ್ವಸ್ತು ಮಂಜೆ ಸೂರಿಯ ಹೋಯಾ.
Reference text: रचना सूर्यमालेतील प्रमुख वस्तू म्हणजे सूर्य होय
WER: 1.0
CER: 1.0
------------------------------

Whisper did not predict an ending timestamp, which can happen if audio is cut off in the middle of a word. Also make sure WhisperTimeStampLogitsProcessor was used during generation.


Audio File: common_voice_mr_31274908.wav
Transcribed text:  සිටින් කිරුණාරු මෙමින් මෙමින් පස්තින් මෙමින් මෙමින් මෙමින් මෙමින් මෙමින
Reference text: समुद्रकिनाऱ्यावरील मोठ्या पर्यटनामुळे वॉटरपोलो व बीच व्हॉलीबॉल हे खेळ देखील लोकप्रिय आहेत
WER: 1.0
CER: 0.9325842696629213
--------------------------------------
Audio File: common_voice_mr_31209630.wav
Transcribed text:  نارائن مہراج نارائن اٹھاولیان
Reference text: नारायण महाराज नारायण आठवले
WER: 1.0
CER: 1.0384615384615385
--------------------------------------
Audio File: common_voice_mr_31209774.wav
Transcribed text:  Ja chcem moju náu, Gregória Paparecci, aserute.
Reference text: याचे मूळ नाव ग्रेगोरियो पापारेची असे होते
WER: 1.0
CER: 1.048780487804878
--------------------------------------
Audio File: common_voice_mr_31372846.wav
Transcribed text:  শ্রি ঵িশ্রুন নি সুর্য প্রকাশ ধাখলা।
Reference text: श्री विष्णूनी सूर्यप्रकाश झाकला
WER: 1.5
CER: 1.032258064516129
--------------------------------------
Audio File: common_voice_mr_31433

Whisper did not predict an ending timestamp, which can happen if audio is cut off in the middle of a word. Also make sure WhisperTimeStampLogitsProcessor was used during generation.


Audio File: common_voice_mr_31275141.wav
Transcribed text:  ਤੇਵਾ ਦੁਵਨਵਂ ਮਦੇ ਗਾਠੁਨ ਜਰਾ ਸਂਧਾਲਾ ਏਖਾਦੇ ਮਹਾਨ ਵੀਰਾ ਨੇ ਮਾਰਲੀ ਤੇਵਰਾ
Reference text: तेव्हा द्वंद्वामध्ये गाठून जरासंधाला एखाद्या महान वीराने मारले तरच त्याचे पारिपत्य शक्य होते
WER: 1.0
CER: 0.9021739130434783
--------------------------------------
Audio File: common_voice_mr_31274994.wav
Transcribed text:  سوریا مجیس فوٹ ہونے کے وستماں ہی نہیں
Reference text: सूर्यामध्ये स्फोट होण्याइतके वस्तूमान नाही
WER: 1.6
CER: 0.9285714285714286
--------------------------------------
Audio File: common_voice_mr_31321140.wav
Transcribed text:  शिखंडी महाभारत या महाकव्यतिल एक पात्रा है।
Reference text: शिखंडी महाभारत या महाकाव्यातील एक पात्र
WER: 0.5
CER: 0.20512820512820512
--------------------------------------
Audio File: common_voice_mr_31209623.wav
Transcribed text:  अखेर जरा संदतमला पन भीम तरही जोरात होता।
Reference text: अखेर जरासंध दमला पण भीम तरीहि जोरात होता
WER: 0.625
CER: 0.2
--------------------------------------
Audio File: commo

Whisper did not predict an ending timestamp, which can happen if audio is cut off in the middle of a word. Also make sure WhisperTimeStampLogitsProcessor was used during generation.


Audio File: common_voice_mr_31209820.wav
Transcribed text:  ઉખોયોગન સાર વર્ગીકરણ તપાલવહું અન્યવહું હોવારા �
Reference text: उपयोगानुसार वर्गीकरण टपालवाहू अन्यवाहू फवारा मारण्यासाठी
WER: 1.1666666666666667
CER: 0.9285714285714286
--------------------------------------
Audio File: common_voice_mr_31274901.wav
Transcribed text:  केरल दक्षिन भाग पांडे राज्या भाग होता वत्याची राजधानी येथे होती।
Reference text: केरळचा दक्षिण भाग पांड्य राज्याचा भाग होता व त्यांची राजधानी येथे होती
WER: 0.5833333333333334
CER: 0.15714285714285714
--------------------------------------
Audio File: common_voice_mr_31209851.wav
Transcribed text:  विचित्र वेर्याच्या मरणानंतर यासान्द्वारे ध्रुतराष्ट वक पांडुराच चन्मला
Reference text: विचित्रवीर्याच्या मरणानंतर व्यासांद्वारे धृतराष्ट्र व पांडुराज जन्मला
WER: 1.0
CER: 0.2028985507246377
--------------------------------------
Audio File: common_voice_mr_31321144.wav
Transcribed text:  જનક રાજા ને હાપ પ્રસ્તાવ ના કાર્લ
Reference text: जनक राजाने हा प्रस्ताव नाकारला
WE

Whisper did not predict an ending timestamp, which can happen if audio is cut off in the middle of a word. Also make sure WhisperTimeStampLogitsProcessor was used during generation.


Audio File: common_voice_mr_31069577.wav
Transcribed text:  ਇਤੇਂ ਆਫੇ ਮੀਸ਼ਨੇ ਅਕਾ ਗੁਸ਼ਰਾਕ ਜੇਂਦਾ ਵਾਖਾਂ ਨ ਦਾਨਾ ਰਾਈਯਾ ਜੋਨਾ ਏਬਾ ਜੀ
Reference text: तिथे असे दिसेल आता दुसर् यांदा दाखवल्या जाणार् या दुव्याऐवजी तुम्हाला अपेक्षित नाव लिहा
WER: 1.0
CER: 0.8735632183908046
--------------------------------------
Audio File: common_voice_mr_31046553.wav
Transcribed text:  एक लव्या चा या उत्तराने अर्जुन अस्वस्त दाला।
Reference text: एकलव्याच्या ह्या उत्तराने अर्जुन अस्वस्थ झाला
WER: 1.0
CER: 0.2
--------------------------------------
Audio File: common_voice_mr_30956481.wav
Transcribed text:  त्यातुन शाहने जालेली स्थानिक आता यूँख खातलेल्या प्रकल्पान ना विरोध करत आहेद।
Reference text: त्यातून शहाणे झालेले स्थानिक आता येऊ घातलेल्या प्रकल्पांना विरोध करत आहेत
WER: 0.7272727272727273
CER: 0.1917808219178082
--------------------------------------
Audio File: common_voice_mr_30899386.wav
Transcribed text:  तिला कल्यानी असे देखिल मंटले जात असे
Reference text: तिला कल्याणी असे देखील म्हटले जात असे
WER: 0.428

Whisper did not predict an ending timestamp, which can happen if audio is cut off in the middle of a word. Also make sure WhisperTimeStampLogitsProcessor was used during generation.


Audio File: common_voice_mr_31208800.wav
Transcribed text:  महराश्टातिल समाजवादाचे ब्रचंडा व्यास्पित असे यथार्थ उद्गार आचार्य अत्रे यानी संतगाडगे वाबन बतल काड़िया हैंगा
Reference text: महाराष्ट्रातील समाजवादाचे प्रचंड व्यासपीठ असे यथार्थ उद्गार आचार्य अत्रे यांनी संत गाडगेबाबांबद्दल काढले आहेत
WER: 0.6428571428571429
CER: 0.26605504587155965
--------------------------------------
Audio File: common_voice_mr_31120203.wav
Transcribed text:  ते तिस्रे जोतिश परिशदेचे अध्यक्ष होते।
Reference text: ते तिसऱ्या ज्योतिष परिषदेचे अध्यक्ष होते
WER: 0.6666666666666666
CER: 0.2
--------------------------------------


Whisper did not predict an ending timestamp, which can happen if audio is cut off in the middle of a word. Also make sure WhisperTimeStampLogitsProcessor was used during generation.


Audio File: common_voice_mr_30900491.wav
Transcribed text:  ત્યાના યાંમોએ મઈશુર્દાજ્યાચે પિતા મળું ઓરખ્લે
Reference text: त्यांना यामुळे म्हैसूर राज्याचे पिता म्हणून ओळखले जायचे
WER: 1.0
CER: 0.9090909090909091
--------------------------------------
Audio File: common_voice_mr_31138396.wav
Transcribed text:  बलराम हा नंद वा यशोदेचा मोठा मुलिगाव कृष्णाचा भाव होता।
Reference text: बलराम हा नंद व यशोदेचा मोठा मुलगा व कृष्णाचा भाऊ होता
WER: 0.45454545454545453
CER: 0.09433962264150944
--------------------------------------
Audio File: common_voice_mr_31195665.wav
Transcribed text:  या कथान मधिल सम्वाद लिखित नसून पात्रान नी ते केवल स्वताचा बुद्धीने मनाईची अस्ताथ।
Reference text: या कथांमधील संवाद लिखित नसून पात्रांनी ते केवळ स्वतःच्या बुद्धीने म्हणायचे असतात
WER: 0.75
CER: 0.2375
--------------------------------------
Audio File: common_voice_mr_30898737.wav
Transcribed text:  तोला जेवायचा का?
Reference text: चला जेवायचं का
WER: 1.0
CER: 0.2857142857142857
----------------------------------

Whisper did not predict an ending timestamp, which can happen if audio is cut off in the middle of a word. Also make sure WhisperTimeStampLogitsProcessor was used during generation.


Audio File: common_voice_mr_31195882.wav
Transcribed text:  त्यान अंतर श्रीमती सोनिया गांधी यानी पंत प्रधान पद दुसरिया व्यक्ति कड़े सोपवुन उन्हा सत्ता केंद्रांची विभागणी केली।
Reference text: त्यानंतर श्रीमती सोनिया गांधी यांनी पंतप्रधानपद दुसर् या व्यक्तीकडे सोपवून पुन्हा सत्ताकेंद्रांची विभागणी केली
WER: 1.0
CER: 0.13636363636363635
--------------------------------------
Audio File: common_voice_mr_31120466.wav
Transcribed text:  कसेच हे शहर न्यू साउथ वेल्स या राज्याची राजधानी देखिला हे।
Reference text: तसेच हे शहर न्यू साउथ वेल्स ह्या राज्याची राजधानी देखील आहे
WER: 0.36363636363636365
CER: 0.11864406779661017
--------------------------------------
Audio File: common_voice_mr_31147744.wav
Transcribed text:  या रुपान्तरात राम दुईयम वदूरबल भूमिके ताहे।
Reference text: या रूपातंरात राम दुय्यम व दुर्बल भूमिकेत आहे
WER: 0.75
CER: 0.29545454545454547
--------------------------------------
Audio File: common_voice_mr_31138365.wav
Transcribed text:  या कार्यक्रमा मधे गुंधली लोग सर्व देवतांच

Whisper did not predict an ending timestamp, which can happen if audio is cut off in the middle of a word. Also make sure WhisperTimeStampLogitsProcessor was used during generation.


Audio File: common_voice_mr_31138743.wav
Transcribed text:  મહારાશ્ટ્રિયા કોંગ્રીસ નેત્યાને કેન્દ્રિય નેત�
Reference text: महाराष्ट्रीय काँग्रेस नेत्यांनी केंद्रीय नेतृत्वासमोर गुडघे टेकले
WER: 1.0
CER: 0.9384615384615385
--------------------------------------
Audio File: common_voice_mr_31069674.wav
Transcribed text:  महा भारत का ज्री कृष्णा ने कोण्यापूर या टिकाना हुन रुक्मिनीचे हरन केले होते हैं।
Reference text: महाभारत काळात श्रीकृष्णाने कौंडिण्यपूर या ठिकाणाहून रुक्मिणीचे हरण केले होते
WER: 1.2
CER: 0.3026315789473684
--------------------------------------
Audio File: common_voice_mr_31086832.wav
Transcribed text:  यह नाओ लाटिन भाषेचिल मेर मंजेच समुद दया शब्दाचे अधिक वचना है।
Reference text: हे नाव लॅटिन भाषेतील मेअर म्हणजे समुद्र या शब्दाचे अनेकवचन आहे
WER: 1.0
CER: 0.3387096774193548
--------------------------------------
Audio File: common_voice_mr_31138453.wav
Transcribed text:  శివ్ జయంతి మంజి సుక్టి అష్ణార్తులా.
Reference text: शिवजयंती म्हणजे सुट्टी असणार तुला
WER: 1.0
CER: 

Whisper did not predict an ending timestamp, which can happen if audio is cut off in the middle of a word. Also make sure WhisperTimeStampLogitsProcessor was used during generation.


Audio File: common_voice_mr_30956171.wav
Transcribed text:  ताटीच अभंगा द्वारे ग्यानेश्वरानी विनवनी ग्यानेश्वरान कडून ग्यानेश्वरी निर्मितीची मुक्ता बाईने चांग देवाना प
Reference text: ताटीच्या अभंगाद्वारे ज्ञानेश्वरांना विनवणी ज्ञानेश्वरांकडून ज्ञानेश्वरीची निर्मिती मुक्ताबाईने चांगदेवाना पासष्टी चा अर्थ सांगितला
WER: 1.0769230769230769
CER: 0.3384615384615385
--------------------------------------
Audio File: common_voice_mr_31120374.wav
Transcribed text:  ते थिल सर्वर अस्त्यांची व्यवस्था पाहर नेहे त्यांचेच काम।
Reference text: तेथील सर्व रस्त्यांची व्यवस्था पाहणे हे त्यांचेच काम
WER: 0.875
CER: 0.17307692307692307
--------------------------------------
Audio File: common_voice_mr_31208846.wav
Transcribed text:  यती पद्याचालित मनताना जियाक्षर उच्छाडल्या अंतर किंचित थामबावे लगते त्या थामनाला यती मनतात।
Reference text: यती पद्य चालीत म्हणताना जे अक्षर उच्चारल्यानंतर किंचित थांबावे लागते त्या थांबण्याला यती म्हणतात
WER: 0.7142857142857143
CER: 0.23958333333333334
------------------------

Whisper did not predict an ending timestamp, which can happen if audio is cut off in the middle of a word. Also make sure WhisperTimeStampLogitsProcessor was used during generation.


Audio File: common_voice_mr_31147740.wav
Transcribed text:  पुर्वार्ध ब्रेटिशान नी अपल्या राज्य कार्भारा साथी भारताची विभागनी वेग-वेगला प्रांतात केली होती, परंतु ती भाषे प
Reference text: पूर्वार्ध ब्रिटिशांनी आपल्या राज्यकारभारासाठी भारताची विभागणी वेगवेगळ्या प्रांतात केली होती परंतु ती भाषेप्रमाणे नव्हती
WER: 0.8571428571428571
CER: 0.23529411764705882
--------------------------------------
Audio File: common_voice_mr_31069672.wav
Transcribed text:  अलीकर चा कालात मुंबाईत या पक्षाने आग्मन केले होते हैं।
Reference text: अलीकडच्या काळात मुंबईत या पक्षाने आगमन केले होते
WER: 0.75
CER: 0.25
--------------------------------------
Audio File: common_voice_mr_31138447.wav
Transcribed text:  जय प्रकाश नारायन यानी स्थपन केला समाजवादी पक्षव या त्या तुकड़ें परीकीच एक पक्षव।
Reference text: जयप्रकाश नारायण यांनी स्थापन केलेला समाजवादी पक्ष हा त्या तुकड्यांपैकीच एक पक्ष
WER: 0.9166666666666666
CER: 0.20253164556962025
--------------------------------------
Audio File: common_voice_mr_31208838.wav

Whisper did not predict an ending timestamp, which can happen if audio is cut off in the middle of a word. Also make sure WhisperTimeStampLogitsProcessor was used during generation.


Audio File: common_voice_mr_31120247.wav
Transcribed text:  હે રાજ્ય શૃષ્ટી સોંદર્યાને વવિવીદો લોકો સંસ્ક�
Reference text: हे राज्य सृष्टिसौंदर्याने व विविध लोकसंस्कृतींनी नटले आहे
WER: 1.0
CER: 0.9298245614035088
--------------------------------------
Audio File: common_voice_mr_31195666.wav
Transcribed text:  अकोला जिल्यातिल तालुके अकोला, बालापूर, पातूर, बारशी टाकली, मुर्तिजापूर, अकोट वतेदलारा
Reference text: अकोला जिल्ह्यातील तालुके अकोला बाळापूर पातूर बार्शीटाकळी मुर्तिजापूर अकोट व तेल्हारा
WER: 0.8181818181818182
CER: 0.19047619047619047
--------------------------------------
Audio File: common_voice_mr_31195437.wav
Transcribed text:  विश्म प्रतिद्ञ्या देववरत हा हस्तिनापुरासा राजा शंतनु वगंगा यांचा पुत्र होता।
Reference text: भीष्मप्रतिज्ञा देवव्रत हा हस्तिनापुराचा राजा शंतनू व गंगा यांचा पुत्र होता
WER: 0.7272727272727273
CER: 0.16216216216216217
--------------------------------------
Audio File: common_voice_mr_31195433.wav
Transcribed text:  मरधे करोत तर नव कवीन चा दुसरा पेडीति