In [1]:
import sys
import os
# Add the project root to Python path so we can import karma
sys.path.append(os.path.dirname(os.getcwd()))


In [9]:
from karma.models.indic_conformer import IndicConformerASR, INDIC_CONFORMER_MULTILINGUAL_META
from karma.eval_datasets.indicvoices_r_dataset import IndicVoicesRDataset
from karma.metrics.common_metrics import WERMetric, CERMetric
from karma.benchmark import Benchmark
from karma.metrics.asr_wer_preprocessor import ASRTextProcessor
from karma.cache.cache_manager import CacheManager


model = IndicConformerASR(model_name_or_path="ai4bharat/indic-conformer-600m-multilingual")
processor = ASRTextProcessor(use_glm=True, use_num2text=True, use_punc=True, use_lowercasing=True, language="hi")
dataset = IndicVoicesRDataset(language="Hindi", postprocessors=[processor])
mertric_configs = [
    {
        "metric": WERMetric(metric_name="wer"),
        "processors": []
    },
    {
        "metric": CERMetric(metric_name="cer"),
        "processors": []
    }
]
cache_manager = CacheManager(model_config=INDIC_CONFORMER_MULTILINGUAL_META, dataset_name=dataset.dataset_name)

✅ Connected to DuckDB at cache.db
✅ DuckDB persistent storage connected


In [10]:
benchmark = Benchmark(model=model, dataset=dataset, cache_manager=cache_manager)

In [11]:
benchmark.evaluate(metric_configs=mertric_configs, batch_size=1)

Fetching 403 files: 100%|██████████| 403/403 [00:00<00:00, 7968.21it/s]


{'overall_score': {'wer': 0.022222222222222223, 'cer': 0.005025125628140704},
 'predictions': [{'prediction': 'इसके अलावा कई सारी ऐसी पत्रिकाएँ भी समाचार पत्र के साथ आती हैं',
   'expected_output': 'इसके अलावा कई सारी ऐसे पत्रिकाएँ भी समाचार पत्र के साथ आती हैं',
   'sample': {'expected_output': 'इसके अलावा कई सारी ऐसे पत्रिकाएँ भी समाचार पत्र के साथ आती हैं',
    'audio': array([-2.9122859e-04, -9.7828422e-05, -2.2524942e-04, ...,
           -1.3460522e-04, -9.2088187e-05,  0.0000000e+00],
          shape=(80881,), dtype=float32),
    'other_args': {'language': 'hi'}},
   'from_cache': False,
   'success': True},
  {'prediction': 'क्योंकि मेरे घर में कुछ लोग को चाय पसंद है और कुछ लोग को कॉफी पीना पसंद है',
   'expected_output': 'क्योंकि मेरे घर में कुछ लोग को चाय पसंद है और कुछ लोग को कॉफी पीना पसंद है',
   'sample': {'expected_output': 'क्योंकि मेरे घर में कुछ लोग को चाय पसंद है और कुछ लोग को कॉफी पीना पसंद है',
    'audio': array([-1.6141692e-04,  9.6207863e-05, -1.4705223e-04, ...,