In [None]:
!pip install -q transformers==4.46.0 accelerate librosa

In [2]:
import torch
import librosa
import soundfile as sf
from transformers import AutoModelForSpeechSeq2Seq, AutoProcessor, pipeline

In [3]:
import locale
locale.getpreferredencoding = lambda: "UTF-8"

In [4]:
device = "cuda:0" if torch.cuda.is_available() else "cpu"
torch_dtype = torch.float16 if torch.cuda.is_available() else torch.float32

The whisper models were trained on either English-only data or multilingual data.

In [None]:
model_id = "openai/whisper-large-v3"

model = AutoModelForSpeechSeq2Seq.from_pretrained(
    model_id, torch_dtype=torch_dtype, low_cpu_mem_usage=True, use_safetensors=True
)
model.to(device)

processor = AutoProcessor.from_pretrained(model_id)

pipe = pipeline(
    "automatic-speech-recognition",
    model=model,
    tokenizer=processor.tokenizer,
    feature_extractor=processor.feature_extractor,
    torch_dtype=torch_dtype,
    device=device,
)

In [9]:
from IPython.display import Audio, display

audio_file_path = "/content/Paaraa-MassTamilan.mp3.mp3"
display(Audio(filename=audio_file_path, autoplay=False))

In [10]:
audio_data, sample_rate = librosa.load(audio_file_path)

In [11]:
prediction = pipe(audio_data, generate_kwargs={"language": "tamil", "task" : "transcribe", "return_timestamps":True})["text"]

You have passed task=transcribe, but also have set `forced_decoder_ids` to [[1, None], [2, 50360]] which creates a conflict. `forced_decoder_ids` will be ignored in favor of task=transcribe.


In [12]:
prediction

' ஏற்றும் பாதையை முடியும் வாரா வருவது வாரா பலையா பீரா விழுப்பு நரகாரா வாரா வாயிரம் உனை வார் ஒரு பன்னேரா பலிப்புலி வரா காரா திரவுள்ள தோழ்கள் உண்டு, தியைக் கட்டும் வாழ்க்கள் உண்டு, குரபிக்கிறைக்கை உண்டு, புயதுக்கும் காதுர்வம் உண்டு, தொட்டுப் பார்க்கை நடுக்கும், புச்சடக்கும் இவனைக் கண்டு, பிரிந்தைக்கு போகுது, வாழ்வைக்கை வேகுந்து, என் சாய்மன் பெயராடை. என் தாய்மன் பேராரை இது தவிர்மாரம் தின் சேரை அடபெல்லை ரந்தம் பொண்டு இனி வாழில் எண்பிசாரை என் தாய்மன் பேராரை இது தவிர்மாரம் தின் சேரை அடபெல்லை ரந்தம் பொண்டு இனி வாழில் எண்பிசாரை வாரா, வருவது வாரா, குழையா, வீரா, விருப்புந்த அலகாரா, வாரா, வாயிரம் புரைவார் உருபன் பேரா, வயிர்புதி வரலாரா, ஐயா! முதலில் அமர்ந்து கொள்ளுங்கள் கண்ணங்கரு இறவு போதாத நமக்கு, பெள்ளக்காரு நீலவான் மீத எதுக்கு, ரத்தக்கரு படிஞ்ச உவாளின் முனைக்கு, முத்தக்கரு உன்னு வேணாம துணைக்கு, உன்னோட காலடி குழப்பாகனோ, போமெல விழப்புன் தழும் வாகனோ போக்கையில் சேரும் வரமாகனோ இல்ல தாய் மண்ணுக்கே நான் உரமாகனோ அண்ணியே வெங்கே அண்ணி கொண்டின் அண்ணியே ஒரும்மன் அன்னி வாசம் மாட்டு வரட்டா புயாவனியே செலப் பு