In [1]:
import whisper
import os
import time
from tqdm import tqdm  # for progress bar

# ๐ Add the folder containing ffmpeg.exe to the PATH for this session
ffmpeg_path = r"C:\Users\vip\AppData\Local\Microsoft\WinGet\Links"
os.environ["PATH"] += os.pathsep + ffmpeg_path

# Load Whisper model on CPU
model = whisper.load_model("large", device="cpu")

# Arabic prompt to guide transcription
prompt = "ูุฐู ูุจุงุฑุงุฉ ูุฑุฉ ูุฏู ุจูู ูุฑููู ุงูุงุชุญุงุฏ ูุงููุตุฑ ูู ุงูุฏูุฑู ุงูุณุนูุฏู. ูุชู ุฐูุฑ ุฃุณูุงุก ุงููุงุนุจูู ูุซู ุนุจุฏ ุงูุฑุฒุงู ุญูุฏุงูููุ ูุฑูุณุชูุงูู ุฑููุงูุฏูุ ุฃุญูุฏ ุดุฑุงุญูููุ ูููุฏ ุงููููุฏ. ุงูุชุนููู ูุชุถูู ุชูุฑูุฑุงุชุ ุชุณุฏูุฏุงุชุ ุฃูุฏุงูุ ูุชุณููุงุช. ุงููุนูู ูุตู ุงูุญุฑูุงุช ุจุดูู ุญูุงุณู ุจุงููุบุฉ ุงูุนุฑุจูุฉ."

# Timer
start = time.time()

# Use tqdm to wrap Whisper's internal segments generator
def transcribe_with_progress():
    result = model.transcribe(
        r"C:\My Projects\SCAI\football_match_50_55_audio.mp3",
        language="ar",
        initial_prompt=prompt,
        verbose=True,  # Whisper prints progress info
        fp16=False     # ensure CPU compatibility
    )
    return result

# Run and show elapsed time
result = transcribe_with_progress()
print(f"\nโฑ๏ธ Total transcription time: {round(time.time() - start, 2)} seconds\n")

# Output result
print(result["text"])




[00:00.000 --> 00:08.420]  ุชุญุชุถู ูุฐู ุงูููุงุฑ ูู ุฃุฌูุงุจ ูููุฆุฉ ุจุงูุตุฎุจ ูุงูุณุญุฑ ูุงููุชุนู ูููุฑููุฉ ุงููุจูุฑุฉ ุฌุฏุง.
[00:09.080 --> 00:14.600]  ูุจุงูุชุฃููุฏ ูู ูุฑุนุทู ููู ุฌุฏุงุ ุจู ุฃุฎุทุฑ ุฑุจูุง ุงููุฑุนุทูุงุช ุนูู ูุณุชูู ุงูุฏูุฑู.
[00:14.600 --> 00:22.260]  ูู ุฃุฌุฑู ุณุช ููุงุท ูุฑูู ูููุณุช ุซูุงุซุฉ ููุงุทุ ุณุช ููุงุท ูุฑูุณุชูุงูู ูููุณุช ูุฌุฑุฏ ุซูุงุซุฉ ููุงุท.
[00:22.600 --> 00:28.860]  ูู ูุณูุนูู ุงููููุฉุ ูู ููุจู ุงููุฏุงุก ููุฃุชู ุจุงูุงูุชุตุงุฑ ุงูุซููู ูููุชุฑุจ ุฃูุซุฑ.
[00:30.000 --> 00:33.280]  ุฃู ูุฃุฎุฐ ุฎุทูุฉ ูููุฉ ูููููุณ ุจููุจ ุงูุฏูุฑู.
[00:33.360 --> 00:35.760]  ุทุฑูู ูุง ุฒุงู ุทููู ุฌุฏุง ุจุงูุชุฃููุฏ.
[00:36.200 --> 00:39.400]  ุงูููุงูุณุฉ ุซูุงุซูุฉ ูููููุณ ุจููุจ ุงูุฏูุฑู.
[00:39.740 --> 00:43.540]  ูุฐู ุนุงุฏุฉ ููุฑุฉ ูุฑูู ุงููู ูุงู ูููุง ูุช

In [6]:
with open("arabic_commentator_transcript.txt", "w", encoding="utf-8") as f:
    f.write(result['text'])


In [None]:
# Save to TXT
output_path = r"C:\My Projects\SCAI\football_match_50_55_transcript.txt"
with open(output_path, "w", encoding="utf-8") as f:
    f.write(result["text"])

print(f"\n๐ Transcription saved to: {output_path}")