In [15]:
import whisper
import textwrap

In [19]:
whisper.available_models()

['tiny.en',
 'tiny',
 'base.en',
 'base',
 'small.en',
 'small',
 'medium.en',
 'medium',
 'large-v1',
 'large-v2',
 'large']

In [20]:
# load models to memory (total size 4GB)
model_base = whisper.load_model("base")
model_small = whisper.load_model("small")
model_medium = whisper.load_model("medium")
model_large = whisper.load_model("large")

100%|█████████████████████████████████████| 1.42G/1.42G [00:59<00:00, 25.6MiB/s]
100%|█████████████████████████████████████| 2.87G/2.87G [01:27<00:00, 35.4MiB/s]


In [2]:
# load audio and pad/trim it to fit 30 seconds
audio = whisper.load_audio("teivainen-zyskowitz.mp3")
audio = whisper.pad_or_trim(audio)

# make log-Mel spectrogram and move to the same device as the model
mel = whisper.log_mel_spectrogram(audio).to(model.device)

# detect the spoken language
_, probs = model.detect_language(mel)
print(f"Detected language: {max(probs, key=probs.get)}")

Detected language: fi


In [22]:
# decode the audio
models = [model_base, model_small, model_medium]
model_names = ['Base model', 'Small model', 'Medium model']
options = whisper.DecodingOptions(fp16=False)

for i, model in enumerate(models):
    result = whisper.decode(model, mel, options)

    # print the recognized text
    print(f"Transcription with {model_names[i]}. \n")
    print(textwrap.fill(result.text, 120))
    print("\n")

Transcription with Base model. 

Terve, kaikki katsotaan, että kuuntelee, että terve tulla avutukästiin maanteiden juontajat tänään isak-rautio. Mennään
jaksoon. Tässä jaksapuutaan mun massa holkaustin, kieltämisen tai kiistämisen lailisuudesta, ehkä vaan vakarististää
muista vastavalleista aiheesta ja vienne meillä on studiossa. Helsingin Yliopiston maailman politiikan professori.
Teivota ei vain etävät tulla. Iva mahtava olla tälttein upeissa studiossa. Kiitos, olen just muuta. Ja näin hyvä
seurassa vielä.


Transcription with Small model. 

Terve, kaikkia katsojat ja kuuntelijat, tervetuloa Futukeastiin. Mä oon teidän juontaja tänään Isaac Rautio. Mennään
jakson. Tässä jakso puhutaan mun muassa holokaustin, kieltämisen tai kiistämisen laillisuudesta. Ehkä vään hakarististää
muista vastaavalaista aiheesta ja vieränä meillä on studiossa. Helsingin yliopiston maailman politiikan professori Teivo
Teiva, ennen tervetuloa. Iva mahtava olla täältä teidän UP-sassa studiossa. Kiitos olla jus

In [None]:
# Transcribe full audio at once. It takes quite long time. Didn't run it.
model = whisper.load_model("small")
result = model.transcribe("teivainen-zyskowitz.mp3")
print(result["text"])