In [1]:
import os
import glob
from transformers import pipeline
import torch
import time

  from .autonotebook import tqdm as notebook_tqdm


In [2]:
model_name = "openai/whisper-medium"
pipe = pipeline("automatic-speech-recognition", model=model_name, device="cuda" if torch.cuda.is_available() else "cpu")

pipe.save_pretrained("./whisper_medium_model")

Device set to use cpu


In [3]:
def load_audio(path):
    audio_files = glob.glob(os.path.join(path, "*.wav"))
    return audio_files

In [4]:
def transcribe_audio(audio_file_path, model_name="openai/whisper-small"):
    pipe = pipeline("automatic-speech-recognition", model=model_name, device="cuda" if torch.cuda.is_available() else "cpu")
    start_time = time.time()
    res = pipe(audio_file_path)
    end_time = time.time()
    return res["text"], end_time - start_time


In [5]:
def test_whisper_speed(audio_files, model_name):
    total_time = 0
    if not audio_files:
        print("Нет аудиофайлов в указанной папке!")
        return

    for audio_file in audio_files:
      try:
        text, time_taken = transcribe_audio(audio_file, model_name)
        total_time+=time_taken
        print(f"File: {os.path.basename(audio_file)}.\nТранскрпция текста: {text}")
      except Exception as e:
        print(f"ошибка во время обработки {os.path.basename(audio_file)}: {e}")
    avg_time = total_time/len(audio_files)
    print(f"Модель: {model_name}")
    print(f"Среднее время транскрипции: {avg_time:.2f} секунд на файл")




In [None]:
if __name__ == "__main__":
    dataset_path = "./podcast/podcast_test/wavs"

    audio_files = load_audio(dataset_path)

    models = ["openai/whisper-small", "openai/whisper-medium", "openai/whisper-large-v3"]

    for model in models:
       test_whisper_speed(audio_files, model)

Device set to use cpu
Due to a bug fix in https://github.com/huggingface/transformers/pull/28687 transcription using a multilingual Whisper will default to language detection followed by transcription instead of translation to English.This might be a breaking change for your use case. If you want to instead always translate your audio to English, make sure to pass `language='en'`.
Passing a tuple of `past_key_values` is deprecated and will be removed in Transformers v4.43.0. You should pass an instance of `EncoderDecoderCache` instead, e.g. `past_key_values=EncoderDecoderCache.from_legacy_cache(past_key_values)`.


File: 6d78db336b729886b4014ec8d7ad4d56.wav.
Транскрпция текста:  Драки снимают постановы.


Device set to use cpu


File: 0ef669bd8451f34c1d0e277349cd41eb.wav.
Транскрпция текста:  Передача мужской женской.


Device set to use cpu


File: 5ed15c01fab4a41fceb4b1e194acefdc.wav.
Транскрпция текста:  Озеро мертвых


Device set to use cpu


File: 6d26a03050f60832a3489bd093be15cd.wav.
Транскрпция текста:  Как делаю стену?


Device set to use cpu


File: 3b1fa189472c480399d37cd12d7ad2ee.wav.
Транскрпция текста:  Мультик Лего Сити Динозавра


Device set to use cpu


File: 6d455a3405e7d5e03999251cd04539ee.wav.
Транскрпция текста:  Великолепный век 22-я Сирия


Device set to use cpu


File: 6af3e6ce8052fcc5383f4bc0e7235f34.wav.
Транскрпция текста:  MBC 뉴스 김성현입니다.


Device set to use cpu


File: 5fbc1defc872c91df995dee391a7f7c0.wav.
Транскрпция текста:  Мокрые кроссовки.


Device set to use cpu


File: 1c0fcb4340df29c2756215ccd36bd1e2.wav.
Транскрпция текста:  Найди в YouTube событие ГКЧП


Device set to use cpu


File: 2e5c4ce647391c3587c3668ac3ae7c86.wav.
Транскрпция текста:  Это будет наш табо-шикрет.


Device set to use cpu


File: 1ef8555b1e7822ed56872bcace024b07.wav.
Транскрпция текста:  Видео великолепный век.


Device set to use cpu


File: 0d9d3618a70ffaa344c8eaa2f8a7bf0b.wav.
Транскрпция текста:  Ну расскажи мне, что такое дерево Тив?


Device set to use cpu


File: 1bdfd3d71c90001023f490f46aa5bed1.wav.
Транскрпция текста:  Открой на YouTube канал ТНТ.


Device set to use cpu


File: 4bbfa2b94e32d881aa1006fb24ca84b7.wav.
Транскрпция текста:  Ты тупой анекдот, а не мне вопросы задавай.


Device set to use cpu


File: 6c0dddce6a86f7fe9c017c03a299773e.wav.
Транскрпция текста:  Мне нужна стоимость авиабилета


Device set to use cpu


File: 1ce09fc2c5deef70d491936ffc42853e.wav.
Транскрпция текста:  Английская песня «Алфавит».


Device set to use cpu


File: 6ad009df06f2300afbc09923a52e6c63.wav.
Транскрпция текста:  Смотреть российский фильм Ростолбай


Device set to use cpu


File: 6a2e1ec332a137590869c8d6f13dc1c4.wav.
Транскрпция текста:  Как сделать прикольные штучки самим?


Device set to use cpu


File: 03a46ffd90601f21e1da25e341d17890.wav.
Транскрпция текста:  Расскажи о животных.


Device set to use cpu


File: 0cd0f503cf489e20e7e72955e20ec8dd.wav.
Транскрпция текста:  So, so, so...


Device set to use cpu


File: 1f3a87af6fea09bbd214905bab0cccc1.wav.
Транскрпция текста:  Игра на пианино.


Device set to use cpu


File: 6af536d6d9edbdef0bde3f4a05f68d20.wav.
Транскрпция текста:  У меня сегодня плохое настроение.


Device set to use cpu


File: 1a66cdb1a0dfe4b8c21c96db8273a59d.wav.
Транскрпция текста:  Виснет приставка ОКО.


Device set to use cpu


File: 02a4939015462328cb24b6233f003af3.wav.
Транскрпция текста:  Что такое солнце?


Device set to use cpu


File: 0f6231dcaeb74e5c64b7a52ebea37ef3.wav.
Транскрпция текста:  Ключи и песни у скриптонейта танцуют сама.


Device set to use cpu


File: 6c76edb42b7d091a3d8c6262bdfcd349.wav.
Транскрпция текста:  Закрой в контакте.


Device set to use cpu


File: 00f1e2a546170234504d9482716adf8e.wav.
Транскрпция текста:  Голодный пес песня


Device set to use cpu


File: 5c277e766d131f45f4ac623d1b341e2f.wav.
Транскрпция текста:  Весёлые похороны 10 часов.


Device set to use cpu


File: 5ed2c09b86c3cd78afb1c1b98902f594.wav.
Транскрпция текста:  Фигня у меня заканчивается.


Device set to use cpu


File: 01bd1b6b90940bd73d40397a3ad9c397.wav.
Транскрпция текста:  Салют Сбер, я тебя люблю!


Device set to use cpu


File: 0dd79ab337f9f181dd8e462b7fec21ed.wav.
Транскрпция текста:  Папка грани с собакой.


Device set to use cpu


File: 1fdbe8e661e7595dc000a19015b023a7.wav.
Транскрпция текста:  Как купить канал ТНТ?


Device set to use cpu


File: 1a7ec19d272157c1d8a3d9fabf1b9717.wav.
Транскрпция текста:  Синий трактор прогулки.


Device set to use cpu


File: 5d7a9851f886389046f93d6c0726885e.wav.
Транскрпция текста:  Эльза, Эльза короче говоря


Device set to use cpu


File: 1c794e102e86b1227e3ac1f343f53981.wav.
Транскрпция текста:  Сколько стоит подключить сервис?


Device set to use cpu


File: 05d3d3f6989cad7c3748878688f39606.wav.
Транскрпция текста:  Мне тоже радостно


Device set to use cpu


File: 0b166d5b354d96e7053ada8e38c35f9e.wav.
Транскрпция текста:  Какая погода всем феррополи


Device set to use cpu


File: 1a478f79d2805968673178bff6747f0e.wav.
Транскрпция текста:  Киокусенька


Device set to use cpu


File: 2f6fe320e6cfcfd1b4d3a8335536481d.wav.
Транскрпция текста:  6 юбилейный проезд 40


Device set to use cpu


File: 4b60df5f64ad39fb3b88895a83ecb7de.wav.
Транскрпция текста:  включись Joker
Модель: openai/whisper-small
Среднее время транскрипции: 7.26 секунд на файл


Device set to use cpu


File: 6d78db336b729886b4014ec8d7ad4d56.wav.
Транскрпция текста:  Драки снимают постановы.


Device set to use cpu


File: 0ef669bd8451f34c1d0e277349cd41eb.wav.
Транскрпция текста:  Передача мужское-женское.


Device set to use cpu


File: 5ed15c01fab4a41fceb4b1e194acefdc.wav.
Транскрпция текста:  Озеро мёртвых.


Device set to use cpu


File: 6d26a03050f60832a3489bd093be15cd.wav.
Транскрпция текста:  как делаю стену


Device set to use cpu


File: 3b1fa189472c480399d37cd12d7ad2ee.wav.
Транскрпция текста:  Мультик Лего с сетью динозавра


Device set to use cpu


File: 6d455a3405e7d5e03999251cd04539ee.wav.
Транскрпция текста:  Великолепный век, 22-я серия.


Device set to use cpu


File: 6af3e6ce8052fcc5383f4bc0e7235f34.wav.
Транскрпция текста:  이 시각 세계였습니다.


Device set to use cpu


File: 5fbc1defc872c91df995dee391a7f7c0.wav.
Транскрпция текста:  Мокрые кроссовки.


Device set to use cpu


File: 1c0fcb4340df29c2756215ccd36bd1e2.wav.
Транскрпция текста:  Найди в Ютубе события ГКЧП.


Device set to use cpu


File: 2e5c4ce647391c3587c3668ac3ae7c86.wav.
Транскрпция текста:  Это будет наш будущий кредит.


Device set to use cpu


File: 1ef8555b1e7822ed56872bcace024b07.wav.
Транскрпция текста:  Видео великолепный век!


Device set to use cpu


File: 0d9d3618a70ffaa344c8eaa2f8a7bf0b.wav.
Транскрпция текста:  Ну, расскажи мне, что такое дереватив?


Device set to use cpu


File: 1bdfd3d71c90001023f490f46aa5bed1.wav.
Транскрпция текста:  Открой на YouTube канал TNT.


Device set to use cpu


File: 4bbfa2b94e32d881aa1006fb24ca84b7.wav.
Транскрпция текста:  Ты тупой анекдот, а не мне вопросы задавай.


Device set to use cpu


File: 6c0dddce6a86f7fe9c017c03a299773e.wav.
Транскрпция текста:  Мне нужна стоимость авиабилета


Device set to use cpu


File: 1ce09fc2c5deef70d491936ffc42853e.wav.
Транскрпция текста:  Английская песня, алфавит.


Device set to use cpu


File: 6ad009df06f2300afbc09923a52e6c63.wav.
Транскрпция текста:  Смотреть российский фильм «Раздолбай».


Device set to use cpu


File: 6a2e1ec332a137590869c8d6f13dc1c4.wav.
Транскрпция текста:  Как сделать прикольные штучки самим.


Device set to use cpu


File: 03a46ffd90601f21e1da25e341d17890.wav.
Транскрпция текста:  Расскажи о животных


Device set to use cpu


File: 0cd0f503cf489e20e7e72955e20ec8dd.wav.
Транскрпция текста:  Саша Шоу


Device set to use cpu


File: 1f3a87af6fea09bbd214905bab0cccc1.wav.
Транскрпция текста:  Игра на пианино.


Device set to use cpu
