# Тестирование сервиса в ручную

In [1]:
from pathlib import Path

import pandas as pd

pd.set_option('display.max_colwidth', 500) 

In [2]:
import sys
import os

project_path = os.path.abspath(os.path.join(os.getcwd(), ".."))
sys.path.append(project_path)

from app.models.transcriber import FastWhisperTranscriber
from app.settings import settings

TEST_AUDIO_FILE = settings.AUDIO_DIR / "test_video_2.webm"

# TEST_AUDIO_FILE = settings.AUDIO_DIR / "test_video_3.mp4"


# MODEL_NAME = "bzikst/faster-whisper-large-v3-russian"
# MODEL_NAME = "bzikst/faster-whisper-large-v3-russian-int8"

MODEL_NAME = "Systran/faster-whisper-tiny"
# MODEL_NAME = "Systran/faster-whisper-small"

# MODEL_NAME = "dvislobokov/faster-whisper-large-v3-turbo-russian"

In [3]:
from pydub import AudioSegment

def get_audio_duration(path: str) -> float:
    audio = AudioSegment.from_file(path)
    return len(audio) / 1000.0

print(f"Audio duration: {get_audio_duration(str(TEST_AUDIO_FILE))} seconds")

Audio duration: 689.82 seconds


In [4]:
transcriber = FastWhisperTranscriber(
    model_name=MODEL_NAME,
    cache_dir=settings.CACHE_DIR,
    device=settings.DEVICE,
    # compute_type="int8",
    cpu_threads=8,
    num_workers=16,    
)


2026-01-12 14:14:14 - model - INFO - Модель Systran/faster-whisper-tiny загружена.


In [5]:

result = transcriber.transcribe(
    audio_path=str(TEST_AUDIO_FILE),
    beam_size=1,
    chunk_length=30,
    language="ru",
)

2026-01-12 14:14:14 - model - INFO - Старт транскрипции: D:\Projects\speech_to_text_service\data\audio\test_video_2.webm
2026-01-12 14:14:18 - faster_whisper - INFO - Processing audio with duration 11:29.820
2026-01-12 14:14:19 - model - INFO - Прогресс: 2.1%
2026-01-12 14:14:21 - model - INFO - Прогресс: 4.2%
2026-01-12 14:14:21 - model - INFO - Прогресс: 6.6%
2026-01-12 14:14:31 - model - INFO - Прогресс: 8.4%
2026-01-12 14:14:31 - model - INFO - Прогресс: 10.1%
2026-01-12 14:14:31 - model - INFO - Прогресс: 12.0%
2026-01-12 14:14:41 - model - INFO - Прогресс: 14.1%
2026-01-12 14:14:42 - model - INFO - Прогресс: 18.1%
2026-01-12 14:15:01 - model - INFO - Прогресс: 21.1%
2026-01-12 14:15:01 - model - INFO - Прогресс: 23.1%
2026-01-12 14:15:01 - model - INFO - Прогресс: 25.0%
2026-01-12 14:15:02 - model - INFO - Прогресс: 27.5%
2026-01-12 14:15:03 - model - INFO - Прогресс: 29.7%
2026-01-12 14:15:03 - model - INFO - Прогресс: 31.4%
2026-01-12 14:15:03 - model - INFO - Прогресс: 33.0%
2

In [6]:
result

{'language': 'ru',
 'duration': 689.82,
 'text': 'И насколько хорошо и так далее, это все делают только они. А все остальные вещи в этой системе могут делать любой ответственность, в которой сюда заведено. Вот. Это выжимка из того следующих, там трех минут или четырех даже. Сколько осталось, Маш? Так, четырим, 50 кри. Ну, пять минут. Ну, там в конце может быть что-то еще надо сказать, а по-моему, про ещел-то не чуть-чуть не. Сколько? Да не завалил. Тоб же у нас есть обращение, по-трогоому сравляем, витеральный, вот, в машине. Слушай, а в воду, 50? А, Север Маш? На, каком? Первое, первое этаж? Не, первое. Ну, спасибо. Ну, то, что они сидиралы, металл-то, что это фальки, которые они эти фальки архивы, насколько я понял, через адмисторацию президента. Нажмай. Другая структура, вот, это рактура. Вы их по-трогоому нас нет с ними, да, и по-трогоому. Нет, нет, нет. И если у нас есть соству, у нас есть соству, они все привязаны. Да, и если у их как-то не может, и тут должны оправляться данные,