In [6]:
import os 
import speech_recognition as sr 
from pydub import AudioSegment
from pydub.silence import split_on_silence

---

In [7]:
filename = './data/005c.wav'

In [17]:
def audio2text(filename, temp_folder = None, language = None, min_silence_len = 700, silence_thresh = -16, keep_silence = 500):
    """
    Splitting the large audio file into chunks
    and apply speech recognition on each of these chunks
    """
    
    # create a speech recognition object
    r = sr.Recognizer()

    # open the audio file using pydub
    sound = AudioSegment.from_wav(filename)
    
    # split audio sound where silence is N miliseconds or more
    chunks = split_on_silence(sound,
        min_silence_len = min_silence_len,
        silence_thresh = sound.dBFS + silence_thresh,
        keep_silence = keep_silence,
    )
    
    # create a directory to store the audio chunks
    temp_folder = "audio-chunks" if temp_folder is None else temp_folder
    if not os.path.isdir(temp_folder):
        os.mkdir(temp_folder)
    whole_text = ""
    
    # process each chunk 
    for i, audio_chunk in enumerate(chunks, start=1):
        # export audio chunk and save it in
        # the `temp_folder` directory.
        chunk_filename = os.path.join(temp_folder, f"chunk{i}.wav")
        audio_chunk.export(chunk_filename, format = "wav")
        
        # recognize the chunk
        with sr.AudioFile(chunk_filename) as source:
            audio_listened = r.record(source)
            
            # try converting it to text
            try:
                text = r.recognize_google(audio_listened, language = "ru")
            except sr.UnknownValueError as e:
                print("Error:", str(e))
            else:
                text = f"{text.capitalize()}. "
#                 print(chunk_filename, ":", text)
                whole_text += text + '\n'
    
    # return the text for all chunks detected
    return whole_text

In [18]:
t = audio2text(
    filename = './data/005c.wav', 
    temp_folder = './data/audio-chunks', 
    language = 'ru',
    min_silence_len = 500,
    silence_thresh = -19,
    keep_silence = 350
)

print(t)

Error: 
Компания. 
Здравствуйте подскажите вот недавно с москвы звонили должны были мне позвонить пригласить меня на seo. 
У меня пробег уже 18000 никто не позвонил сейчас я звоню данилу. 
Вот он не понимает. 
Samsung блокировка никто из них не поднимаешь телефон ничего не отвечает у меня сейчас загорелась. 
Машины машины. 
Новая. 
Жена. 
Очень приятно высокого город. 
Алматы. 
Хорошо у вас какая модель автомобиль. 
Nissan. 
Хорошо я вас понял за нас потом номер нашёл. 
Работа ночная работа в 9:00 утра. 
Я сейчас забыл нажать марине хорошо. 
Хорошо. 



In [19]:
t = audio2text(
    filename = './data/006c.wav', 
    temp_folder = './data/audio-chunks', 
    language = 'ru',
    min_silence_len = 500,
    silence_thresh = -19,
    keep_silence = 350
)

print(t)

Error: 
Error: 
Error: 
Error: 
Error: 
Error: 
Error: 
Error: 
Error: 
Добрый день. 
Сергей геннадьевич компания renault казахстан innamorata вот вам сейчас удобно разговаривать. 
Хорошо мы приглашаем вас пройти опрос по качеству обслуживания это займёт несколько. 
У вас найдётся время. 
Да конечно. 
Хорошо сергеевич по нашим данным вы приобретали renault kaptur в дилерском центре interlan остаток лета. 
Достоверно хорошо давайте представим что ваш друг родственник или коллега захотел приобрести новый автомобиль. 
Порекомендуете ли вы ему обратиться в центр ван-авто пожалуйста оцените по шкале от 1 до 10 где 1 это определённо не рекомендую. 
Однозначно рекомендую. 
10 всё устроила. 
Хорошо а скажите пожалуйста по этой же десятибалльной шкале следующие вопросы насколько приветливого встретили в дилерском центре панавто. 
Так здесь. 
За основу принципа менеджера сразу подошли всё начали спрашивать объясняете показать. 
Хорошо а насколько менеджер хорошо смог определить потребности и пом