In [1]:
!pip install openai-whisper --no-cache-dir
!pip install pydub
!pip install psutil
!pip install ffmpeg

import os
import whisper
import gc
from pydub import AudioSegment
import tempfile
from tqdm.notebook import tqdm
import psutil
import time  # Precisamos importar o módulo 'time' para usar 'time.sleep()'

Collecting openai-whisper
  Downloading openai-whisper-20230918.tar.gz (794 kB)
[?25l     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m0.0/794.3 kB[0m [31m?[0m eta [36m-:--:--[0m[2K     [91m━━━━━━━━━[0m[91m╸[0m[90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m194.6/794.3 kB[0m [31m5.6 MB/s[0m eta [36m0:00:01[0m[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m794.3/794.3 kB[0m [31m16.6 MB/s[0m eta [36m0:00:00[0m
[?25h  Installing build dependencies ... [?25l[?25hdone
  Getting requirements to build wheel ... [?25l[?25hdone
  Preparing metadata (pyproject.toml) ... [?25l[?25hdone
Collecting triton==2.0.0 (from openai-whisper)
  Downloading triton-2.0.0-1-cp310-cp310-manylinux2014_x86_64.manylinux_2_17_x86_64.whl (63.3 MB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m63.3/63.3 MB[0m [31m318.2 MB/s[0m eta [36m0:00:00[0m
Collecting tiktoken==0.3.3 (from openai-whisper)
  Downloading tiktoken-0.3.3-cp310-cp310-manylinu

In [2]:
def split_audio(file_name, chunk_length_ms=300000):
    audio = AudioSegment.from_file(file_name, format="mp3")
    return [audio[i:i+chunk_length_ms] for i in range(0, len(audio), chunk_length_ms)]

def split_and_transcribe_audio(model, file_name, output_file, chunk_length_ms=300000):
    chunks = split_audio(file_name, chunk_length_ms)
    with open(output_file, 'w', encoding='utf-8') as f_out:
        for chunk_num, audio_chunk in enumerate(chunks):
            temp_file = tempfile.NamedTemporaryFile(suffix=".wav", delete=False)
            try:
                audio_chunk.export(temp_file.name, format="wav")
                retry_attempts = 3
                delay = 2  # delay inicial em segundos
                success = False
                while retry_attempts > 0:
                    try:
                        result = model.transcribe(temp_file.name, language="Portuguese")
                        f_out.write(result["text"])
                        success = True
                        break
                    except MemoryError:
                        print(f"Erro de memória no chunk {chunk_num}. Tentando novamente em {delay} segundos...")
                        retry_attempts -= 1
                        time.sleep(delay)
                        delay *= 2  # Double the delay for the next retry
                    except Exception as e:
                        print(f"Erro no chunk {chunk_num}: {e}")
                        break

                if not success:
                    print(f"Não foi possível transcrever o chunk {chunk_num} após várias tentativas.")

                if chunk_num % 20 == 0 and chunk_num > 0:
                    gc.collect()
                    mem = psutil.virtual_memory()
                    while mem.available < 1 * (1024 ** 3):  # espera até ter pelo menos 1GB disponível
                        print(f"Memória baixa ({mem.available / (1024.0 ** 3):.2f} GB). Esperando...")
                        time.sleep(10)
                        mem = psutil.virtual_memory()

            finally:
                temp_file.close()
                os.unlink(temp_file.name)

def main():
    model = whisper.load_model("large")
    files = [
		"./sample_data/DP-900 ｜ EP 1⧸4 ｜ DP900 ｜ Treinamento Oficial ｜ Microsoft Azure Data Fundamentals.mp3",
		"./sample_data/DP-900 ｜ EP 2⧸4 ｜ DP900 ｜ Treinamento Oficial ｜ Microsoft Azure Data Fundamentals.mp3",
		"./sample_data/DP-900 ｜ EP 3⧸4 ｜ DP900 ｜ Treinamento Oficial ｜ Microsoft Azure Data Fundamentals.mp3",
		"./sample_data/DP-900 ｜ EP 4⧸4 ｜ DP900 ｜ Treinamento Oficial ｜ Microsoft Azure Data Fundamentals.mp3"	]


    for file_path in files:
        base_name = os.path.splitext(os.path.basename(file_path))[0]
        output_file = os.path.join("./sample_data", f"{base_name}.txt")
        split_and_transcribe_audio(model, file_path, output_file)
        print(f"Transcrição para o arquivo '{file_path}' salva em '{output_file}'.")

if __name__ == "__main__":
    main()


100%|█████████████████████████████████████| 2.87G/2.87G [01:07<00:00, 45.9MiB/s]


Transcrição para o arquivo './sample_data/DP-900 ｜ EP 1⧸4 ｜ DP900 ｜ Treinamento Oficial ｜ Microsoft Azure Data Fundamentals.mp3' salva em './sample_data/DP-900 ｜ EP 1⧸4 ｜ DP900 ｜ Treinamento Oficial ｜ Microsoft Azure Data Fundamentals.txt'.
Transcrição para o arquivo './sample_data/DP-900 ｜ EP 2⧸4 ｜ DP900 ｜ Treinamento Oficial ｜ Microsoft Azure Data Fundamentals.mp3' salva em './sample_data/DP-900 ｜ EP 2⧸4 ｜ DP900 ｜ Treinamento Oficial ｜ Microsoft Azure Data Fundamentals.txt'.
Transcrição para o arquivo './sample_data/DP-900 ｜ EP 3⧸4 ｜ DP900 ｜ Treinamento Oficial ｜ Microsoft Azure Data Fundamentals.mp3' salva em './sample_data/DP-900 ｜ EP 3⧸4 ｜ DP900 ｜ Treinamento Oficial ｜ Microsoft Azure Data Fundamentals.txt'.
Transcrição para o arquivo './sample_data/DP-900 ｜ EP 4⧸4 ｜ DP900 ｜ Treinamento Oficial ｜ Microsoft Azure Data Fundamentals.mp3' salva em './sample_data/DP-900 ｜ EP 4⧸4 ｜ DP900 ｜ Treinamento Oficial ｜ Microsoft Azure Data Fundamentals.txt'.
