# Instalação do Whisper AI no Windows

## Pré-requisitos:

- Python
- PyTorch
- Chocolatey
- FFMPEG
- Whisper AI

## Etapas de Instalação

### 1. Instalando o Python
- Baixe a versão mais recente do Python (3.7 - 3.10) do site oficial.
- Marque a opção 'add python.exe to path' durante a instalação.

### 2. Instalando o PyTorch
- Baixe a versão correspondente do PyTorch do site oficial, adequada ao seu sistema operacional e versão do Python.
- Escolha a plataforma de cálculo de acordo com a configuração do seu computador.

### 3. Instalando o Chocolatey
- Abra o PowerShell como administrador e copie o comando do site do Chocolatey para instalação.
- Cole o comando no PowerShell e execute.

### 4. Instalando o FFMPEG
- Digite 'choco install ffmpeg' no PowerShell e execute.

### 5. Instalando o Whisper AI
- Abra o prompt de comando e digite 'pip install -U openai-whisper'. Execute o comando.

## Uso do Whisper AI

- Para transcrever um arquivo de áudio, digite 'whisper [nome do arquivo]' no prompt de comando.
- O Whisper AI pode transcrever múltiplos arquivos de uma vez e suporta vários formatos de arquivo.
- Cinco modelos diferentes podem ser escolhidos para transcrição com qualidade e tempo de processamento variáveis. Utilize o comando '--model' após o nome do arquivo para especificar um modelo.
- O Whisper AI também pode transcrever áudio em outros idiomas e traduzir para o inglês.
- Vários argumentos estão disponíveis para personalizar o comportamento de transcrição do Whisper AI. Para obter a lista completa de argumentos, digite 'whisper --help' no prompt de comando.

###### Fonte: 
https://youtu.be/ABFqbY_rmEk


In [None]:
import whisper

model = whisper.load_model("base") #existem 5 opções de modelo, cada um com exigencia computacional diferente. Ver https://github.com/openai/whisper
result = model.transcribe("C:\\whisper\\marcel\\marcel_part_1.mp3", language="Portuguese")
print(result["text"])

# can be used for translation as well (here, Japanese to English)
#result = model.transcribe("japanese.wav", language="Japanese", task="translate", beam_size=5, best_of=5)

In [None]:
import json

# Caminho do arquivo JSON
caminho_arquivo = r"C:\whisper\Favero\Favero.json"

# Abrir o arquivo JSON
with open(caminho_arquivo) as arquivo:
    # Carregar o conteúdo do arquivo JSON
    dados_json = json.load(arquivo)

# Agora você pode acessar os dados do arquivo JSON
# Por exemplo, se o arquivo JSON contém um objeto com uma chave "nome":
nome = dados_json["text"]
print("Text:", nome)

# Possivelmente será necessário trabalhar com os arquivos de áudio antes de rodar no Whisper

## Converte arquivo de vídeo em formato mp4 para mp3

In [None]:
import subprocess

# Caminho do arquivo MP4 de entrada
arquivo_mp4 = "C:\\whisper\\Favero\\Favero.mp4"

# Caminho do arquivo MP3 de saída
arquivo_mp3 = "C:\\whisper\\Favero\\Favero.mp3"

# Comando FFmpeg para realizar a conversão
comando_ffmpeg = f"ffmpeg -i {arquivo_mp4} -vn -acodec libmp3lame {arquivo_mp3}"


# Executa o comando FFmpeg no prompt de comando
subprocess.call(comando_ffmpeg, shell=True)
 

print("Conversão concluída!")

# Combina arquivos de aúdio mp3 num único arquivo

In [None]:
from pydub import AudioSegment

# Caminho dos arquivos de entrada
arquivo1 = "C:\\whisper\\marcel_01.mp3"
arquivo2 = "C:\\whisper\\marcel_02.mp3"

# Carrega os arquivos MP3
audio1 = AudioSegment.from_file(arquivo1, format="mp3")
audio2 = AudioSegment.from_file(arquivo2, format="mp3")

# Junta os arquivos
audio_unido = audio1 + audio2

# Define o caminho do arquivo de saída
arquivo_saida = "C:\\whisper\\marcel_unido.mp3"

# Exporta o arquivo unido
audio_unido.export(arquivo_saida, format="mp3")

print("Arquivos MP3 foram unidos com sucesso!")

## Divide um arquivo mp3 em várias partes menoresa

In [None]:
from pydub import AudioSegment
import os

def split_audio_file(input_file, duration_limit, output_folder):
    # Load the input MP3 file
    audio = AudioSegment.from_mp3(input_file)

    # Calculate the maximum number of milliseconds in each part
    duration_per_part = duration_limit * 1000

    # Create the output folder if it doesn't exist
    if not os.path.exists(output_folder):
        os.makedirs(output_folder)

    # Split the audio file into smaller parts
    num_parts = len(audio) // duration_per_part + 1
    for i in range(num_parts):
        # Set the start and end time for the current part
        start_time = i * duration_per_part
        end_time = (i + 1) * duration_per_part

        # Extract the current part from the audio
        part = audio[start_time:end_time]

        # Set the output file name
        output_file = os.path.join(output_folder, f"marcel_part_{i+1}.mp3")

        # Export the current part as an MP3 file
        part.export(output_file, format="mp3")

# Input MP3 file path
input_file = "C:\\whisper\\marcel_unido.mp3"

# Duration limit of each part in seconds
duration_limit = 1000

# Output folder for the split parts
output_folder = "C:\\whisper\\marcel"

# Call the function to split the MP3 file
split_audio_file(input_file, duration_limit, output_folder)

##Cria os frames do vídeo

In [None]:
import os
import numpy as np
from moviepy.editor import VideoFileClip
import matplotlib.pyplot as plt

 # Caminho do arquivo de vídeo
video_path = #Caminho do vídeo aqui

 # Verifique se o vídeo existe
if not os.path.exists(video_path):
    raise SystemExit("Erro: o arquivo de vídeo não foi encontrado.")

# Carregue o vídeo
clip = VideoFileClip(video_path)

 # Duração total do vídeo em segundos
duration = clip.duration

# Gere 10 tempos aleatórios dentro da duração do vídeo
random_times = np.random.uniform(0, duration, 100)

# Pasta onde as imagens serão salvas
output_folder = #Caminho dos frames aqui
if not os.path.exists(output_folder):
    os.makedirs(output_folder)

# Extraia os frames e salve como imagens JPEG
for i, t in enumerate(random_times):
    imgpath = os.path.join(output_folder, f"frame_{i}.jpeg")
    img = clip.get_frame(t)
    plt.imsave(imgpath, img)

print("Quadros salvos com sucesso.")