<a href="https://colab.research.google.com/github/eduardobbastos/colabs/blob/main/transcri_o_audio_video_app.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# üéßüìù Transcri√ß√£o autom√°tica de √°udio ou v√≠deo no Google Colab

Bem-vindo! Este notebook permite **extrair a transcri√ß√£o de qualquer √°udio ou v√≠deo**, seja por upload de arquivo ou por URL (YouTube, Vimeo, Spotify, etc.), usando o modelo Whisper da OpenAI.

## **Como usar este notebook**

1. **Execute a c√©lula de instala√ß√£o de pacotes:**  
   Clique no bot√£o de ‚Äúplay‚Äù (‚ñ∂Ô∏è) na primeira c√©lula de c√≥digo para instalar as depend√™ncias necess√°rias.  
   _Aguarde at√© aparecer ‚ÄúSuccessfully installed...‚Äù antes de seguir para as pr√≥ximas c√©lulas._

2. **Rode a c√©lula principal do c√≥digo:**  
   - Escolha o que voc√™ deseja transcrever:
     - **1** para v√≠deo (√°udio ser√° extra√≠do automaticamente)
     - **2** para √°udio (direto do arquivo ou da URL)
   - Depois, escolha entre fazer upload do arquivo ou informar a URL.
     - **Upload:** selecione o arquivo do seu computador.
     - **URL:** cole o link do v√≠deo ou do √°udio (ex: do YouTube, Vimeo, ou link direto de √°udio .mp3).
   - O notebook ir√° baixar/processar seu arquivo, extrair o √°udio se for v√≠deo e gerar a transcri√ß√£o.

3. **Aguarde a transcri√ß√£o:**  
   O tempo de processamento depende do tamanho do arquivo e do modelo usado (por padr√£o, o modelo √© `medium`, com boa fidelidade).

4. **Baixe o arquivo de transcri√ß√£o:**  
   Ap√≥s o processamento, um arquivo `.txt` com o texto transcrito ser√° gerado e disponibilizado para download.

---

> **Dica:**  
> Para m√°xima qualidade, utilize arquivos com boa clareza de √°udio.  
> Para arquivos longos ou para m√°xima precis√£o, voc√™ pode alterar o modelo para `"large"` no c√≥digo, mas pode demorar mais e consumir mais mem√≥ria.

---

Pronto! Agora, basta seguir as instru√ß√µes no notebook e processar seus √°udios e v√≠deos para obter a transcri√ß√£o em texto, pronta para ser usada em qualquer aplica√ß√£o de IA ou automa√ß√£o.



In [None]:
!pip install git+https://github.com/openai/whisper.git
!sudo apt update && sudo apt install ffmpeg
!pip install moviepy yt-dlp

In [None]:
import yt_dlp
import os
from moviepy import VideoFileClip
from google.colab import files
import whisper
from datetime import datetime

# Fun√ß√£o para gerar timestamp
def get_timestamp():
    return datetime.now().strftime('%Y%m%d_%H%M%S')

def download_video(url, output_path_base='downloaded_video'):
    timestamp = get_timestamp()
    output_path = f"{output_path_base}_{timestamp}"
    ydl_opts = {
        'format': 'bestvideo+bestaudio/best',
        'outtmpl': f'{output_path}.%(ext)s',
        'merge_output_format': 'mp4'
    }
    with yt_dlp.YoutubeDL(ydl_opts) as ydl:
        info = ydl.extract_info(url, download=True)
        if 'requested_downloads' in info:
            ext = info['requested_downloads'][0]['ext']
        else:
            ext = info['ext'] if 'ext' in info else 'mp4'
    return f"{output_path}.{ext}"

def download_audio(url, output_path_base='downloaded_audio'):
    timestamp = get_timestamp()
    output_path = f"{output_path_base}_{timestamp}"
    ydl_opts = {
        'format': 'bestaudio/best',
        'outtmpl': f'{output_path}.%(ext)s',
        'postprocessors': [{
            'key': 'FFmpegExtractAudio',
            'preferredcodec': 'mp3',
            'preferredquality': '192',
        }],
        'prefer_ffmpeg': True
    }
    with yt_dlp.YoutubeDL(ydl_opts) as ydl:
        info = ydl.extract_info(url, download=True)
        if 'requested_downloads' in info:
            ext = info['requested_downloads'][0]['ext']
        else:
            ext = info['ext'] if 'ext' in info else 'mp3'
    return f"{output_path}.mp3"

# --- Interface de escolha do usu√°rio ---
print('O que voc√™ deseja transcrever?')
print('1 - V√≠deo (o √°udio ser√° extra√≠do)')
print('2 - √Åudio (direto do arquivo ou URL)')
task = input('Digite 1 ou 2: ').strip()

if task == '1':
    print('Transcri√ß√£o de V√çDEO selecionada.')
    print('Escolha o m√©todo:\n1 - Upload do arquivo de v√≠deo\n2 - URL de v√≠deo')
    method = input('Digite 1 ou 2: ').strip()
    if method == '1':
        print('Fa√ßa upload do seu v√≠deo...')
        uploaded = files.upload()
        video_path_base = list(uploaded.keys())[0]
        file_ext = os.path.splitext(video_path_base)[1]
        timestamp = get_timestamp()
        video_path = f"{os.path.splitext(video_path_base)[0]}_{timestamp}{file_ext}"
        os.rename(video_path_base, video_path)
    elif method == '2':
        url = input('Cole a URL do v√≠deo: ').strip()
        print('Baixando v√≠deo...')
        video_path = download_video(url)
        print('Download conclu√≠do:', video_path)
    else:
        print('Op√ß√£o inv√°lida.')
        raise SystemExit
    # Extrair √°udio do v√≠deo
    print('Extraindo √°udio do v√≠deo...')
    audio_path = os.path.splitext(video_path)[0] + '_audio.mp3'
    clip = VideoFileClip(video_path)
    clip.audio.write_audiofile(audio_path, codec='mp3', bitrate='320k')
    clip.close()
elif task == '2':
    print('Transcri√ß√£o de √ÅUDIO selecionada.')
    print('Escolha o m√©todo:\n1 - Upload do arquivo de √°udio\n2 - URL de √°udio')
    method = input('Digite 1 ou 2: ').strip()
    if method == '1':
        print('Fa√ßa upload do seu √°udio...')
        uploaded = files.upload()
        audio_path_base = list(uploaded.keys())[0]
        file_ext = os.path.splitext(audio_path_base)[1]
        timestamp = get_timestamp()
        audio_path = f"{os.path.splitext(audio_path_base)[0]}_{timestamp}{file_ext}"
        os.rename(audio_path_base, audio_path)
    elif method == '2':
        url = input('Cole a URL do √°udio: ').strip()
        print('Baixando √°udio...')
        audio_path = download_audio(url)
        print('Download conclu√≠do:', audio_path)
    else:
        print('Op√ß√£o inv√°lida.')
        raise SystemExit
else:
    print('Op√ß√£o inv√°lida.')
    raise SystemExit

# --- Transcri√ß√£o autom√°tica ---
print('Carregando modelo Whisper (medium)...')
model = whisper.load_model("medium")  # Altere para "large" se quiser m√°xima fidelidade
print('Transcrevendo, aguarde...')
result = model.transcribe(audio_path, fp16=False, language="pt")

# --- Salvar e baixar transcri√ß√£o ---
txt_path = os.path.splitext(audio_path)[0] + '_transcription.txt'
with open(txt_path, "w", encoding="utf-8") as f:
    f.write(result["text"])
print('Transcri√ß√£o salva em:', txt_path)
files.download(txt_path)
print('Processo finalizado com sucesso!')
