# üéß Sonarize ‚Äì Transcri√ß√£o e Resumo de √Åudios do YouTube

Este notebook implementa um pipeline completo para:

1. **Baixar o √°udio** de um v√≠deo do YouTube usando a biblioteca `pytubefix`.
2. **Transcrever o √°udio** automaticamente com o modelo Whisper da OpenAI.
3. **Gerar um resumo inteligente** da transcri√ß√£o utilizando a API do Google Gemini.

## üìå Funcionalidades

- Download r√°pido do √°udio em formato `.m4a`.
- Transcri√ß√£o precisa com suporte ao idioma portugu√™s.
- Resumo autom√°tico do conte√∫do transcrito com IA generativa.

## üöÄ Como usar

Basta executar as c√©lulas sequencialmente e fornecer a URL do v√≠deo quando solicitado.

---

**Observa√ß√£o:** Lembre-se de substituir `"SUA_API_KEY_AQUI"` pela sua chave de API do Google Gemini na terceira c√©lula.

In [None]:
# Importa√ß√µes
from pytubefix import YouTube
from pytubefix.cli import on_progress

# Entrada do usu√°rio
url = input("üîó Digite a url: ")

# Cria√ß√£o do objeto YouTube
yt = YouTube(url, on_progress_callback=on_progress)


# Exibi√ß√£o das informa√ß√µes do v√≠deo
print(f"\nüìπ T√≠tulo: {yt.title}")
print(f"‚è±Ô∏è Dura√ß√£o: {yt.length} segundos")
print(f"üë§ Autor: {yt.author}")

# Download do √°udio
print("\nüîÑ Iniciando download do √°udio...")
ys = yt.streams.get_audio_only()
ys.download(filename="audioyt.m4a")
print('‚úÖ Download conclu√≠do!')

In [None]:
# Importa√ß√£o da biblioteca Whisper (reconhecimento de fala da OpenAI)
import whisper

# Carrega o modelo "base" (equilibrado entre velocidade e precis√£o)
# Outras op√ß√µes: tiny, small, medium, large
modelo = whisper.load_model("base")


resultado = modelo.transcribe("audioyt.m4a",   # Transcreve o arquivo de √°udio "audioyt.m4a"
                              fp16=False,      # fp16=False: desativa precis√£o reduzida (compatibilidade)
                              language ="pt")  # language="pt": for√ßa o idioma portugu√™s




with open("transcricao.txt",         # Salva a transcri√ß√£o em um arquivo de texto
          "w",                       # "w": modo escrita
          encoding="utf-8") as f:    # encoding="utf-8": suporte a caracteres especiais
    # resultado["text"] cont√©m o texto transcrito
    f.write(resultado["text"])

In [None]:
# Importa√ß√£o da biblioteca Google Gemini AI
from google import genai


# Abre e l√™ o arquivo de transcri√ß√£o criado anteriormente
with open('transcricao.txt', 'r') as arquivo:
    conteudo = arquivo.read() # L√™ todo o conte√∫do do arquivo
    # Cria uma pergunta/prompt para a IA
    pergunta = f"""
Fa√ßa um resumo breve do
contedudo: {conteudo}
"""

# Cria cliente com sua chave de API (autentica√ß√£o)
# Substitua "SUA_API_KEY_AQUI" pela sua chave real
genai.Client(api_key="SUA_API_KEY_AQUI")

# Envia a pergunta para o modelo Gemini
# model='gemini-flash-lite-latest': modelo r√°pido e leve
# contents=pergunta: o prompt que criamos
response = genai.GenerativeModel('gemini-flash-lite-latest').generate_content(       
     contents=pergunta                       
)


# Extrai e exibe a resposta gerada
resp = response.text                 # Pega o texto da resposta
print(resp)                          # Mostra o resumo no terminal