<a href="https://colab.research.google.com/github/armandossrecife/teste/blob/main/pipeline_traduz_musica_ingles_para_portugues.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Pipeline de Tradu√ß√£o de M√∫sica com Whisper

Instru√ß√µes para criar um pipeline completo de tradu√ß√£o de m√∫sica do ingl√™s para o portugu√™s usando a biblioteca Whisper.

## instrucao1 - Instala√ß√£o da biblioteca Whisper

```bash
!pip install -q git+https://github.com/openai/whisper.git
```

## instrucao2 - Instala√ß√£o do programa ffmpeg

```bash
!apt-get install -y ffmpeg
```

## instrucao3 - Download do arquivo .mp4

```bash
!wget https://github.com/armandossrecife/teste/raw/refs/heads/main/Adrienne.mp4
```

## instrucao4 - Transcri√ß√£o do √°udio

```python
import whisper

audio_path = "/content/Adrienne.mp4"

print(f"Arquivo: {audio_path}")

# Modelos poss√≠veis: tiny, base, small, medium, large
# "small" √© r√°pido e bom para portugu√™s, "large" √© mais preciso mas mais lento
modelo_selecionado = "small"
print(f"Carregando o modelo: {modelo_selecionado}")
model = whisper.load_model(modelo_selecionado)
print("Modelo carregado com sucesso!")

try:
  print(f"Iniciando a transcri√ß√£o do √°udio {audio_path}")
  # Transcrever
  result = model.transcribe(audio_path, language="pt")
  print("\n--- TRANSCRI√á√ÉO COMPLETA ---\n")
  print(result["text"])

  print(f"Salvando o texto...")
  # Salvar transcri√ß√£o em arquivo TXT
  nome_arquivo_texto = "transcricao.txt"
  with open(nome_arquivo_texto, "w", encoding="utf-8") as f:
    f.write(result["text"])
  print("Texto salvo com sucesso!")
except Exception as ex:
  print(f"Erro {str(ex)} ao fazer a transcri√ß√£o do arquivo {audio_path}")
```

## instrucao5 - Engenharia do Prompt de tradu√ß√£o

```python
# Carregar a transcri√ß√£o
with open("transcricao.txt", "r", encoding="utf-8") as f:
    texto_original = f.read()

# Prompt para tradu√ß√£o po√©tica
prompt_traducao = f"""
Voc√™ pode traduzir o seguinte texto de ingl√™s para portugu√™s?
Al√©m disso, voc√™ pode deixar essa tradu√ß√£o em um formato mais po√©tico/musical
(para soar como letra de m√∫sica em portugu√™s)?

Texto para traduzir:
{texto_original}
"""

print("Prompt de tradu√ß√£o criado com sucesso!")
print(prompt_traducao[:500] + "...")  # Mostrar apenas parte do prompt
```

## instrucao6 - Salvar a tradu√ß√£o em JSON

```python
import json

# Supondo que temos a tradu√ß√£o (aqui seria substitu√≠do pela resposta real da API)
traducao_pt = {
    "titulo": "Adrienne (Tradu√ß√£o Po√©tica)",
    "letra_original": texto_original,
    "letra_traduzida": "[Aqui viria a tradu√ß√£o po√©tica gerada]",
    "artista": "Artista Original",
    "tradutor": "Whisper + OpenAI",
    "data_traducao": "2023-11-10"
}

# Salvar em arquivo JSON
with open("traducao_musica.json", "w", encoding="utf-8") as f:
    json.dump(traducao_pt, f, ensure_ascii=False, indent=2)

print("Tradu√ß√£o salva em traducao_musica.json")
```

## instrucao7 - Explica√ß√£o da tradu√ß√£o

```python
# Carregar a tradu√ß√£o
with open("traducao_musica.json", "r", encoding="utf-8") as f:
    traducao = json.load(f)

# Prompt para explica√ß√£o da tradu√ß√£o
prompt_explicacao = f"""
Agora, uma vez o texto traduzido, voc√™ pode explicar o significado dessa tradu√ß√£o em portugu√™s?

Texto original:
{traducao['letra_original']}

Tradu√ß√£o para portugu√™s:
{traducao['letra_traduzida']}

Por favor, explique as escolhas de tradu√ß√£o, o significado da m√∫sica e como a vers√£o po√©tica em portugu√™s captura a ess√™ncia da original.
"""

print("Prompt para explica√ß√£o da tradu√ß√£o criado com sucesso!")
print(prompt_explicacao[:500] + "...")  # Mostrar apenas parte do prompt
```

## Pipeline Completo

Este pipeline completo:
1. Instala as depend√™ncias necess√°rias
2. Baixa um arquivo de √°udio de exemplo
3. Transcreve o √°udio usando o modelo Whisper
4. Prepara um prompt para tradu√ß√£o po√©tica
5. Salva a tradu√ß√£o em formato JSON
6. Gera uma explica√ß√£o sobre as escolhas de tradu√ß√£o

Nota: Para completar totalmente o pipeline, seria necess√°rio integrar com uma API de IA (como a API da OpenAI) para processar os prompts de tradu√ß√£o e explica√ß√£o. O c√≥digo acima prepara todos os elementos, mas a execu√ß√£o completa dependeria dessa integra√ß√£o adicional.

# Implementa√ß√£o do Pipeline usando a API do Gemini

In [1]:
# instrucao1 - Instalar a biblioteca whisper
!pip install -q git+https://github.com/openai/whisper.git

  Installing build dependencies ... [?25l[?25hdone
  Getting requirements to build wheel ... [?25l[?25hdone
  Preparing metadata (pyproject.toml) ... [?25l[?25hdone
  Building wheel for openai-whisper (pyproject.toml) ... [?25l[?25hdone


In [2]:
# instrucao2 - Instalar o programa ffmpeg
!apt-get install -y ffmpeg

Reading package lists... Done
Building dependency tree... Done
Reading state information... Done
ffmpeg is already the newest version (7:4.4.2-0ubuntu0.22.04.1).
0 upgraded, 0 newly installed, 0 to remove and 35 not upgraded.


In [3]:
# instrucao3 - Baixar um arquivo .mp4 p√∫blico
!wget https://github.com/armandossrecife/teste/raw/refs/heads/main/Adrienne.mp4

--2025-08-22 02:36:26--  https://github.com/armandossrecife/teste/raw/refs/heads/main/Adrienne.mp4
Resolving github.com (github.com)... 140.82.113.3
Connecting to github.com (github.com)|140.82.113.3|:443... connected.
HTTP request sent, awaiting response... 302 Found
Location: https://raw.githubusercontent.com/armandossrecife/teste/refs/heads/main/Adrienne.mp4 [following]
--2025-08-22 02:36:26--  https://raw.githubusercontent.com/armandossrecife/teste/refs/heads/main/Adrienne.mp4
Resolving raw.githubusercontent.com (raw.githubusercontent.com)... 185.199.108.133, 185.199.109.133, 185.199.110.133, ...
Connecting to raw.githubusercontent.com (raw.githubusercontent.com)|185.199.108.133|:443... connected.
HTTP request sent, awaiting response... 200 OK
Length: 14944332 (14M) [application/octet-stream]
Saving to: ‚ÄòAdrienne.mp4‚Äô


2025-08-22 02:36:27 (113 MB/s) - ‚ÄòAdrienne.mp4‚Äô saved [14944332/14944332]



In [4]:
# Instalar a biblioteca do Google Gemini
!pip install -q google-generativeai

In [8]:
import whisper
import google.generativeai as genai
import json
import os

# Configurar a API do Google Gemini
# Voc√™ precisa ter uma chave de API v√°lida
GEMINI_API_KEY = "?"  # Substitua pela sua chave API
genai.configure(api_key=GEMINI_API_KEY)

# Configurar o modelo Gemini
modelo_gemini = genai.GenerativeModel('gemini-2.0-flash')

In [9]:
# instrucao4 - Transcri√ß√£o do √°udio com Whisper
def transcrever_audio(audio_path):
    print(f"Arquivo: {audio_path}")

    # Modelos poss√≠veis: tiny, base, small, medium, large
    modelo_selecionado = "small"
    print(f"Carregando o modelo: {modelo_selecionado}")
    model = whisper.load_model(modelo_selecionado)
    print("Modelo carregado com sucesso!")

    try:
        print(f"Iniciando a transcri√ß√£o do √°udio {audio_path}")
        # Transcrever
        result = model.transcribe(audio_path, language="pt")
        print("\n--- TRANSCRI√á√ÉO COMPLETA ---\n")
        print(result["text"])

        print(f"Salvando o texto...")
        # Salvar transcri√ß√£o em arquivo TXT
        nome_arquivo_texto = "transcricao.txt"
        with open(nome_arquivo_texto, "w", encoding="utf-8") as f:
            f.write(result["text"])
        print("Texto salvo com sucesso!")

        return result["text"]
    except Exception as ex:
        print(f"Erro {str(ex)} ao fazer a transcri√ß√£o do arquivo {audio_path}")
        return None

# instrucao5 - Tradu√ß√£o com Gemini
def traduzir_texto(texto_ingles):
    prompt_traducao = f"""
    Voc√™ pode traduzir o seguinte texto de ingl√™s para portugu√™s?
    Al√©m disso, voc√™ pode deixar essa tradu√ß√£o em um formato mais po√©tico/musical
    (para soar como letra de m√∫sica em portugu√™s)?

    Texto para traduzir:
    {texto_ingles}
    """

    try:
        response = modelo_gemini.generate_content(prompt_traducao)
        return response.text
    except Exception as e:
        print(f"Erro ao traduzir: {e}")
        return None

# instrucao6 - Salvar em JSON
def salvar_traducao_json(texto_original, texto_traduzido, nome_arquivo="traducao_musica.json"):
    dados_traducao = {
        "original": texto_original,
        "traducao_poetica": texto_traduzido,
        "idioma_original": "ingl√™s",
        "idioma_traducao": "portugu√™s"
    }

    with open(nome_arquivo, "w", encoding="utf-8") as f:
        json.dump(dados_traducao, f, ensure_ascii=False, indent=2)

    print(f"Tradu√ß√£o salva em {nome_arquivo}")

# instrucao7 - Explica√ß√£o da tradu√ß√£o
def explicar_traducao(texto_original, texto_traduzido):
    prompt_explicacao = f"""
    Agora, uma vez o texto traduzido, voc√™ pode explicar o significado dessa tradu√ß√£o em portugu√™s?

    Texto original em ingl√™s:
    {texto_original}

    Tradu√ß√£o para portugu√™s:
    {texto_traduzido}

    Por favor, explique as escolhas de tradu√ß√£o, o significado da m√∫sica e como a vers√£o po√©tica em portugu√™s
    captura a ess√™ncia da original. Escreva em portugu√™s.
    """

    try:
        response = modelo_gemini.generate_content(prompt_explicacao)

        # Salvar explica√ß√£o em arquivo
        with open("explicacao_traducao.txt", "w", encoding="utf-8") as f:
            f.write(response.text)

        print("Explica√ß√£o da tradu√ß√£o salva em explicacao_traducao.txt")
        return response.text
    except Exception as e:
        print(f"Erro ao gerar explica√ß√£o: {e}")
        return None

# Fun√ß√£o principal para executar o pipeline completo
def pipeline_traducao_musica(audio_path):
    print("=== INICIANDO PIPELINE DE TRADU√á√ÉO DE M√öSICA ===\n")

    # Passo 1: Transcrever √°udio
    print("1. Transcrevendo √°udio...")
    texto_original = transcrever_audio(audio_path)

    if texto_original is None:
        print("Falha na transcri√ß√£o. Abortando pipeline.")
        return

    # Passo 2: Traduzir texto
    print("\n2. Traduzindo texto...")
    texto_traduzido = traduzir_texto(texto_original)

    if texto_traduzido is None:
        print("Falha na tradu√ß√£o. Abortando pipeline.")
        return

    print("\n--- TRADU√á√ÉO PO√âTICA ---\n")
    print(texto_traduzido)

    # Passo 3: Salvar em JSON
    print("\n3. Salvando tradu√ß√£o em JSON...")
    salvar_traducao_json(texto_original, texto_traduzido)

    # Passo 4: Explicar tradu√ß√£o
    print("\n4. Gerando explica√ß√£o da tradu√ß√£o...")
    explicacao = explicar_traducao(texto_original, texto_traduzido)

    if explicacao:
        print("\n--- EXPLICA√á√ÉO DA TRADU√á√ÉO ---\n")
        print(explicacao)

    print("\n=== PIPELINE CONCLU√çDO COM SUCESSO ===")

In [10]:
audio_path = "/content/Adrienne.mp4"

# Verificar se o arquivo de √°udio existe
if not os.path.exists(audio_path):
  print(f"Arquivo {audio_path} n√£o encontrado. Verifique o caminho.")
else:
  pipeline_traducao_musica(audio_path)

=== INICIANDO PIPELINE DE TRADU√á√ÉO DE M√öSICA ===

1. Transcrevendo √°udio...
Arquivo: /content/Adrienne.mp4
Carregando o modelo: small
Modelo carregado com sucesso!
Iniciando a transcri√ß√£o do √°udio /content/Adrienne.mp4





--- TRANSCRI√á√ÉO COMPLETA ---

 üéµ üéµ I've been thinking about you, my love üéµ üéµ And all the crazy things that you've brought me through üéµ üéµ And I've been coming around üéµ Throwing it back to you What you thinkin' of me? When you kiss him Could you tease me when you lick the skin? And all the while I showered you with trust and promises What I'm needin' now, some sweet revenge To get back on that I lost then To leave you all I had to give But I could never reach him Adia I thought I knew you once again You used me, used me Adia I should have lived you long before You used me, used me Oh I used to have my money, drove my car I treated you like a shining star But in my sky, all burnt out you I'll have the last laugh When I see you walkin' some other guy Cause I know you're gonna end up all alone So take these words, some good advice All you've done's could come back twice Never cared how much it hurt I really need to tell you Adia I thought I knew you once again You us