# üé¨ LipSync Video Generator - Google Colab

Sistema completo de gera√ß√£o de v√≠deos com sincroniza√ß√£o labial usando IA

**Tecnologias:**
- ü§ñ Gemini 2.5 Flash - Formata√ß√£o de texto
- üéôÔ∏è ElevenLabs v3 - S√≠ntese de voz
- üé¨ WaveSpeed Wan 2.2 - Lip-sync e gera√ß√£o de v√≠deo
- üéûÔ∏è FFmpeg - Concatena√ß√£o de v√≠deos

---

## üìã Instru√ß√µes R√°pidas:

1. Execute a c√©lula **"Instala√ß√£o"** (‚èØÔ∏è)
2. Configure suas **API Keys** na c√©lula seguinte
3. Execute **"Iniciar Interface"**
4. Use a interface Gradio que vai abrir!

**Tempo total:** ~2-3 minutos de setup

---

## üîß 1. Instala√ß√£o de Depend√™ncias

Esta c√©lula instala todos os pacotes necess√°rios.

In [None]:
%%capture
# Instala√ß√£o silenciosa (sem output)

print("üîß Instalando depend√™ncias...")

# Instala FFmpeg
!apt-get update -qq
!apt-get install -y ffmpeg -qq

# Instala bibliotecas Python
!pip install -q gradio>=5.0.0
!pip install -q python-dotenv>=1.0.0
!pip install -q requests>=2.31.0
!pip install -q ffmpeg-python>=0.2.0
!pip install -q google-generativeai>=0.3.0
!pip install -q elevenlabs>=1.0.0
!pip install -q Pillow>=10.0.0

print("‚úÖ Instala√ß√£o conclu√≠da!")

## üîë 2. Configura√ß√£o de API Keys

**Onde obter suas chaves:**

- üîë **Gemini:** https://ai.google.dev/
- üîë **ElevenLabs:** https://elevenlabs.io/app/settings
- üîë **WaveSpeed:** https://wavespeed.ai/

Cole suas chaves abaixo:

In [None]:
import os
from google.colab import userdata

# Configure suas API keys aqui
# OP√á√ÉO 1: Cole diretamente (menos seguro, mas mais r√°pido)
GEMINI_API_KEY = ""  # Cole sua chave aqui
ELEVENLABS_API_KEY = ""  # Cole sua chave aqui
WAVESPEED_API_KEY = ""  # Cole sua chave aqui

# OP√á√ÉO 2: Use Colab Secrets (mais seguro)
# 1. Clique no √≠cone de üîë na barra lateral esquerda
# 2. Adicione as secrets: GEMINI_API_KEY, ELEVENLABS_API_KEY, WAVESPEED_API_KEY
# 3. Descomente as linhas abaixo:
#
# try:
#     GEMINI_API_KEY = userdata.get('GEMINI_API_KEY')
#     ELEVENLABS_API_KEY = userdata.get('ELEVENLABS_API_KEY')
#     WAVESPEED_API_KEY = userdata.get('WAVESPEED_API_KEY')
# except:
#     pass

# Define vari√°veis de ambiente
os.environ['GEMINI_API_KEY'] = GEMINI_API_KEY
os.environ['ELEVENLABS_API_KEY'] = ELEVENLABS_API_KEY
os.environ['WAVESPEED_API_KEY'] = WAVESPEED_API_KEY

# Verifica se as chaves foram configuradas
if not GEMINI_API_KEY or not ELEVENLABS_API_KEY or not WAVESPEED_API_KEY:
    print("‚ö†Ô∏è ATEN√á√ÉO: Configure suas API keys acima!")
    print("Cole suas chaves nas vari√°veis ou use Colab Secrets.")
else:
    print("‚úÖ API Keys configuradas com sucesso!")
    print(f"   Gemini: {'*' * 10}{GEMINI_API_KEY[-4:]}")
    print(f"   ElevenLabs: {'*' * 10}{ELEVENLABS_API_KEY[-4:]}")
    print(f"   WaveSpeed: {'*' * 10}{WAVESPEED_API_KEY[-4:]}")

## üì• 3. Baixar C√≥digo do Projeto

Clona o reposit√≥rio do GitHub com todo o c√≥digo.

In [None]:
import os

# Remove diret√≥rio se j√° existir
if os.path.exists('Automation-Ugc'):
    !rm -rf Automation-Ugc

print("üì• Clonando reposit√≥rio...")

# Clone o reposit√≥rio
!git clone https://github.com/sterling9879/Automation-Ugc.git

# Muda para o diret√≥rio do projeto
%cd Automation-Ugc

print("‚úÖ Reposit√≥rio clonado!")
print(f"üìÅ Diret√≥rio atual: {os.getcwd()}")

## üß™ 4. Testar Conex√µes (Opcional)

Testa se as API keys est√£o funcionando.

In [None]:
print("üß™ Testando conex√µes com as APIs...\n")

# Testa Gemini
try:
    import google.generativeai as genai
    genai.configure(api_key=os.environ['GEMINI_API_KEY'])
    model = genai.GenerativeModel('gemini-2.0-flash-exp')
    response = model.generate_content("Hello")
    print("‚úÖ Gemini API: Funcionando")
except Exception as e:
    print(f"‚ùå Gemini API: Erro - {e}")

# Testa ElevenLabs
try:
    from elevenlabs import ElevenLabs
    client = ElevenLabs(api_key=os.environ['ELEVENLABS_API_KEY'])
    voices = client.voices.get_all()
    print(f"‚úÖ ElevenLabs API: Funcionando ({len(voices.voices)} vozes dispon√≠veis)")
except Exception as e:
    print(f"‚ùå ElevenLabs API: Erro - {e}")

# Testa WaveSpeed
try:
    import requests
    headers = {'Authorization': f'Bearer {os.environ["WAVESPEED_API_KEY"]}'}
    response = requests.get('https://api.wavespeed.ai/api/v3/wavespeed-ai/me', headers=headers, timeout=10)
    if response.status_code == 200:
        data = response.json()
        print(f"‚úÖ WaveSpeed API: Funcionando (Cr√©ditos: {data.get('credits', 'N/A')})")
    else:
        print(f"‚ö†Ô∏è WaveSpeed API: Status {response.status_code}")
except Exception as e:
    print(f"‚ùå WaveSpeed API: Erro - {e}")

# Testa FFmpeg
try:
    import subprocess
    result = subprocess.run(['ffmpeg', '-version'], capture_output=True, text=True)
    if result.returncode == 0:
        version = result.stdout.split('\n')[0].split(' ')[2]
        print(f"‚úÖ FFmpeg: Instalado (vers√£o {version})")
    else:
        print("‚ùå FFmpeg: N√£o encontrado")
except Exception as e:
    print(f"‚ùå FFmpeg: Erro - {e}")

print("\nüéâ Testes conclu√≠dos!")

## üöÄ 5. Iniciar Interface Gradio

Executa a aplica√ß√£o web completa!

**Ap√≥s executar:**
1. Clique no link `Running on public URL: https://...gradio.live`
2. A interface vai abrir em uma nova aba
3. Use normalmente!

**Dica:** Use `share=True` para gerar um link p√∫blico que voc√™ pode compartilhar (v√°lido por 72h).

In [None]:
# Importa a aplica√ß√£o
import sys
sys.path.insert(0, '/content/Automation-Ugc')

# Importa e configura
from app import create_interface

print("üöÄ Iniciando interface Gradio...\n")

# Cria interface
app = create_interface()

# Lan√ßa com link p√∫blico
app.launch(
    share=True,  # Gera link p√∫blico
    debug=False,
    show_error=True
)

# A interface ficar√° rodando at√© voc√™ parar o notebook

## üìñ Como Usar a Interface

### 1Ô∏è‚É£ Campo de Roteiro
- Cole ou digite seu texto completo
- O sistema divide automaticamente em batches de 3 par√°grafos
- Cada batch gera um v√≠deo

### 2Ô∏è‚É£ Selecione a Voz
- Escolha uma voz do ElevenLabs
- Todas as vozes da sua conta aparecem

### 3Ô∏è‚É£ Escolha o Modelo
- **Multilingual v3** üåü - Melhor qualidade (padr√£o)
- **Turbo v3** ‚ö° - Mais r√°pido
- **Flash v3** üöÄ - Ultra r√°pido

### 4Ô∏è‚É£ Upload de Imagens
- Adicione 1-20 imagens do apresentador
- Use diferentes √¢ngulos para variedade
- Formatos: PNG, JPG, JPEG

### 5Ô∏è‚É£ Gerar V√≠deo
- Clique em **"üé¨ Gerar V√≠deo"**
- Acompanhe o progresso em tempo real
- Baixe o v√≠deo final quando conclu√≠do

---

## ‚è±Ô∏è Tempo de Processamento

**Exemplo:** Roteiro de 2000 caracteres (‚âà4 v√≠deos)
- Formata√ß√£o de texto: ~10s
- Gera√ß√£o de √°udios: ~20-30s
- Gera√ß√£o de v√≠deos (paralelo): ~5-8 minutos
- Concatena√ß√£o: ~10s

**Total:** ~6-9 minutos

---

## üí° Dicas

‚úÖ **Mantenha o Colab ativo** - N√£o feche a aba durante o processamento

‚úÖ **Use imagens de qualidade** - Melhor imagem = melhor lip-sync

‚úÖ **Varie as imagens** - Diferentes √¢ngulos = v√≠deo mais din√¢mico

‚úÖ **Textos longos** - Divida em m√∫ltiplas execu√ß√µes se necess√°rio

‚úÖ **Limite do Colab** - Sess√µes gratuitas t√™m timeout ap√≥s inatividade

---

## üêõ Solu√ß√£o de Problemas

### Erro: "API Key inv√°lida"
- Volte √† c√©lula de configura√ß√£o e verifique suas chaves
- Execute novamente a c√©lula de configura√ß√£o

### Erro: "M√≥dulo n√£o encontrado"
- Execute novamente a c√©lula de instala√ß√£o
- Reinicie o runtime: `Runtime ‚Üí Restart runtime`

### Interface n√£o abre
- Clique no link `https://...gradio.live`
- Se expirou, re-execute a c√©lula de inicializa√ß√£o

### Colab desconectou
- Reconecte: `Runtime ‚Üí Reconnect`
- Execute novamente a partir da c√©lula de instala√ß√£o

---

## üìä Monitoramento

Durante o processamento, voc√™ ver√°:
- ‚öôÔ∏è Status atual (formatando, gerando √°udio, etc)
- üìä Barra de progresso (0-100%)
- üìã Logs detalhados de cada etapa
- ‚úÖ Link do v√≠deo final

---

## üîß Uso Avan√ßado (Opcional)

### Executar Via C√≥digo Python

Se preferir, voc√™ pode usar diretamente as classes Python:

In [None]:
# Exemplo de uso direto via c√≥digo
from job_manager import JobManager
from pathlib import Path

# Inicializa gerenciador
manager = JobManager()

# Cria job
text = """Seu roteiro aqui..."""
voice = "Nome da Voz"
images = ["caminho/para/imagem1.jpg", "caminho/para/imagem2.jpg"]
model = "eleven_multilingual_v3"

job, error = manager.create_job(
    input_text=text,
    voice_name=voice,
    image_paths=images,
    model_id=model
)

if error:
    print(f"‚ùå Erro: {error}")
else:
    print("‚úÖ Job criado!")
    
    # Processa job
    def progress_callback(msg, percent):
        print(f"[{percent}%] {msg}")
    
    final_video = manager.process_job(job, progress_callback)
    print(f"\nüéâ V√≠deo final: {final_video}")

## üíæ Download dos V√≠deos

V√≠deos ficam salvos em `temp/job_<id>/`

Para baixar:

In [None]:
from google.colab import files
import os
from pathlib import Path

# Lista todos os v√≠deos finais
temp_dir = Path('temp')

if temp_dir.exists():
    videos = list(temp_dir.glob('*/final_video.mp4'))
    
    if videos:
        print(f"üìπ Encontrados {len(videos)} v√≠deo(s):\n")
        
        for video in videos:
            print(f"   {video}")
            print(f"   Tamanho: {video.stat().st_size / 1024 / 1024:.2f} MB")
            
            # Faz download
            files.download(str(video))
            print(f"   ‚úÖ Download iniciado\n")
    else:
        print("‚ö†Ô∏è Nenhum v√≠deo encontrado ainda.")
        print("Processe um v√≠deo primeiro usando a interface Gradio.")
else:
    print("‚ö†Ô∏è Pasta temp n√£o encontrada.")
    print("Processe um v√≠deo primeiro usando a interface Gradio.")

## üßπ Limpar Arquivos Tempor√°rios

Para liberar espa√ßo no Colab:

In [None]:
import shutil
from pathlib import Path

temp_dir = Path('temp')

if temp_dir.exists():
    # Calcula tamanho antes
    total_size = sum(f.stat().st_size for f in temp_dir.glob('**/*') if f.is_file())
    
    print(f"üìÅ Pasta temp: {total_size / 1024 / 1024:.2f} MB")
    print("\nüóëÔ∏è Removendo arquivos tempor√°rios...")
    
    shutil.rmtree(temp_dir)
    
    print("‚úÖ Limpeza conclu√≠da!")
    print(f"üíæ Espa√ßo liberado: {total_size / 1024 / 1024:.2f} MB")
else:
    print("‚ÑπÔ∏è Pasta temp n√£o existe ou j√° foi limpa.")

---

## üìö Links √öteis

- üìñ [Documenta√ß√£o Completa](https://github.com/sterling9879/Automation-Ugc)
- üêõ [Reportar Bug](https://github.com/sterling9879/Automation-Ugc/issues)
- üí¨ [Discuss√µes](https://github.com/sterling9879/Automation-Ugc/discussions)

---

## ‚ö†Ô∏è Avisos Importantes

1. **Custos de API:** Voc√™ ser√° cobrado pelas APIs (Gemini, ElevenLabs, WaveSpeed)
2. **Timeout do Colab:** Sess√µes gratuitas t√™m limite de tempo
3. **Privacidade:** Seus v√≠deos ficam no Colab at√© voc√™ limpar
4. **Links Gradio:** Links p√∫blicos expiram ap√≥s 72 horas
5. **API Keys:** Nunca compartilhe suas chaves publicamente

---

## üéâ Pronto!

**Agora voc√™ pode gerar v√≠deos profissionais com lip-sync diretamente no navegador, sem instalar nada!**

Desenvolvido com ‚ù§Ô∏è usando Gemini, ElevenLabs e WaveSpeed

---

*Vers√£o: 1.0 | √öltima atualiza√ß√£o: 2024*