============================================
NOTEBOOK GOOGLE COLAB - TRADUTOR GPT-4O MINI
PRONTO PARA USAR - COPIE E COLE TUDO
============================================

In [None]:
# ============================================
# C√âLULA 1: Instalar depend√™ncias
# ============================================
!pip install -q requests beautifulsoup4 python-docx openai python-dotenv
print("‚úÖ Depend√™ncias instaladas com sucesso!")

‚úÖ Depend√™ncias instaladas com sucesso!


In [None]:
# ============================================
# C√âLULA 2: Importar bibliotecas
# ============================================
from google.colab import files
from openai import AzureOpenAI
from docx import Document
from docx.shared import Pt, RGBColor
from docx.enum.text import WD_ALIGN_PARAGRAPH
from datetime import datetime
from bs4 import BeautifulSoup
import requests
import os
from typing import Tuple, List
print("‚úÖ Bibliotecas importadas com sucesso!")

‚úÖ Bibliotecas importadas com sucesso!


============================================
C√âLULA 3: CLASSE COMPLETA - COPIE AQUI
============================================

In [None]:
class TradutorGPT5Mini:
    """Tradutor profissional usando ChatGPT 5 Mini + Azure AI"""

    def __init__(self, api_key: str, api_version: str, azure_endpoint: str, deployment_name: str = "gpt-5-mini"):
        """Inicializa o cliente Azure OpenAI com GPT5 Mini"""
        self.client = AzureOpenAI(
            api_key=api_key,
            api_version=api_version,
            azure_endpoint=azure_endpoint
        )
        self.deployment_name = deployment_name

    def extrair_texto_url(self, url: str, max_caracteres: int = 50000) -> Tuple[str, str]:
        """Extrai texto de uma URL com tratamento robusto"""
        try:
            headers = {
                'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36'
            }
            response = requests.get(url, headers=headers, timeout=15)
            response.raise_for_status()
            response.encoding = response.apparent_encoding

            soup = BeautifulSoup(response.content, 'html.parser')

            # Remover elementos desnecess√°rios
            for element in soup(['script', 'style', 'nav', 'footer', 'button', 'form']):
                element.decompose()

            # Extrair t√≠tulo
            title = soup.find(['h1', 'title'])
            title_text = title.get_text(strip=True) if title else "Documento Traduzido"

            # Extrair conte√∫do
            main_content = soup.find(['main', 'article']) or soup.find('body')
            if main_content:
                paragraphs = main_content.find_all(['p', 'h2', 'h3', 'li'])
            else:
                paragraphs = soup.find_all(['p', 'h2', 'h3', 'li'])

            content_parts = [p.get_text(strip=True) for p in paragraphs if p.get_text(strip=True)]
            content = '\n\n'.join(content_parts)

            if len(content) > max_caracteres:
                content = content[:max_caracteres] + "\n\n[... conte√∫do truncado ...]"

            return title_text, content

        except Exception as e:
            raise Exception(f"‚ùå Erro ao extrair texto: {e}")

    def traduzir_texto(self, texto: str, idioma_origem: str = "portugu√™s",
                      idioma_destino: str = "ingl√™s") -> str:
        """Traduz texto usando ChatGPT 4o Mini"""
        try:
            chunks = self._dividir_em_chunks(texto, max_chars=8000)
            textos_traduzidos = []

            for i, chunk in enumerate(chunks, 1):
                if len(chunks) > 1:
                    print(f"  üîÑ Traduzindo chunk {i}/{len(chunks)}...")

                prompt = f"""Traduza o seguinte texto de {idioma_origem} para {idioma_destino}.
Mantenha a formata√ß√£o, estrutura de par√°grafos e significado original.
Responda APENAS com o texto traduzido, sem explica√ß√µes.

TEXTO:
{chunk}"""

                response = self.client.chat.completions.create(
                    model=self.deployment_name,
                    messages=[
                        {
                            "role": "system",
                            "content": f"Voc√™ √© um tradutor profissional de {idioma_origem} para {idioma_destino}."
                        },
                        {
                            "role": "user",
                            "content": prompt
                        }
                    ],

                    max_completion_tokens=16384
                )

                texto_traduzido = response.choices[0].message.content.strip()
                textos_traduzidos.append(texto_traduzido)

            return '\n\n'.join(textos_traduzidos)

        except Exception as e:
            raise Exception(f"‚ùå Erro ao traduzir: {e}")

    def _dividir_em_chunks(self, texto: str, max_chars: int = 8000) -> List[str]:
        """Divide texto em chunks mantendo integridade"""
        paragrafos = texto.split('\n\n')
        chunks = []
        chunk_atual = []
        tamanho_atual = 0

        for paragrafo in paragrafos:
            tamanho_paragrafo = len(paragrafo)
            if tamanho_atual + tamanho_paragrafo > max_chars and chunk_atual:
                chunks.append('\n\n'.join(chunk_atual))
                chunk_atual = [paragrafo]
                tamanho_atual = tamanho_paragrafo
            else:
                chunk_atual.append(paragrafo)
                tamanho_atual += tamanho_paragrafo + 2

        if chunk_atual:
            chunks.append('\n\n'.join(chunk_atual))

        return chunks

    def salvar_em_docx(self, titulo: str, conteudo_original: str,
                      conteudo_traduzido: str, idioma_origem: str,
                      idioma_destino: str, caminho_saida: str, url: str = "") -> str:
        """Salva o conte√∫do traduzido em arquivo DOCX formatado"""
        try:
            doc = Document()

            # T√≠tulo
            heading = doc.add_heading(f"{titulo}", level=1)
            heading.alignment = WD_ALIGN_PARAGRAPH.CENTER
            heading.runs[0].font.color.rgb = RGBColor(0, 51, 102)

            # Informa√ß√µes
            info = doc.add_paragraph()
            info.add_run(f"Tradu√ß√£o: {idioma_origem.upper()} ‚Üí {idioma_destino.upper()}").font.italic = True

            if url:
                doc.add_paragraph(f"Fonte: {url}").runs[0].font.size = Pt(9)

            doc.add_paragraph(f"Gerado em: {datetime.now().strftime('%d/%m/%Y √†s %H:%M:%S')}").runs[0].font.size = Pt(9)
            doc.add_paragraph()

            # Conte√∫do traduzido
            doc.add_heading("üìã Conte√∫do Traduzido", level=2)
            doc.paragraphs[-1].runs[0].font.color.rgb = RGBColor(0, 102, 51)

            for paragrafo in conteudo_traduzido.split('\n\n'):
                if paragrafo.strip():
                    p = doc.add_paragraph(paragrafo.strip())
                    p.paragraph_format.line_spacing = 1.15

            # Original (preview)
            doc.add_page_break()
            doc.add_heading("üìÑ Conte√∫do Original", level=2)

            for paragrafo in conteudo_original.split('\n\n')[:3]:
                if paragrafo.strip():
                    doc.add_paragraph(paragrafo.strip())

            if len(conteudo_original.split('\n\n')) > 3:
                doc.add_paragraph("[... conte√∫do truncado ...]").runs[0].font.italic = True

            doc.save(caminho_saida)
            return caminho_saida

        except Exception as e:
            raise Exception(f"‚ùå Erro ao salvar: {e}")

    def processar_url_completo(self, url: str, idioma_origem: str = "portugu√™s",
                              idioma_destino: str = "ingl√™s",
                              caminho_saida: str = "traducao.docx") -> str:
        """Processa URL completa: extrai ‚Üí traduz ‚Üí salva"""
        print(f"\nüöÄ Iniciando tradu√ß√£o com ChatGPT 5 Mini")
        print(f"{'='*60}")

        print(f"\nüåê Etapa 1: Extraindo texto...")
        titulo, conteudo_original = self.extrair_texto_url(url)
        print(f"   ‚úÖ T√≠tulo: {titulo}")
        print(f"   ‚úÖ Caracteres: {len(conteudo_original):,}")

        print(f"\nüîÑ Etapa 2: Traduzindo...")
        conteudo_traduzido = self.traduzir_texto(conteudo_original, idioma_origem, idioma_destino)
        print(f"   ‚úÖ Tradu√ß√£o conclu√≠da")

        print(f"\nüíæ Etapa 3: Salvando arquivo...")
        arquivo = self.salvar_em_docx(titulo, conteudo_original, conteudo_traduzido,
                                      idioma_origem, idioma_destino, caminho_saida, url)
        print(f"   ‚úÖ {arquivo}")
        print(f"\n{'='*60}\n")

        return arquivo

        print("‚úÖ Classe TradutorGPT5Mini carregada com sucesso!")

============================================
C√âLULA 4: Configurar credenciais Azure
============================================

In [None]:
print("\nüîë CONFIGURA√á√ÉO DA AZURE")
print("="*60)
print("\nOp√ß√µes:")
print("1 - Inserir credenciais manualmente")
print("2 - Carregar arquivo .env")
opcao = input("\nEscolha (1 ou 2): ").strip()
if opcao == "2":
    print("\nüìÅ Carregando arquivo .env...")
    uploaded = files.upload()
    env_file = list(uploaded.keys())[0]

    from dotenv import load_dotenv
    load_dotenv(env_file)

    API_KEY = os.getenv('AZURE_API_KEY')
    AZURE_ENDPOINT = os.getenv('AZURE_ENDPOINT')
    DEPLOYMENT_NAME = os.getenv('DEPLOYMENT_NAME', 'gpt-5-mini')
    print("‚úÖ Credenciais carregadas do .env")
else:
    print("\nüìù Digite suas credenciais:")
    API_KEY = input("   üîê Azure API Key: ").strip()
    AZURE_ENDPOINT = input("   üåê Azure Endpoint (ex: https://seu-recurso.openai.azure.com/): ").strip()
    DEPLOYMENT_NAME = input("   ü§ñ Deployment Name (padr√£o: gpt-5-mini): ").strip() or "gpt-5-mini"
    print("\n‚úÖ Credenciais configuradas")


üîë CONFIGURA√á√ÉO DA AZURE

Op√ß√µes:
1 - Inserir credenciais manualmente
2 - Carregar arquivo .env

Escolha (1 ou 2): 2

üìÅ Carregando arquivo .env...


Saving .env to .env (4)
‚úÖ Credenciais carregadas do .env


============================================
C√âLULA 5: Criar inst√¢ncia do Tradutor
============================================

In [None]:
print("\nüöÄ Inicializando tradutor...")
tradutor = TradutorGPT5Mini(
    api_key=API_KEY,
    api_version="2025-04-01-preview",
    azure_endpoint=AZURE_ENDPOINT,
    deployment_name=DEPLOYMENT_NAME
)
print("‚úÖ Tradutor pronto para usar!")


üöÄ Inicializando tradutor...
‚úÖ Tradutor pronto para usar!


============================================
C√âLULA 6: Configurar par√¢metros de tradu√ß√£o
============================================

In [None]:
print("\n" + "="*60)
print("‚öôÔ∏è  CONFIGURAR TRADU√á√ÉO")
print("="*60)
URL = input("\nüåê Digite a URL a traduzir: ").strip()
print("\nüìö Idiomas: portugu√™s, ingl√™s, espanhol, franc√™s, alem√£o, italiano, japon√™s, chin√™s, etc.")
IDIOMA_ORIGEM = input("   Idioma de origem (padr√£o: portugu√™s): ").strip().lower() or "portugu√™s"
IDIOMA_DESTINO = input("   Idioma de destino (padr√£o: ingl√™s): ").strip().lower() or "ingl√™s"
ARQUIVO_SAIDA = f"traducao_{IDIOMA_DESTINO.replace(' ', '_')}.docx"
print(f"\n‚úÖ Configura√ß√£o:")
print(f"   URL: {URL}")
print(f"   Tradu√ß√£o: {IDIOMA_ORIGEM} ‚Üí {IDIOMA_DESTINO}")
print(f"   Arquivo: {ARQUIVO_SAIDA}")


‚öôÔ∏è  CONFIGURAR TRADU√á√ÉO

üåê Digite a URL a traduzir: https://en.wikipedia.org/wiki/Engineering

üìö Idiomas: portugu√™s, ingl√™s, espanhol, franc√™s, alem√£o, italiano, japon√™s, chin√™s, etc.
   Idioma de origem (padr√£o: portugu√™s): ingl√™s
   Idioma de destino (padr√£o: ingl√™s): portugu√™s

‚úÖ Configura√ß√£o:
   URL: https://en.wikipedia.org/wiki/Engineering
   Tradu√ß√£o: ingl√™s ‚Üí portugu√™s
   Arquivo: traducao_portugu√™s.docx


============================================
C√âLULA 7: Executar tradu√ß√£o
============================================

In [None]:
print("\n" + "="*60)
print("‚ñ∂Ô∏è  INICIANDO TRADU√á√ÉO...")
print("="*60)
try:
    arquivo = tradutor.processar_url_completo(
        url=URL,
        idioma_origem=IDIOMA_ORIGEM,
        idioma_destino=IDIOMA_DESTINO,
        caminho_saida=ARQUIVO_SAIDA
    )
    print(f"‚úÖ SUCESSO! Arquivo: {arquivo}")
    sucesso = True
except Exception as e:
    print(f"‚ùå ERRO: {e}")
    sucesso = False


‚ñ∂Ô∏è  INICIANDO TRADU√á√ÉO...

üöÄ Iniciando tradu√ß√£o com ChatGPT 5 Mini

üåê Etapa 1: Extraindo texto...
   ‚úÖ T√≠tulo: Engineering - Wikipedia
   ‚úÖ Caracteres: 50,029

üîÑ Etapa 2: Traduzindo...
  üîÑ Traduzindo chunk 1/7...
  üîÑ Traduzindo chunk 2/7...
  üîÑ Traduzindo chunk 3/7...
  üîÑ Traduzindo chunk 4/7...
  üîÑ Traduzindo chunk 5/7...
  üîÑ Traduzindo chunk 6/7...
  üîÑ Traduzindo chunk 7/7...
   ‚úÖ Tradu√ß√£o conclu√≠da

üíæ Etapa 3: Salvando arquivo...
   ‚úÖ traducao_portugu√™s.docx


‚úÖ SUCESSO! Arquivo: traducao_portugu√™s.docx


============================================
C√âLULA 8: Download do arquivo
============================================

In [None]:
if sucesso:
    print("\nüì• Iniciando download do arquivo...")
    try:
        files.download(ARQUIVO_SAIDA)
        print("‚úÖ Download iniciado! Verifique sua pasta de downloads.")
    except Exception as e:
        print(f"‚ùå Erro no download: {e}")
else:
    print("\n‚ö†Ô∏è  N√£o foi poss√≠vel fazer o download (erro na tradu√ß√£o)")


üì• Iniciando download do arquivo...


<IPython.core.display.Javascript object>

<IPython.core.display.Javascript object>

‚úÖ Download iniciado! Verifique sua pasta de downloads.
