# üöÄ Projeto Final 2: Sistema Inteligente de An√°lise de Documentos com Multi-Agentes

**M√≥dulo 13 - LangChain v0.3**

*Pedro Guth - Expert em IA & AWS*

---

T√°, chegamos no segundo projeto final! Se no primeiro projeto criamos um assistente simples, agora vamos partir pro **n√≠vel hardcore**: um sistema multi-agente que analisa documentos, extrai insights e ainda gera relat√≥rios automaticamente!

√â tipo ter uma equipe de consultores trabalhando pros seus documentos 24/7! üìä

## üéØ O que vamos construir?

Imagina que voc√™ tem uma pilha de documentos (PDFs, textos, relat√≥rios) e precisa:

1. **Extrair informa√ß√µes-chave** automaticamente
2. **Analisar sentimentos** e tend√™ncias 
3. **Gerar resumos executivos**
4. **Criar visualiza√ß√µes** dos dados encontrados
5. **Responder perguntas** sobre qualquer documento

√â como ter um **ChatGPT turbinado** que n√£o s√≥ conversa, mas tamb√©m vira analista de dados!

**Dica!** Este projeto combina TUDO que vimos: RAG, Agents, Memory, Chains e muito mais!

## üèóÔ∏è Arquitetura do Sistema

Nosso sistema ter√° **4 agentes especialistas**:

```mermaid
graph TD
    A[Documento] --> B[Agente Extrator]
    B --> C[Agente Analisador]
    B --> D[Agente Visualizador]
    B --> E[Agente Perguntador]
    C --> F[Relat√≥rio Final]
    D --> F
    E --> F
```

Cada agente tem uma **especialidade**, tipo uma empresa de consultoria onde cada um faz sua parte!

In [None]:
# Primeiro, vamos instalar e importar tudo que precisamos
!pip install langchain langchain-google-genai chromadb pypdf python-docx matplotlib seaborn wordcloud textstat plotly -q

print("üéâ Instala√ß√£o conclu√≠da! Bora pro c√≥digo!")

In [None]:
# Imports essenciais
import os
import re
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
from wordcloud import WordCloud
import plotly.express as px
import plotly.graph_objects as go
from datetime import datetime
import json

# LangChain imports
from langchain_google_genai import ChatGoogleGenerativeAI
from langchain.prompts import ChatPromptTemplate, PromptTemplate
from langchain.schema import BaseOutputParser
from langchain.text_splitter import RecursiveCharacterTextSplitter
from langchain.document_loaders import PyPDFLoader, TextLoader
from langchain.vectorstores import Chroma
from langchain_google_genai import GoogleGenerativeAIEmbeddings
from langchain.chains import RetrievalQA
from langchain.agents import initialize_agent, Tool, AgentType
from langchain.memory import ConversationBufferMemory

print("üìö Todas as bibliotecas importadas com sucesso!")

## üîë Configura√ß√£o Inicial

Antes de come√ßar, precisamos configurar nossa chave da API do Google. √â como dar a chave do carro pro nosso sistema dirigir sozinho!

In [None]:
# Configura√ß√£o da API Key
from google.colab import userdata

# Se estiver no Colab, use a linha abaixo:
api_key = userdata.get('GOOGLE_API_KEY')

# Se estiver rodando local, descomente e coloque sua chave:
# api_key = "sua_chave_aqui"

os.environ["GOOGLE_API_KEY"] = api_key

# Inicializando nosso modelo principal
llm = ChatGoogleGenerativeAI(
    model="gemini-2.0-flash-exp",
    temperature=0.3,  # Meio termo entre criatividade e precis√£o
    google_api_key=api_key
)

print("ü§ñ LLM configurado! Gemini 2.0 Flash pronto pra trabalhar!")

## üìÑ Carregamento e Processamento de Documentos

Vamos criar um sistema que consegue ler diferentes tipos de documento. √â tipo ensinar nosso sistema a ler portugu√™s, ingl√™s, PDF, Word... tudo!

In [None]:
class DocumentProcessor:
    def __init__(self):
        self.text_splitter = RecursiveCharacterTextSplitter(
            chunk_size=1000,
            chunk_overlap=200,
            separators=["\n\n", "\n", ".", "!", "?", ",", " ", ""]
        )
        self.documents = []
        self.chunks = []
    
    def load_text_file(self, file_path):
        """Carrega arquivo de texto simples"""
        try:
            with open(file_path, 'r', encoding='utf-8') as file:
                content = file.read()
            return content
        except:
            print(f"‚ùå Erro ao carregar {file_path}")
            return None
    
    def process_text(self, text, source="texto"):
        """Processa texto em chunks menores"""
        if text:
            # Cria chunks do texto
            chunks = self.text_splitter.split_text(text)
            
            # Adiciona metadados a cada chunk
            processed_chunks = []
            for i, chunk in enumerate(chunks):
                processed_chunks.append({
                    'content': chunk,
                    'source': source,
                    'chunk_id': i,
                    'word_count': len(chunk.split())
                })
            
            self.chunks.extend(processed_chunks)
            return processed_chunks
        return []

# Vamos criar um exemplo de documento para testar
sample_text = """
Relat√≥rio de Vendas - Q4 2024

Este relat√≥rio apresenta uma an√°lise detalhada do desempenho de vendas do quarto trimestre de 2024.

Resumo Executivo:
As vendas do Q4 2024 apresentaram um crescimento significativo de 25% em rela√ß√£o ao mesmo per√≠odo do ano anterior. 
O setor de tecnologia liderou o crescimento, representando 40% do faturamento total.

Principais M√©tricas:
- Receita total: R$ 2.5 milh√µes
- Crescimento: +25% YoY
- Novos clientes: 150
- Taxa de reten√ß√£o: 85%

Desafios Identificados:
1. Concorr√™ncia acirrada no mercado de software
2. Necessidade de melhorar o atendimento ao cliente
3. Expans√£o para novos mercados geogr√°ficos

Oportunidades:
1. Lan√ßamento de novos produtos em 2025
2. Parcerias estrat√©gicas com empresas de tecnologia
3. Investimento em marketing digital

Conclus√£o:
O Q4 2024 foi um per√≠odo de forte crescimento, mas √© necess√°rio focar na reten√ß√£o de clientes e expans√£o de mercado para 2025.
"""

# Processando nosso documento de exemplo
processor = DocumentProcessor()
chunks = processor.process_text(sample_text, "relatorio_vendas_q4")

print(f"üìä Documento processado com sucesso!")
print(f"üìù Total de chunks: {len(chunks)}")
print(f"üìÑ Primeiro chunk: {chunks[0]['content'][:100]}...")

## üß† Sistema de Embeddings e Vector Store

Agora vamos transformar nossos textos em **vetores matem√°ticos**. √â como dar uma "impress√£o digital" pra cada peda√ßo de texto, permitindo que o sistema encontre informa√ß√µes relacionadas rapidinho!

**Dica!** Lembra do M√≥dulo 9? Estamos usando exatamente os conceitos de Vector Store que aprendemos l√°!

In [None]:
# Configurando embeddings e vector store
embeddings = GoogleGenerativeAIEmbeddings(
    model="models/embedding-001",
    google_api_key=api_key
)

# Preparando textos e metadados para o Chroma
texts = [chunk['content'] for chunk in chunks]
metadatas = [{'source': chunk['source'], 'chunk_id': chunk['chunk_id']} for chunk in chunks]

# Criando o vector store
vectorstore = Chroma.from_texts(
    texts=texts,
    embedding=embeddings,
    metadatas=metadatas,
    collection_name="documentos_projeto"
)

print("üîç Vector Store criado com sucesso!")
print(f"üìä {len(texts)} documentos indexados")

# Testando uma busca
query = "receita e crescimento"
resultados = vectorstore.similarity_search(query, k=2)

print(f"\nüîé Teste de busca para '{query}':")
for i, doc in enumerate(resultados):
    print(f"Resultado {i+1}: {doc.page_content[:100]}...")

## ü§ñ Agente 1: Extrator de Informa√ß√µes

Nosso primeiro agente √© especialista em **garimpar** informa√ß√µes importantes dos documentos. √â tipo aquele amigo que sempre acha o que voc√™ precisa em qualquer bagun√ßa!

Ele vai procurar:
- **M√©tricas num√©ricas** (vendas, percentuais, etc.)
- **Datas importantes**
- **Nomes de pessoas/empresas**
- **Palavras-chave relevantes**

In [None]:
# Template para extra√ß√£o de informa√ß√µes
extraction_template = ChatPromptTemplate.from_messages([
    ("system", """
    Voc√™ √© um especialista em extra√ß√£o de informa√ß√µes de documentos.
    Sua miss√£o √© encontrar e organizar as informa√ß√µes mais importantes.
    
    Extraia as seguintes informa√ß√µes do texto:
    1. M√âTRICAS NUM√âRICAS (valores, percentuais, quantidades)
    2. DATAS E PER√çODOS importantes
    3. NOMES (pessoas, empresas, produtos)
    4. PALAVRAS-CHAVE relevantes
    5. T√ìPICOS PRINCIPAIS
    
    Organize tudo em formato JSON claro e estruturado.
    """),
    ("human", "Texto para an√°lise: {texto}")
])

# Criando nosso agente extrator
def extrair_informacoes(texto):
    """
    Extrai informa√ß√µes estruturadas do texto
    """
    chain = extraction_template | llm
    
    try:
        resposta = chain.invoke({"texto": texto})
        return resposta.content
    except Exception as e:
        return f"Erro na extra√ß√£o: {e}"

# Testando com nosso documento
texto_completo = " ".join([chunk['content'] for chunk in chunks])
info_extraida = extrair_informacoes(texto_completo)

print("üìä INFORMA√á√ïES EXTRA√çDAS:")
print("=" * 50)
print(info_extraida)

## üìà Agente 2: Analisador de Sentimentos e Tend√™ncias

Este agente √© nosso **psic√≥logo de textos**! Ele analisa:
- **Sentimento geral** (positivo, negativo, neutro)
- **N√≠vel de confian√ßa** das informa√ß√µes
- **Tend√™ncias** mencionadas
- **Pontos de aten√ß√£o** e oportunidades

**Dica!** √â como ter um consultor que n√£o s√≥ l√™ os n√∫meros, mas entende as entrelinhas!

In [None]:
# Template para an√°lise de sentimentos
sentiment_template = ChatPromptTemplate.from_messages([
    ("system", """
    Voc√™ √© um analista expert em sentiment analysis e an√°lise de tend√™ncias.
    
    Analise o texto e forne√ßa:
    
    1. SENTIMENT SCORE: (0-100, onde 0=muito negativo, 50=neutro, 100=muito positivo)
    2. CONFIAN√áA: N√≠vel de certeza das informa√ß√µes (0-100)
    3. TEND√äNCIAS IDENTIFICADAS: Crescimento, decl√≠nio, estabilidade
    4. PALAVRAS-CHAVE EMOCIONAIS: Termos que indicam sentiment
    5. INSIGHTS: 3 principais insights sobre o contexto
    6. ALERTAS: Poss√≠veis pontos de aten√ß√£o
    
    Seja objetivo e use dados do texto para justificar sua an√°lise.
    """),
    ("human", "Texto para an√°lise: {texto}")
])

def analisar_sentimento(texto):
    """
    Analisa sentimento e tend√™ncias do texto
    """
    chain = sentiment_template | llm
    
    try:
        resposta = chain.invoke({"texto": texto})
        return resposta.content
    except Exception as e:
        return f"Erro na an√°lise: {e}"

# Analisando nosso documento
analise_sentimento = analisar_sentimento(texto_completo)

print("üé≠ AN√ÅLISE DE SENTIMENTO:")
print("=" * 50)
print(analise_sentimento)

## üìä Agente 3: Gerador de Visualiza√ß√µes

Este √© nosso **designer de dados**! Ele pega as informa√ß√µes extra√≠das e cria gr√°ficos lindos e informativos.

Vamos extrair dados num√©ricos e criar visualiza√ß√µes autom√°ticas!

In [None]:
# Vamos extrair dados num√©ricos do nosso texto para visualizar
import re

def extrair_dados_numericos(texto):
    """
    Extrai n√∫meros, percentuais e valores do texto
    """
    # Padr√µes para encontrar dados num√©ricos
    valores_reais = re.findall(r'R\$\s*([\d,\.]+(?:\s*(?:milh√µes?|mil))?)', texto)
    percentuais = re.findall(r'(\d+)%', texto)
    numeros = re.findall(r'\b(\d{1,3}(?:[,\.]\d{3})*(?:[,\.]\d+)?)\b', texto)
    
    return {
        'valores_reais': valores_reais,
        'percentuais': [int(p) for p in percentuais],
        'numeros': numeros
    }

# Extraindo dados do nosso documento
dados_numericos = extrair_dados_numericos(texto_completo)
print("üí∞ Dados Num√©ricos Encontrados:")
print(f"Valores em Reais: {dados_numericos['valores_reais']}")
print(f"Percentuais: {dados_numericos['percentuais']}")
print(f"Outros n√∫meros: {dados_numericos['numeros'][:10]}...")  # Primeiros 10

# Criando visualiza√ß√µes
plt.style.use('seaborn-v0_8')
fig, ((ax1, ax2), (ax3, ax4)) = plt.subplots(2, 2, figsize=(15, 12))
fig.suptitle('üìä Dashboard Autom√°tico do Documento', fontsize=16, fontweight='bold')

# Gr√°fico 1: Percentuais encontrados
if dados_numericos['percentuais']:
    labels = ['Crescimento', 'Reten√ß√£o', 'Market Share']
    valores = dados_numericos['percentuais'][:3]  # Primeiros 3 percentuais
    
    # Garantir que temos dados suficientes
    while len(valores) < 3:
        valores.append(0)
    
    ax1.bar(labels[:len(valores)], valores, color=['#FF6B6B', '#4ECDC4', '#45B7D1'])
    ax1.set_title('üìà Principais M√©tricas (%)')
    ax1.set_ylabel('Percentual')
    
    # Adicionando valores no topo das barras
    for i, v in enumerate(valores):
        ax1.text(i, v + 1, f'{v}%', ha='center', va='bottom', fontweight='bold')

# Gr√°fico 2: Distribui√ß√£o de Sentimentos (simulado)
sentimentos = ['Positivo', 'Neutro', 'Negativo']
scores = [70, 20, 10]  # Baseado na an√°lise do texto
colors = ['#2ECC71', '#F39C12', '#E74C3C']

ax2.pie(scores, labels=sentimentos, colors=colors, autopct='%1.1f%%', startangle=90)
ax2.set_title('üé≠ An√°lise de Sentimento')

# Gr√°fico 3: Timeline de m√©tricas (exemplo)
meses = ['Q1', 'Q2', 'Q3', 'Q4']
crescimento = [10, 15, 20, 25]  # Dados do documento

ax3.plot(meses, crescimento, marker='o', linewidth=3, markersize=8, color='#9B59B6')
ax3.fill_between(meses, crescimento, alpha=0.3, color='#9B59B6')
ax3.set_title('üìà Tend√™ncia de Crescimento')
ax3.set_ylabel('Crescimento (%)')
ax3.grid(True, alpha=0.3)

# Gr√°fico 4: Word Cloud das palavras mais importantes
wordcloud = WordCloud(
    width=400, height=300,
    background_color='white',
    colormap='viridis',
    max_words=50
).generate(texto_completo)

ax4.imshow(wordcloud, interpolation='bilinear')
ax4.axis('off')
ax4.set_title('‚òÅÔ∏è Palavras-chave Principais')

plt.tight_layout()
plt.show()

print("üé® Visualiza√ß√µes geradas automaticamente!")

## ü§î Agente 4: Sistema de Perguntas e Respostas

Este √© nosso **g√™nio da l√¢mpada**! Voc√™ faz uma pergunta sobre qualquer coisa do documento e ele responde na lata!

Usando RAG (Retrieval Augmented Generation) que aprendemos no M√≥dulo 10!

In [None]:
# Criando sistema de Q&A com RAG
qa_template = ChatPromptTemplate.from_messages([
    ("system", """
    Voc√™ √© um assistente especialista em an√°lise de documentos.
    Use APENAS as informa√ß√µes dos documentos fornecidos para responder.
    
    Se a informa√ß√£o n√£o estiver nos documentos, diga claramente:
    "Esta informa√ß√£o n√£o est√° dispon√≠vel nos documentos analisados."
    
    Seja preciso, cite n√∫meros quando relevante e forne√ßa contexto.
    """),
    ("human", """
    Contexto dos documentos:
    {contexto}
    
    Pergunta: {pergunta}
    
    Resposta baseada apenas no contexto:
    """)
])

def fazer_pergunta(pergunta, k=3):
    """
    Faz uma pergunta sobre os documentos usando RAG
    """
    # Busca documentos relevantes
    docs_relevantes = vectorstore.similarity_search(pergunta, k=k)
    
    # Junta o contexto
    contexto = "\n\n".join([doc.page_content for doc in docs_relevantes])
    
    # Cria a chain
    chain = qa_template | llm
    
    try:
        resposta = chain.invoke({
            "contexto": contexto,
            "pergunta": pergunta
        })
        return resposta.content, docs_relevantes
    except Exception as e:
        return f"Erro: {e}", []

# Testando com algumas perguntas
perguntas_teste = [
    "Qual foi o crescimento de vendas no Q4?",
    "Quantos novos clientes foram adquiridos?",
    "Quais s√£o os principais desafios identificados?",
    "Qual √© a receita total mencionada?"
]

print("ü§ñ SISTEMA DE PERGUNTAS E RESPOSTAS")
print("=" * 60)

for pergunta in perguntas_teste:
    print(f"\n‚ùì {pergunta}")
    resposta, docs = fazer_pergunta(pergunta)
    print(f"üí° {resposta}")
    print("-" * 40)

## üéØ Sistema Multi-Agente Integrado

Agora vamos juntar **todos os agentes** num sistema √∫nico! √â como orquestrar uma banda onde cada m√∫sico toca sua parte, mas o resultado final √© uma sinfonia!

**Dica!** Aqui usamos os conceitos de Agents e Tools do M√≥dulo 11!

In [None]:
class SistemaMultiAgente:
    def __init__(self, vectorstore, llm):
        self.vectorstore = vectorstore
        self.llm = llm
        self.memory = ConversationBufferMemory(
            memory_key="chat_history",
            return_messages=True
        )
        self.relatorio_final = {}
    
    def processar_documento_completo(self, texto):
        """
        Executa an√°lise completa com todos os agentes
        """
        print("üöÄ Iniciando an√°lise multi-agente...")
        
        # Agente 1: Extra√ß√£o
        print("\nüîç Agente 1: Extraindo informa√ß√µes...")
        info_extraida = extrair_informacoes(texto)
        
        # Agente 2: An√°lise de Sentimento
        print("üé≠ Agente 2: Analisando sentimentos...")
        analise = analisar_sentimento(texto)
        
        # Agente 3: Visualiza√ß√µes (j√° criamos acima)
        print("üìä Agente 3: Gerando visualiza√ß√µes...")
        dados_viz = extrair_dados_numericos(texto)
        
        # Compilando relat√≥rio final
        self.relatorio_final = {
            'timestamp': datetime.now().strftime('%Y-%m-%d %H:%M:%S'),
            'informacoes_extraidas': info_extraida,
            'analise_sentimento': analise,
            'dados_numericos': dados_viz,
            'sistema_qa': 'Ativo e funcionando'
        }
        
        return self.relatorio_final
    
    def gerar_resumo_executivo(self):
        """
        Gera um resumo executivo baseado em todas as an√°lises
        """
        resumo_template = ChatPromptTemplate.from_messages([
            ("system", """
            Voc√™ √© um consultor s√™nior criando um resumo executivo.
            
            Com base em todas as an√°lises realizadas, crie um resumo executivo
            profissional com:
            
            1. S√çNTESE DOS PRINCIPAIS ACHADOS
            2. M√âTRICAS-CHAVE
            3. INSIGHTS ESTRAT√âGICOS
            4. RECOMENDA√á√ïES
            5. PR√ìXIMOS PASSOS
            
            Use linguagem executiva, seja conciso e foque no que importa para tomada de decis√£o.
            """),
            ("human", "Dados das an√°lises: {dados_completos}")
        ])
        
        chain = resumo_template | self.llm
        
        try:
            resposta = chain.invoke({
                "dados_completos": str(self.relatorio_final)
            })
            return resposta.content
        except Exception as e:
            return f"Erro ao gerar resumo: {e}"

# Inicializando nosso sistema multi-agente
sistema = SistemaMultiAgente(vectorstore, llm)

# Executando an√°lise completa
relatorio = sistema.processar_documento_completo(texto_completo)

print("\n‚úÖ An√°lise multi-agente conclu√≠da!")
print(f"üìÑ Relat√≥rio gerado √†s: {relatorio['timestamp']}")

## üìã Relat√≥rio Executivo Final

Agora vamos gerar o **gran finale**: um relat√≥rio executivo completo que junta tudo que nossos agentes descobriram!

In [None]:
# Gerando o resumo executivo
resumo_executivo = sistema.gerar_resumo_executivo()

print("üìä RELAT√ìRIO EXECUTIVO FINAL")
print("=" * 80)
print(resumo_executivo)
print("=" * 80)

# Salvando relat√≥rio completo em JSON
relatorio_completo = {
    'documento_analisado': 'Relat√≥rio de Vendas Q4 2024',
    'timestamp': datetime.now().isoformat(),
    'resumo_executivo': resumo_executivo,
    'detalhes': relatorio
}

# Salvando em arquivo
with open('relatorio_multiagente.json', 'w', encoding='utf-8') as f:
    json.dump(relatorio_completo, f, ensure_ascii=False, indent=2)

print("\nüíæ Relat√≥rio salvo em 'relatorio_multiagente.json'")
print("\nüéâ Sistema multi-agente funcionando perfeitamente!")

## üéÆ Exerc√≠cio Pr√°tico 1

**Desafio**: Crie seu pr√≥prio documento de teste!

1. Escreva um texto sobre qualquer assunto (empresa, projeto, an√°lise)
2. Inclua dados num√©ricos (percentuais, valores, datas)
3. Execute todo o pipeline multi-agente
4. Compare os resultados!

**Dica!** Pode ser sobre sua empresa, um projeto fict√≠cio, ou at√© an√°lise de um filme!

In [None]:
# SEU C√ìDIGO AQUI!
# Crie um novo documento e teste o sistema

meu_documento = """
# Substitua este texto pelo seu documento personalizado
# Lembre-se de incluir:
# - Dados num√©ricos
# - Datas
# - Informa√ß√µes que possam ser analisadas
"""

# Descomente as linhas abaixo quando tiver seu documento pronto:
# novo_processor = DocumentProcessor()
# novos_chunks = novo_processor.process_text(meu_documento, "meu_teste")
# # Continue o processamento...

print("‚úèÔ∏è Escreva seu documento e execute a an√°lise!")

## üîß Melhorias e Extens√µes

Nosso sistema j√° est√° **funcionando**, mas sempre d√° pra melhorar! Aqui est√£o algumas ideias pra turbinar ainda mais:

### üöÄ Pr√≥ximos N√≠veis:

1. **An√°lise de m√∫ltiplos documentos** simultaneamente
2. **Compara√ß√£o temporal** (documentos de per√≠odos diferentes)
3. **Alertas autom√°ticos** quando m√©tricas passam de limites
4. **Integra√ß√£o com APIs** externas (bancos de dados, CRM)
5. **Interface web** com Streamlit (que vamos ver no pr√≥ximo m√≥dulo!)

**Dica!** No M√≥dulo 14 vamos transformar isso numa aplica√ß√£o web linda!

In [None]:
# Fun√ß√£o para comparar m√∫ltiplos documentos
def comparar_documentos(doc1, doc2, titulo1="Documento 1", titulo2="Documento 2"):
    """
    Compara dois documentos lado a lado
    """
    print(f"üîÑ Comparando {titulo1} vs {titulo2}")
    
    # An√°lise do primeiro documento
    info1 = extrair_informacoes(doc1)
    sent1 = analisar_sentimento(doc1)
    
    # An√°lise do segundo documento
    info2 = extrair_informacoes(doc2)
    sent2 = analisar_sentimento(doc2)
    
    # Template para compara√ß√£o
    comparacao_template = ChatPromptTemplate.from_messages([
        ("system", """
        Voc√™ √© um analista comparativo especialista.
        
        Compare os dois documentos e identifique:
        1. PRINCIPAIS DIFEREN√áAS
        2. TEND√äNCIAS OPOSTAS
        3. PONTOS EM COMUM
        4. INSIGHTS COMPARATIVOS
        5. RECOMENDA√á√ïES BASEADAS NA COMPARA√á√ÉO
        
        Seja espec√≠fico e use dados concretos das an√°lises.
        """),
        ("human", """
        An√°lise Documento 1 ({titulo1}):
        {analise1}
        
        An√°lise Documento 2 ({titulo2}):
        {analise2}
        
        Fa√ßa uma compara√ß√£o detalhada:
        """)
    ])
    
    chain = comparacao_template | llm
    
    try:
        resultado = chain.invoke({
            "titulo1": titulo1,
            "titulo2": titulo2,
            "analise1": f"{info1}\n\n{sent1}",
            "analise2": f"{info2}\n\n{sent2}"
        })
        return resultado.content
    except Exception as e:
        return f"Erro na compara√ß√£o: {e}"

# Exemplo de uso (quando voc√™ tiver dois documentos)
print("üîç Fun√ß√£o de compara√ß√£o criada!")
print("üìù Use comparar_documentos(doc1, doc2) para comparar textos")

## üìä M√©tricas de Performance do Sistema

Vamos medir qu√£o **eficiente** nosso sistema est√° sendo! √â importante sempre monitorar performance em sistemas de produ√ß√£o.

In [None]:
import time
from collections import Counter

class MetricasPerformance:
    def __init__(self):
        self.tempos_execucao = []
        self.tokens_processados = 0
        self.consultas_realizadas = 0
        self.inicio_sessao = time.time()
    
    def medir_tempo_execucao(self, funcao, *args, **kwargs):
        """Mede tempo de execu√ß√£o de uma fun√ß√£o"""
        inicio = time.time()
        resultado = funcao(*args, **kwargs)
        fim = time.time()
        
        tempo_execucao = fim - inicio
        self.tempos_execucao.append(tempo_execucao)
        
        return resultado, tempo_execucao
    
    def estatisticas_performance(self):
        """Retorna estat√≠sticas de performance"""
        if not self.tempos_execucao:
            return "Nenhuma medi√ß√£o realizada ainda"
        
        tempo_total_sessao = time.time() - self.inicio_sessao
        tempo_medio = np.mean(self.tempos_execucao)
        tempo_total_processamento = sum(self.tempos_execucao)
        
        stats = {
            'tempo_sessao_total': f"{tempo_total_sessao:.2f}s",
            'tempo_processamento_total': f"{tempo_total_processamento:.2f}s",
            'tempo_medio_por_operacao': f"{tempo_medio:.2f}s",
            'operacoes_realizadas': len(self.tempos_execucao),
            'operacoes_por_minuto': f"{len(self.tempos_execucao) / (tempo_total_sessao / 60):.1f}"
        }
        
        return stats

# Inicializando m√©tricas
metricas = MetricasPerformance()

# Testando performance com algumas opera√ß√µes
print("‚ö° Testando Performance do Sistema")
print("=" * 50)

# Teste 1: Extra√ß√£o de informa√ß√µes
resultado, tempo = metricas.medir_tempo_execucao(extrair_informacoes, texto_completo)
print(f"üîç Extra√ß√£o de informa√ß√µes: {tempo:.2f}s")

# Teste 2: An√°lise de sentimento
resultado, tempo = metricas.medir_tempo_execucao(analisar_sentimento, texto_completo)
print(f"üé≠ An√°lise de sentimento: {tempo:.2f}s")

# Teste 3: Pergunta e resposta
resultado, tempo = metricas.medir_tempo_execucao(fazer_pergunta, "Qual foi o crescimento?")
print(f"‚ùì Pergunta e resposta: {tempo:.2f}s")

# Estat√≠sticas finais
stats = metricas.estatisticas_performance()
print("\nüìä ESTAT√çSTICAS DE PERFORMANCE:")
for chave, valor in stats.items():
    print(f"{chave}: {valor}")

## üéÆ Exerc√≠cio Final: Sistema Personalizado

**Mega Desafio**: Crie um sistema multi-agente para **seu dom√≠nio espec√≠fico**!

Escolha uma das op√ß√µes:

1. **Sistema de RH**: Analisa curr√≠culos e perfis de candidatos
2. **Sistema Financeiro**: Analisa relat√≥rios de investimento
3. **Sistema de Marketing**: Analisa campanhas e resultados
4. **Sistema Acad√™mico**: Analisa papers e pesquisas

**Requisitos**:
- Pelo menos 3 agentes especializados
- Sistema de perguntas customizado
- Visualiza√ß√µes espec√≠ficas do dom√≠nio
- Relat√≥rio final personalizado

In [None]:
# SEU SISTEMA PERSONALIZADO AQUI!

# Exemplo de estrutura:
class MeuSistemaEspecializado:
    def __init__(self):
        # Seus agentes especializados
        pass
    
    def agente_especializado_1(self, texto):
        # Seu primeiro agente especializado
        pass
    
    def agente_especializado_2(self, texto):
        # Seu segundo agente especializado  
        pass
    
    def gerar_relatorio_personalizado(self):
        # Seu relat√≥rio personalizado
        pass

print("üöÄ Crie seu sistema personalizado aqui!")
print("üí° Use como base tudo que aprendemos, mas adapte pro seu dom√≠nio!")

## üéä Resum√£o do Projeto Final 2

**Liiindo!** Voc√™ acabou de criar um sistema multi-agente completo! üéâ

### üèÜ O que conquistamos:

‚úÖ **Sistema Multi-Agente** com 4 especialistas
‚úÖ **Extra√ß√£o autom√°tica** de informa√ß√µes
‚úÖ **An√°lise de sentimento** avan√ßada
‚úÖ **Visualiza√ß√µes autom√°ticas** dos dados
‚úÖ **Sistema de Q&A** com RAG
‚úÖ **Relat√≥rios executivos** autom√°ticos
‚úÖ **M√©tricas de performance**

### üîó Conceitos do LangChain utilizados:

- **ChatModels** (M√≥dulo 2) ‚úÖ
- **LCEL** (M√≥dulo 3) ‚úÖ  
- **Prompt Templates** (M√≥dulo 4) ‚úÖ
- **Chains** (M√≥dulo 6) ‚úÖ
- **Memory Systems** (M√≥dulo 7) ‚úÖ
- **Document Loading** (M√≥dulo 8) ‚úÖ
- **Vector Stores** (M√≥dulo 9) ‚úÖ
- **RAG** (M√≥dulo 10) ‚úÖ
- **Agents** (M√≥dulo 11) ‚úÖ

### üöÄ Pr√≥ximos passos:

**M√≥dulo 14**: Vamos transformar este sistema numa **aplica√ß√£o web linda** com Streamlit!

**Dica!** Guarde bem este c√≥digo, pois vamos usar como base pro deploy!

## üéØ Exerc√≠cio B√¥nus: Otimiza√ß√£o de Custos

Em produ√ß√£o, √© importante **otimizar custos** de API. Vamos criar um sistema que monitora e otimiza o uso de tokens!

In [None]:
class OtimizadorCustos:
    def __init__(self):
        self.tokens_utilizados = 0
        self.custo_por_token = 0.000002  # Exemplo de custo
        self.cache_respostas = {}  # Cache simples
    
    def calcular_tokens_aproximados(self, texto):
        """Estimativa r√°pida de tokens (1 token ‚âà 4 caracteres)"""
        return len(texto) // 4
    
    def verificar_cache(self, pergunta):
        """Verifica se j√° temos resposta em cache"""
        return self.cache_respostas.get(pergunta)
    
    def adicionar_cache(self, pergunta, resposta):
        """Adiciona resposta ao cache"""
        self.cache_respostas[pergunta] = resposta
    
    def fazer_pergunta_otimizada(self, pergunta):
        """Pergunta otimizada com cache"""
        # Verifica cache primeiro
        resposta_cache = self.verificar_cache(pergunta)
        if resposta_cache:
            print(f"üíæ Resposta encontrada em cache! Economia de tokens.")
            return resposta_cache
        
        # Se n√£o tem cache, faz a pergunta
        resposta, docs = fazer_pergunta(pergunta)
        tokens_usados = self.calcular_tokens_aproximados(pergunta + resposta)
        
        # Atualiza m√©tricas
        self.tokens_utilizados += tokens_usados
        
        # Salva no cache
        self.adicionar_cache(pergunta, resposta)
        
        print(f"üè∑Ô∏è Tokens utilizados: {tokens_usados}")
        print(f"üí∞ Custo estimado: ${tokens_usados * self.custo_por_token:.6f}")
        
        return resposta
    
    def relatorio_custos(self):
        """Relat√≥rio de custos acumulados"""
        custo_total = self.tokens_utilizados * self.custo_por_token
        return {
            'tokens_total': self.tokens_utilizados,
            'custo_total': f"${custo_total:.6f}",
            'respostas_em_cache': len(self.cache_respostas),
            'economia_potencial': f"${len(self.cache_respostas) * 100 * self.custo_por_token:.6f}"
        }

# Testando otimiza√ß√£o
otimizador = OtimizadorCustos()

print("üí∞ TESTE DE OTIMIZA√á√ÉO DE CUSTOS")
print("=" * 50)

# Primeira pergunta
resp1 = otimizador.fazer_pergunta_otimizada("Qual foi o crescimento?")

# Segunda pergunta (mesma - deve usar cache)
resp2 = otimizador.fazer_pergunta_otimizada("Qual foi o crescimento?")

# Relat√≥rio final
relatorio = otimizador.relatorio_custos()
print("\nüìä RELAT√ìRIO DE CUSTOS:")
for chave, valor in relatorio.items():
    print(f"{chave}: {valor}")

print("\nüí° Sistema de cache funcionando! Economia garantida em produ√ß√£o!")