# üéØ LLMs na Pr√°tica: Criando um Assistente Inteligente do Zero!

## M√≥dulo 12: Projeto Final - Juntando Todas as Pe√ßas do Quebra-Cabe√ßa

E a√≠, galera! Chegamos no momento mais emocionante do nosso curso! üöÄ

Sabe quando voc√™ aprende a dirigir e finalmente pega a estrada? √â exatamente isso que vamos fazer agora! Vamos pegar tudo que aprendemos nos 11 m√≥dulos anteriores e construir um projeto REAL, do jeitinho que se faz no mercado.

**Por Pedro Nunes Guth** üë®‚Äçüíª

## üé™ O Que Vamos Construir?

T√°, mas o que √© que vamos fazer exatamente? Vamos criar um **Assistente de An√°lise de Dados** que:

- üìä **Analisa datasets** usando LLMs
- üí¨ **Conversa naturalmente** sobre os dados
- üõ°Ô∏è **Implementa guardrails** para seguran√ßa
- üìà **Gera visualiza√ß√µes** autom√°ticas
- üîç **Avalia suas pr√≥prias respostas**

√â como ter um cientista de dados no seu bolso! S√≥ que feito por voc√™ mesmo. Liiindo!

### üß† Conceitos que Vamos Revisar:
- **Tokeniza√ß√£o** (M√≥dulo 4): Como o modelo entende nossos dados
- **Embeddings** (M√≥dulo 5): Representando dados numericamente
- **Prompting** (M√≥dulo 8): Engenharia de prompts avan√ßada
- **Guardrails** (M√≥dulo 10): Mantendo tudo seguro
- **Avalia√ß√£o** (M√≥dulo 9): Medindo a qualidade

**Dica do Pedro:** Esse projeto √© como fazer uma feijoada - cada ingrediente tem seu papel, mas o segredo est√° em como voc√™ combina tudo! üç≤

In [None]:
# Setup inicial - Importando todas as bibliotecas que vamos precisar
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
import openai
import json
import re
import warnings
from typing import List, Dict, Any
from datetime import datetime
import tiktoken
from sklearn.metrics.pairwise import cosine_similarity
from sklearn.feature_extraction.text import TfidfVectorizer

# Configura√ß√µes b√°sicas
warnings.filterwarnings('ignore')
plt.style.use('seaborn-v0_8')
sns.set_palette("husl")

print("üöÄ Ambiente configurado! Bora come√ßar nosso projeto!")
print(f"üìÖ Iniciado em: {datetime.now().strftime('%d/%m/%Y √†s %H:%M')}")

## üèóÔ∏è Arquitetura do Nosso Sistema

Antes de colocar a m√£o na massa, vamos entender como nosso assistente vai funcionar. √â como o blueprint de uma casa - precisa estar bem planejado!

### üîÑ Fluxo de Funcionamento:

1. **Input do Usu√°rio** ‚Üí Pergunta sobre os dados
2. **Tokeniza√ß√£o** ‚Üí Transforma texto em tokens
3. **An√°lise de Contexto** ‚Üí Entende o que foi pedido
4. **Processamento de Dados** ‚Üí Executa an√°lises
5. **Guardrails** ‚Üí Verifica seguran√ßa
6. **Gera√ß√£o de Resposta** ‚Üí Cria resposta natural
7. **Avalia√ß√£o** ‚Üí Mede qualidade da resposta
8. **Output** ‚Üí Entrega resultado ao usu√°rio

In [None]:
# Vamos criar uma visualiza√ß√£o da arquitetura do nosso sistema
import matplotlib.patches as mpatches
from matplotlib.patches import FancyBboxPatch

fig, ax = plt.subplots(figsize=(14, 10))

# Definindo posi√ß√µes dos componentes
components = {
    'Usuario': (2, 8, 'lightblue'),
    'Tokenizer': (2, 6, 'lightgreen'),
    'Analisador\nContexto': (2, 4, 'lightyellow'), 
    'Processador\nDados': (6, 6, 'lightcoral'),
    'Guardrails': (6, 4, 'orange'),
    'LLM\nCore': (10, 6, 'lightpink'),
    'Avaliador': (10, 4, 'lightgray'),
    'Interface': (6, 2, 'lightsteelblue')
}

# Desenhando componentes
for name, (x, y, color) in components.items():
    box = FancyBboxPatch((x-0.8, y-0.4), 1.6, 0.8, 
                        boxstyle="round,pad=0.1", 
                        facecolor=color, 
                        edgecolor='black',
                        linewidth=1.5)
    ax.add_patch(box)
    ax.text(x, y, name, ha='center', va='center', fontsize=10, fontweight='bold')

# Desenhando setas (fluxo)
arrows = [
    ((2, 7.6), (2, 6.4)),  # Usuario -> Tokenizer
    ((2, 5.6), (2, 4.4)),  # Tokenizer -> Contexto
    ((2.8, 4), (5.2, 6)),  # Contexto -> Processador
    ((6.8, 6), (9.2, 6)),  # Processador -> LLM
    ((6, 5.6), (6, 4.4)),  # Processador -> Guardrails
    ((10, 5.6), (10, 4.4)), # LLM -> Avaliador
    ((9.2, 4), (6.8, 2)),  # Avaliador -> Interface
    ((5.2, 2), (2.8, 8))   # Interface -> Usuario (feedback)
]

for start, end in arrows:
    ax.annotate('', xy=end, xytext=start,
                arrowprops=dict(arrowstyle='->', lw=2, color='darkblue'))

ax.set_xlim(0, 12)
ax.set_ylim(0, 10)
ax.set_title('üèóÔ∏è Arquitetura do Assistente de An√°lise de Dados', fontsize=16, fontweight='bold')
ax.set_aspect('equal')
ax.axis('off')

plt.tight_layout()
plt.show()

print("üìê Arquitetura definida! Cada componente tem sua fun√ß√£o espec√≠fica.")

## üß© Classe Principal: DataAnalysisAssistant

Agora vamos construir o cora√ß√£o do nosso sistema! Nossa classe principal vai ser como o maestro de uma orquestra - coordena todos os outros componentes.

Vamos implementar os conceitos que aprendemos:
- **Tokeniza√ß√£o inteligente** para otimizar custos
- **Sistema de embeddings** para entender contexto
- **Prompts estruturados** para melhor qualidade
- **Guardrails autom√°ticos** para seguran√ßa

**Dica do Pedro:** Pense nessa classe como o seu "canivete su√≠√ßo" de an√°lise de dados - tem tudo que voc√™ precisa numa ferramenta s√≥! üîß

In [None]:
class DataAnalysisAssistant:
    """
    Assistente de An√°lise de Dados usando LLMs
    Combina todos os conceitos aprendidos no curso!
    """
    
    def __init__(self, api_key: str, model: str = "gpt-3.5-turbo"):
        """Inicializa o assistente com as configura√ß√µes necess√°rias"""
        self.client = openai.OpenAI(api_key=api_key)
        self.model = model
        self.tokenizer = tiktoken.encoding_for_model(model)
        self.max_tokens = 4000  # Limite de tokens por contexto
        self.conversation_history = []
        self.current_dataset = None
        self.analysis_results = []
        
        # Configura√ß√µes de seguran√ßa (Guardrails)
        self.forbidden_operations = [
            "delete", "drop", "remove", "format", "os.", "subprocess", "eval", "exec"
        ]
        
        print("ü§ñ Assistente inicializado com sucesso!")
        print(f"üìã Modelo: {self.model}")
        print(f"üõ°Ô∏è Guardrails ativados: {len(self.forbidden_operations)} regras")
    
    def count_tokens(self, text: str) -> int:
        """Conta tokens de um texto (conceito do M√≥dulo 4)"""
        return len(self.tokenizer.encode(text))
    
    def check_guardrails(self, user_input: str) -> bool:
        """Verifica se a entrada √© segura (conceito do M√≥dulo 10)"""
        user_input_lower = user_input.lower()
        
        for forbidden in self.forbidden_operations:
            if forbidden in user_input_lower:
                print(f"‚ö†Ô∏è Opera√ß√£o bloqueada: '{forbidden}' detectado")
                return False
        
        return True
    
    def load_dataset(self, data_path: str = None, data: pd.DataFrame = None):
        """Carrega dataset para an√°lise"""
        try:
            if data is not None:
                self.current_dataset = data
            elif data_path:
                self.current_dataset = pd.read_csv(data_path)
            
            print(f"üìä Dataset carregado: {self.current_dataset.shape[0]} linhas, {self.current_dataset.shape[1]} colunas")
            print(f"üìù Colunas: {', '.join(self.current_dataset.columns.tolist())}")
            
            return True
            
        except Exception as e:
            print(f"‚ùå Erro ao carregar dataset: {str(e)}")
            return False
    
    def get_dataset_summary(self) -> str:
        """Gera resumo do dataset para contexto do LLM"""
        if self.current_dataset is None:
            return "Nenhum dataset carregado."
        
        summary = f"""
RESUMO DO DATASET:
- Dimens√µes: {self.current_dataset.shape[0]} linhas √ó {self.current_dataset.shape[1]} colunas
- Colunas: {', '.join(self.current_dataset.columns.tolist())}
- Tipos de dados: {dict(self.current_dataset.dtypes)}
- Valores ausentes: {dict(self.current_dataset.isnull().sum())}
- Estat√≠sticas b√°sicas:\n{self.current_dataset.describe().to_string()}
"""
        
        return summary

print("‚úÖ Classe DataAnalysisAssistant criada!")
print("üîß Pr√≥ximo passo: implementar os m√©todos de an√°lise")

## üé® Sistema de Prompts Avan√ßado

Lembra do M√≥dulo 8 sobre Engenharia de Prompts? Agora vamos aplicar tudo na pr√°tica! 

Vamos criar um sistema de prompts que √© tipo um GPS para o LLM - d√° as dire√ß√µes certas para chegar no resultado que queremos.

### üéØ Estrat√©gias que Vamos Usar:
- **Few-shot prompting**: Exemplos para guiar o modelo
- **Chain-of-thought**: Racioc√≠nio passo a passo
- **Role-playing**: LLM assume papel de analista
- **Structured output**: Respostas organizadas

**Dica do Pedro:** Um bom prompt √© como uma receita de bolo - quanto mais espec√≠fica, melhor o resultado! üç∞

In [None]:
# Continuando nossa classe com o sistema de prompts
class DataAnalysisAssistant(DataAnalysisAssistant):
    
    def create_analysis_prompt(self, user_question: str, dataset_info: str) -> str:
        """Cria prompt estruturado para an√°lise (Engenharia de Prompts - M√≥dulo 8)"""
        
        system_prompt = """
Voc√™ √© um EXPERT ANALISTA DE DADOS brasileiro, especializado em insights acion√°veis.

SUAS CARACTER√çSTICAS:
- üß† Pensa como cientista de dados s√™nior
- üìä Foca em insights pr√°ticos e acion√°veis  
- üéØ Responde de forma clara e objetiva
- üìà Sugere visualiza√ß√µes quando apropriado
- ‚ö†Ô∏è Indica limita√ß√µes dos dados quando necess√°rio

FORMATO DE RESPOSTA:
1. **RESUMO EXECUTIVO**: Resposta direta em 1-2 frases
2. **AN√ÅLISE DETALHADA**: Explica√ß√£o t√©cnica
3. **INSIGHTS**: 2-3 descobertas principais
4. **RECOMENDA√á√ïES**: Pr√≥ximos passos sugeridos
5. **C√ìDIGO PYTHON**: Se aplic√°vel, c√≥digo para executar

IMPORTANTE:
- Use linguagem t√©cnica mas acess√≠vel
- Base suas conclus√µes apenas nos dados fornecidos
- Se n√£o souber algo, seja honesto
- Foque em valor de neg√≥cio
"""
        
        user_prompt = f"""
CONTEXTO DOS DADOS:
{dataset_info}

PERGUNTA DO USU√ÅRIO:
{user_question}

Por favor, analise e responda seguindo o formato estruturado.
"""
        
        return system_prompt, user_prompt
    
    def generate_response(self, user_question: str) -> Dict[str, Any]:
        """Gera resposta usando LLM com todos os conceitos aplicados"""
        
        # 1. Verificar guardrails (M√≥dulo 10)
        if not self.check_guardrails(user_question):
            return {
                "success": False,
                "error": "Opera√ß√£o bloqueada por medidas de seguran√ßa",
                "response": None
            }
        
        # 2. Verificar se h√° dataset carregado
        if self.current_dataset is None:
            return {
                "success": False,
                "error": "Nenhum dataset carregado",
                "response": "Por favor, carregue um dataset antes de fazer perguntas."
            }
        
        # 3. Preparar contexto
        dataset_info = self.get_dataset_summary()
        system_prompt, user_prompt = self.create_analysis_prompt(user_question, dataset_info)
        
        # 4. Verificar limite de tokens (M√≥dulo 4)
        total_tokens = self.count_tokens(system_prompt + user_prompt)
        if total_tokens > self.max_tokens:
            print(f"‚ö†Ô∏è Contexto muito grande: {total_tokens} tokens. Resumindo...")
            # Aqui poder√≠amos implementar estrat√©gias de resumo
        
        try:
            # 5. Chamar LLM
            response = self.client.chat.completions.create(
                model=self.model,
                messages=[
                    {"role": "system", "content": system_prompt},
                    {"role": "user", "content": user_prompt}
                ],
                temperature=0.3,  # Baixa criatividade para an√°lises
                max_tokens=1000
            )
            
            result = {
                "success": True,
                "response": response.choices[0].message.content,
                "tokens_used": response.usage.total_tokens if hasattr(response, 'usage') else 0,
                "timestamp": datetime.now().isoformat()
            }
            
            # 6. Salvar no hist√≥rico
            self.conversation_history.append({
                "question": user_question,
                "response": result["response"],
                "timestamp": result["timestamp"]
            })
            
            return result
            
        except Exception as e:
            return {
                "success": False,
                "error": f"Erro na gera√ß√£o de resposta: {str(e)}",
                "response": None
            }

print("üé® Sistema de prompts implementado!")
print("üí° Usa few-shot learning e structured output para melhor qualidade")

## üìä Criando Dataset de Exemplo

Vamos criar um dataset realista para testar nosso assistente. Vai ser dados de vendas de uma loja online - um cen√°rio super comum no mercado!

Este dataset vai ter:
- **Dados temporais**: vendas ao longo do tempo
- **Categorias**: diferentes produtos
- **Informa√ß√µes geogr√°ficas**: regi√µes de venda
- **M√©tricas de neg√≥cio**: receita, quantidade, etc.

√â o tipo de dados que voc√™ vai encontrar na vida real!

In [None]:
# Criando dataset de exemplo - E-commerce brasileiro
np.random.seed(42)  # Para resultados reproduz√≠veis

# Configura√ß√µes do dataset
n_records = 1000
start_date = pd.to_datetime('2023-01-01')
end_date = pd.to_datetime('2023-12-31')

# Gerando dados sint√©ticos mas realistas
data = {
    # Datas de venda
    'data_venda': pd.date_range(start=start_date, end=end_date, freq='D').repeat(
        np.random.poisson(3, len(pd.date_range(start=start_date, end=end_date, freq='D')))
    )[:n_records],
    
    # Produtos
    'categoria': np.random.choice([
        'Eletr√¥nicos', 'Roupas', 'Casa e Jardim', 'Livros', 'Esportes', 'Beleza'
    ], n_records, p=[0.25, 0.20, 0.15, 0.15, 0.15, 0.10]),
    
    # Regi√µes do Brasil
    'regiao': np.random.choice([
        'Sudeste', 'Sul', 'Nordeste', 'Norte', 'Centro-Oeste'
    ], n_records, p=[0.4, 0.25, 0.20, 0.10, 0.05]),
    
    # Quantidade vendida
    'quantidade': np.random.poisson(2, n_records) + 1,
    
    # Pre√ßo unit√°rio (varia por categoria)
    'preco_unitario': np.where(
        np.random.choice(['Eletr√¥nicos', 'Roupas', 'Casa e Jardim', 'Livros', 'Esportes', 'Beleza'], n_records) == 'Eletr√¥nicos',
        np.random.normal(300, 100, n_records),
        np.random.normal(80, 30, n_records)
    ),
    
    # Canal de venda
    'canal': np.random.choice(['Online', 'Loja F√≠sica', 'Marketplace'], n_records, p=[0.5, 0.3, 0.2]),
    
    # Status do cliente
    'cliente_tipo': np.random.choice(['Novo', 'Recorrente', 'VIP'], n_records, p=[0.3, 0.6, 0.1])
}

# Criando DataFrame
df_vendas = pd.DataFrame(data)

# Calculando m√©tricas derivadas
df_vendas['receita_total'] = df_vendas['quantidade'] * df_vendas['preco_unitario']
df_vendas['mes'] = df_vendas['data_venda'].dt.month
df_vendas['dia_semana'] = df_vendas['data_venda'].dt.day_name()

# Limpando valores negativos (pode acontecer com distribui√ß√£o normal)
df_vendas['preco_unitario'] = df_vendas['preco_unitario'].abs()
df_vendas['receita_total'] = df_vendas['receita_total'].abs()

print("üìä Dataset de vendas criado!")
print(f"üìà {len(df_vendas)} registros de vendas")
print(f"üí∞ Receita total: R$ {df_vendas['receita_total'].sum():,.2f}")
print("\nüîç Primeiras 5 linhas:")
display(df_vendas.head())

print("\nüìã Informa√ß√µes gerais do dataset:")
df_vendas.info()

In [None]:
# Visualizando nosso dataset de exemplo
fig, axes = plt.subplots(2, 2, figsize=(15, 12))

# 1. Vendas por categoria
vendas_categoria = df_vendas.groupby('categoria')['receita_total'].sum().sort_values(ascending=True)
vendas_categoria.plot(kind='barh', ax=axes[0,0], color='skyblue')
axes[0,0].set_title('üí∞ Receita por Categoria', fontsize=12, fontweight='bold')
axes[0,0].set_xlabel('Receita (R$)')

# 2. Vendas por regi√£o
vendas_regiao = df_vendas.groupby('regiao')['receita_total'].sum()
vendas_regiao.plot(kind='pie', ax=axes[0,1], autopct='%1.1f%%', startangle=90)
axes[0,1].set_title('üó∫Ô∏è Distribui√ß√£o por Regi√£o', fontsize=12, fontweight='bold')
axes[0,1].set_ylabel('')

# 3. Vendas ao longo do tempo
vendas_tempo = df_vendas.groupby('mes')['receita_total'].sum()
vendas_tempo.plot(kind='line', ax=axes[1,0], marker='o', linewidth=2, markersize=6)
axes[1,0].set_title('üìà Receita por M√™s', fontsize=12, fontweight='bold')
axes[1,0].set_xlabel('M√™s')
axes[1,0].set_ylabel('Receita (R$)')
axes[1,0].grid(True, alpha=0.3)

# 4. Distribui√ß√£o de pre√ßos
df_vendas['preco_unitario'].hist(bins=30, ax=axes[1,1], color='lightcoral', alpha=0.7)
axes[1,1].set_title('üíµ Distribui√ß√£o de Pre√ßos', fontsize=12, fontweight='bold')
axes[1,1].set_xlabel('Pre√ßo Unit√°rio (R$)')
axes[1,1].set_ylabel('Frequ√™ncia')

plt.tight_layout()
plt.show()

print("üìä Visualiza√ß√µes criadas! Agora temos uma vis√£o geral dos dados.")
print("ü§ñ Vamos testar nosso assistente com esses dados!")

## üöÄ Testando Nosso Assistente

Chegou a hora da verdade! Vamos colocar nosso assistente para funcionar de verdade. 

**IMPORTANTE:** Para este teste funcionar, voc√™ precisa:
1. Ter uma chave da API OpenAI
2. Configurar a vari√°vel `OPENAI_API_KEY`

Se n√£o tiver a chave, n√£o se preocupe - vamos simular as respostas para voc√™ ver como funcionaria!

**Dica do Pedro:** Na vida real, sempre teste com dados pequenos primeiro - √© como provar o tempero antes de servir o prato inteiro! üë®‚Äçüç≥

In [None]:
# Configura√ß√£o da API (substitua pela sua chave ou use simula√ß√£o)
import os

# Tente pegar a chave da API das vari√°veis de ambiente
api_key = os.getenv('OPENAI_API_KEY')

if api_key:
    print("üîë API Key encontrada! Vamos usar o LLM real.")
    use_real_api = True
else:
    print("‚ö†Ô∏è API Key n√£o encontrada. Vamos simular as respostas.")
    print("üí° Para usar de verdade, configure: os.environ['OPENAI_API_KEY'] = 'sua-chave'")
    use_real_api = False

# Classe simulada para demonstra√ß√£o (quando n√£o h√° API key)
class SimulatedAssistant:
    def __init__(self):
        self.current_dataset = None
        self.conversation_history = []
    
    def load_dataset(self, data=None):
        self.current_dataset = data
        return True
    
    def generate_response(self, question):
        # Respostas simuladas baseadas na pergunta
        simulated_responses = {
            "receita": """
**RESUMO EXECUTIVO**: A receita total do per√≠odo analisado foi de R$ 234.567,89, com crescimento constante ao longo do ano.

**AN√ÅLISE DETALHADA**: 
- Categoria 'Eletr√¥nicos' representa 35% da receita total
- Regi√£o Sudeste concentra 40% das vendas
- Picos de venda em meses de promo√ß√£o (maio, novembro)

**INSIGHTS**:
1. üì± Eletr√¥nicos s√£o nosso carro-chefe
2. üó∫Ô∏è Concentra√ß√£o geogr√°fica no Sudeste
3. üìÖ Sazonalidade clara nas vendas
""",
            "categoria": """
**RESUMO EXECUTIVO**: Eletr√¥nicos lideram com 35% da receita, seguidos por Roupas (22%) e Casa e Jardim (18%).

**AN√ÅLISE DETALHADA**:
- Eletr√¥nicos: Alto ticket m√©dio (R$ 320)
- Roupas: Volume alto, ticket m√©dio (R$ 85)
- Livros: Categoria com menor performance

**RECOMENDA√á√ïES**:
1. üéØ Investir mais em marketing de eletr√¥nicos
2. üìö Revisar estrat√©gia para livros
3. üëó Explorar cross-sell entre roupas e beleza
"""
        }
        
        # Escolhe resposta baseada em palavras-chave
        question_lower = question.lower()
        if "receita" in question_lower or "total" in question_lower:
            response = simulated_responses["receita"]
        elif "categoria" in question_lower:
            response = simulated_responses["categoria"]
        else:
            response = "**RESPOSTA SIMULADA**: Esta √© uma demonstra√ß√£o. Com a API real, eu analisaria seus dados espec√≠ficos!"
        
        return {
            "success": True,
            "response": response,
            "tokens_used": 150,
            "timestamp": datetime.now().isoformat()
        }

# Inicializando assistente
if use_real_api:
    assistant = DataAnalysisAssistant(api_key=api_key)
else:
    assistant = SimulatedAssistant()

# Carregando nosso dataset
assistant.load_dataset(data=df_vendas)

print("ü§ñ Assistente pronto para an√°lises!")
print(f"üìä Dataset carregado: {len(df_vendas)} registros")

In [None]:
# Testando nosso assistente com perguntas reais
perguntas_teste = [
    "Qual foi a receita total e qual categoria teve melhor performance?",
    "Como as vendas se distribuem por regi√£o do Brasil?",
    "Qual a diferen√ßa de performance entre clientes novos e recorrentes?",
    "Existe alguma sazonalidade nas vendas ao longo dos meses?"
]

print("üîç TESTANDO ASSISTENTE COM PERGUNTAS REAIS\n")
print("=" * 60)

for i, pergunta in enumerate(perguntas_teste, 1):
    print(f"\n‚ùì PERGUNTA {i}: {pergunta}")
    print("-" * 50)
    
    # Gerando resposta
    resultado = assistant.generate_response(pergunta)
    
    if resultado["success"]:
        print(f"‚úÖ RESPOSTA:")
        print(resultado["response"])
        print(f"\nüìä Tokens utilizados: {resultado.get('tokens_used', 'N/A')}")
    else:
        print(f"‚ùå ERRO: {resultado['error']}")
    
    print("\n" + "=" * 60)

print("\nüéâ Teste conclu√≠do! Assistente funcionando perfeitamente!")

## üìè Sistema de Avalia√ß√£o de Qualidade

Lembra do M√≥dulo 9 sobre Avalia√ß√£o? Agora vamos implementar um sistema para medir a qualidade das respostas do nosso assistente!

Vamos criar m√©tricas para avaliar:
- **Relev√¢ncia**: A resposta responde √† pergunta?
- **Completude**: Todas as partes foram abordadas?
- **Precis√£o**: Os dados est√£o corretos?
- **Clareza**: A resposta √© f√°cil de entender?

√â como ter um "professor" interno que avalia as respostas do assistente!

**Dica do Pedro:** Na vida real, sempre me√ßa a qualidade das suas solu√ß√µes - o que n√£o √© medido, n√£o pode ser melhorado! üìä

In [None]:
class ResponseEvaluator:
    """
    Sistema de avalia√ß√£o de qualidade das respostas
    Implementa conceitos do M√≥dulo 9 - Avalia√ß√£o de Modelos
    """
    
    def __init__(self):
        self.evaluation_history = []
        
        # Palavras-chave que indicam qualidade da resposta
        self.quality_indicators = {
            'estrutura': ['resumo executivo', 'an√°lise detalhada', 'insights', 'recomenda√ß√µes'],
            'dados': ['R$', '%', 'total', 'm√©dia', 'm√°ximo', 'm√≠nimo'],
            'negocio': ['crescimento', 'performance', 'oportunidade', 'estrat√©gia'],
            'clareza': ['primeiro', 'segundo', 'portanto', 'porque', 'al√©m disso']
        }
    
    def evaluate_response(self, question: str, response: str, actual_data: pd.DataFrame = None) -> Dict[str, Any]:
        """Avalia a qualidade de uma resposta"""
        
        scores = {
            'relevancia': self._evaluate_relevance(question, response),
            'completude': self._evaluate_completeness(response),
            'clareza': self._evaluate_clarity(response),
            'estrutura': self._evaluate_structure(response)
        }
        
        # Score geral (m√©dia ponderada)
        weights = {'relevancia': 0.3, 'completude': 0.3, 'clareza': 0.2, 'estrutura': 0.2}
        overall_score = sum(scores[metric] * weight for metric, weight in weights.items())
        
        evaluation = {
            'question': question,
            'response': response,
            'scores': scores,
            'overall_score': overall_score,
            'quality_level': self._get_quality_level(overall_score),
            'timestamp': datetime.now().isoformat(),
            'recommendations': self._get_improvement_recommendations(scores)
        }
        
        self.evaluation_history.append(evaluation)
        return evaluation
    
    def _evaluate_relevance(self, question: str, response: str) -> float:
        """Avalia se a resposta √© relevante para a pergunta"""
        # Usando TF-IDF para medir similaridade sem√¢ntica
        vectorizer = TfidfVectorizer(stop_words='english')
        
        try:
            tfidf_matrix = vectorizer.fit_transform([question.lower(), response.lower()])
            similarity = cosine_similarity(tfidf_matrix[0:1], tfidf_matrix[1:2])[0][0]
            return min(similarity * 2, 1.0)  # Normaliza para 0-1
        except:
            return 0.5  # Score neutro se houver erro
    
    def _evaluate_completeness(self, response: str) -> float:
        """Avalia se a resposta √© completa (tem estrutura esperada)"""
        response_lower = response.lower()
        
        # Verifica presen√ßa de elementos estruturais
        structure_elements = 0
        for element in self.quality_indicators['estrutura']:
            if element in response_lower:
                structure_elements += 1
        
        # Verifica presen√ßa de dados quantitativos
        data_elements = 0
        for element in self.quality_indicators['dados']:
            if element in response_lower:
                data_elements += 1
        
        # Score baseado na presen√ßa de elementos estruturais e dados
        structure_score = min(structure_elements / len(self.quality_indicators['estrutura']), 1.0)
        data_score = min(data_elements / len(self.quality_indicators['dados']), 1.0)
        
        return (structure_score + data_score) / 2
    
    def _evaluate_clarity(self, response: str) -> float:
        """Avalia a clareza da resposta"""
        # M√©tricas de clareza
        sentences = response.split('.')
        avg_sentence_length = np.mean([len(s.split()) for s in sentences if s.strip()])
        
        # Penaliza frases muito longas ou muito curtas
        length_score = 1.0 - abs(avg_sentence_length - 15) / 30
        length_score = max(0, min(1, length_score))
        
        # Verifica presen√ßa de conectivos (indicam fluidez)
        response_lower = response.lower()
        clarity_elements = sum(1 for element in self.quality_indicators['clareza'] 
                              if element in response_lower)
        clarity_score = min(clarity_elements / len(self.quality_indicators['clareza']), 1.0)
        
        return (length_score + clarity_score) / 2
    
    def _evaluate_structure(self, response: str) -> float:
        """Avalia a estrutura da resposta"""
        # Verifica se tem se√ß√µes organizadas
        has_sections = len(re.findall(r'\*\*[^*]+\*\*', response)) >= 2
        has_lists = '1.' in response or '2.' in response or '‚Ä¢' in response
        has_emojis = bool(re.search(r'[üéØüìäüí∞üìàüîç‚ö†Ô∏è‚úÖ‚ùå]', response))
        
        structure_score = (has_sections + has_lists + has_emojis) / 3
        return structure_score
    
    def _get_quality_level(self, score: float) -> str:
        """Converte score num√©rico em n√≠vel qualitativo"""
        if score >= 0.8:
            return "Excelente üåü"
        elif score >= 0.6:
            return "Boa üëç"
        elif score >= 0.4:
            return "Regular üëå"
        else:
            return "Precisa Melhorar üîß"
    
    def _get_improvement_recommendations(self, scores: Dict[str, float]) -> List[str]:
        """Gera recomenda√ß√µes de melhoria baseadas nos scores"""
        recommendations = []
        
        if scores['relevancia'] < 0.6:
            recommendations.append("Focar mais na pergunta espec√≠fica do usu√°rio")
        
        if scores['completude'] < 0.6:
            recommendations.append("Incluir mais dados quantitativos e estrutura formal")
        
        if scores['clareza'] < 0.6:
            recommendations.append("Usar frases mais claras e conectivos")
        
        if scores['estrutura'] < 0.6:
            recommendations.append("Organizar melhor com se√ß√µes e listas")
        
        return recommendations
    
    def get_evaluation_summary(self) -> Dict[str, Any]:
        """Retorna resumo das avalia√ß√µes"""
        if not self.evaluation_history:
            return {"message": "Nenhuma avalia√ß√£o realizada ainda"}
        
        # Calcular estat√≠sticas
        scores = [eval_data['overall_score'] for eval_data in self.evaluation_history]
        
        return {
            'total_evaluations': len(self.evaluation_history),
            'average_score': np.mean(scores),
            'best_score': np.max(scores),
            'worst_score': np.min(scores),
            'quality_distribution': {
                level: sum(1 for eval_data in self.evaluation_history 
                          if eval_data['quality_level'] == level)
                for level in ["Excelente üåü", "Boa üëç", "Regular üëå", "Precisa Melhorar üîß"]
            }
        }

# Criando avaliador
evaluator = ResponseEvaluator()

print("üìè Sistema de avalia√ß√£o criado!")
print("üéØ M√©tricas: Relev√¢ncia, Completude, Clareza, Estrutura")

In [None]:
# Avaliando as respostas do nosso assistente
print("üìä AVALIANDO QUALIDADE DAS RESPOSTAS\n")
print("=" * 60)

# Vamos avaliar as respostas que acabamos de gerar
perguntas_avaliar = [
    "Qual foi a receita total e qual categoria teve melhor performance?",
    "Como as vendas se distribuem por regi√£o do Brasil?"
]

for pergunta in perguntas_avaliar:
    print(f"\n‚ùì PERGUNTA: {pergunta}")
    print("-" * 50)
    
    # Gerar resposta
    resultado = assistant.generate_response(pergunta)
    
    if resultado["success"]:
        # Avaliar qualidade
        avaliacao = evaluator.evaluate_response(
            question=pergunta,
            response=resultado["response"],
            actual_data=df_vendas
        )
        
        print(f"üéØ QUALIDADE GERAL: {avaliacao['quality_level']} ({avaliacao['overall_score']:.2f})")
        print("\nüìä SCORES DETALHADOS:")
        for metrica, score in avaliacao['scores'].items():
            emoji = "‚úÖ" if score >= 0.6 else "‚ö†Ô∏è" if score >= 0.4 else "‚ùå"
            print(f"  {emoji} {metrica.title()}: {score:.2f}")
        
        if avaliacao['recommendations']:
            print("\nüí° RECOMENDA√á√ïES DE MELHORIA:")
            for rec in avaliacao['recommendations']:
                print(f"  ‚Ä¢ {rec}")
    
    print("\n" + "=" * 60)

# Resumo geral das avalia√ß√µes
resumo = evaluator.get_evaluation_summary()
print("\nüìà RESUMO GERAL DAS AVALIA√á√ïES:")
print(f"üìä Total de avalia√ß√µes: {resumo['total_evaluations']}")
print(f"üéØ Score m√©dio: {resumo['average_score']:.2f}")
print(f"üåü Melhor score: {resumo['best_score']:.2f}")
print(f"üîß Pior score: {resumo['worst_score']:.2f}")

print("\nüèÜ Distribui√ß√£o de qualidade:")
for nivel, quantidade in resumo['quality_distribution'].items():
    if quantidade > 0:
        print(f"  {nivel}: {quantidade} resposta(s)")

## üìä Visualizando M√©tricas de Performance

Vamos criar um dashboard visual para acompanhar a performance do nosso assistente! √â importante visualizar os dados para entender onde estamos bem e onde podemos melhorar.

Vamos mostrar:
- **Evolu√ß√£o da qualidade** ao longo do tempo
- **Distribui√ß√£o dos scores** por m√©trica
- **Compara√ß√£o de performance** entre diferentes tipos de pergunta

**Dica do Pedro:** Um bom dashboard √© como o painel do seu carro - mostra tudo que voc√™ precisa saber de uma olhada s√≥! üöó

In [None]:
# Criando dashboard de m√©tricas de performance
def create_performance_dashboard(evaluator: ResponseEvaluator):
    """Cria visualiza√ß√µes das m√©tricas de performance"""
    
    if not evaluator.evaluation_history:
        print("‚ö†Ô∏è Nenhuma avalia√ß√£o dispon√≠vel para visualizar")
        return
    
    # Preparar dados
    eval_data = evaluator.evaluation_history
    
    # DataFrames para an√°lise
    df_scores = pd.DataFrame([
        {
            'timestamp': eval_data[i]['timestamp'],
            'overall_score': eval_data[i]['overall_score'],
            'quality_level': eval_data[i]['quality_level'],
            **eval_data[i]['scores']
        }
        for i in range(len(eval_data))
    ])
    
    # Criar visualiza√ß√µes
    fig, axes = plt.subplots(2, 2, figsize=(16, 12))
    
    # 1. Score geral por avalia√ß√£o
    axes[0,0].plot(range(len(df_scores)), df_scores['overall_score'], 
                   marker='o', linewidth=2, markersize=8, color='navy')
    axes[0,0].axhline(y=0.8, color='green', linestyle='--', alpha=0.7, label='Excelente')
    axes[0,0].axhline(y=0.6, color='orange', linestyle='--', alpha=0.7, label='Boa')
    axes[0,0].axhline(y=0.4, color='red', linestyle='--', alpha=0.7, label='Regular')
    axes[0,0].set_title('üìà Evolu√ß√£o do Score Geral', fontsize=12, fontweight='bold')
    axes[0,0].set_xlabel('N√∫mero da Avalia√ß√£o')
    axes[0,0].set_ylabel('Score (0-1)')
    axes[0,0].legend()
    axes[0,0].grid(True, alpha=0.3)
    
    # 2. Distribui√ß√£o dos scores por m√©trica
    metricas = ['relevancia', 'completude', 'clareza', 'estrutura']
    scores_por_metrica = [df_scores[metrica].values for metrica in metricas]
    
    box_plot = axes[0,1].boxplot(scores_por_metrica, labels=metricas, patch_artist=True)
    colors = ['lightblue', 'lightgreen', 'lightyellow', 'lightcoral']
    for patch, color in zip(box_plot['boxes'], colors):
        patch.set_facecolor(color)
    
    axes[0,1].set_title('üìä Distribui√ß√£o por M√©trica', fontsize=12, fontweight='bold')
    axes[0,1].set_ylabel('Score (0-1)')
    axes[0,1].tick_params(axis='x', rotation=45)
    
    # 3. Radar chart das m√©tricas m√©dias
    theta = np.linspace(0, 2 * np.pi, len(metricas), endpoint=False)
    scores_medios = [df_scores[metrica].mean() for metrica in metricas]
    
    # Fechar o pol√≠gono
    theta = np.concatenate((theta, [theta[0]]))
    scores_medios = scores_medios + [scores_medios[0]]
    
    axes[0,1].remove()  # Remove o boxplot para criar radar
    ax_radar = fig.add_subplot(2, 2, 2, projection='polar')
    
    ax_radar.plot(theta, scores_medios, 'o-', linewidth=2, color='purple')
    ax_radar.fill(theta, scores_medios, alpha=0.25, color='purple')
    ax_radar.set_thetagrids(np.degrees(theta[:-1]), metricas)
    ax_radar.set_ylim(0, 1)
    ax_radar.set_title('üéØ Radar das M√©tricas M√©dias', fontsize=12, fontweight='bold', pad=20)
    
    # 4. Distribui√ß√£o de n√≠veis de qualidade
    quality_counts = df_scores['quality_level'].value_counts()
    colors_pie = ['gold', 'lightgreen', 'orange', 'lightcoral']
    
    wedges, texts, autotexts = axes[1,0].pie(quality_counts.values, 
                                            labels=quality_counts.index,
                                            autopct='%1.1f%%',
                                            colors=colors_pie,
                                            startangle=90)
    axes[1,0].set_title('üèÜ Distribui√ß√£o de Qualidade', fontsize=12, fontweight='bold')
    
    # 5. Heatmap de correla√ß√£o entre m√©tricas
    correlation_matrix = df_scores[metricas].corr()
    
    im = axes[1,1].imshow(correlation_matrix, cmap='coolwarm', aspect='auto', vmin=-1, vmax=1)
    axes[1,1].set_xticks(range(len(metricas)))
    axes[1,1].set_yticks(range(len(metricas)))
    axes[1,1].set_xticklabels(metricas, rotation=45)
    axes[1,1].set_yticklabels(metricas)
    axes[1,1].set_title('üîó Correla√ß√£o entre M√©tricas', fontsize=12, fontweight='bold')
    
    # Adicionar valores na heatmap
    for i in range(len(metricas)):
        for j in range(len(metricas)):
            axes[1,1].text(j, i, f'{correlation_matrix.iloc[i, j]:.2f}',
                          ha='center', va='center', color='black', fontweight='bold')
    
    # Colorbar para heatmap
    cbar = plt.colorbar(im, ax=axes[1,1], shrink=0.8)
    cbar.set_label('Correla√ß√£o', rotation=270, labelpad=15)
    
    plt.tight_layout()
    plt.show()
    
    # Estat√≠sticas textuais
    print("\nüìä ESTAT√çSTICAS DETALHADAS:")
    print("=" * 40)
    
    for metrica in metricas:
        score_medio = df_scores[metrica].mean()
        desvio = df_scores[metrica].std()
        emoji = "üü¢" if score_medio >= 0.7 else "üü°" if score_medio >= 0.5 else "üî¥"
        print(f"{emoji} {metrica.title()}: {score_medio:.3f} ¬± {desvio:.3f}")
    
    print(f"\nüéØ Score Geral M√©dio: {df_scores['overall_score'].mean():.3f}")
    print(f"üìà Tend√™ncia: {'Melhorando' if df_scores['overall_score'].iloc[-1] > df_scores['overall_score'].iloc[0] else 'Est√°vel'}")

# Criar dashboard
create_performance_dashboard(evaluator)

## üéØ Exerc√≠cio Pr√°tico: Seu Pr√≥prio Assistente

Agora √© a sua vez! Vamos criar um exerc√≠cio onde voc√™ pode personalizar e expandir o assistente.

### üèÖ Desafio 1: Personalize o Assistente

Modifique o assistente para trabalhar com seu pr√≥prio dom√≠nio:
1. **Troque o dataset** por dados do seu interesse
2. **Customize os prompts** para seu contexto espec√≠fico
3. **Adicione novas m√©tricas** de avalia√ß√£o
4. **Implemente novos guardrails** espec√≠ficos do seu dom√≠nio

**Dica do Pedro:** Pense em um problema real que voc√™ tem - dados de vendas, estoque, marketing, RH... O c√©u √© o limite! üöÄ

In [None]:
# EXERC√çCIO PR√ÅTICO 1: Criando seu pr√≥prio dataset e assistente

print("üèÖ EXERC√çCIO 1: CRIE SEU PR√ìPRIO ASSISTENTE")
print("=" * 50)
print("\nüìù INSTRU√á√ïES:")
print("1. Escolha um dom√≠nio (RH, Marketing, Finan√ßas, etc.)")
print("2. Crie um dataset sint√©tico ou use dados reais")
print("3. Customize o sistema de prompts")
print("4. Teste e avalie seu assistente")

# Exemplo: Dataset de RH
def create_hr_dataset(n_employees=500):
    """Cria dataset sint√©tico de RH para exemplo"""
    np.random.seed(42)
    
    departments = ['TI', 'Vendas', 'Marketing', 'RH', 'Financeiro', 'Opera√ß√µes']
    positions = ['J√∫nior', 'Pleno', 'S√™nior', 'Lead', 'Manager']
    
    data = {
        'employee_id': range(1, n_employees + 1),
        'department': np.random.choice(departments, n_employees),
        'position': np.random.choice(positions, n_employees),
        'years_experience': np.random.exponential(3, n_employees).astype(int),
        'salary': np.random.normal(8000, 3000, n_employees),
        'performance_score': np.random.normal(8.5, 1.5, n_employees),
        'training_hours': np.random.poisson(20, n_employees),
        'satisfaction_score': np.random.normal(7.5, 2, n_employees),
        'remote_work_days': np.random.choice([0, 1, 2, 3, 4, 5], n_employees)
    }
    
    # Limpeza de dados
    df = pd.DataFrame(data)
    df['salary'] = df['salary'].clip(lower=3000, upper=25000)
    df['performance_score'] = df['performance_score'].clip(lower=1, upper=10)
    df['satisfaction_score'] = df['satisfaction_score'].clip(lower=1, upper=10)
    
    return df

# Criar dataset de exemplo
hr_data = create_hr_dataset()

print("\n‚úÖ Dataset de RH criado como exemplo:")
print(f"üë• {len(hr_data)} funcion√°rios")
print(f"üè¢ {hr_data['department'].nunique()} departamentos")
print(f"üí∞ Sal√°rio m√©dio: R$ {hr_data['salary'].mean():,.2f}")

display(hr_data.head())

print("\nüéØ SEU DESAFIO:")
print("- Modifique este c√≥digo para seu dom√≠nio espec√≠fico")
print("- Crie perguntas relevantes para seus dados")
print("- Teste a qualidade das respostas")
print("- Implemente melhorias baseadas na avalia√ß√£o")

## üèÜ Exerc√≠cio Avan√ßado: Sistema de Feedback Cont√≠nuo

### üéØ Desafio 2: Implementar Aprendizado Cont√≠nuo

Este √© o exerc√≠cio mais avan√ßado! Vamos criar um sistema que:
1. **Coleta feedback** dos usu√°rios sobre as respostas
2. **Armazena hist√≥rico** de intera√ß√µes
3. **Ajusta prompts** baseado no feedback
4. **Melhora continuamente** a qualidade

√â como criar um assistente que aprende com a experi√™ncia!

**Dica do Pedro:** Este tipo de sistema √© usado em empresas reais - voc√™ est√° aprendendo tecnologia de ponta! üåü

In [None]:
# EXERC√çCIO AVAN√áADO: Sistema de Feedback e Melhoria Cont√≠nua

class ContinuousImprovementSystem:
    """
    Sistema de melhoria cont√≠nua baseado em feedback
    Conceito avan√ßado para aplica√ß√µes reais
    """
    
    def __init__(self):
        self.feedback_history = []
        self.prompt_versions = []
        self.performance_metrics = []
        
    def collect_user_feedback(self, question: str, response: str, 
                            user_rating: int, user_comments: str = ""):
        """Coleta feedback do usu√°rio (1-5 estrelas)"""
        feedback = {
            'timestamp': datetime.now().isoformat(),
            'question': question,
            'response': response,
            'user_rating': user_rating,
            'user_comments': user_comments,
            'automated_score': None  # Ser√° preenchido pela avalia√ß√£o autom√°tica
        }
        
        self.feedback_history.append(feedback)
        return feedback
    
    def analyze_feedback_patterns(self):
        """Analisa padr√µes no feedback para identificar melhorias"""
        if len(self.feedback_history) < 5:
            return {"message": "Feedback insuficiente para an√°lise"}
        
        df_feedback = pd.DataFrame(self.feedback_history)
        
        analysis = {
            'average_rating': df_feedback['user_rating'].mean(),
            'rating_distribution': df_feedback['user_rating'].value_counts().to_dict(),
            'low_rated_patterns': self._find_low_rated_patterns(df_feedback),
            'improvement_suggestions': self._generate_improvement_suggestions(df_feedback)
        }
        
        return analysis
    
    def _find_low_rated_patterns(self, df_feedback):
        """Identifica padr√µes em respostas mal avaliadas"""
        low_rated = df_feedback[df_feedback['user_rating'] <= 2]
        
        if len(low_rated) == 0:
            return "Nenhuma resposta mal avaliada encontrada"
        
        patterns = {
            'common_words_in_questions': self._extract_common_words(low_rated['question'].tolist()),
            'avg_response_length': low_rated['response'].str.len().mean(),
            'common_complaints': self._extract_common_words(low_rated['user_comments'].tolist())
        }
        
        return patterns
    
    def _extract_common_words(self, texts):
        """Extrai palavras mais comuns de uma lista de textos"""
        if not texts or all(not text for text in texts):
            return []
        
        # Juntar todos os textos
        all_text = ' '.join([str(text) for text in texts if text])
        
        # Extrair palavras (simples)
        words = re.findall(r'\b\w+\b', all_text.lower())
        
        # Contar frequ√™ncias
        word_counts = {}
        for word in words:
            if len(word) > 3:  # Ignorar palavras muito pequenas
                word_counts[word] = word_counts.get(word, 0) + 1
        
        # Retornar top 5
        return sorted(word_counts.items(), key=lambda x: x[1], reverse=True)[:5]
    
    def _generate_improvement_suggestions(self, df_feedback):
        """Gera sugest√µes de melhoria baseadas no feedback"""
        suggestions = []
        
        avg_rating = df_feedback['user_rating'].mean()
        
        if avg_rating < 3.0:
            suggestions.append("Qualidade geral baixa - revisar sistema de prompts")
        
        if df_feedback['user_rating'].std() > 1.5:
            suggestions.append("Alta variabilidade - padronizar qualidade das respostas")
        
        low_rated_ratio = len(df_feedback[df_feedback['user_rating'] <= 2]) / len(df_feedback)
        if low_rated_ratio > 0.3:
            suggestions.append("Muitas respostas mal avaliadas - implementar filtros adicionais")
        
        return suggestions
    
    def generate_improvement_report(self):
        """Gera relat√≥rio completo de melhorias"""
        analysis = self.analyze_feedback_patterns()
        
        print("üìä RELAT√ìRIO DE MELHORIA CONT√çNUA")
        print("=" * 50)
        
        if 'average_rating' in analysis:
            rating = analysis['average_rating']
            emoji = "üåü" if rating >= 4 else "üëç" if rating >= 3 else "üëé"
            print(f"\n{emoji} Avalia√ß√£o M√©dia: {rating:.2f}/5.0")
            
            print("\nüìä Distribui√ß√£o de Avalia√ß√µes:")
            for stars, count in sorted(analysis['rating_distribution'].items()):
                bar = "‚≠ê" * stars
                print(f"  {bar} ({stars}): {count} avalia√ß√µes")
            
            if analysis['improvement_suggestions']:
                print("\nüí° Sugest√µes de Melhoria:")
                for i, suggestion in enumerate(analysis['improvement_suggestions'], 1):
                    print(f"  {i}. {suggestion}")
        else:
            print(analysis['message'])

# Exemplo de uso do sistema de melhoria cont√≠nua
improvement_system = ContinuousImprovementSystem()

# Simulando feedback de usu√°rios
feedbacks_exemplo = [
    ("Qual a receita total?", "A receita foi de R$ 100.000", 4, "Resposta clara"),
    ("Como est√£o as vendas?", "As vendas est√£o bem", 2, "Muito vaga"),
    ("An√°lise de categorias?", "Eletr√¥nicos lideram com 35%...", 5, "Excelente an√°lise"),
    ("Tend√™ncia de crescimento?", "N√£o h√° dados suficientes", 1, "N√£o ajudou"),
    ("Performance por regi√£o?", "Sudeste: 40%, Sul: 25%...", 4, "Bem detalhado")
]

print("üîÑ Coletando feedback simulado...")
for question, response, rating, comment in feedbacks_exemplo:
    improvement_system.collect_user_feedback(question, response, rating, comment)

# Gerar relat√≥rio
improvement_system.generate_improvement_report()

print("\nüéØ SEU DESAFIO AVAN√áADO:")
print("1. Implementar coleta de feedback real em uma interface")
print("2. Criar sistema de A/B testing para diferentes prompts")
print("3. Automatizar ajustes baseados no feedback")
print("4. Implementar m√©tricas de neg√≥cio espec√≠ficas")
print("\nüí° Isso √© o que diferencia solu√ß√µes amadoras de profissionais!")

## üéä Resumo Final: O Que Constru√≠mos

Parab√©ns! Voc√™ acabou de construir um sistema completo de an√°lise de dados com LLMs! üéâ

### üèóÔ∏è O Que Implementamos:

#### ü§ñ **Assistente Inteligente**
- Sistema de tokeniza√ß√£o otimizado
- Prompts estruturados e eficazes
- Guardrails de seguran√ßa
- Gera√ß√£o de respostas contextuais

#### üìä **Sistema de Avalia√ß√£o**
- M√©tricas automatizadas de qualidade
- Dashboard visual de performance
- An√°lise de tend√™ncias
- Identifica√ß√£o de pontos de melhoria

#### üîÑ **Melhoria Cont√≠nua**
- Coleta de feedback estruturada
- An√°lise de padr√µes de problemas
- Sugest√µes autom√°ticas de melhoria
- Relat√≥rios executivos

### üß† **Conceitos do Curso Aplicados:**
- ‚úÖ **Tokeniza√ß√£o** (M√≥dulo 4): Otimiza√ß√£o de custos
- ‚úÖ **Embeddings** (M√≥dulo 5): An√°lise sem√¢ntica
- ‚úÖ **Prompting** (M√≥dulo 8): Engenharia avan√ßada
- ‚úÖ **Avalia√ß√£o** (M√≥dulo 9): M√©tricas de qualidade
- ‚úÖ **Guardrails** (M√≥dulo 10): Seguran√ßa autom√°tica
- ‚úÖ **Limita√ß√µes** (M√≥dulo 11): Tratamento de edge cases

**Dica do Pedro:** Voc√™ n√£o s√≥ aprendeu a teoria - construiu um sistema que pode ser usado na vida real! Isso √© o que faz a diferen√ßa no mercado! üöÄ

In [None]:
# Visualiza√ß√£o final - Mapa mental do que foi constru√≠do
import matplotlib.patches as mpatches
from matplotlib.patches import FancyBboxPatch, Circle

fig, ax = plt.subplots(figsize=(16, 12))

# Centro - Nosso Projeto
center = Circle((8, 6), 1.5, facecolor='gold', edgecolor='black', linewidth=3)
ax.add_patch(center)
ax.text(8, 6, 'ASSISTENTE\nDE AN√ÅLISE\nDE DADOS', ha='center', va='center', 
        fontsize=12, fontweight='bold')

# Componentes principais
components = {
    'Tokeniza√ß√£o\nInteligente': (3, 9, 'lightblue', 'M√≥dulo 4'),
    'Sistema de\nPrompts': (13, 9, 'lightgreen', 'M√≥dulo 8'),
    'Guardrails\nSeguran√ßa': (3, 3, 'orange', 'M√≥dulo 10'),
    'Avalia√ß√£o\nQualidade': (13, 3, 'lightcoral', 'M√≥dulo 9'),
    'An√°lise\nSemantica': (2, 6, 'lightyellow', 'M√≥dulo 5'),
    'Melhoria\nCont√≠nua': (14, 6, 'lightpink', 'Avan√ßado')
}

# Desenhando componentes
for name, (x, y, color, module) in components.items():
    # Caixa principal
    box = FancyBboxPatch((x-1.2, y-0.8), 2.4, 1.6, 
                        boxstyle="round,pad=0.2", 
                        facecolor=color, 
                        edgecolor='black',
                        linewidth=2)
    ax.add_patch(box)
    ax.text(x, y+0.2, name, ha='center', va='center', fontsize=10, fontweight='bold')
    ax.text(x, y-0.4, f'({module})', ha='center', va='center', fontsize=8, style='italic')
    
    # Linha conectando ao centro
    ax.plot([x, 8], [y, 6], 'k--', alpha=0.5, linewidth=2)

# Funcionalidades implementadas
features = [
    "‚úÖ An√°lise automatizada de datasets",
    "‚úÖ Respostas estruturadas e contextuais", 
    "‚úÖ Sistema de seguran√ßa robusto",
    "‚úÖ M√©tricas de qualidade autom√°ticas",
    "‚úÖ Dashboard visual de performance",
    "‚úÖ Feedback e melhoria cont√≠nua",
    "‚úÖ Otimiza√ß√£o de custos (tokens)",
    "‚úÖ Tratamento de edge cases"
]

# Lista de funcionalidades
for i, feature in enumerate(features):
    ax.text(0.5, 11-i*0.4, feature, fontsize=10, va='center')

# T√≠tulo e configura√ß√µes
ax.set_xlim(0, 16)
ax.set_ylim(0, 12)
ax.set_title('üéä PROJETO FINAL COMPLETO - Sistema de An√°lise com LLMs', 
             fontsize=18, fontweight='bold', pad=20)
ax.axis('off')

# Legenda
legend_elements = [
    mpatches.Patch(color='gold', label='Core System'),
    mpatches.Patch(color='lightblue', label='Tokeniza√ß√£o'),
    mpatches.Patch(color='lightgreen', label='Prompting'),
    mpatches.Patch(color='orange', label='Seguran√ßa'),
    mpatches.Patch(color='lightcoral', label='Avalia√ß√£o'),
    mpatches.Patch(color='lightpink', label='Melhoria Cont√≠nua')
]
ax.legend(handles=legend_elements, loc='upper right', bbox_to_anchor=(0.98, 0.98))

plt.tight_layout()
plt.show()

# Estat√≠sticas finais
print("üéâ PROJETO FINAL CONCLU√çDO COM SUCESSO!")
print("=" * 50)
print(f"üìä Linhas de c√≥digo: ~500+")
print(f"üß© M√≥dulos integrados: 6/11")
print(f"‚ö° Funcionalidades: {len(features)}")
print(f"üèÜ N√≠vel: Profissional")
print("\nüí° PR√ìXIMOS PASSOS:")
print("- Implementar interface web (Streamlit/Flask)")
print("- Adicionar suporte a m√∫ltiplos tipos de arquivo")
print("- Integrar com APIs de dados externos")
print("- Implementar cache inteligente")
print("- Adicionar autentica√ß√£o e multi-tenancy")
print("\nüöÄ Voc√™ est√° pronto para o M√≥dulo 13 - T√≥picos Avan√ßados!")

## üéØ Prepara√ß√£o para o M√≥dulo 13

Voc√™ acabou de completar um projeto incr√≠vel! Mas nossa jornada ainda n√£o acabou. No pr√≥ximo e √∫ltimo m√≥dulo, vamos explorar t√≥picos avan√ßados como:

### üîÆ **O Que Vem Por A√≠:**
- **Fine-tuning** de modelos para casos espec√≠ficos
- **RAG (Retrieval-Augmented Generation)** para conhecimento externo
- **Agents** aut√¥nomos que executam tarefas complexas
- **Multimodalidade** (texto + imagem + √°udio)
- **Otimiza√ß√µes avan√ßadas** para produ√ß√£o
- **Tend√™ncias futuras** em LLMs

### üéì **Reflex√£o Final:**
Olhe para tr√°s e veja o quanto voc√™ evoluiu! Voc√™:
- ‚úÖ Entendeu a arquitetura Transformer
- ‚úÖ Dominou tokeniza√ß√£o e embeddings  
- ‚úÖ Aplicou engenharia de prompts avan√ßada
- ‚úÖ Implementou sistemas de seguran√ßa
- ‚úÖ Criou m√©tricas de avalia√ß√£o
- ‚úÖ Construiu um projeto completo e funcional

**Isso n√£o √© pouca coisa!** Voc√™ est√° no caminho certo para se tornar um expert em LLMs! üåü

**Dica do Pedro:** Pratique o que aprendeu, experimente com seus pr√≥prios dados e n√£o tenha medo de errar - √© errando que se aprende! Nos vemos no √∫ltimo m√≥dulo para fechar com chave de ouro! üîë‚ú®