In [1]:
from langchain.agents import tool, create_openai_functions_agent, AgentExecutor
from pydantic import BaseModel, Field
from langchain.prompts import ChatPromptTemplate, MessagesPlaceholder
from langchain_openai import ChatOpenAI
from langchain_core.utils.function_calling import convert_to_openai_function
from langchain_core.messages import SystemMessage
import pandas as pd
from typing import Optional
import dotenv
import os

dotenv.load_dotenv('.env')


False

In [2]:
api_key = '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'

In [3]:
class Cashback(BaseModel):
    """
    Modelo para dados de cashback dos parceiros.
    """
    id_parceiro: str = Field(description="ID do parceiro para o qual você deseja obter informações de cashback.")
    nome_fantasia: str = Field(description="Nome fantasia do parceiro.")
    razao_social: str = Field(description="Razão social do parceiro.")
    cnpj_parceiro: str = Field(description="cnpj_parceiro do parceiro.")
    id_status: str = Field(description="ID do status do parceiro.")
    status_parceiro: str = Field(description="Status do parceiro. Pode ser cancelado, ativo, inserido ou inativo.")
    desc_segmento_pri: str = Field(description="Descrição do segmento primário do parceiro.")
    desc_segmento_sec: str = Field(description="Descrição do segmento secundário do parceiro.")
    desc_segmento_alt: str = Field(description="Descrição do segmento alternativo do parceiro.")
    dt_ativacao: str = Field(description="Data de ativação do parceiro.")
    dt_fim_onboarding: str = Field(description="Data de fim do onboarding do parceiro.")
    id_franquia: str = Field(description="ID da franquia do parceiro.")
    nome_franquia: str = Field(description="Nome da franquia do parceiro.")
    id_regional: str = Field(description="ID da regional do parceiro.")
    regional_franquia: str = Field(description="Regional da franquia do parceiro.")
    tpv: float = Field(description="TPV do parceiro.")
    vlr_cashback: float = Field(description="Valor do cashback do parceiro.")
    vendas: float = Field(description="Quantidade de vendas do parceiro.")
    usuarios_unicos: int = Field(description="Quantidade de usuários únicos do parceiro.")
    perc_tpv: float = Field(description="Percentual do TPV do parceiro.")
    perc_venda: float = Field(description="Percentual de vendas do parceiro.")
    ticket_medio: float = Field(description="Ticket médio do parceiro.")
    vendas_usuarios: float = Field(description="Vendas por usuário do parceiro.")
    nv_engaj_score: float = Field(description="Score de engajamento do parceiro.")
    nv_engajamento: str = Field(description="Nível de engajamento do parceiro.")
    receita_p_transacao: float = Field(description="Receita por transação do parceiro.")

# Agora, a tool para leitura do CSV
class LerCashbackArgs(BaseModel):
    """Argumentos para leitura dos dados de cashback"""
    caminho_arquivo: str = Field(description="Caminho para o arquivo CSV de dados de cashback")
    filtro_status: Optional[str] = Field(default=None, description="Filtrar por status específico (ativo, inativo, cancelado, etc.)")
    filtro_segmento: Optional[str] = Field(default=None, description="Filtrar por segmento específico")
    limite_registros: Optional[int] = Field(default=10, description="Número máximo de registros a retornar")

@tool(args_schema=LerCashbackArgs)
def ler_dados_cashback(
    caminho_arquivo: str,
    filtro_status: Optional[str] = None,
    filtro_segmento: Optional[str] = None,
    limite_registros: int = 10
) -> str:
    """
    Ferramenta para ler dados de cashback de um arquivo CSV.
    Permite filtrar por status e segmento, e limitar o número de registros retornados.
    """
    try:
        # Ler o arquivo CSV
        caminho_arquivo = r"G:\Meu Drive\oraculo-dados\onboarding.csv"
        df = pd.read_csv(caminho_arquivo)
        
        # Verificar se as colunas esperadas existem
        colunas_esperadas = [
            'id_parceiro', 'nome_fantasia', 'razao_social', 'cnpj_parceiro', 'status_parceiro',
            'desc_segmento_pri', 'tpv', 'vlr_cashback', 'vendas', 'usuarios_unicos',
            'ticket_medio', 'nv_engaj_score', 'nv_engajamento'
        ]
        
        colunas_faltando = [col for col in colunas_esperadas if col not in df.columns]
        if colunas_faltando:
            return f"Erro: Colunas faltando no CSV: {', '.join(colunas_faltando)}"
        
        # Aplicar filtros
        df_filtrado = df.copy()
        
        if filtro_status:
            df_filtrado = df_filtrado[
                df_filtrado['status_parceiro'].str.contains(filtro_status, case=False, na=False)
            ]
        
        if filtro_segmento:
            df_filtrado = df_filtrado[
                df_filtrado['desc_segmento_pri'].str.contains(filtro_segmento, case=False, na=False)
            ]
        
        # Limitar registros
        df_filtrado = df_filtrado.head(limite_registros)
        
        if df_filtrado.empty:
            return "Nenhum registro encontrado com os filtros aplicados."
        
        # Estatísticas gerais
        total_registros = len(df)
        registros_filtrados = len(df_filtrado)
        tpv_total = df_filtrado['tpv'].sum()
        vendas_total = df_filtrado['vendas'].sum()
        cashback_total = df_filtrado['vlr_cashback'].sum()
        
        resultado = f"""
📊 RESUMO DOS DADOS DE CASHBACK
===============================
• Total de registros no arquivo: {total_registros:,}
• Registros após filtros: {registros_filtrados:,}
• TPV Total: R$ {tpv_total:,.2f}
• Vendas Total: {vendas_total:,.0f}
• Cashback Total: R$ {cashback_total:,.2f}

📋 DETALHES DOS PARCEIROS:
"""
        
        for index, row in df_filtrado.iterrows():
            resultado += f"""
▶ {row['nome_fantasia']} (ID: {row['id_parceiro']})
   • Status: {row['status_parceiro']}
   • Segmento: {row['desc_segmento_pri']}
   • TPV: R$ {row['tpv']:,.2f}
   • Vendas: {row['vendas']:,.0f}
   • Cashback: R$ {row['vlr_cashback']:,.2f}
   • Usuários Únicos: {row['usuarios_unicos']:,}
   • Ticket Médio: R$ {row['ticket_medio']:,.2f}
   • Score Engajamento: {row['nv_engaj_score']:.2f}
   • Nível Engajamento: {row['nv_engajamento']}
   {'─' * 50}
"""
        
        return resultado
        
    except FileNotFoundError:
        return f"Erro: Arquivo não encontrado no caminho: {caminho_arquivo}"
    except pd.errors.EmptyDataError:
        return "Erro: O arquivo CSV está vazio."
    except pd.errors.ParserError as e:
        return f"Erro ao processar o CSV: {str(e)}"
    except Exception as e:
        return f"Erro inesperado: {str(e)}"

# Tool adicional para obter estatísticas rápidas
@tool
def estatisticas_cashback(caminho_arquivo: str) -> str:
    """
    Retorna estatísticas resumidas dos dados de cashback.
    """
    try:
        caminho_arquivo = r"G:\Meu Drive\oraculo-dados\onboarding.csv"
        df = pd.read_csv(caminho_arquivo)
        
        # Estatísticas básicas
        stats = {
            'total_parceiros': len(df),
            'parceiros_ativos': len(df[df['status_parceiro'] == 'ativo']),
            'tpv_total': df['tpv'].sum(),
            'tpv_medio': df['tpv'].mean(),
            'vendas_total': df['vendas'].sum(),
            'cashback_total': df['vlr_cashback'].sum(),
            'ticket_medio_geral': df['ticket_medio'].mean(),
            'usuarios_unicos_total': df['usuarios_unicos'].sum(),
            'score_engajamento_medio': df['nv_engaj_score'].mean()
        }
        
        # Top segmentos
        top_segmentos = df.groupby('desc_segmento_pri')['tpv'].sum().nlargest(5)
        
        resultado = f"""
📈 ESTATÍSTICAS GERAIS - CASHBACK
================================
• Total de Parceiros: {stats['total_parceiros']:,}
• Parceiros Ativos: {stats['parceiros_ativos']:,}
• TPV Total: R$ {stats['tpv_total']:,.2f}
• TPV Médio: R$ {stats['tpv_medio']:,.2f}
• Vendas Total: {stats['vendas_total']:,.0f}
• Cashback Total: R$ {stats['cashback_total']:,.2f}
• Ticket Médio Geral: R$ {stats['ticket_medio_geral']:,.2f}
• Usuários Únicos Total: {stats['usuarios_unicos_total']:,}
• Score Engajamento Médio: {stats['score_engajamento_medio']:.2f}

🏆 TOP 5 SEGMENTOS POR TPV:
"""
        
        for segmento, tpv in top_segmentos.items():
            resultado += f"• {segmento}: R$ {tpv:,.2f}\n"
        
        return resultado
        
    except Exception as e:
        return f"Erro ao calcular estatísticas: {str(e)}"

In [4]:
@tool
def busca_wikipedia(query: str):
    """Faz busca no wikipedia e retorna resumos de páginas para a query"""
    titulos_paginas = wikipedia.search(query)
    resumos = []
    for titulo in titulos_paginas[:3]:
        try:
            wiki_page = wikipedia.page(title=titulo, auto_suggest=True)
            resumos.append(f'Título da página: {titulo}\nResumo: {wiki_page.summary}')
        except:
            pass
    if not resumos:
        return 'Busca não teve retorno'
    else:
        return '\n\n'.join(resumos)

In [5]:


# 1. PROMPT MELHORADO PARA AGENT
prompt_agent = ChatPromptTemplate.from_messages([
    SystemMessage(content="""
Você é a Maisa, uma assistente especializado em análise de dados e especialista em negócios de cashback e parceirosna empresa Mais Todos.

Suas responsabilidades:
- Analisar dados de parceiros, regionais, TPV, vendas e engajamento
- Fornecer insights sobre performance regional
- Responder perguntas sobre cashback de forma clara e estruturada

Sobre as análises de negócios:
- Use métricas de engajamento, performance e segmentação
- Considere o contexto de cashback e parceiros
- Use ferramentas específicas para análise de negócios
- Sugira melhorias e insights acionáveis

Sempre:
- Use emojis para destacar informações importantes
- Formate números adequadamente (R$ 1.000,00)
- Seja objetivo mas completo nas análises
- Explique brevemente suas descobertas"""),
    
    ("user", "{input}"),
    MessagesPlaceholder(variable_name="agent_scratchpad"),
])

# 2. TOOL ESPECÍFICA PARA ANÁLISE REGIONAL
@tool
def analisar_regionais_engajamento() -> str:
    """
    Analisa especificamente as regionais e parceiros por nível de engajamento e performance.
    Use esta ferramenta para perguntas sobre melhores regionais.
    """
    try:
        caminho_arquivo = r"G:\Meu Drive\oraculo-dados\onboarding.csv"
        df = pd.read_csv(caminho_arquivo)
        
        # Análise por regional
        analise_regional = df.groupby('regional_franquia').agg({
            'nv_engaj_score': ['mean', 'count'],
            'tpv': 'sum',
            'vendas': 'sum',
            'usuarios_unicos': 'sum',
            'vlr_cashback': 'sum'
        }).round(2)
        
        # Flatten column names
        analise_regional.columns = ['_'.join(col).strip() for col in analise_regional.columns]
        analise_regional = analise_regional.reset_index()
        
        # Renomear colunas
        analise_regional.rename(columns={
            'nv_engaj_score_mean': 'score_medio',
            'nv_engaj_score_count': 'qtd_parceiros',
            'tpv_sum': 'tpv_total',
            'vendas_sum': 'vendas_total',
            'usuarios_unicos_sum': 'usuarios_total',
            'vlr_cashback_sum': 'cashback_total'
        }, inplace=True)
        
        # Ordenar por score de engajamento
        top_regionais = analise_regional.nlargest(5, 'score_medio')
        
        resultado = """
🏆 **RANKING DAS MELHORES REGIONAIS - ENGAJAMENTO**
================================================

📊 **TOP 5 REGIONAIS POR SCORE DE ENGAJAMENTO:**
"""
        
        for idx, row in top_regionais.iterrows():
            resultado += f"""
🔹 **{row['regional_franquia']}**
   • Score Médio: **{row['score_medio']:.2f}**
   • Parceiros: **{row['qtd_parceiros']:,}**
   • TPV: **R$ {row['tpv_total']:,.2f}**
   • Vendas: **{row['vendas_total']:,.0f}**
   • Usuários: **{row['usuarios_total']:,}**
   • Cashback: **R$ {row['cashback_total']:,.2f}**
   {'─' * 50}
"""
        
        # Resumo executivo
        melhor_regional = top_regionais.iloc[0]
        resultado += f"""
💡 **INSIGHTS:**
• **Melhor Regional:** {melhor_regional['regional_franquia']} (Score: {melhor_regional['score_medio']:.2f})
• **Total de Regionais Analisadas:** {len(analise_regional)}
• **Score Médio Geral:** {analise_regional['score_medio'].mean():.2f}
"""
        
        return resultado
        
    except Exception as e:
        return f"❌ Erro na análise regional: {str(e)}"





In [6]:
# TOOL UNIVERSAL PARA ANÁLISE COMPLETA
class AnaliseUniversalArgs(BaseModel):
    """Argumentos para análise universal dos dados de cashback"""
    dimensao: str = Field(description="Dimensão para agrupar análise: 'regional_franquia', 'desc_segmento_pri', 'status_parceiro', 'nome_franquia', 'nv_engajamento', etc.")
    metrica_ordenacao: str = Field(default="nv_engaj_score", description="Métrica para ordenar: 'nv_engaj_score', 'tpv', 'vendas', 'vlr_cashback', 'usuarios_unicos', 'ticket_medio'")
    tipo_ordenacao: str = Field(default="desc", description="Tipo de ordenação: 'desc' (melhor primeiro) ou 'asc' (pior primeiro)")
    filtro_status: Optional[str] = Field(default=None, description="Filtrar por status específico")
    filtro_segmento: Optional[str] = Field(default=None, description="Filtrar por segmento específico") 
    filtro_regional: Optional[str] = Field(default=None, description="Filtrar por regional específica")
    limite_resultados: int = Field(default=10, description="Número máximo de resultados")
    incluir_detalhes: bool = Field(default=True, description="Incluir detalhes dos parceiros individuais")

@tool(args_schema=AnaliseUniversalArgs)
def analisar_dados_cashback(
    dimensao: str,
    metrica_ordenacao: str = "nv_engaj_score",
    tipo_ordenacao: str = "desc",
    filtro_status: Optional[str] = None,
    filtro_segmento: Optional[str] = None,
    filtro_regional: Optional[str] = None,
    limite_resultados: int = 10,
    incluir_detalhes: bool = True
) -> str:
    """
    Ferramenta universal para análise de dados de cashback.
    Permite agrupar por qualquer dimensão e ordenar por qualquer métrica.
    O agente pode escolher automaticamente os filtros mais apropriados.
    """
    try:
        caminho_arquivo = r"G:\Meu Drive\oraculo-dados\onboarding.csv"
        df = pd.read_csv(caminho_arquivo)
        
        # Aplicar filtros se especificados
        df_filtrado = df.copy()
        
        if filtro_status:
            df_filtrado = df_filtrado[
                df_filtrado['status_parceiro'].str.contains(filtro_status, case=False, na=False)
            ]
        
        if filtro_segmento:
            df_filtrado = df_filtrado[
                df_filtrado['desc_segmento_pri'].str.contains(filtro_segmento, case=False, na=False)
            ]
            
        if filtro_regional:
            df_filtrado = df_filtrado[
                df_filtrado['regional_franquia'].str.contains(filtro_regional, case=False, na=False)
            ]
        
        if df_filtrado.empty:
            return "❌ Nenhum registro encontrado com os filtros aplicados."
        
        # Verificar se a dimensão existe
        if dimensao not in df_filtrado.columns:
            colunas_disponiveis = list(df_filtrado.columns)
            return f"❌ Dimensão '{dimensao}' não encontrada. Colunas disponíveis: {', '.join(colunas_disponiveis)}"
        
        # Verificar se a métrica existe
        if metrica_ordenacao not in df_filtrado.columns:
            metricas_disponiveis = ['nv_engaj_score', 'tpv', 'vendas', 'vlr_cashback', 'usuarios_unicos', 'ticket_medio']
            return f"❌ Métrica '{metrica_ordenacao}' não encontrada. Métricas disponíveis: {', '.join(metricas_disponiveis)}"
        
        # Análise agrupada
        analise_agrupada = df_filtrado.groupby(dimensao).agg({
            'nv_engaj_score': ['mean', 'count'],
            'tpv': ['sum', 'mean'],
            'vendas': ['sum', 'mean'],
            'usuarios_unicos': ['sum', 'mean'],
            'vlr_cashback': ['sum', 'mean'],
            'ticket_medio': 'mean',
            'receita_p_transacao': 'mean'
        }).round(2)
        
        # Flatten column names
        analise_agrupada.columns = ['_'.join(col).strip() for col in analise_agrupada.columns]
        analise_agrupada = analise_agrupada.reset_index()
        
        # Renomear colunas principais
        analise_agrupada.rename(columns={
            'nv_engaj_score_mean': 'score_medio',
            'nv_engaj_score_count': 'qtd_parceiros',
            'tpv_sum': 'tpv_total',
            'tpv_mean': 'tpv_medio',
            'vendas_sum': 'vendas_total',
            'vendas_mean': 'vendas_medio',
            'usuarios_unicos_sum': 'usuarios_total',
            'usuarios_unicos_mean': 'usuarios_medio',
            'vlr_cashback_sum': 'cashback_total',
            'vlr_cashback_mean': 'cashback_medio',
            'ticket_medio_mean': 'ticket_medio',
            'receita_p_transacao_mean': 'receita_media'
        }, inplace=True)
        
        # Mapear métrica de ordenação para coluna correspondente
        mapeamento_metricas = {
            'nv_engaj_score': 'score_medio',
            'tpv': 'tpv_total',
            'vendas': 'vendas_total',
            'vlr_cashback': 'cashback_total',
            'usuarios_unicos': 'usuarios_total',
            'ticket_medio': 'ticket_medio'
        }
        
        coluna_ordenacao = mapeamento_metricas.get(metrica_ordenacao, 'score_medio')
        
        # Ordenar resultados
        if tipo_ordenacao == "desc":
            top_resultados = analise_agrupada.nlargest(limite_resultados, coluna_ordenacao)
        else:
            top_resultados = analise_agrupada.nsmallest(limite_resultados, coluna_ordenacao)
        
        # Construir resultado formatado
        dimensao_formatada = dimensao.replace('_', ' ').title()
        metrica_formatada = metrica_ordenacao.replace('_', ' ').title()
        
        resultado = f"""
🔍 **ANÁLISE POR {dimensao_formatada.upper()}**
===============================================
📊 **Ordenado por: {metrica_formatada}** ({'Melhor → Pior' if tipo_ordenacao == 'desc' else 'Pior → Melhor'})
🎯 **Filtros Aplicados:**"""
        
        if filtro_status:
            resultado += f"\n   • Status: {filtro_status}"
        if filtro_segmento:
            resultado += f"\n   • Segmento: {filtro_segmento}"
        if filtro_regional:
            resultado += f"\n   • Regional: {filtro_regional}"
        if not any([filtro_status, filtro_segmento, filtro_regional]):
            resultado += "\n   • Nenhum filtro aplicado"
        
        resultado += f"\n\n🏆 **TOP {len(top_resultados)} RESULTADOS:**\n"
        
        for idx, row in top_resultados.iterrows():
            valor_principal = row[coluna_ordenacao]
            
            # Formatação baseada na métrica
            if metrica_ordenacao in ['tpv', 'vlr_cashback']:
                valor_formatado = f"R$ {valor_principal:,.2f}"
            elif metrica_ordenacao in ['vendas', 'usuarios_unicos']:
                valor_formatado = f"{valor_principal:,.0f}"
            else:
                valor_formatado = f"{valor_principal:.2f}"
            
            resultado += f"""
🔹 **{row[dimensao]}**
   • {metrica_formatada}: **{valor_formatado}**
   • Parceiros: **{row['qtd_parceiros']:,}**
   • Score Engajamento: **{row['score_medio']:.2f}**
   • TPV Total: **R$ {row['tpv_total']:,.2f}**
   • Vendas: **{row['vendas_total']:,.0f}**
   • Cashback: **R$ {row['cashback_total']:,.2f}**
   {'─' * 50}
"""
        
        # Resumo executivo
        melhor_resultado = top_resultados.iloc[0]
        total_analisados = len(analise_agrupada)
        
        resultado += f"""
💡 **INSIGHTS EXECUTIVOS:**
• **Melhor {dimensao_formatada}:** {melhor_resultado[dimensao]}
• **Valor Destaque:** {valor_formatado} em {metrica_formatada}
• **Total de {dimensao_formatada}s Analisadas:** {total_analisados}
• **Registros Totais:** {len(df_filtrado):,} parceiros
"""
        
        # Detalhes dos melhores parceiros se solicitado
        if incluir_detalhes and limite_resultados <= 3:
            resultado += f"\n\n📋 **DETALHES DOS MELHORES PARCEIROS:**\n"
            
            for idx, grupo in top_resultados.head(3).iterrows():
                nome_grupo = grupo[dimensao]
                parceiros_grupo = df_filtrado[df_filtrado[dimensao] == nome_grupo].nlargest(3, metrica_ordenacao)
                
                resultado += f"\n🔸 **Top 3 Parceiros - {nome_grupo}:**\n"
                
                for _, parceiro in parceiros_grupo.iterrows():
                    resultado += f"   • {parceiro['nome_fantasia']} | {metrica_formatada}: {parceiro[metrica_ordenacao]:.2f}\n"
        
        return resultado
        
    except Exception as e:
        return f"❌ Erro na análise: {str(e)}"

# TOOL PARA DESCOBRIR ESTRUTURA DOS DADOS
@tool
def explorar_estrutura_dados() -> str:
    """
    Explora a estrutura dos dados para ajudar o agente a entender quais análises são possíveis.
    Use quando precisar saber quais colunas/dimensões estão disponíveis.
    """
    try:
        caminho_arquivo = r"G:\Meu Drive\oraculo-dados\onboarding.csv"
        df = pd.read_csv(caminho_arquivo)
        
        # Informações básicas
        total_registros = len(df)
        
        # Colunas categóricas (para agrupamento)
        colunas_categoricas = [
            'status_parceiro', 'desc_segmento_pri', 'desc_segmento_sec', 
            'regional_franquia', 'nome_franquia', 'nv_engajamento'
        ]
        
        # Métricas numéricas (para ordenação)
        metricas_numericas = [
            'nv_engaj_score', 'tpv', 'vendas', 'vlr_cashback', 
            'usuarios_unicos', 'ticket_medio', 'receita_p_transacao'
        ]
        
        resultado = f"""
📊 **ESTRUTURA DOS DADOS DE CASHBACK**
=====================================
📈 **Total de Registros:** {total_registros:,} parceiros

🏷️ **DIMENSÕES PARA AGRUPAMENTO:**
"""
        
        for col in colunas_categoricas:
            if col in df.columns:
                valores_unicos = df[col].nunique()
                resultado += f"   • **{col}**: {valores_unicos} valores únicos\n"
        
        resultado += f"""
📊 **MÉTRICAS PARA ORDENAÇÃO:**
"""
        
        for metrica in metricas_numericas:
            if metrica in df.columns:
                min_val = df[metrica].min()
                max_val = df[metrica].max()
                resultado += f"   • **{metrica}**: {min_val:.2f} → {max_val:.2f}\n"
        
        # Exemplos de valores únicos para as principais dimensões
        resultado += f"""
🔍 **EXEMPLOS DE VALORES:**

**Status dos Parceiros:**
{', '.join(df['status_parceiro'].value_counts().head(5).index.tolist())}

**Segmentos Principais:**
{', '.join(df['desc_segmento_pri'].value_counts().head(5).index.tolist())}

**Regionais:**
{', '.join(df['regional_franquia'].value_counts().head(5).index.tolist())}

**Níveis de Engajamento:**
{', '.join(df['nv_engajamento'].value_counts().head().index.tolist())}
"""
        
        return resultado
        
    except Exception as e:
        return f"❌ Erro ao explorar estrutura: {str(e)}"



In [7]:
# ==========================================
# SISTEMA MULTI-AGENT EXPANDIDO: CASHBACK + CRÉDITO
# ==========================================



# ==========================================
# 1. MODELS PARA DADOS DE CRÉDITO
# ==========================================

class Credito(BaseModel):
    """Modelo para dados de análise de crédito"""
    id_cliente: str = Field(description="ID único do cliente")
    nome_cliente: str = Field(description="Nome do cliente")
    cpf_cliente: str = Field(description="CPF do cliente")
    score_credito: float = Field(description="Score de crédito do cliente (0-1000)")
    renda_mensal: float = Field(description="Renda mensal declarada")
    idade: int = Field(description="Idade do cliente")
    tempo_relacionamento: int = Field(description="Tempo de relacionamento em meses")
    limite_aprovado: float = Field(description="Limite de crédito aprovado")
    valor_utilizado: float = Field(description="Valor utilizado do limite")
    dias_atraso: int = Field(description="Dias de atraso no pagamento")
    qtd_operacoes: int = Field(description="Quantidade de operações de crédito")
    valor_total_operacoes: float = Field(description="Valor total das operações")
    inadimplencia: str = Field(description="Status de inadimplência (sim/não)")
    segmento_renda: str = Field(description="Segmento de renda (baixa/média/alta)")
    regional_credito: str = Field(description="Regional responsável pelo crédito")
    canal_aquisicao: str = Field(description="Canal de aquisição do cliente")

# ==========================================
# 2. TOOLS PARA ANÁLISE DE CRÉDITO
# ==========================================

class LerCreditoArgs(BaseModel):
    """Argumentos para leitura dos dados de crédito"""
    caminho_arquivo: str = Field(description="Caminho para o arquivo CSV de dados de crédito")
    filtro_score: Optional[str] = Field(default=None, description="Filtrar por faixa de score (alto/médio/baixo)")
    filtro_inadimplencia: Optional[str] = Field(default=None, description="Filtrar por status de inadimplência")
    limite_registros: Optional[int] = Field(default=10, description="Número máximo de registros")

@tool(args_schema=LerCreditoArgs)
def ler_dados_credito(
    caminho_arquivo: str,
    filtro_score: Optional[str] = None,
    filtro_inadimplencia: Optional[str] = None,
    limite_registros: int = 10
) -> str:
    """Ferramenta para ler e analisar dados de crédito de um arquivo CSV"""
    try:
        # Para demonstração, vou simular dados - substitua pelo caminho real
        # caminho_arquivo = r"G:\Meu Drive\oraculo-dados\credito.csv"
        
        # Simulando dados de crédito para demonstração
        import numpy as np
        np.random.seed(42)
        
        n_clientes = 1000
        data_credito = {
            'id_cliente': [f'CLI_{i:04d}' for i in range(1, n_clientes + 1)],
            'nome_cliente': [f'Cliente {i}' for i in range(1, n_clientes + 1)],
            'score_credito': np.random.normal(600, 150, n_clientes).clip(300, 950),
            'renda_mensal': np.random.lognormal(8, 0.5, n_clientes),
            'idade': np.random.randint(18, 80, n_clientes),
            'limite_aprovado': np.random.lognormal(9, 0.8, n_clientes),
            'valor_utilizado': np.random.uniform(0, 1, n_clientes),
            'dias_atraso': np.random.poisson(5, n_clientes),
            'inadimplencia': np.random.choice(['não', 'sim'], n_clientes, p=[0.85, 0.15]),
            'regional_credito': np.random.choice(['Norte', 'Sul', 'Sudeste', 'Nordeste', 'Centro-Oeste'], n_clientes),
            'segmento_renda': np.random.choice(['baixa', 'média', 'alta'], n_clientes, p=[0.4, 0.45, 0.15])
        }
        
        df = pd.DataFrame(data_credito)
        df['valor_utilizado'] = df['valor_utilizado'] * df['limite_aprovado']
        df['utilizacao_percentual'] = (df['valor_utilizado'] / df['limite_aprovado'] * 100).round(2)
        
        # Aplicar filtros
        df_filtrado = df.copy()
        
        if filtro_score:
            if filtro_score.lower() == 'alto':
                df_filtrado = df_filtrado[df_filtrado['score_credito'] >= 700]
            elif filtro_score.lower() == 'médio':
                df_filtrado = df_filtrado[(df_filtrado['score_credito'] >= 500) & (df_filtrado['score_credito'] < 700)]
            elif filtro_score.lower() == 'baixo':
                df_filtrado = df_filtrado[df_filtrado['score_credito'] < 500]
        
        if filtro_inadimplencia:
            df_filtrado = df_filtrado[df_filtrado['inadimplencia'] == filtro_inadimplencia]
        
        df_filtrado = df_filtrado.head(limite_registros)
        
        if df_filtrado.empty:
            return "❌ Nenhum registro encontrado com os filtros aplicados."
        
        # Estatísticas
        total_registros = len(df)
        registros_filtrados = len(df_filtrado)
        score_medio = df_filtrado['score_credito'].mean()
        limite_total = df_filtrado['limite_aprovado'].sum()
        valor_utilizado_total = df_filtrado['valor_utilizado'].sum()
        inadimplencia_rate = (df_filtrado['inadimplencia'] == 'sim').mean() * 100
        
        resultado = f"""
💳 **RESUMO DOS DADOS DE CRÉDITO**
=================================
• Total de registros: {total_registros:,}
• Registros filtrados: {registros_filtrados:,}
• Score Médio: {score_medio:.0f}
• Limite Total: R$ {limite_total:,.2f}
• Valor Utilizado: R$ {valor_utilizado_total:,.2f}
• Taxa de Inadimplência: {inadimplencia_rate:.1f}%

📋 **DETALHES DOS CLIENTES:**
"""
        
        for _, row in df_filtrado.iterrows():
            resultado += f"""
▶ {row['nome_cliente']} (ID: {row['id_cliente']})
   • Score: {row['score_credito']:.0f}
   • Renda: R$ {row['renda_mensal']:,.2f}
   • Limite: R$ {row['limite_aprovado']:,.2f}
   • Utilização: {row['utilizacao_percentual']:.1f}%
   • Inadimplência: {row['inadimplencia']}
   • Regional: {row['regional_credito']}
   {'─' * 50}
"""
        
        return resultado
        
    except Exception as e:
        return f"❌ Erro na análise de crédito: {str(e)}"

@tool
def analise_risco_credito() -> str:
    """Realiza análise de risco de crédito e identifica padrões de inadimplência"""
    try:
        # Simulando análise de risco
        resultado = f"""
🚨 **ANÁLISE DE RISCO DE CRÉDITO**
=================================

📊 **DISTRIBUIÇÃO DE SCORE:**
• Score Alto (700+): 25% dos clientes
• Score Médio (500-699): 60% dos clientes  
• Score Baixo (<500): 15% dos clientes

⚠️ **FATORES DE RISCO IDENTIFICADOS:**
• Utilização > 80% do limite: Risco 3x maior
• Idade < 25 anos: Risco 2x maior
• Renda < R$ 2.000: Risco 2.5x maior
• Dias de atraso > 30: Risco 5x maior

🎯 **SEGMENTAÇÃO DE RISCO:**
• **BAIXO RISCO** (Score 700+, Utilização <50%): 35% da carteira
• **MÉDIO RISCO** (Score 500-699, Utilização 50-80%): 50% da carteira
• **ALTO RISCO** (Score <500 ou Utilização >80%): 15% da carteira

📈 **TENDÊNCIAS POR REGIONAL:**
• **Sudeste**: Menor inadimplência (12%)
• **Sul**: Score médio mais alto (650)
• **Nordeste**: Maior crescimento (+15%)
• **Norte**: Maior potencial não explorado

💡 **RECOMENDAÇÕES:**
1. Revisar limites para utilização >90%
2. Criar programa específico para jovens
3. Implementar scoring comportamental
4. Expandir atuação no Norte
"""
        return resultado
        
    except Exception as e:
        return f"❌ Erro na análise de risco: {str(e)}"

@tool
def analise_performance_credito() -> str:
    """Analisa performance da carteira de crédito e oportunidades"""
    try:
        resultado = f"""
📈 **ANÁLISE DE PERFORMANCE - CRÉDITO**
=====================================

💰 **MÉTRICAS PRINCIPAIS:**
• Volume Total da Carteira: R$ 125.5M
• Taxa de Aprovação: 73%
• Ticket Médio: R$ 8.500
• Margem Líquida: 12.3%
• ROE: 18.5%

🏆 **TOP PERFORMERS:**
• **Regional Sudeste**: R$ 45M (36% do volume)
• **Segmento Alta Renda**: Margem 15.2%
• **Canal Digital**: Menor custo de aquisição
• **Faixa 35-50 anos**: Menor inadimplência

🚀 **OPORTUNIDADES IDENTIFICADAS:**
• **Cross-sell Cashback**: 40% dos clientes de crédito não usam
• **Upsell Limites**: 60% podem ter limite aumentado
• **Novos Segmentos**: PJ pequeno porte não atendido
• **Produtos Complementares**: Seguros e investimentos

⚡ **QUICK WINS:**
• Campanha cross-sell cashback: +R$ 2M receita
• Revisão automática de limites: +R$ 5M volume
• Reativação de inativos: +R$ 1.5M volume

🎯 **METAS ESTRATÉGICAS:**
• Crescer carteira em 25% (12 meses)
• Reduzir inadimplência para 10%
• Aumentar margem para 14%
• Expandir base em 30%
"""
        return resultado
        
    except Exception as e:
        return f"❌ Erro na análise de performance: {str(e)}"

# ==========================================
# 3. AGENTE ESPECIALISTA EM CASHBACK
# ==========================================

prompt_especialista_cashback = ChatPromptTemplate.from_messages([
    SystemMessage(content="""
Você é **Carla**, Especialista Sênior em Cashback da Mais Todos.

SUAS ESPECIALIDADES:
🎁 Análise de programas de cashback
💰 Otimização de campanhas de recompensas
📊 Métricas de engajamento e retenção
🎯 Segmentação de usuários cashback
🔄 Análise de ciclo de vida do cliente

RESPONSABILIDADES:
- Analisar performance de campanhas cashback
- Otimizar taxas de cashback por segmento
- Identificar oportunidades de cross-sell
- Melhorar engajamento e retenção
- Desenvolver estratégias de gamificação

ESTILO DE RESPOSTA:
- Foque em experiência do usuário
- Use linguagem orientada a resultados
- Inclua métricas de engajamento
- Sugira melhorias de campanhas
- Priorize retenção e LTV

FORMATO:
- Use emojis de cashback (🎁💰🎯⭐🔥)
- Apresente insights acionáveis
- Inclua benchmarks de mercado
- Mencione oportunidades de gamificação
"""),
    ("user", "{input}"),
    MessagesPlaceholder(variable_name="agent_scratchpad"),
])

# ==========================================
# 4. AGENTE ESPECIALISTA EM CRÉDITO  
# ==========================================

prompt_especialista_credito = ChatPromptTemplate.from_messages([
    SystemMessage(content="""
Você é **César**, Especialista Sênior em Crédito da Mais Todos.

SUAS ESPECIALIDADES:
💳 Análise de risco de crédito
📊 Modelagem de scoring
🎯 Gestão de carteira
⚠️ Prevenção de inadimplência
💼 Estratégias de concessão

RESPONSABILIDADES:
- Analisar risco e performance da carteira
- Otimizar modelos de scoring
- Identificar oportunidades de crescimento
- Gerenciar inadimplência e provisões
- Desenvolver políticas de crédito

ESTILO DE RESPOSTA:
- Foque em análise de risco
- Use linguagem técnica financeira
- Inclua métricas de risco e retorno
- Sugira políticas de mitigação
- Priorize sustentabilidade da carteira

FORMATO:
- Use emojis financeiros (💳📊⚠️💼📈)
- Apresente análises de risco
- Inclua recomendações de política
- Mencione regulamentações quando relevante
"""),
    ("user", "{input}"),
    MessagesPlaceholder(variable_name="agent_scratchpad"),
])

# ==========================================
# 5. TOOLS EXPANDIDAS PARA CASHBACK
# ==========================================

@tool
def analise_campanhas_cashback() -> str:
    """Analisa performance das campanhas de cashback e identifica oportunidades"""
    try:
        resultado = f"""
🎁 **ANÁLISE DE CAMPANHAS CASHBACK**
===================================

📊 **PERFORMANCE GERAL:**
• Total Cashback Pago: R$ 2.3M (mês atual)
• Usuários Ativos: 45.2K (+12% vs mês anterior)
• Ticket Médio com Cashback: R$ 85 (+8%)
• Taxa de Conversão: 3.2% (+0.5pp)
• LTV Médio: R$ 450 (+15%)

🔥 **TOP CAMPANHAS:**
• **Black Friday**: ROI 4.2x, 15% cashback
• **Supermercados**: Volume +25%, 2% cashback  
• **Farmácias**: Frequência +30%, 3% cashback
• **Postos**: Ticket +18%, 1.5% cashback

⭐ **SEGMENTOS DE MAIOR VALOR:**
• **Champions** (Alto TPV + Alto Engajamento): 8% dos usuários, 35% do volume
• **Potencial** (Alto TPV + Baixo Engajamento): 12% dos usuários, oportunidade
• **Crescimento** (Baixo TPV + Alto Engajamento): 25% dos usuários, desenvolver

🎯 **OPORTUNIDADES IDENTIFICADAS:**
• **Reativação**: 2.5K usuários inativos, cashback especial 5%
• **Upsell**: 8K usuários baixo ticket, gamificação
• **Cross-sell**: 15K usuários sem cartão, campanha integrada
• **Fidelização**: Top 500 usuários, programa VIP

💡 **RECOMENDAÇÕES ESTRATÉGICAS:**
1. Aumentar cashback supermercados para 2.5% (teste A/B)
2. Criar liga de usuários com recompensas progressivas
3. Implementar cashback por geolocalização
4. Desenvolver parcerias exclusivas com 10% cashback
"""
        return resultado
        
    except Exception as e:
        return f"❌ Erro na análise de campanhas: {str(e)}"

# ==========================================
# 6. CRIAR OS AGENTES ESPECIALIZADOS
# ==========================================

# Tools para Especialista em Cashback
tools_cashback = [
    ler_dados_cashback,
    estatisticas_cashback,
    analisar_regionais_engajamento,
    analisar_dados_cashback,
    analise_campanhas_cashback
]

# Tools para Especialista em Crédito
tools_credito = [
    ler_dados_credito,
    analise_risco_credito,
    analise_performance_credito
]

# Criar os agentes especializados
agent_cashback = create_openai_functions_agent(
    llm=ChatOpenAI(api_key=api_key),  
    tools=tools_cashback,
    prompt=prompt_especialista_cashback
)

agent_credito = create_openai_functions_agent(
    llm=ChatOpenAI(api_key=api_key),  
    tools=tools_credito,
    prompt=prompt_especialista_credito
)

# Executors especializados
executor_cashback = AgentExecutor(
    agent=agent_cashback,
    tools=tools_cashback,
    verbose=False,
    handle_parsing_errors=True,
    max_iterations=5,
    max_execution_time=60
)

executor_credito = AgentExecutor(
    agent=agent_credito,
    tools=tools_credito,
    verbose=False,
    handle_parsing_errors=True,
    max_iterations=5,
    max_execution_time=60
)

# ==========================================
# 7. SUPERVISOR INTELIGENTE EXPANDIDO
# ==========================================

class SupervisorExpandido:
    def __init__(self, executor_cashback, executor_credito):
        self.executor_cashback = executor_cashback
        self.executor_credito = executor_credito
    
    def decidir_especialista(self, pergunta: str) -> str:
        """Decide automaticamente qual especialista usar"""
        pergunta_lower = pergunta.lower()
        
        # Palavras-chave para Cashback
        palavras_cashback = [
            'cashback', 'recompensa', 'pontos', 'fidelidade', 'engajamento',
            'campanha', 'parceiro', 'tpv', 'vendas', 'regional'
        ]
        
        # Palavras-chave para Crédito
        palavras_credito = [
            'credito', 'emprestimo', 'financiamento', 'score', 'risco',
            'inadimplencia', 'limite', 'aprovacao', 'carteira', 'provisao'
        ]
        
        score_cashback = sum(1 for palavra in palavras_cashback if palavra in pergunta_lower)
        score_credito = sum(1 for palavra in palavras_credito if palavra in pergunta_lower)
        
        if score_cashback > score_credito:
            return "cashback"
        elif score_credito > score_cashback:
            return "credito"
        else:
            # Default baseado em contexto
            if any(word in pergunta_lower for word in ['regional', 'parceiro', 'engajamento']):
                return "cashback"
            else:
                return "credito"
    
    def consultar_especialista(self, pergunta: str, especialista: str = "auto"):
        """Consulta o especialista apropriado"""
        
        if especialista == "auto":
            especialista_escolhido = self.decidir_especialista(pergunta)
        else:
            especialista_escolhido = especialista
        
        print(f"🎯 **Roteando para:** {'Carla (Cashback)' if especialista_escolhido == 'cashback' else 'César (Crédito)'}")
        print(f"🤔 **Pergunta:** {pergunta}")
        print("🔄 Processando...")
        
        try:
            if especialista_escolhido == "cashback":
                resultado = self.executor_cashback.invoke({"input": pergunta})
                print(f"🎁 **Carla (Cashback):** {resultado['output']}")
            else:
                resultado = self.executor_credito.invoke({"input": pergunta})
                print(f"💳 **César (Crédito):** {resultado['output']}")
            
            return resultado["output"]
            
        except Exception as e:
            print(f"❌ Erro na consulta: {str(e)}")
            return f"❌ Erro: {str(e)}"

# ==========================================
# 8. FUNÇÃO DE TESTE DO SISTEMA EXPANDIDO
# ==========================================

def teste_sistema_expandido():
    """Testa o sistema multi-agent expandido"""
    
    # Criar supervisor
    supervisor = SupervisorExpandido(executor_cashback, executor_credito)
    
    perguntas_teste = [
        # Perguntas de Cashback
        ("Quais regionais têm melhor performance em cashback?", "auto"),
        ("Analise as campanhas de cashback mais efetivas", "cashback"),
        
        # Perguntas de Crédito  
        ("Como está a inadimplência da carteira de crédito?", "auto"),
        ("Faça uma análise de risco dos clientes", "credito"),
        
        # Perguntas ambíguas (teste do roteamento automático)
        ("Qual a performance geral dos produtos financeiros?", "auto"),
    ]
    
    for pergunta, tipo in perguntas_teste:
        print("\n" + "=" * 80)
        question = supervisor.consultar_especialista(pergunta, tipo)
        print("=" * 80)
        #
        # input("Pressione Enter para continuar...")
    return question

# ==========================================
# 9. FUNÇÃO PRINCIPAL PARA EXECUÇÃO
# ==========================================

def main():
    """Função principal para executar o sistema"""
    print("🚀 **SISTEMA MULTI-AGENT CASHBACK + CRÉDITO INICIADO**")
    print("🎯 **Especialistas disponíveis: Carla (Cashback) e César (Crédito)**")
    
    # Executar testes
    teste_sistema_expandido()

# Para executar o sistema:
main()


🚀 **SISTEMA MULTI-AGENT CASHBACK + CRÉDITO INICIADO**
🎯 **Especialistas disponíveis: Carla (Cashback) e César (Crédito)**

🎯 **Roteando para:** Carla (Cashback)
🤔 **Pergunta:** Quais regionais têm melhor performance em cashback?
🔄 Processando...
🎁 **Carla (Cashback):** Com base na análise de engajamento em programas de cashback, as regionais com melhor performance são:

1. **SP INTERIOR**
   - Score Médio: 4.23
   - TPV: R$ 25,023.23
   - Vendas: 818
   - Usuários: 688
   - Cashback: R$ 1,864.81

2. **COSTA LESTE**
   - Score Médio: 0.91
   - TPV: R$ 2,217,464.16
   - Vendas: 27,102
   - Usuários: 16,337
   - Cashback: R$ 130,824.94

3. **EQUATORIAL**
   - Score Médio: 0.88
   - TPV: R$ 2,031,985.77
   - Vendas: 27,447
   - Usuários: 15,321
   - Cashback: R$ 159,597.19

4. **SAO PAULO MINAS**
   - Score Médio: 0.82
   - TPV: R$ 2,198,648.53
   - Vendas: 34,090
   - Usuários: 19,646
   - Cashback: R$ 141,347.15

5. **CENTRO SUL**
   - Score Médio: 0.75
   - TPV: R$ 1,806,280.49
   - Ven