In [1]:
# Instalando depend√™ncias b√°sicas
!pip install pandas streamlit requests python-dotenv

# Instalando bibliotecas para o LLM Open Source (Usaremos Transformers para carregar um modelo)
!pip install transformers accelerate bitsandbytes sentencepiece


Collecting streamlit
  Downloading streamlit-1.51.0-py3-none-any.whl.metadata (9.5 kB)
Collecting pydeck<1,>=0.8.0b4 (from streamlit)
  Downloading pydeck-0.9.1-py2.py3-none-any.whl.metadata (4.1 kB)
Downloading streamlit-1.51.0-py3-none-any.whl (10.2 MB)
[2K   [90m‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ[0m [32m10.2/10.2 MB[0m [31m67.7 MB/s[0m eta [36m0:00:00[0m
[?25hDownloading pydeck-0.9.1-py2.py3-none-any.whl (6.9 MB)
[2K   [90m‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ[0m [32m6.9/6.9 MB[0m [31m44.2 MB/s[0m eta [36m0:00:00[0m
[?25hInstalling collected packages: pydeck, streamlit
Successfully installed pydeck-0.9.1 streamlit-1.51.0
Collecting bitsandbytes
  Downloading bitsandbytes-0.48.2-py3-none-manylinux_2_24_x86_64.whl.metadata (10 kB)
Downloading bitsandbytes-0.48.2-py3-none-manylinux_2_24_x86_64.whl (5

In [8]:
import pandas as pd
import numpy as np
import torch
from transformers import AutoModelForCausalLM, AutoTokenizer
from IPython.display import display, Markdown

# --- Seu c√≥digo de SIMULA√á√ÉO DE DADOS (mantido para garantir a execu√ß√£o) ---

np.random.seed(42)
num_pedidos = 1000
estados = ["SP", "RJ", "MG", "BA", "PE", "RS", "PR", "AM", "GO"]

# C√°lculo de probabilidade
pesos_produtos = np.linspace(0.01, 0.1, 20)
probabilidades_produtos = pesos_produtos / np.sum(pesos_produtos)

data = {
    'orderId': np.arange(1000, 1000 + num_pedidos),
    'preco_total_item': np.round(np.random.uniform(10.0, 500.0, num_pedidos), 2),
    'data_pedido': pd.to_datetime(pd.date_range(start='2024-01-01', periods=num_pedidos, freq='D')),
    'status_pedido': np.random.choice(["Completed", "Pending", "Canceled", "Processing"], num_pedidos, p=[0.75, 0.15, 0.05, 0.05]),
    'nome_cliente': [f"Cliente_{i % 100}" for i in range(num_pedidos)],
    'segmento_cliente': np.random.choice(["Gold", "Silver", "Bronze", "Standard"], num_pedidos, p=[0.15, 0.25, 0.35, 0.25]),
    'cidade': [f"Cidade_{i % 50}" for i in range(num_pedidos)],
    'estado': np.random.choice(estados, num_pedidos),
    'nome_produto': np.random.choice([f"Produto_{i}" for i in range(20)], num_pedidos, p=probabilidades_produtos),
    'quantidade': np.random.randint(1, 6, num_pedidos)
}
df = pd.DataFrame(data)

# Recria√ß√£o das Colunas de An√°lise
def map_region(estado):
    if not estado: return "Desconhecida"
    estado = estado.upper()
    if estado in ["AC", "AP", "AM", "PA", "RO", "RR", "TO"]: return "Norte"
    elif estado in ["AL", "BA", "CE", "MA", "PB", "PE", "PI", "RN", "SE"]: return "Nordeste"
    elif estado in ["DF", "GO", "MT", "MS"]: return "Centro-Oeste"
    elif estado in ["ES", "MG", "RJ", "SP"]: return "Sudeste"
    elif estado in ["PR", "RS", "SC"]: return "Sul"
    else: return "Desconhecida"

df['regiao'] = df['estado'].apply(map_region)
df['mes_ano'] = df['data_pedido'].dt.to_period('M').astype(str)

# --- CRIA√á√ÉO E DEFINI√á√ÉO DO df_kpi ---
receita_total = df['preco_total_item'].sum()
pedidos_unicos = df['orderId'].nunique()
df_kpi = pd.DataFrame([{
    'receita_total': receita_total,
    'pedidos_unicos': pedidos_unicos,
    'ticket_medio': receita_total / pedidos_unicos if pedidos_unicos > 0 else 0
}])
# --------------------------------------------------------------------------------

# ‚ö° TROCA DO MODELO PARA OTIMIZA√á√ÉO DA VELOCIDADE ‚ö°
MODEL_NAME = "microsoft/Phi-3-mini-4k-instruct"

# --- 1. Carregamento e Configura√ß√£o do LLM ---

try:
    # Tenta usar as vari√°veis globais (se j√° carregadas)
    global tokenizer, model
    _ = tokenizer
    _ = model
    print(f"Modelo {MODEL_NAME} j√° estava carregado. Continuando...")

except NameError:
    # Se n√£o estiverem carregadas, carrega o modelo Phi-3
    print(f"Carregando Modelo {MODEL_NAME}. Isso deve ser muito mais r√°pido que o Mistral 7B...")
    try:
        # Usamos torch_dtype=None, confiando no dispositivo autom√°tico para otimizar
        tokenizer = AutoTokenizer.from_pretrained(MODEL_NAME)
        model = AutoModelForCausalLM.from_pretrained(
            MODEL_NAME,
            device_map="auto",
            torch_dtype=torch.float16, # Ajuste para melhor desempenho na T4
            trust_remote_code=True # Necess√°rio para o Phi-3
        )
        print(f"Modelo {MODEL_NAME} carregado com sucesso na GPU! Espere uma infer√™ncia muito mais r√°pida.")
    except Exception as e:
        print(f"Erro ao carregar o modelo {MODEL_NAME}. Verifique se o runtime est√° em GPU. Erro: {e}")
        raise SystemExit(e) # Para a execu√ß√£o se o modelo n√£o carregar

# üöÄ FUN√á√ÉO DE GERA√á√ÉO DE INSIGHTS (Compat√≠vel com Phi-3 e limpeza) üöÄ
def generate_insights(prompt):
    messages = [
        {"role": "user", "content": prompt}
    ]
    # O Phi-3 usa o template de chat do Mistral/Llama
    encodeds = tokenizer.apply_chat_template(messages, return_tensors="pt")
    model_inputs = encodeds.to(model.device)

    generated_ids = model.generate(
        model_inputs,
        max_new_tokens=1000,
        do_sample=True,
        temperature=0.7,
        pad_token_id=tokenizer.eos_token_id
    )

    response = tokenizer.decode(generated_ids[0], skip_special_tokens=False)

    # Limpeza: Procurar pela tag de fechamento da instru√ß√£o [/INST]
    try:
        start_index = response.index('[/INST]') + len('[/INST]')
        clean_response = response[start_index:].strip()
    except ValueError:
        clean_response = response.strip()

    return clean_response

# --- 2. Prepara√ß√£o dos Dados para o Prompt ---

data_summary = f"""
## Resumo do Dataframe de Vendas:
* **Total de Pedidos:** {df_kpi['pedidos_unicos'].iloc[0]}
* **Receita Total:** R$ {df_kpi['receita_total'].iloc[0]:,.2f}
* **Ticket M√©dio Global:** R$ {df_kpi['ticket_medio'].iloc[0]:,.2f}

## Amostra de Dados (df.head()):
{df.head().to_markdown(index=False)}

## Agregados Relevantes:
* **Receita por Status:**
{df.groupby('status_pedido')['preco_total_item'].sum().sort_values(ascending=False).to_markdown()}

* **Receita por Regi√£o (Top 3):**
{df.groupby('regiao')['preco_total_item'].sum().nlargest(3).to_markdown()}

* **Produtos Mais Vendidos (Top 5 em Receita):**
{df.groupby('nome_produto')['preco_total_item'].sum().nlargest(5).to_markdown()}

* **Segmento de Cliente (Receita Total):**
{df.groupby('segmento_cliente')['preco_total_item'].sum().sort_values(ascending=False).to_markdown()}
"""

# --- 3. Prompt S√™nior para Gera√ß√£o de Insights (Otimizado para Portugu√™s e Feedback Acion√°vel) ---
analyst_prompt = f"""
Voc√™ √© um Analista de Dados S√™nior e fluente em Portugu√™s do Brasil.
Sua tarefa √© analisar os dados de vendas fornecidos abaixo e produzir uma an√°lise focada em **Tomada de Decis√£o**.

Instru√ß√µes Cruciais:
1.  **IDIOMA:** A resposta DEVE ser **100% em Portugu√™s do Brasil**.
2.  **FORMATO:** Gere 5 insights essenciais, formatados como uma lista numerada.
3.  **ESTRUTURA:** Cada ponto deve seguir esta estrutura EXATA, utilizando negrito para destaque:
    * **Insight Chave:** [O fato principal e a evid√™ncia num√©rica (R$) extra√≠da dos dados.]
    * **Recomenda√ß√£o Acion√°vel:** [O que a equipe de vendas/marketing deve fazer com base no insight.]

4.  **REGRAS R√çGIDAS DE FORMATA√á√ÉO:**
    * N√ÉO use as palavras 'Analyze', 'Analysis', 'Recommendation' ou 'Recomenda√ß√£o' como cabe√ßalhos.
    * N√ÉO use marcadores de lista internos (como bullet points). Mantenha a resposta concisa.
    * Use o formato monet√°rio (R$) corretamente.

--- DADOS PARA AN√ÅLISE ---
{data_summary}
--- FIM DOS DADOS ---

## üìä An√°lise de 5 Pontos com A√ß√µes Recomendadas:
"""

# --- 4. Execu√ß√£o do Agente ---
print("\n" + "="*50)
print("ü§ñ AGENTE DE INSIGHTS DE IA EM EXECU√á√ÉO...")
print("="*50)

# Chamar a fun√ß√£o de gera√ß√£o de insights
insights = generate_insights(analyst_prompt)

# --- 5. Exibi√ß√£o dos Resultados ---
print("\n" + "#"*50)
display(Markdown("## ‚ú® Insights Gerados pelo Modelo Phi-3 Mini"))
display(Markdown(insights))
print("#"*50)

Modelo microsoft/Phi-3-mini-4k-instruct j√° estava carregado. Continuando...

ü§ñ AGENTE DE INSIGHTS DE IA EM EXECU√á√ÉO...

##################################################


## ‚ú® Insights Gerados pelo Modelo Phi-3 Mini (R√°pido e Otimizado) ‚ú®

1. *Insight Chave:* **Receita Gerada por Status ("Pending" est√° significativamente abaixo do esperado):** R$ 40,694.1 (5.4% da receita total).
   *Recomenda√ß√£o Acion√°vel:* A equipe de vendas deve priorizar a resolu√ß√£o de pedidos "Pending" para aumentar a receita. Isso pode ser alcan√ßado atrav√©s de comunica√ß√£o direta com clientes, fornecimento de informa√ß√µes adicionais, ou at√© mesmo ofertas de descontos para acelera√ß√£o do processo de aprova√ß√£o.

2. *Insight Chave:* **Receita Gerada em Sul e Nordeste est√° quase igual:** R$ 59,192.1 (23.6%) e R$ 49,798.6 (19.9%), respectivamente.
   *Recomenda√ß√£o Acion√°vel:* Para aumentar a receita, a equipe de marketing pode considerar campanhas regionais para cada regi√£o, com foco em promo√ß√µes espec√≠ficas e publicidade localizada. Essas estrat√©gias podem ajudar a diferenciar a experi√™ncia do cliente em cada regi√£o e aumentar as vendas.

3. *Insight Chave:* **Produto_18 √© o produto mais vendido em termos de receita:** R$ 20,473.2 (8.2% da receita total).
   *Recomenda√ß√£o Acion√°vel:* Para ampliar as vendas, a equipe de marketing pode considerar investir mais em promo√ß√µes e publicidade para o Produto_18. Tamb√©m pode ser √∫til oferecer o produto como um incentivo para clientes que completem uma compra de certa quantia.

4. *Insight Chave:* **Segmento "Silver" representa a quase metade da receita total:** R$ 63,241.5 (25.3%).
   *Recomenda√ß√£o Acion√°vel:* Como o segmento "Silver" √© significativamente maior que os outros segmentos em termos de receita, a equipe de marketing pode considerar ofertas personalizadas ou campanhas espec√≠ficas para este segmento de clientes. Essas estrat√©gias podem incluir descontos, promo√ß√µes exclusivas, ou at√© mesmo eventos exclusivos para clientes desse segmento.

5. *Insight Chave:* **Quantidade M√©dia de Itens por Pedido est√° abaixo do esperado:** M√©dia de 2,8 itens por pedido.
   *Recomenda√ß√£o Acion√°vel:* A equipe de vendas ou marketing pode considerar promo√ß√µes que incentivam clientes a adicionar mais itens aos pedidos. Isso pode incluir ofertas de "combo" de produtos, descontos por pedido de determinada quantidade, ou at√© mesmo recomenda√ß√µes personalizadas de produtos relacionados.</s>

##################################################
