# Pandas Workflow com LlamaIndex Workflows

>Este notebook demonstra como criar um sistema de an√°lise de dados usando LlamaIndex, Pandas e Groq para consultas em linguagem natural.


## Sobre a Atualiza√ß√£o do LlamaIndex

O **LlamaIndex** descontinuou o m√≥dulo **QueryPipeline** em favor de uma nova abordagem chamada **Workflows**.
Essa mudan√ßa foi implementada na vers√£o `0.11` do LlamaIndex, com o objetivo de oferecer uma arquitetura mais
flex√≠vel e escal√°vel para a constru√ß√£o de aplica√ß√µes de IA generativa.

### Por que o QueryPipeline foi descontinuado?
O QueryPipeline era uma API declarativa √∫til para orquestrar consultas simples a avan√ßadas sobre os dados.
Por√©m, ele se mostrou limitado para cen√°rios mais din√¢micos. Por isso, os **Workflows** foram introduzidos,
trazendo uma arquitetura orientada a eventos para fluxos de trabalho mais sofisticados.

### O que s√£o Workflows?
Workflows permitem orquestrar etapas personalizadas de forma ass√≠ncrona e condicional, facilitando
integra√ß√µes complexas e manipula√ß√£o de dados em tempo real.

**Documenta√ß√£o oficial:** [docs.llamaindex.ai](https://docs.llamaindex.ai)



#C√≥digo:


##1 Instalar Depend√™ncias:

In [1]:
# Instalar depend√™ncias (-q para instala√ß√£o silenciosa)
!pip install -q jedi>=0.16, llama-index llama-index-llms-openai llama-index-llms-groq llama-index-experimental gradio fpdf

##1.1 Para uso no Colab


In [2]:
import nest_asyncio
nest_asyncio.apply()

##2 Imports

In [3]:
import pandas as pd
import textwrap
import re
from pydantic import BaseModel, Field, field_validator, ConfigDict, ValidationError
from llama_index.core import Settings
from llama_index.llms.groq import Groq
from llama_index.experimental.query_engine import PandasQueryEngine
from llama_index.core.workflow import Workflow, Event, StartEvent as BaseStartEvent, StopEvent, step
from llama_index.core.prompts import PromptTemplate
from google.colab import userdata
from typing import Any, List, Tuple, Optional
import asyncio
import gradio as gr
from fpdf import FPDF
from datetime import datetime

##3 Instru√ß√µes e Prompts

(Importante para validar a sa√≠da, pode ser usado como debug ou  )

In [4]:
# ===== INSTRU√á√ïES PARA CONVERS√ÉO DE CONSULTAS =====
instruction_str = (
    "1. Converta a consulta para c√≥digo Python execut√°vel usando Pandas.\n"
    "2. A linha final do c√≥digo deve ser uma express√£o Python que possa ser chamada com a fun√ß√£o `eval()`.\n"
    "3. O c√≥digo deve representar uma solu√ß√£o para a consulta.\n"
    "4. IMPRIMA APENAS A EXPRESS√ÉO FINAL.\n"
    "5. N√£o coloque a express√£o entre aspas.\n"
    "6. Evite atribui√ß√µes (=) na linha final - prefira express√µes que retornem valores.\n"
    "7. Para opera√ß√µes de m√∫ltiplas linhas, termine com uma express√£o que retorne o resultado.\n"
    "8. Exemplos v√°lidos:\n"
    "   - df.groupby('coluna')['valor'].sum()\n"
    "   - df['coluna'].value_counts().head(5)\n"
    "   - df.describe()\n"
    "9. Evite c√≥digos como 'df['coluna'] = valor' - prefira consultas que retornem dados.\n"
)

# ===== PROMPTS =====
pandas_prompt_str = (
    "Voc√™ est√° trabalhando com um dataframe do pandas em Python chamado `df`.\n"
    "{colunas_detalhes}\n\n"
    "Este √© o resultado de `print(df.head())`:\n"
    "{df_str}\n\n"
    "Siga estas instru√ß√µes:\n"
    "{instruction_str}\n"
    "Consulta: {query_str}\n\n"
    "Express√£o:"
)

RESPONSE_SYNTHESIS_PROMPT_STR = (
   "Dada uma pergunta de entrada, atue como analista de dados e elabore uma resposta a partir dos resultados da consulta.\n"
   "Responda de forma natural, sem introdu√ß√µes como 'A resposta √©:' ou algo semelhante.\n"
   "Consulta: {query_str}\n\n"
   "Instru√ß√µes do Pandas (opcional):\n{pandas_instructions}\n\n"
   "Sa√≠da do Pandas: {pandas_output}\n\n"
   "Resposta: "
   "Ao final, exibir o c√≥digo usado para gerar a resposta, no formato: O c√≥digo utilizado foi {pandas_instructions}"
)

print("‚úÖ Prompts configurados com sucesso!")

‚úÖ Prompts configurados com sucesso!


##4 Configura√ß√£o Pydantic V2

In [16]:
class LLMConfig(BaseModel):
    model: str = Field(..., description="Nome do modelo Groq a ser usado")
    api_key: str = Field(..., description="Chave da API Groq")
    data_url: str = Field(..., description="URL do CSV com os dados")

    @field_validator("data_url")
    @classmethod
    def validar_url(cls, v: str) -> str:
        if not (v.startswith("http://") or v.startswith("https://")):
            raise ValueError("data_url deve come√ßar com http:// ou https://")
        return v

    @field_validator("api_key")
    @classmethod
    def validar_api_key(cls, v: str) -> str:
        if not v or len(v.strip()) == 0:
            raise ValueError("api_key n√£o pode ser vazia")
        return v

print("‚úÖ Configura√ß√£o LLM com Pydantic criada!")


# ===== HIST√ìRICO DE PERGUNTAS/RESPOSTAS =====
class Historico(BaseModel):
    entradas: List[Tuple[str, str]] = []

    def adicionar(self, pergunta: str, resposta: str):
        """Adiciona uma entrada ao hist√≥rico se pergunta e resposta forem v√°lidas."""
        if pergunta and resposta:
            self.entradas.append((pergunta, resposta))

print("‚úÖ Modelo de hist√≥rico com Pydantic criado!")

‚úÖ Configura√ß√£o LLM com Pydantic criada!
‚úÖ Modelo de hist√≥rico com Pydantic criado!


##5 Modelos de Eventos

(Rastrear cada passo da intera√ß√£o, como um hist√≥rico organizado)

In [27]:
# --- Modelos de Eventos com Pydantic ---

class CodeEvent(Event):
    pandas_prompt: str
    query: str
    df: pd.DataFrame
    model_config = ConfigDict(arbitrary_types_allowed=True)

class OutputEvent(Event):
    pandas_code: str
    pandas_output: object = None
    query: str
    pandas_prompt: str
    df: pd.DataFrame
    model_config = ConfigDict(arbitrary_types_allowed=True)

class ExecutedEvent(Event):
    pandas_code: str
    pandas_output: object = None
    query: str
    pandas_prompt: str
    df: pd.DataFrame
    model_config = ConfigDict(arbitrary_types_allowed=True)

print("‚úÖ Eventos com DataFrame propagado corrigidos!")

‚úÖ Eventos com DataFrame propagado corrigidos!


##6 Fun√ß√µes Auxiliares

In [29]:
def carregar_arquivo(caminho_arquivo: str, df_estado: pd.DataFrame = None):
    """
    Carrega um CSV do caminho fornecido. Se caminho_arquivo for None, mant√©m df_estado.
    Retorna mensagem de status e DataFrame atualizado.
    """
    if caminho_arquivo is None or caminho_arquivo == "":
        return "Nenhum arquivo enviado. Usando dados atuais.", df_estado
    try:
        df_novo = pd.read_csv(caminho_arquivo)
        return "Arquivo carregado com sucesso!", df_novo
    except Exception as e:
        return f"Erro ao carregar arquivo: {str(e)}", df_estado

def formatar_texto(response: str, largura: int = 100, imprimir: bool = True):
    texto_formatado = textwrap.fill(response, width=largura)
    if imprimir:
        print(texto_formatado)
    return texto_formatado

def descricao_colunas(df: pd.DataFrame) -> str:
    descricao = "\n".join([f"`{col}`: {str(df[col].dtype)}" for col in df.columns])
    return "Colunas do DataFrame:\n" + descricao

def limpar_codigo_pandas(codigo: str) -> str:
    """Limpa e valida o c√≥digo Pandas gerado pela LLM"""
    codigo = re.sub(r'```(?:python)?\n?', '', codigo)
    linhas = codigo.split('\n')
    codigo_limpo = []

    for linha in linhas:
        linha = linha.strip()
        if (linha and
            not linha.startswith('#') and
            not linha.startswith('//') and
            not linha.lower().startswith('resposta:') and
            not linha.lower().startswith('resultado:') and
            not linha.lower().startswith('c√≥digo:')):
            codigo_limpo.append(linha)

    codigo_final = '\n'.join(codigo_limpo).strip()

    # Se h√° m√∫ltiplas linhas, pega a √∫ltima linha como express√£o final
    if '\n' in codigo_final:
        linhas_codigo = [l.strip() for l in codigo_final.split('\n') if l.strip()]
        # Pega a √∫ltima linha que seja uma express√£o (n√£o atribui√ß√£o)
        for linha in reversed(linhas_codigo):
            if not ('=' in linha and not linha.startswith('df[')):
                codigo_final = linha
                break

    return codigo_final

print("‚úÖ Fun√ß√µes auxiliares configuradas!")

‚úÖ Fun√ß√µes auxiliares configuradas!


##7 Configura√ß√£o da API e Dados

In [30]:
# Configure sua chave da API Groq nos Secrets do Colab
# V√° em:  (√≠cone da chave) -> Add new secret
# Name: Groq_API
# Value: sua_chave_aqui

try:
    key = userdata.get("Groq_API")
    print("‚úÖ Chave API carregada com sucesso!")
except Exception as e:
    print("‚ùå Erro ao carregar chave API:", e)
    print("Configure a chave 'Groq_API' nos Secrets do Colab")

# ===== CONFIGURA√á√ÉO E DADOS =====
config = LLMConfig(
    model="meta-llama/llama-4-scout-17b-16e-instruct",
    api_key=key,
    data_url="https://raw.githubusercontent.com/YuriArduino/Estudos_Artificial_Intelligence/refs/heads/Dados/vendas.csv"
)

df = pd.read_csv(config.data_url)
Settings.llm = Groq(model=config.model, api_key=config.api_key)

print(" Estrutura do DataFrame:")
print(df.head())
print(f"\n Colunas dispon√≠veis:")
print(df.columns.tolist())
print(f"\n Info do DataFrame:")
print(df.info())
print(f"\n‚úÖ Configura√ß√£o completa! Dataset: {df.shape[0]} linhas, {df.shape[1]} colunas")

‚úÖ Chave API carregada com sucesso!
 Estrutura do DataFrame:
     ID_compra filial       cidade tipo_cliente     genero       tipo_produto  \
0  750-67-8428      A  Santo Andr√©       Membro   Feminino     Sa√∫de e Beleza   
1  226-31-3081      C  S√£o Caetano       Normal   Feminino        Eletr√¥nicos   
2  631-41-3108      A  Santo Andr√©       Normal  Masculino               Casa   
3  123-19-1176      A  Santo Andr√©       Membro  Masculino     Sa√∫de e Beleza   
4  373-73-7910      A  Santo Andr√©       Normal  Masculino  Esportes e Viagem   

   preco_unitario  quantidade  imposto_5%     total        data      hora  \
0           74.69           7     26.1415  548.9715  2024-01-05  13:08:00   
1           15.28           5      3.8200   80.2200  2024-03-08  10:29:00   
2           46.33           7     16.2155  340.5255  2024-03-03  13:23:00   
3           58.22           8     23.2880  489.0480  2024-01-27  20:33:00   
4           86.31           7     30.2085  634.3785  2024-

##8 Classe Workflow Principal

In [31]:
# --- Workflow Compat√≠vel com Diferentes Vers√µes ---
from llama_index.core.workflow import Workflow, step, StartEvent, StopEvent
import pandas as pd

class PandasWorkflow(Workflow):

    @step(pass_context=True)  # Adiciona pass_context para compatibilidade
    async def iniciar_processamento(self, ctx, ev: StartEvent) -> CodeEvent:
        """
        Step que GARANTE receber StartEvent
        """
        print(f" StartEvent recebido no workflow!")
        print(f"üìù Tipo do evento: {type(ev)}")
        print(f"üìã Conte√∫do: {dir(ev)}")

        # M√∫ltiplas formas de extrair dados para m√°xima compatibilidade
        query = None
        df_local = None

        # M√©todo 1: Atributos diretos
        if hasattr(ev, 'query'):
            query = ev.query
            df_local = ev.df
            print("‚úÖ Dados extra√≠dos via atributos diretos")

        # M√©todo 2: get() se dispon√≠vel
        elif hasattr(ev, 'get'):
            query = ev.get('query')
            df_local = ev.get('df')
            print("‚úÖ Dados extra√≠dos via get()")

        # M√©todo 3: Dicion√°rio
        elif hasattr(ev, '__getitem__'):
            try:
                query = ev['query']
                df_local = ev['df']
                print("‚úÖ Dados extra√≠dos via √≠ndice")
            except:
                pass

        # M√©todo 4: Contexto do workflow
        if query is None and hasattr(ctx, 'data'):
            query = ctx.data.get('query')
            df_local = ctx.data.get('df')
            print("‚úÖ Dados extra√≠dos via contexto")

        # Fallback: usar dados globais se nada funcionar
        if query is None:
            print("‚ö†Ô∏è Usando fallback para dados")
            query = getattr(self, '_temp_query', 'Consulta padr√£o')
            df_local = getattr(self, '_temp_df', pd.DataFrame())

        print(f"üìä Query final: {query}")
        print(f"üìä DataFrame shape: {df_local.shape if df_local is not None else 'None'}")

        # Processa o prompt
        colunas_info = descricao_colunas(df_local)
        prompt_text = pandas_prompt_str.format(
            colunas_detalhes=colunas_info,
            df_str=df_local.head(5),
            instruction_str=instruction_str,
            query_str=query
        )

        return CodeEvent(
            pandas_prompt=prompt_text,
            query=query,
            df=df_local
        )

    @step
    async def gerar_codigo(self, ev: CodeEvent) -> OutputEvent:
        """Gera c√≥digo pandas"""
        print(f"üîß Gerando c√≥digo para: {ev.query}")

        response = await Settings.llm.acomplete(ev.pandas_prompt)
        codigo_bruto = str(response).strip()
        codigo_limpo = limpar_codigo_pandas(codigo_bruto)
        print(f"‚úÖ C√≥digo: {codigo_limpo}")

        return OutputEvent(
            pandas_code=codigo_limpo,
            pandas_output=None,
            query=ev.query,
            pandas_prompt=ev.pandas_prompt,
            df=ev.df
        )

    @step
    async def executar_codigo(self, ev: OutputEvent) -> ExecutedEvent:
        """Executa o c√≥digo"""
        print(f"‚ñ∂Ô∏è Executando c√≥digo: {ev.pandas_code}")

        try:
            contexto = {"df": ev.df, "pd": pd, "__builtins__": __builtins__}
            resultado = eval(ev.pandas_code, contexto)
            print(f"‚úÖ Resultado: {resultado}")
        except Exception as e:
            resultado = f"Erro: {str(e)}"
            print(f"‚ùå {resultado}")

        return ExecutedEvent(
            pandas_code=ev.pandas_code,
            pandas_output=resultado,
            query=ev.query,
            pandas_prompt=ev.pandas_prompt,
            df=ev.df
        )

    @step
    async def finalizar(self, ev: ExecutedEvent) -> StopEvent:
        """Finaliza com resposta"""
        print(f" Finalizando processamento")

        if isinstance(ev.pandas_output, str) and "Erro" in ev.pandas_output:
            resposta_final = f"N√£o foi poss√≠vel processar: {ev.pandas_output}"
        else:
            prompt_text = RESPONSE_SYNTHESIS_PROMPT_STR.format(
                query_str=ev.query,
                pandas_instructions=ev.pandas_code,
                pandas_output=ev.pandas_output
            )
            resposta = await Settings.llm.acomplete(prompt_text)
            resposta_final = str(resposta).strip()

        return StopEvent(result={
            "resposta_final": resposta_final,
            "pandas_code": ev.pandas_code,
            "pandas_output": ev.pandas_output,
            "query": ev.query
        })

print("‚úÖ Workflow robusto definido!")

‚úÖ Workflow robusto definido!


##9 Fun√ß√£o de Execu√ß√£o

In [32]:
async def executar_consulta(query: str, df_local: pd.DataFrame, mostrar_detalhes: bool = True):
    """
    Vers√£o robusta que funciona com diferentes configura√ß√µes
    """
    try:
        print(f" Iniciando processamento: {query}")

        # Tentativa 1: Workflow padr√£o
        try:
            wf = PandasWorkflow()

            # Armazena dados temporariamente no workflow para fallback
            wf._temp_query = query
            wf._temp_df = df_local

            # Tenta diferentes formas de criar StartEvent
            try:
                # M√©todo 1: StartEvent com atributos
                start_event = StartEvent()
                start_event.query = query
                start_event.df = df_local
                result = await wf.run(start_event)
            except:
                # M√©todo 2: run com par√¢metros diretos
                result = await wf.run(query=query, df=df_local)

            print(f"‚úÖ Workflow executado com sucesso!")

            if hasattr(result, 'result'):
                dados = result.result

                if mostrar_detalhes:
                    print("\n === RESULTADO ===")
                    print(f"Query: {dados.get('query')}")
                    print(f"C√≥digo: {dados.get('pandas_code')}")
                    print(f"Output: {dados.get('pandas_output')}")
                    print(f"Resposta: {dados.get('resposta_final')}")

                return type('WorkflowResult', (), dados)()

        except Exception as e:
            print(f"‚ö†Ô∏è Workflow falhou: {e}")
            raise

    except Exception as e:
        print(f"‚ùå Todas as tentativas falharam: {e}")
        print("üîÑ Tentando processamento direto...")

        # Fallback: processamento direto sem workflow
        return await processar_consulta_direta(query, df_local)

# Fun√ß√£o de processamento direto (fallback)
async def processar_consulta_direta(query: str, df_local: pd.DataFrame):
    """Processamento sem workflow como fallback"""
    try:
        print(" Processamento direto iniciado...")

        # Gerar c√≥digo
        colunas_info = descricao_colunas(df_local)
        prompt_text = pandas_prompt_str.format(
            colunas_detalhes=colunas_info,
            df_str=df_local.head(5),
            instruction_str=instruction_str,
            query_str=query
        )

        response = await Settings.llm.acomplete(prompt_text)
        codigo_limpo = limpar_codigo_pandas(str(response).strip())
        print(f"‚úÖ C√≥digo: {codigo_limpo}")

        # Executar c√≥digo
        try:
            contexto = {"df": df_local, "pd": pd, "__builtins__": __builtins__}
            resultado = eval(codigo_limpo, contexto)
            print(f"‚úÖ Resultado: {resultado}")
        except Exception as e:
            resultado = f"Erro na execu√ß√£o: {str(e)}"

        # Sintetizar resposta
        if isinstance(resultado, str) and "Erro" in resultado:
            resposta_final = f"N√£o foi poss√≠vel processar: {resultado}"
        else:
            prompt_synthesis = RESPONSE_SYNTHESIS_PROMPT_STR.format(
                query_str=query,
                pandas_instructions=codigo_limpo,
                pandas_output=resultado
            )
            resposta = await Settings.llm.acomplete(prompt_synthesis)
            resposta_final = str(resposta).strip()

        return type('DirectResult', (), {
            'resposta_final': resposta_final,
            'pandas_code': codigo_limpo,
            'pandas_output': resultado,
            'query': query
        })()

    except Exception as e:
        return type('ErrorResult', (), {
            'resposta_final': f"‚ùå Erro no processamento: {str(e)}",
            'pandas_code': '',
            'pandas_output': None,
            'query': query
        })()

print("‚úÖ Fun√ß√µes robustas definidas!")

async def executar_multiplas_consultas(consultas: list, df_local: pd.DataFrame = None):
    """
    Executa v√°rias consultas em sequ√™ncia usando um DataFrame opcional.
    """
    resultados = []

    for i, consulta in enumerate(consultas, 1):
        print(f"\n{'='*60}")
        print(f"CONSULTA {i}/{len(consultas)}")
        print(f"{'='*60}")

        resultado = await executar_consulta(consulta, df_local=df_local)
        resultados.append(resultado)

        print("\n")  # Espa√ßamento entre consultas

    return resultados

print("‚úÖ Fun√ß√µes de execu√ß√£o adaptadas para DataFrame din√¢mico!")


‚úÖ Fun√ß√µes robustas definidas!
‚úÖ Fun√ß√µes de execu√ß√£o adaptadas para DataFrame din√¢mico!


9.2 Fun√ß√µes auxiliares Gradio

In [33]:
# --- Fun√ß√£o para carregar CSV ---
def carregar_dados(file, df_estado):
    if file is None:
        return "‚ùå Nenhum arquivo selecionado", df_estado
    try:
        df_local = pd.read_csv(file)
        return f"‚úÖ Arquivo carregado com sucesso! {df_local.shape[0]} linhas, {df_local.shape[1]} colunas.", df_local
    except Exception as e:
        return f"‚ùå Erro ao carregar arquivo: {str(e)}", df_estado


# --- Fun√ß√£o para executar consulta com workflow ---
async def executar_consulta_async(pergunta, df_local):
    """
    Fun√ß√£o ass√≠ncrona simplificada para o Gradio
    """
    try:
        resultado = await executar_consulta(pergunta, df_local, mostrar_detalhes=False)

        if resultado is not None:
            return resultado
        else:
            return type('MockResult', (), {
                'resposta_final': "‚ùå Erro: Workflow n√£o executou corretamente",
                'pandas_code': '',
                'pandas_output': None,
                'query': pergunta
            })()

    except Exception as e:
        print(f"‚ùå Erro na fun√ß√£o async: {str(e)}")
        import traceback
        traceback.print_exc()
        return type('MockResult', (), {
            'resposta_final': f"‚ùå Erro: {str(e)}",
            'pandas_code': '',
            'pandas_output': None,
            'query': pergunta
        })()

    except Exception as e:
        print(f"‚ùå Erro no workflow: {str(e)}")
        # Retorna um objeto mock em caso de erro
        return type('MockResult', (), {
            'resposta_final': f"‚ùå Erro ao processar consulta: {str(e)}",
            'pandas_code': '',
            'pandas_output': None,
            'query': pergunta
        })()


# --- Fun√ß√£o para processar perguntas (vers√£o s√≠ncrona para Gradio) ---
def processar_pergunta(pergunta, df_local, historico: Historico):
    if df_local is None:
        return "‚ùå Nenhum arquivo CSV carregado.", historico

    if not pergunta or not pergunta.strip():
        return "‚ùå Digite uma pergunta v√°lida.", historico

    try:
        # Executa a fun√ß√£o ass√≠ncrona do workflow
        resultado = asyncio.run(executar_consulta_async(pergunta, df_local))
        resposta = resultado.resposta_final if hasattr(resultado, 'resposta_final') else "‚ùå Erro ao processar a consulta."

        # Atualiza o hist√≥rico usando Pydantic
        historico.adicionar(pergunta, resposta)

        return resposta, historico

    except Exception as e:
        erro_msg = f"‚ùå Erro ao processar pergunta: {str(e)}"
        historico.adicionar(pergunta, erro_msg)
        return erro_msg, historico


# --- Fun√ß√£o para gerar PDF ---
def gerar_pdf(historico: Historico):
    if not historico.entradas:
        return "‚ùå Nenhum dado para adicionar ao PDF"

    try:
        timestamp = datetime.now().strftime("%Y%m%d_%H%M%S")
        caminho_pdf = f"relatorio_pandas_{timestamp}.pdf"

        pdf = FPDF()
        pdf.add_page()
        pdf.set_auto_page_break(auto=True, margin=15)

        # T√≠tulo do relat√≥rio
        pdf.set_font("Arial", "B", 16)
        pdf.cell(0, 10, "Relat√≥rio de Consultas Pandas", ln=True, align="C")
        pdf.ln(10)

        # Adiciona cada pergunta e resposta
        for i, (pergunta, resposta) in enumerate(historico.entradas, 1):
            # Pergunta
            pdf.set_font("Arial", "B", 12)
            pdf.multi_cell(0, 8, f"Pergunta {i}: {pergunta}")
            pdf.ln(2)

            # Resposta
            pdf.set_font("Arial", "", 10)
            pdf.multi_cell(0, 6, f"Resposta: {resposta}")
            pdf.ln(8)

        pdf.output(caminho_pdf)
        return f"‚úÖ PDF gerado: {caminho_pdf}"

    except Exception as e:
        return f"‚ùå Erro ao gerar PDF: {str(e)}"


print("‚úÖ Fun√ß√µes auxiliares do Gradio corrigidas!")

‚úÖ Fun√ß√µes auxiliares do Gradio corrigidas!


9.1 Gradio

In [34]:
# --- Interface Gradio Corrigida ---
import gradio as gr

# --- Interface Gradio ---
with gr.Blocks(title="Pandas CSV Analyzer", theme=gr.themes.Soft()) as app:
    gr.Markdown("""
    # üêº Consultas em CSV com Pandas via Workflow

    Fa√ßa upload de um arquivo CSV e fa√ßa perguntas sobre os dados em linguagem natural!
    """)

    with gr.Row():
        with gr.Column(scale=2):
            # Upload CSV
            input_arquivo = gr.File(
                file_count="single",
                type="filepath",
                label="üìÅ Upload do arquivo CSV",
                file_types=[".csv"]
            )
            upload_status = gr.Textbox(
                label="üìä Status do Upload",
                interactive=False,
                placeholder="Nenhum arquivo carregado ainda..."
            )

        with gr.Column(scale=1):
            # Informa√ß√µes do dataset
            gr.Markdown("### ‚ÑπÔ∏è Informa√ß√µes do Dataset")
            gr.Markdown("O status do upload aparecer√° ao lado.")

    gr.Markdown("---")

    with gr.Row():
        with gr.Column(scale=3):
            # Entrada de pergunta
            input_pergunta = gr.Textbox(
                label="‚ùì Digite sua pergunta sobre os dados",
                placeholder="Ex: Qual a m√©dia da coluna idade? Quantas linhas tem o dataset?",
                lines=2
            )

        with gr.Column(scale=1):
            # Bot√µes
            botao_enviar = gr.Button("üöÄ Enviar Pergunta", variant="primary", size="lg")
            botao_limpar = gr.Button("üóëÔ∏è Limpar", variant="secondary")

    # Sa√≠da da resposta
    output_resposta = gr.Textbox(
        label="üí¨ Resposta",
        lines=5,
        interactive=False,
        placeholder="A resposta aparecer√° aqui ap√≥s enviar uma pergunta..."
    )

    gr.Markdown("---")

    with gr.Row():
        with gr.Column():
            # Hist√≥rico e PDF
            gr.Markdown("### üìã Hist√≥rico e Relat√≥rios")
            botao_pdf = gr.Button("üìÑ Gerar Relat√≥rio PDF", variant="secondary")
            output_pdf = gr.Textbox(
                label="üìÅ Arquivo PDF",
                interactive=False,
                placeholder="Nenhum PDF gerado ainda..."
            )

    # Estados (invis√≠veis)
    df_estado = gr.State(value=None)
    historico_estado = gr.State(value=Historico())

    # --- Conex√µes dos Eventos ---

    # Upload do arquivo
    input_arquivo.change(
        fn=carregar_dados,
        inputs=[input_arquivo, df_estado],
        outputs=[upload_status, df_estado]
    )

    # Envio da pergunta
    botao_enviar.click(
        fn=processar_pergunta,
        inputs=[input_pergunta, df_estado, historico_estado],
        outputs=[output_resposta, historico_estado]
    )

    # Limpar campo de pergunta
    botao_limpar.click(
        fn=lambda: "",
        outputs=[input_pergunta]
    )

    # Gerar PDF
    botao_pdf.click(
        fn=gerar_pdf,
        inputs=[historico_estado],
        outputs=[output_pdf]
    )

    # Enter para enviar
    input_pergunta.submit(
        fn=processar_pergunta,
        inputs=[input_pergunta, df_estado, historico_estado],
        outputs=[output_resposta, historico_estado]
    )

print("‚úÖ Interface Gradio configurada e pronta!")

# Lan√ßa a interface
if __name__ == "__main__":
    app.launch(
        debug=True,
        share=False,  # Mude para True se quiser compartilhar publicamente
        server_name="0.0.0.0",  # Para funcionar no Colab
        server_port=7860
    )

‚úÖ Interface Gradio configurada e pronta!
Colab notebook detected. This cell will run indefinitely so that you can see errors and logs. To turn off, set debug=False in launch().
Note: opening Chrome Inspector may crash demo inside Colab notebooks.
* To create a public link, set `share=True` in `launch()`.


<IPython.core.display.Javascript object>

 Iniciando processamento: Qual √© a quantidade de registros no arquivo?
‚ö†Ô∏è Workflow falhou: The following services are not available: ctx
‚ùå Todas as tentativas falharam: The following services are not available: ctx
üîÑ Tentando processamento direto...
 Processamento direto iniciado...
‚úÖ C√≥digo: df.shape[0]
‚úÖ Resultado: 1000
 Iniciando processamento: Qual √© a quantidade de registros no arquivo?
‚ö†Ô∏è Workflow falhou: The following services are not available: ctx
‚ùå Todas as tentativas falharam: The following services are not available: ctx
üîÑ Tentando processamento direto...
 Processamento direto iniciado...
‚úÖ C√≥digo: df.shape[0]
‚úÖ Resultado: 1000
Keyboard interruption in main thread... closing server.


##10 Teste R√°pido

In [13]:
# Teste r√°pido para verificar se tudo est√° funcionando
query_teste = "Qual √© a avalia√ß√£o m√©dia de cada filial?"
result = await executar_consulta(query_teste)

if result:
    print("\n Sistema funcionando perfeitamente!")
else:
    print("\n Houve algum problema - verifique a configura√ß√£o da API")

TypeError: executar_consulta() missing 1 required positional argument: 'df_local'

##11 Exemplos de Uso Individual

In [None]:
# Execute uma consulta por vez para testar

# Exemplo 1
query = "Quais s√£o os 5 produtos mais vendidos?"
result = await executar_consulta(query)

In [None]:
# Exemplo 2
query = "Qual o total de vendas por regi√£o?"
result = await executar_consulta(query)

In [None]:
# Exemplo 3
query = "Qual produto tem a maior margem de lucro?"
result = await executar_consulta(query)

In [None]:
# Exemplo 4
query = "Quantas vendas foram feitas em cada m√™s?"
result = await executar_consulta(query)

In [None]:
query = "Qual o gen√™ro que mais consome e o segmento do produto?"
result = await executar_consulta(query)

##12 Bateria de Testes

In [None]:
# Executar m√∫ltiplas consultas de uma vez
consultas_exemplo = [
    "Qual √© a avalia√ß√£o m√©dia de cada filial?",
    "Quais s√£o os 5 produtos mais vendidos?",
    "Qual o total de vendas por regi√£o?",
    "Qual produto tem a maior margem de lucro?",
    "Quantas vendas foram feitas em cada m√™s?",
    "Qual √© a receita total por categoria de produto?",
    "Qual filial teve melhor desempenho?",
    "Mostre a distribui√ß√£o de pre√ßos dos produtos"
]

print(" Executando bateria de testes...")
resultados = await executar_multiplas_consultas(consultas_exemplo)

print(f"\n‚úÖ Conclu√≠do! {len([r for r in resultados if r])} consultas processadas com sucesso.")

##13 Modo Interativo

In [None]:
# Modo interativo - digite suas pr√≥prias consultas
print(" MODO INTERATIVO")
print("Digite suas consultas (digite 'sair' para terminar)")
print("-" * 50)

while True:
    try:
        query = input("\n Sua consulta: ").strip()

        if query.lower() in ['sair', 'exit', 'quit', '']:
            print(" At√© logo!")
            break

        await executar_consulta(query, mostrar_detalhes=False)

    except KeyboardInterrupt:
        print("\n Interrompido pelo usu√°rio!")
        break
    except Exception as e:
        print(f" Erro: {e}")

##14 An√°lise Manual dos Dados


In [None]:
# An√°lise dos dados originais para compara√ß√£o
print(" AN√ÅLISE MANUAL DOS DADOS (para compara√ß√£o)")
print("="*50)

print(f"Estat√≠sticas b√°sicas:")
print(df.describe())

print(f"\nContagem por categoria:")
for col in df.select_dtypes(include=['object']).columns:
    print(f"\n{col}:")
    print(df[col].value_counts().head())

print(f"\nValores nulos:")
print(df.isnull().sum())

#Dicas e Informa√ß√µes

In [None]:
print("üí° DICAS PARA USO:")
print("="*50)
print("1. Para consultas complexas, seja espec√≠fico")
print("2. Use nomes exatos das colunas mostradas na an√°lise")
print("3. Experimente diferentes tipos de an√°lise:")
print("   - Agrupamentos: 'm√©dia por categoria'")
print("   - Rankings: 'top 10 produtos'")
print("   - Filtros: 'vendas acima de X valor'")
print("   - S√©ries temporais: 'vendas por m√™s'")
print("4. O sistema mostra o c√≥digo Pandas usado!")

print(f"\n INFORMA√á√ïES DO DATASET:")
print(f"Suas colunas: {list(df.columns)}")
print(f"Quantidade de dados: {df.shape[0]} linhas x {df.shape[1]} colunas")
print(f"Tipos de dados: {df.dtypes.value_counts().to_dict()}")

print(f"\n SUGEST√ïES DE CONSULTAS:")
example_queries = [
    "Qual a correla√ß√£o entre pre√ßo e quantidade vendida?",
    "Mostre a distribui√ß√£o de vendas por dia da semana",
    "Qual filial tem o melhor desempenho?",
    "Compare as vendas do primeiro e √∫ltimo trimestre",
    "Identifique produtos com baixo estoque",
    "Qual √© o produto mais caro por categoria?",
    "Mostre as vendas m√©dias por vendedor",
    "Qual regi√£o tem menor varia√ß√£o de pre√ßos?"
]

for i, query in enumerate(example_queries, 1):
    print(f"{i}. {query}")

print(f"\n MODELO UTILIZADO: {config.model}")
print(f" URL DOS DADOS: {config.data_url}")

#Notas de Uso:

*   Configura√ß√£o da API: Configure sua chave Groq nos Secrets do Colab
*   Execu√ß√£o sequencial: Execute as c√©lulas na ordem
*   Personaliza√ß√£o: Modifique a URL dos dados na C√©lula 6
*   Debug: Os logs mostram o c√≥digo Pandas gerado
*   Interativo: Use a C√©lula 12 para consultas livres

##Estrutura final:

*   Instala√ß√£o autom√°tica de depend√™ncias
* Configura√ß√£o completa da API
* Explora√ß√£o autom√°tica dos dados
* Sistema de workflow robusto
* Exemplos prontos para uso
* Modo interativo
* Sistema de debug integrado


>Desenvolvido por Yuri Arduino Bernardineli Alves | GitHub: [YuriArduino](https://github.com/YuriArduino) | E-mail: yuriarduino@gmail.com