<a href="https://colab.research.google.com/github/kimbanica/Agente-Aut-nomo-de-An-lise-Fiscal-v1.0-/blob/main/Agente_Aut%C3%B4nomo_de_An%C3%A1lise_Fiscal_(v1_0).ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [None]:
# C√âLULA 1: Instala√ß√µes
print("Instalando depend√™ncias (OpenAI, Google/Gemini, Gradio, Langchain)...")
!pip install gradio pandas langchain langchain-experimental langchain-community llama-cpp-python openai tabulate python-multipart langchain-google-genai

In [None]:
# C√âLULA 2: Leitura Segura das Chaves de API
import os
from google.colab import userdata

# Tenta ler as chaves do Cofre de Senhas
try:
    os.environ["OPENAI_API_KEY"] = userdata.get('OPENAI_API_KEY')
    os.environ["GOOGLE_API_KEY"] = userdata.get('GOOGLE_API_KEY')

    if not os.environ["OPENAI_API_KEY"]:
        print("ATEN√á√ÉO: Chave 'OPENAI_API_KEY' n√£o encontrada no Cofre. Verifique o nome e se o acesso ao notebook est√° ligado.")

    if not os.environ["GOOGLE_API_KEY"]:
        print("ATEN√á√ÉO: Chave 'GOOGLE_API_KEY' n√£o encontrada no Cofre. Verifique o nome e se o acesso ao notebook est√° ligado.")

    print("Chaves de API carregadas do Cofre com sucesso.")

except Exception as e:
    print(f"Erro ao acessar o Cofre de Senhas: {e}")
    print("Por favor, verifique se voc√™ adicionou as chaves 'OPENAI_API_KEY' e 'GOOGLE_API_KEY' no menu üîë 'Secrets' √† esquerda.")

In [None]:

# C√âLULA 3: Cria√ß√£o do Arquivo do Agente (Backend)
# O comando %%writefile DEVE ser a primeira linha desta c√©lula
%%writefile agente_csv.py
import os
import zipfile
import tempfile
import pandas as pd
import traceback

from dotenv import load_dotenv
load_dotenv()

# Importando os LLMs de AMBOS os provedores
from langchain_community.llms import OpenAI
from langchain_google_genai import ChatGoogleGenerativeAI
from langchain_experimental.agents import create_pandas_dataframe_agent

# Lendo as duas chaves do ambiente (que a C√©lula 2 configurou)
openai_api_key = os.getenv("OPENAI_API_KEY")
google_api_key = os.getenv("GOOGLE_API_KEY")

def get_prompt_especializado(ramo_atividade: str) -> str:
    """
    Cria o prompt com regras de neg√≥cio espec√≠ficas.
    """
    prompt_especialista = f"O ramo de atividade da empresa √©: **{ramo_atividade}**.\n"

    if ramo_atividade == "Ind√∫stria":
        prompt_especialista += "REGRAS DE IND√öSTRIA: Preste aten√ß√£o em 'IPI' e 'Substitui√ß√£o Tribut√°ria'.\n"
    elif ramo_atividade == "Agroneg√≥cio":
        prompt_especialista += "REGRAS DE AGRONEG√ìCIO: Monitore CFOPs espec√≠ficos do setor (Venda de produ√ß√£o, Insumos).\n"
    elif ramo_atividade == "Setor Automotivo":
        prompt_especialista += "REGRAS DO SETOR AUTOMOTIVO: Valide notas fiscais de pe√ßas e servi√ßos, confira c√≥digos.\n"
    elif ramo_atividade in ["√ìrg√£os P√∫blicos", "Terceiro Setor"]:
         prompt_especialista += f"REGRAS DE {ramo_atividade.upper()}: A an√°lise de 'Centros de Custo' √© priorit√°ria.\n"
    else:
        prompt_especialista += "Nenhuma regra espec√≠fica de ramo. Siga as instru√ß√µes gerais.\n"

    return prompt_especialista


def responder(arquivo_zip_path: str, pergunta_usuario: str, ramo_atividade: str) -> str:
    """
    Fun√ß√£o principal do agente, agora com l√≥gica de Fallback:
    1. Tenta OpenAI
    2. Se falhar, tenta Gemini
    """

    # --- 1. Prepara√ß√£o (Leitura do CSV) ---
    try:
        temp_dir = tempfile.mkdtemp()
        with zipfile.ZipFile(arquivo_zip_path, 'r') as zip_ref:
            zip_ref.extractall(temp_dir)

        csv_files = [os.path.join(temp_dir, f) for f in os.listdir(temp_dir) if f.endswith('.csv')]
        if not csv_files:
            return "Nenhum arquivo CSV encontrado no ZIP."

        caminho_csv = csv_files[0]

        # --- L√ìGICA DE LEITURA ROBUSTA (MODIFICADO) ---
        try:
            # 1. Tenta o padr√£o (v√≠rgula, engine C, utf-8)
            df = pd.read_csv(caminho_csv, encoding='utf-8')
        except (pd.errors.ParserError, UnicodeDecodeError) as e:
            print(f"Falha na leitura padr√£o (v√≠rgula): {e}. Tentando com ponto-e-v√≠rgula...")
            try:
                # 2. Tenta com ponto-e-v√≠rgula (comum no Brasil, latin1)
                df = pd.read_csv(caminho_csv, sep=';', encoding='latin1')
            except pd.errors.ParserError as e2:
                print(f"Falha com ponto-e-v√≠rgula: {e2}. Tentando pular linhas ruins...")
                try:
                    # 3. Tenta pular linhas ruins (engine python)
                    # on_bad_lines='skip' √© a chave aqui
                    df = pd.read_csv(caminho_csv, encoding='latin1', engine='python', on_bad_lines='skip')
                    print(f"Aviso: O CSV foi lido pulando linhas mal formatadas.")
                except Exception as e_final:
                    # 4. Falha total
                    print(f"Erro final de leitura: {e_final}")
                    return f"Erro Cr√≠tico ao ler o CSV: O arquivo parece estar corrompido ou em formato desconhecido. Detalhe: {str(e_final)}"
        # --- FIM DA L√ìGICA DE LEITURA ROBUSTA ---

    except Exception as e:
        # Pega erros do ZIP ou outros erros de arquivo
        return f"Erro ao extrair o ZIP ou encontrar o CSV: {str(e)}"

    # --- 2. Constru√ß√£o do C√©rebro (Prompt) ---
    prefixo_base = "Voc√™ √© um assistente de dados avan√ßado que fala apenas portugu√™s. Voc√™ √© especialista em analisar DataFrames do Pandas."
    prompt_especialista = get_prompt_especializado(ramo_atividade)
    prefixo_final = prefixo_base + "\n" + prompt_especialista

    pergunta_para_agente = (
        "Tarefas:\n"
        "1. (TAREFA PRINCIPAL): Se as colunas 'Tipo_Documento' e 'Centro_Custo' n√£o existirem, crie-as e classifique CADA LINHA por tipo (compra, venda, servi√ßo) e por centros de custos.\n"
        "2. (TAREFA DO USU√ÅRIO): Ap√≥s a classifica√ß√£o, responda a esta pergunta: "
        f"'{pergunta_usuario}'\n"
        "Responda ao usu√°rio em portugu√™s."
    )

    # --- 3. L√≥gica de Execu√ß√£o (OpenAI com Fallback para Gemini) ---

    # TENTATIVA 1: OpenAI (O "Engenheiro" preferido)
    try:
        if not openai_api_key:
            raise ValueError("OPENAI_API_KEY n√£o foi carregada do Cofre de Senhas.")

        print("Iniciando Tentativa 1 (OpenAI)...")
        llm_openai = OpenAI(temperature=0, openai_api_key=openai_api_key)

        agente_openai = create_pandas_dataframe_agent(
            llm_openai, df, prefix=prefixo_final, verbose=True,
            allow_dangerous_code=True, agent_executor_kwargs={"handle_parsing_errors": True}
        )

        resposta = agente_openai.run(pergunta_para_agente)
        print("Resposta obtida com OpenAI.")
        return f"**(Respondido por: OpenAI)**\n\n" + str(resposta)

    except Exception as e_openai:
        print(f"Erro com OpenAI: {str(e_openai)}")
        print("Iniciando Tentativa 2 (Fallback com Gemini)...")

        # TENTATIVA 2: Gemini (O "Estrategista" de backup)
        try:
            if not google_api_key:
                raise ValueError("GOOGLE_API_KEY n√£o foi carregada do Cofre de Senhas para o fallback.")

            llm_gemini = ChatGoogleGenerativeAI(
                model="gemini-1.5-pro-latest", # Recomendo 1.5 Pro
                temperature=0,
                google_api_key=google_api_key
            )

            agente_gemini = create_pandas_dataframe_agent(
                llm_gemini, df, prefix=prefixo_final, verbose=True,
                allow_dangerous_code=True, agent_executor_kwargs={"handle_parsing_errors": True}
            )

            resposta = agente_gemini.run(pergunta_para_agente)
            print("Resposta obtida com Gemini (Fallback).")
            return f"**(Respondido por: Gemini 1.5 Pro - Fallback)**\n\n" + str(resposta)

        except Exception as e_gemini:
            print(f"Erro com Gemini (Fallback): {str(e_gemini)}")
            return (
                f"**Erro Cr√≠tico: Ambos os agentes falharam.**\n\n"
                f"**Erro OpenAI:** {str(e_openai)}\n\n"
                f"**Erro Gemini (Fallback):** {str(e_gemini)}"
            )

In [None]:
# C√âLULA 4: Importa√ß√£o e Lan√ßamento do Frontend (Gradio)
import gradio as gr
import agente_csv

print("\nDepend√™ncias instaladas e agente_csv.py (com Fallback) criado.")
print("Iniciando a interface Gradio...")

# Fun√ß√£o ponte (sem mudan√ßas)
def executar_agente_interface(arquivo_zip, ramo_atividade, pergunta_usuario):
    if arquivo_zip is None:
        return "Erro: Por favor, fa√ßa o upload de um arquivo .ZIP."
    if not pergunta_usuario:
        return "Erro: Por favor, digite uma pergunta."

    caminho_zip = arquivo_zip.name
    resposta_do_agente = agente_csv.responder(caminho_zip, pergunta_usuario, ramo_atividade)
    return resposta_do_agente

# Ramos de atividade (sem mudan√ßas)
ramos_de_atividade = [
    "Ind√∫stria", "Agroneg√≥cio", "Setor Automotivo", "Servi√ßos",
    "√ìrg√£os P√∫blicos", "Terceiro Setor", "Varejo", "Outro"
]

# Constru√ß√£o da UI (sem mudan√ßas)
with gr.Blocks(theme=gr.themes.Soft()) as demo:
    gr.Markdown("# ü§ñ Agente Aut√¥nomo para An√°lise de Documentos Fiscais")
    gr.Markdown("Fa√ßa o upload do seu arquivo **.ZIP**, selecione o ramo e fa√ßa sua pergunta.")

    with gr.Row():
        with gr.Column(scale=1):
            in_arquivo = gr.File(label="Upload do Arquivo .ZIP", file_types=[".zip"])
            in_ramo = gr.Dropdown(label="Selecione o Ramo de Atividade (Contexto)", choices=ramos_de_atividade, value="Ind√∫stria")
            in_pergunta = gr.Textbox(label="Digite sua pergunta sobre os dados", placeholder="Ex: Qual o valor total das notas fiscais de compra?")
            btn_processar = gr.Button("Perguntar ao Agente", variant="primary")
        with gr.Column(scale=2):
            out_resposta = gr.Markdown(label="Resposta do Agente")

    btn_processar.click(
        fn=executar_agente_interface,
        inputs=[in_arquivo, in_ramo, in_pergunta],
        outputs=[out_resposta]
    )

    gr.Markdown("---")
    gr.Markdown("### O agente tentar√° responder com OpenAI (GPT-4) e usar√° o Gemini 1.5 Pro como fallback.")

# 5. Lan√ßar a interface
demo.launch(share=True, debug=True)