+ Est√°vel

In [36]:
import sqlite3
import pandas as pd
import json
import os
import re
from typing import TypedDict, List, Optional, Any
from datetime import datetime

# Bibliotecas de IA e Grafo
from langchain_ollama import ChatOllama
from langgraph.graph import StateGraph, END
from rapidfuzz import process, fuzz

# --- CONFIGURA√á√ÉO ---
DB_PATH = 'db.sqlite3'
LOG_FILE = "historico_conversas_pandas.md"

# --- CLASSE DE DADOS (PANDAS PURO) ---
class ImobiliariaDataEngine:
    def __init__(self):
        # MODO MOCK
        data = {
            'id': [101, 102, 103, 104, 105],
            'titulo': ['Casa Premium', 'Apto Compacto', 'Cobertura Luxo', 'S√≠tio Verde', 'Casa Vila'],
            'descricao': [
                'Linda resid√™ncia com piso de porcelanato, √°rea gourmet e garagem.', 
                'Apartamento simples, ideal para estudantes. Sem vaga.', 
                'Vista total, possui jacuzzi e churrasqueira.', 
                'Muito verde, pomar e piscina.', 
                'Casa antiga reformada.'
            ],
            'bairro': ['Benfica', 'Centro', 'S√£o Mateus', 'Aeroporto', 'Benfica'],
            'especificacao': ['3 quartos', '1 quarto', '4 quartos', '5 quartos', '2 quartos'],
            'preco_aluguel': [2500, 800, 5000, 3000, 1200],
            'preco_condominio': [0, 200, 1000, 0, 0],
            'preco_iptu': [100, 50, 500, 200, 80],
            'aceita_pets': [1, 0, 1, 1, 1]
        }
        self.df = pd.DataFrame(data)
        
        # Engenharia de Atributos
        self.df['custo_total'] = self.df['preco_aluguel'] + self.df['preco_condominio'] + self.df['preco_iptu']
        
        # --- NOVO: Coluna leg√≠vel para a IA ler sobre Pets ---
        self.df['status_pets'] = self.df['aceita_pets'].map({1: 'Aceita Pets', 0: 'N√£o Aceita'})
        
        # Cria coluna de busca textual
        self.df['texto_busca'] = (
            self.df['titulo'] + " " + 
            self.df['descricao'] + " " + 
            self.df['bairro'] + " " + 
            self.df['especificacao']
        ).fillna('').str.lower()
        
        self.bairros_validos = self.df['bairro'].unique().tolist()
        print(f">>> [INIT] Banco carregado com {len(self.df)} im√≥veis.")

    def fuzzy_match_bairro(self, bairro_input):
        if not bairro_input: return None
        match = process.extractOne(bairro_input, self.bairros_validos, scorer=fuzz.WRatio)
        if match and match[1] > 80:
            return match[0]
        return None

# --- DEFINI√á√ÉO DO ESTADO ---
class AgentState(TypedDict):
    input: str                  
    chat_history: List[str]     
    filtros_interpretados: dict 
    df_atual: Any               
    resposta_final: str        

# --- N√ìS DO SISTEMA ---
class SistemaImobiliario:
    def __init__(self):
        self.engine = ImobiliariaDataEngine()
        self.llm_json = ChatOllama(model="gemma2:9b", temperature=0, format="json")
        self.llm_text = ChatOllama(model="gemma2:9b", temperature=0.2)
        
        if not os.path.exists(LOG_FILE):
            with open(LOG_FILE, "w", encoding="utf-8") as f:
                f.write("# Hist√≥rico de Conversas (Engine Pandas)\n\n")

    def _log(self, user, ai, debug):
        timestamp = datetime.now().strftime("%H:%M:%S")
        with open(LOG_FILE, "a", encoding="utf-8") as f:
            f.write(f"## {timestamp}\n**User:** {user}\n\n**AI:** {ai}\n\n> *Debug:* `{debug}`\n\n---\n")

    # 1. N√ì INTERPRETADOR
    def node_interpretador(self, state: AgentState):
        """Traduz linguagem natural para par√¢metros de filtro."""
        print(f"   üß† [Interpretador] Lendo: '{state['input']}'")
        
        prompt = f"""
        Voc√™ √© um parser de inten√ß√£o.
        Analise a frase e extraia um JSON.
        
        INPUT: "{state['input']}"
        CONTEXTO RECENTE: {state['chat_history'][-2:] if state['chat_history'] else 'Nenhum'}
        
        REGRAS:
        1. "keywords": Lista de caracter√≠sticas F√çSICAS (ex: "piscina", "varanda").
           - Converta para SINGULAR (ex: "vagas" -> "vaga").
           - IGNORE palavras gen√©ricas ("im√≥vel", "casa", "apto", "lugar", "op√ß√£o", "quero").
        2. "bairro": Nome do bairro ou null.
        3. "pets": true se mencionar animais/pets, sen√£o null.
        4. "refinamento": true se disser "desses", "da lista", "o mais barato", "entre eles", "esse tem", "quais".
           - Se mudar de bairro/assunto, √© false.
        5. "ordenacao": "menor_preco" (se disser "barato"), "maior_preco" ou null.
        
        JSON OUTPUT APENAS:
        """
        response = self.llm_json.invoke(prompt)
        try:
            filtros = json.loads(response.content)
        except:
            filtros = {}
        return {"filtros_interpretados": filtros}

    # 2. N√ì BUSCADOR
    def node_buscador(self, state: AgentState):
        filtros = state['filtros_interpretados']
        
        # Stop Words (Limpeza extra de seguran√ßa)
        STOP_WORDS = ['imovel', 'im√≥vel', 'casa', 'apartamento', 'apto', 'lugar', 'opcao', 'op√ß√£o', 'quero']
        raw_keywords = filtros.get('keywords', [])
        clean_keywords = [k for k in raw_keywords if k.lower() not in STOP_WORDS]
        filtros['keywords'] = clean_keywords # Atualiza para o log
        
        print(f"   üêº [Buscador Pandas] Aplicando: {filtros}")
        
        # L√≥gica de Mem√≥ria
        usar_memoria = False
        if filtros.get('refinamento') and state.get('df_atual') is not None:
            if not state['df_atual'].empty:
                usar_memoria = True

        if usar_memoria:
            df = state['df_atual'].copy()
            print("      -> Refinando busca anterior...")
        else:
            df = self.engine.df.copy()
            print("      -> Iniciando busca completa...")

        # 1. Bairro
        if filtros.get('bairro'):
            bairro_real = self.engine.fuzzy_match_bairro(filtros['bairro'])
            if bairro_real:
                df = df[df['bairro'] == bairro_real]
                print(f"      -> Bairro corrigido: {bairro_real}")

        # 2. Keywords (Regex)
        if clean_keywords:
            regex_pattern = '|'.join([re.escape(k.lower()) for k in clean_keywords])
            if regex_pattern:
                df = df[df['texto_busca'].str.contains(regex_pattern, regex=True)]
                print(f"      -> Regex aplicado: '{regex_pattern}'")

        # 3. Pets
        if filtros.get('pets'):
            df = df[df['aceita_pets'] == 1]

        # 4. Ordena√ß√£o
        if filtros.get('ordenacao') == 'menor_preco':
            df = df.sort_values(by='custo_total', ascending=True)
        elif filtros.get('ordenacao') == 'maior_preco':
            df = df.sort_values(by='custo_total', ascending=False)
        
        return {"df_atual": df}

    # 3. N√ì REDATOR (CORRIGIDO PARA VER A COLUNA DE PETS)
    def node_redator(self, state: AgentState):
        df = state['df_atual']
        
        if df.empty:
            res = "N√£o encontrei im√≥veis com essas caracter√≠sticas exatas."
        else:
            top_df = df.head(3)
            
            # --- CRUCIAL: Adicionamos 'status_pets' na visualiza√ß√£o ---
            colunas_visiveis = ['titulo', 'bairro', 'custo_total', 'status_pets', 'descricao']
            tabela_md = top_df[colunas_visiveis].to_markdown(index=False)
            
            prompt = f"""
            Voc√™ √© um assistente imobili√°rio.
            
            DADOS ENCONTRADOS:
            {tabela_md}

            PERGUNTA DO USU√ÅRIO: "{state['input']}"

            INSTRU√á√ïES:
            1. Use a coluna 'status_pets' para responder sobre animais.
            2. Se perguntou "qual o mais barato", √© o primeiro da lista.
            3. Responda de forma natural.
            """
            res = self.llm_text.invoke(prompt).content

        return {"resposta_final": res}

    def build_graph(self):
        workflow = StateGraph(AgentState)
        workflow.add_node("interpretador", self.node_interpretador)
        workflow.add_node("buscador", self.node_buscador)
        workflow.add_node("redator", self.node_redator)
        
        workflow.set_entry_point("interpretador")
        workflow.add_edge("interpretador", "buscador")
        workflow.add_edge("buscador", "redator")
        workflow.add_edge("redator", END)
        return workflow.compile()

# --- EXECU√á√ÉO: SIMULA√á√ÉO DE CONVERSA LONGA ---
if __name__ == "__main__":
    app = SistemaImobiliario()
    grafo = app.build_graph()
    
    roteiro_conversa = [
        "Ol√°, estou procurando um im√≥vel no bairro Benfica.",
        "Quais desses aceitam animais de estima√ß√£o?",
        "E qual √© o mais barato entre eles?",
        "Esse im√≥vel tem garagem? Verifica na descri√ß√£o por favor.",
        "Entendi. Mudei de ideia, me mostre apartamentos no Centro.",
        "Tem algum com porteiro ou seguran√ßa?"
    ]

    print("\n" + "="*60)
    print(" üé≠ SIMULA√á√ÉO DE CONVERSA CONT√çNUA")
    print("="*60)

    memoria_df = None
    historico = []

    for i, pergunta in enumerate(roteiro_conversa, 1):
        print(f"\nüë§ USU√ÅRIO (Turno {i}): {pergunta}")
        
        inputs = {
            "input": pergunta,
            "chat_history": historico,
            "df_atual": memoria_df,
            "filtros_interpretados": {},
            "resposta_final": ""
        }
        
        resultado = grafo.invoke(inputs)
        
        texto = resultado['resposta_final']
        memoria_df = resultado['df_atual']
        filtros = resultado['filtros_interpretados']
        
        print(f"ü§ñ AGENTE:\n{texto}")
        
        historico.append(f"User: {pergunta}")
        historico.append(f"AI: {texto}")
        app._log(pergunta, texto, filtros)

    print(f"\n‚úÖ Teste finalizado. Logs salvos em: {LOG_FILE}")

>>> [INIT] Banco carregado com 5 im√≥veis.

 üé≠ SIMULA√á√ÉO DE CONVERSA CONT√çNUA

üë§ USU√ÅRIO (Turno 1): Ol√°, estou procurando um im√≥vel no bairro Benfica.
   üß† [Interpretador] Lendo: 'Ol√°, estou procurando um im√≥vel no bairro Benfica.'


INFO:httpx:HTTP Request: POST http://127.0.0.1:11434/api/chat "HTTP/1.1 200 OK"


   üêº [Buscador Pandas] Aplicando: {'keywords': [], 'bairro': 'Benfica', 'pets': None, 'refinamento': False, 'ordenacao': None}
      -> Iniciando busca completa...
      -> Bairro corrigido: Benfica


INFO:httpx:HTTP Request: POST http://127.0.0.1:11434/api/chat "HTTP/1.1 200 OK"


ü§ñ AGENTE:
Ol√°!  Temos duas op√ß√µes no bairro Benfica:

* **Casa Vila:** Uma casa antiga reformada, por R$1280. Aceita pets! üê∂üê±
* **Casa Premium:** Uma resid√™ncia mais moderna com piso de porcelanato, √°rea gourmet e garagem, por R$2600. Tamb√©m aceita animais de estima√ß√£o.  

Qual delas te interessa mais? üòä  




üë§ USU√ÅRIO (Turno 2): Quais desses aceitam animais de estima√ß√£o?
   üß† [Interpretador] Lendo: 'Quais desses aceitam animais de estima√ß√£o?'


INFO:httpx:HTTP Request: POST http://127.0.0.1:11434/api/chat "HTTP/1.1 200 OK"


   üêº [Buscador Pandas] Aplicando: {'keywords': [], 'bairro': 'Benfica', 'pets': True, 'refinamento': True, 'ordenacao': None}
      -> Refinando busca anterior...
      -> Bairro corrigido: Benfica


INFO:httpx:HTTP Request: POST http://127.0.0.1:11434/api/chat "HTTP/1.1 200 OK"


ü§ñ AGENTE:
As casas que aceitam animais de estima√ß√£o s√£o:

* **Casa Premium** em Benfica, com custo total de R$ 2600.
* **Casa Vila** em Benfica, com custo total de R$ 1280. 


 üòä  Espero ter ajudado! üè°üê∂üê±  


üë§ USU√ÅRIO (Turno 3): E qual √© o mais barato entre eles?
   üß† [Interpretador] Lendo: 'E qual √© o mais barato entre eles?'


INFO:httpx:HTTP Request: POST http://127.0.0.1:11434/api/chat "HTTP/1.1 200 OK"


   üêº [Buscador Pandas] Aplicando: {'keywords': [], 'bairro': 'Benfica', 'pets': None, 'refinamento': True, 'ordenacao': 'menor_preco'}
      -> Refinando busca anterior...
      -> Bairro corrigido: Benfica


INFO:httpx:HTTP Request: POST http://127.0.0.1:11434/api/chat "HTTP/1.1 200 OK"


ü§ñ AGENTE:
A op√ß√£o mais barata entre as duas casas √© a **Casa Vila**, localizada em Benfica, com um custo total de R$ 1280.  

Ela aceita animais de estima√ß√£o, assim como a Casa Premium. üòä 




üë§ USU√ÅRIO (Turno 4): Esse im√≥vel tem garagem? Verifica na descri√ß√£o por favor.
   üß† [Interpretador] Lendo: 'Esse im√≥vel tem garagem? Verifica na descri√ß√£o por favor.'


INFO:httpx:HTTP Request: POST http://127.0.0.1:11434/api/chat "HTTP/1.1 200 OK"


   üêº [Buscador Pandas] Aplicando: {'keywords': ['garagem'], 'bairro': None, 'pets': None, 'refinamento': True, 'ordenacao': None}
      -> Refinando busca anterior...
      -> Regex aplicado: 'garagem'


INFO:httpx:HTTP Request: POST http://127.0.0.1:11434/api/chat "HTTP/1.1 200 OK"


ü§ñ AGENTE:
Sim, essa casa tem garagem! A descri√ß√£o diz que √© uma "Linda resid√™ncia com piso de porcelanato, √°rea gourmet e garagem".  


Gostaria de saber mais sobre alguma outra caracter√≠stica desse im√≥vel? 


üë§ USU√ÅRIO (Turno 5): Entendi. Mudei de ideia, me mostre apartamentos no Centro.
   üß† [Interpretador] Lendo: 'Entendi. Mudei de ideia, me mostre apartamentos no Centro.'


INFO:httpx:HTTP Request: POST http://127.0.0.1:11434/api/chat "HTTP/1.1 200 OK"


   üêº [Buscador Pandas] Aplicando: {'keywords': ['apartamentos'], 'bairro': 'Centro', 'pets': None, 'refinamento': False, 'ordenacao': None}
      -> Iniciando busca completa...
      -> Bairro corrigido: Centro
      -> Regex aplicado: 'apartamentos'
ü§ñ AGENTE:
N√£o encontrei im√≥veis com essas caracter√≠sticas exatas.

üë§ USU√ÅRIO (Turno 6): Tem algum com porteiro ou seguran√ßa?
   üß† [Interpretador] Lendo: 'Tem algum com porteiro ou seguran√ßa?'


INFO:httpx:HTTP Request: POST http://127.0.0.1:11434/api/chat "HTTP/1.1 200 OK"


   üêº [Buscador Pandas] Aplicando: {'keywords': ['porteiro', 'seguran√ßa'], 'bairro': None, 'pets': None, 'refinamento': False, 'ordenacao': None}
      -> Iniciando busca completa...
      -> Regex aplicado: 'porteiro|seguran√ßa'
ü§ñ AGENTE:
N√£o encontrei im√≥veis com essas caracter√≠sticas exatas.

‚úÖ Teste finalizado. Logs salvos em: historico_conversas_pandas.md


em teste