In [8]:
import sqlite3
import pandas as pd
import json
import re
from typing import TypedDict, List, Any
from langchain_ollama import ChatOllama
from langgraph.graph import StateGraph, END
from rapidfuzz import process, fuzz

# --- ENGINE DE DADOS (DADOS REAIS DO DB.SQLITE3) ---
class RealEstateEngine:
    def __init__(self, db_path: str):
        self.db_path = db_path
        self.df = self._load_data()
        self.bairros_validos = self.df['bairro'].unique().tolist()

    def _load_data(self):
        conn = sqlite3.connect(self.db_path)
        # Carregando a tabela core_imovel do banco fornecido
        df = pd.read_sql_query("SELECT * FROM core_imovel", conn)
        conn.close()

        # Convers√£o de pre√ßos para c√°lculo de custo total
        for col in ['preco_aluguel', 'preco_iptu', 'preco_condominio']:
            df[col] = pd.to_numeric(df[col], errors='coerce').fillna(0)
        
        # Custo Total: Soma de Aluguel + IPTU + Condom√≠nio
        df['custo_total'] = df['preco_aluguel'] + df['preco_condominio'] + df['preco_iptu']
        df['status_pets'] = df['aceita_pets'].map({1: 'Aceita Pets', 0: 'N√£o Aceita'})
        
        # Indexa√ß√£o Generalista: T√≠tulo + Descri√ß√£o + Bairro + Especifica√ß√£o
        df['texto_busca'] = (
            df['titulo'].fillna('') + " " + 
            df['descricao'].fillna('') + " " + 
            df['bairro'].fillna('') + " " + 
            df['especificacao'].fillna('')
        ).str.lower()
        
        return df

    def fuzzy_match_bairro(self, input_b):
        if not input_b: return None
        match = process.extractOne(input_b, self.bairros_validos, scorer=fuzz.WRatio)
        return match[0] if match and match[1] > 80 else None

# --- ESTADO DO AGENTE ---
class AgentState(TypedDict):
    input: str
    filtros_ativos: dict
    df_resultado: Any
    resposta: str

# --- AGENTE INTELIGENTE ---
class AgentPro:
    def __init__(self, db_path):
        self.engine = RealEstateEngine(db_path)
        # Gemma 2 para orquestra√ß√£o l√≥gica
        self.llm = ChatOllama(model="gemma2:9b", temperature=0)

    def node_orchestrator(self, state: AgentState):
        """Reconcilia filtros anteriores com a nova inten√ß√£o sem√¢ntica."""
        contexto = state.get('filtros_ativos', {})
        
        # Prompt achatado para evitar KeyError e focado em extra√ß√£o de atributos
        prompt = f"""
        Voc√™ √© um Orquestrador de Inten√ß√£o. Analise:
        FILTROS ANTERIORES: {contexto}
        USER INPUT: "{state['input']}"
        
        Sua miss√£o √© gerar um JSON com:
        - "acao": "REFINAR" (se for continua√ß√£o) ou "RESETAR" (novo bairro/assunto).
        - "bairro": nome do bairro (ex: Centro, Benfica).
        - "keywords": lista de atributos (ex: 'portaria', 'jacuzzi', 'porcelanato', 'garagem').
        - "pets": true/false/null.
        
        RESPONDA APENAS JSON:
        {{ "acao": "...", "bairro": "...", "keywords": [], "pets": null }}
        """
        try:
            resp = json.loads(self.llm.invoke(prompt, format="json").content)
        except:
            resp = {"acao": "RESETAR", "keywords": []}

        # L√≥gica de Merge Sem√¢ntico
        if resp.get('acao') == "REFINAR":
            filtros = {**contexto}
            for k, v in resp.items():
                if v and k != "acao": filtros[k] = v
        else:
            filtros = {k: v for k, v in resp.items() if k != "acao"}
            
        return {"filtros_ativos": filtros}

    def node_searcher(self, state: AgentState):
        """Busca t√©cnica exaustiva no DataFrame."""
        f = state['filtros_ativos']
        df = self.engine.df.copy()

        # 1. Bairro (Fuzzy Match)
        if f.get('bairro'):
            b = self.engine.fuzzy_match_bairro(f['bairro'])
            if b: df = df[df['bairro'] == b]

        # 2. Keywords (Busca em T√≠tulo E Descri√ß√£o)
        keywords = f.get('keywords', [])
        if keywords:
            # Regex permite encontrar a palavra mesmo no meio de frases longas
            pattern = "|".join([re.escape(k.lower()) for k in keywords])
            df = df[df['texto_busca'].str.contains(pattern, na=False)]

        # 3. Ordena√ß√£o especial
        if "barato" in state['input'].lower():
            df = df.sort_values(by='custo_total')

        return {"df_resultado": df}

    def node_writer(self, state: AgentState):
        df = state['df_resultado']
        if df.empty:
            res = "N√£o encontrei im√≥veis com esses crit√©rios. Posso ajudar com outro bairro?"
        else:
            info = df.head(3)[['titulo', 'bairro', 'custo_total', 'descricao']].to_markdown()
            res = self.llm.invoke(f"Baseado nestes dados reais:\n{info}\nResponda: {state['input']}").content
        return {"resposta": res}

    def build(self):
        g = StateGraph(AgentState)
        g.add_node("interp", self.node_orchestrator)
        g.add_node("search", self.node_searcher)
        g.add_node("write", self.node_writer)
        g.set_entry_point("interp")
        g.add_edge("interp", "search")
        g.add_edge("search", "write")
        g.add_edge("write", END)
        return g.compile()

# --- SCRIPT DE TESTE DE ESTRESSE ---
if __name__ == "__main__":
    bot = AgentPro("db.sqlite3")
    app = bot.build()
    
    roteiro = [
        "Procure no Centro um apartamento com portaria.", # Teste de portaria na descri√ß√£o
        "Agora quero algo luxuoso no Alto dos Passos, com porcelanato.", # Teste t√©cnico
        "Tem cobertura em S√£o Mateus com jacuzzi?", # Teste de nicho
        "Qual o valor total dessa cobertura?" # Teste de c√°lculo
    ]

    mem_filtros = {}
    df_mesa = None

    for i, msg in enumerate(roteiro, 1):
        print(f"\n[{i}] üë§: {msg}")
        saida = app.invoke({"input": msg, "filtros_ativos": mem_filtros, "df_resultado": df_mesa, "resposta": ""})
        mem_filtros = saida['filtros_ativos']
        df_mesa = saida['df_resultado']
        print(f"ü§ñ: {saida['resposta']}")


[1] üë§: Procure no Centro um apartamento com portaria.
ü§ñ: De acordo com os dados fornecidos, o **Kitnet no Cal√ßad√£o**, localizado no **Centro**, possui **portaria 24h**.  


Parece que encontramos o que voc√™ procura! üòä 


[2] üë§: Agora quero algo luxuoso no Alto dos Passos, com porcelanato.
ü§ñ: Com base nos dados fornecidos, parece que o apartamento "Apartamento Luxo Alto dos Passos" √© exatamente o que voc√™ procura! 

Ele est√° localizado no bairro Alto dos Passos e possui acabamento em porcelanato. O custo total √© de R$ 6200.


Gostaria de saber mais detalhes sobre este im√≥vel? Ou prefere explorar outras op√ß√µes?  


[3] üë§: Tem cobertura em S√£o Mateus com jacuzzi?
ü§ñ: Sim, de acordo com os dados fornecidos, existe uma cobertura em S√£o Mateus com jacuzzi. 

A descri√ß√£o diz: "Cobertura incr√≠vel com vista panor√¢mica, √°rea gourmet e jacuzzi." 




[4] üë§: Qual o valor total dessa cobertura?
ü§ñ: O valor total da cobertura √© R$ 4.100,00.  



In [9]:
import sqlite3
import pandas as pd
import json
import re
from typing import TypedDict, List, Any, Optional
from langchain_ollama import ChatOllama
from langgraph.graph import StateGraph, END
from rapidfuzz import process, fuzz

# --- ENGINE DE DADOS (CARREGAMENTO DO DB.SQLITE3) ---
class RealEstateEngine:
    def __init__(self, db_path: str):
        self.db_path = db_path
        self.df = self._load_data()
        self.bairros_validos = self.df['bairro'].unique().tolist()

    def _load_data(self):
        conn = sqlite3.connect(self.db_path)
        df = pd.read_sql_query("SELECT * FROM core_imovel", conn)
        conn.close()

        # Normaliza√ß√£o financeira e num√©rica
        cols_financeiras = ['preco_aluguel', 'preco_iptu', 'preco_condominio']
        cols_numericas = ['quartos', 'banheiros', 'garagem', 'area']
        
        for col in cols_financeiras + cols_numericas:
            df[col] = pd.to_numeric(df[col], errors='coerce').fillna(0)
        
        df['custo_total'] = df['preco_aluguel'] + df['preco_condominio'] + df['preco_iptu']
        df['status_pets'] = df['aceita_pets'].map({1: 'Aceita Pets', 0: 'N√£o Aceita'})
        
        # Indexa√ß√£o de busca profunda (Unifica metadados e descri√ß√£o)
        df['texto_busca'] = (
            df['titulo'].fillna('') + " " + 
            df['descricao'].fillna('') + " " + 
            df['bairro'].fillna('') + " " + 
            df['especificacao'].fillna('')
        ).str.lower()
        
        return df

    def fuzzy_match_bairro(self, input_b):
        if not input_b: return None
        match = process.extractOne(input_b, self.bairros_validos, scorer=fuzz.WRatio)
        return match[0] if match and match[1] > 80 else None

# --- ESTADO DO GRAFO ---
class AgentState(TypedDict):
    input: str
    filtros_ativos: dict
    df_resultado: Any
    comparativo: Optional[str]
    resposta: str

# --- AGENTE ULTRA ---
class AgentUltra:
    def __init__(self, db_path):
        self.engine = RealEstateEngine(db_path)
        # Gemma 2:9b para orquestra√ß√£o e an√°lise
        self.llm = ChatOllama(model="gemma2:9b", temperature=0)

    def node_orchestrator(self, state: AgentState):
        """Identifica se a inten√ß√£o √© busca, refinamento ou compara√ß√£o."""
        contexto = state.get('filtros_ativos', {})
        prompt = f"""
        Voc√™ √© um Analista Imobili√°rio. Analise a entrada: "{state['input']}"
        CONTEXTO ATUAL: {contexto}

        A√ß√£o: 
        - "RESETAR": Novo bairro ou busca do zero.
        - "REFINAR": Mais detalhes sobre o que j√° estamos vendo.
        - "COMPARAR": Quer ver as diferen√ßas entre os im√≥veis listados.

        JSON OUTPUT:
        {{
          "acao": "...",
          "filtros": {{
            "bairro": "string",
            "keywords": ["vaga", "portaria", "jacuzzi", etc],
            "min_quartos": int,
            "min_garagem": int,
            "pets": bool,
            "ordem": "preco_asc" | "area_desc"
          }}
        }}
        """
        try:
            resp = json.loads(self.llm.invoke(prompt, format="json").content)
        except:
            resp = {"acao": "RESETAR", "filtros": {}}

        # Reconcilia√ß√£o de Estado
        if resp.get('acao') == "REFINAR":
            filtros = {**contexto, **resp.get('filtros', {})}
        else:
            filtros = resp.get('filtros', {})

        return {"filtros_ativos": filtros, "proximo_passo": resp.get('acao')}

    def node_searcher(self, state: AgentState):
        """Busca t√©cnica com suporte a filtros num√©ricos."""
        f = state['filtros_ativos']
        df = self.engine.df.copy()

        if f.get('bairro'):
            b = self.engine.fuzzy_match_bairro(f['bairro'])
            if b: df = df[df['bairro'] == b]

        if f.get('min_quartos'):
            df = df[df['quartos'] >= f['min_quartos']]
            
        if f.get('min_garagem'):
            df = df[df['garagem'] >= f['min_garagem']]

        if f.get('keywords'):
            pattern = "|".join([re.escape(k.lower()) for k in f['keywords']])
            df = df[df['texto_busca'].str.contains(pattern, na=False)]

        # Ordena√ß√£o din√¢mica
        if f.get('ordem') == "preco_asc":
            df = df.sort_values(by='custo_total')
        elif f.get('ordem') == "area_desc":
            df = df.sort_values(by='area', ascending=False)

        return {"df_resultado": df}

    def node_writer(self, state: AgentState):
        """Gera resposta com tabelas MD para clareza."""
        df = state['df_resultado']
        if df.empty:
            res = "N√£o localizei im√≥veis com esses crit√©rios. Podemos tentar outro bairro ou menos exig√™ncias?"
        else:
            top = df.head(3)
            # Monta uma tabela de resumo para o usu√°rio
            tabela = top[['titulo', 'bairro', 'custo_total', 'quartos', 'garagem', 'descricao']].to_markdown(index=False)
            prompt = f"Dados Reais:\n{tabela}\n\nResponda amigavelmente e destaque os diferenciais: {state['input']}"
            res = self.llm.invoke(prompt).content
        return {"resposta": res}

    def build(self):
        g = StateGraph(AgentState)
        g.add_node("interp", self.node_orchestrator)
        g.add_node("search", self.node_searcher)
        g.add_node("write", self.node_writer)
        g.set_entry_point("interp")
        g.add_edge("interp", "search")
        g.add_edge("search", "write")
        g.add_edge("write", END)
        return g.compile()

# --- STRESS TEST: JORNADA DO CLIENTE ---
if __name__ == "__main__":
    bot = AgentUltra("db.sqlite3")
    app = bot.build()
    
    roteiro = [
        "Procure no Centro um apartamento com portaria.", 
        "Quais as taxas desse im√≥vel (IPTU e Condom√≠nio)?", # Teste de transpar√™ncia
        "Agora procure algo em S√£o Mateus com 3 quartos e vaga de garagem.", # Filtro num√©rico
        "Desses de S√£o Mateus, qual o maior em √°rea?", # Ordena√ß√£o por atributo
        "Tem cobertura com jacuzzi?", # Busca de nicho
        "Qual a diferen√ßa de pre√ßo e √°rea entre o luxo do Alto dos Passos e a cobertura de S√£o Mateus?" # Compara√ß√£o complexa
    ]

    mem_filtros = {}
    df_mesa = None

    print("\nüöÄ INICIANDO TESTE DE ESTRESSE: AGENTE ULTRA\n")

    for i, msg in enumerate(roteiro, 1):
        print(f"[{i}] üë§: {msg}")
        saida = app.invoke({"input": msg, "filtros_ativos": mem_filtros, "df_resultado": df_mesa, "resposta": ""})
        mem_filtros = saida['filtros_ativos']
        df_mesa = saida['df_resultado']
        print(f"ü§ñ: {saida['resposta']}\n" + "-"*40)


üöÄ INICIANDO TESTE DE ESTRESSE: AGENTE ULTRA

[1] üë§: Procure no Centro um apartamento com portaria.
ü§ñ: Ol√°! üòä  

Procurando um apartamento no Centro com portaria 24 horas? Que tal essa **Kitnet no Cal√ßad√£o**? ü§©

Ela fica no cora√ß√£o da cidade, perto de tudo que voc√™ precisa, e oferece seguran√ßa com a portaria sempre dispon√≠vel. üòâ


Gostaria de saber mais sobre ela?  

----------------------------------------
[2] üë§: Quais as taxas desse im√≥vel (IPTU e Condom√≠nio)?
ü§ñ: Ol√°! üòä  

As informa√ß√µes sobre IPTU e condom√≠nio para esse kitnet no Cal√ßad√£o n√£o est√£o dispon√≠veis nos dados que voc√™ me forneceu. 

**Mas, o que √© realmente bacana nesse im√≥vel:**

* **Localiza√ß√£o privilegiada:** No cora√ß√£o da cidade, perto de tudo! Isso facilita muito a vida, n√©?
* **Seguran√ßa:**  Portaria 24h para garantir sua tranquilidade.


Para saber sobre as taxas de IPTU e condom√≠nio, voc√™ pode entrar em contato com o propriet√°rio ou imobili√°ria respons√°ve