# Chatbot com Rag - 001

## SETUP

In [23]:
from langchain_openai import ChatOpenAI
from langchain.prompts import PromptTemplate
from langchain_community.document_loaders import TextLoader
from langchain.globals import set_llm_cache
from langchain.cache import InMemoryCache
import yaml
import os
import asyncio
import time
import asyncio  


with open("config.yaml", "r") as config_file:
    config = yaml.safe_load(config_file)
os.environ["OPENAI_API_KEY"] = config["OPENAI_API_KEY"]

# Configurar cache para respostas mais rápidas
set_llm_cache(InMemoryCache())

# Modelo rápido para análise inicial
openai_rapido = ChatOpenAI(model='gpt-3.5-turbo', temperature=0)
# Modelo premium para resposta final
openai_premium = ChatOpenAI(model='gpt-4', temperature=0)

# Confirmação de que o setup foi realizado com sucesso
print("✅ Setup concluído com sucesso!")
print("🔥 Cache ativado para respostas mais rápidas!")
print(f"⚡ Modelo rápido: {openai_rapido.model_name}")
print(f"🔧 Modelo premium: {openai_premium.model_name}")
print(f"🌡️ Temperatura: {openai_premium.temperature}")
print("🚀 Sistema otimizado pronto para uso!")

✅ Setup concluído com sucesso!
🔥 Cache ativado para respostas mais rápidas!
⚡ Modelo rápido: gpt-3.5-turbo
🔧 Modelo premium: gpt-4
🌡️ Temperatura: 0.0
🚀 Sistema otimizado pronto para uso!


# Carregar os Documentos

In [24]:
loader = TextLoader('base_conhecimento_britadeira.txt')
documents = loader.load()

print("Documentos carregados:")
for doc in documents:
    first_line = doc.page_content.split('\n')[0]
    print(f"- {first_line}")

Documentos carregados:
- Base de Conhecimento Aprimorada para a Britadeira XP500


In [28]:
# Cadeias otimizadas com modelos híbridos
chain_base_conhecimento = prompt_base_conhecimento | openai_rapido      # GPT-3.5 para análise rápida
chain_historico_conversas = prompt_historico_conversas | openai_rapido  # GPT-3.5 para análise rápida  
chain_final = prompt_final | openai_premium                             # GPT-4 para resposta final

print("✅ Cadeias otimizadas definidas com sucesso!")
print("⚡ Análises iniciais: GPT-3.5 Turbo (rápido)")
print("🎯 Resposta final: GPT-4 (premium)")

✅ Cadeias otimizadas definidas com sucesso!
⚡ Análises iniciais: GPT-3.5 Turbo (rápido)
🎯 Resposta final: GPT-4 (premium)


# Passando dados e executando

In [30]:
async def executar_chains():
    # Executar as duas primeiras chains em paralelo
    resultado_base, resultado_historico = await asyncio.gather(
        chain_base_conhecimento.ainvoke({"context": inputs["context"], "question": inputs["question"]}),
        chain_historico_conversas.ainvoke({"historico": inputs["historico"], "question": inputs["question"]})
    )
    
    # Executar chain final com os resultados
    resultado_final = await chain_final.ainvoke({
        "resposta_base_conhecimento": resultado_base, 
        "resposta_historico_conversas": resultado_historico
    })
    
    return resultado_base, resultado_historico, resultado_final

# Executar e atribuir às mesmas variáveis
# Execução Assíncrona Otimizada com Medição de Tempo
async def executar_chains_otimizada():
    inicio = time.time()
    print("⏱️ Iniciando execução das chains otimizadas...")
    
    # Executar as duas primeiras chains em paralelo (GPT-3.5)
    inicio_paralelo = time.time()
    resultado_base, resultado_historico = await asyncio.gather(
        chain_base_conhecimento.ainvoke({"context": inputs["context"], "question": inputs["question"]}),
        chain_historico_conversas.ainvoke({"historico": inputs["historico"], "question": inputs["question"]})
    )
    fim_paralelo = time.time()
    print(f"⚡ Análises paralelas (GPT-3.5) executadas em: {fim_paralelo - inicio_paralelo:.2f}s")
    
    # Executar chain final com GPT-4
    inicio_final = time.time()
    resultado_final = await chain_final.ainvoke({
        "resposta_base_conhecimento": resultado_base, 
        "resposta_historico_conversas": resultado_historico
    })
    fim_final = time.time()
    print(f"🎯 Resposta final (GPT-4) executada em: {fim_final - inicio_final:.2f}s")
    
    fim = time.time()
    print(f"🏁 TEMPO TOTAL OTIMIZADO: {fim - inicio:.2f}s")
    
    return resultado_base, resultado_historico, resultado_final

# Executar versão otimizada
resultado_base_conhecimento, resultado_historico_conversas, resultado_final = await executar_chains_otimizada()

print("\n" + "="*60)
print("📊 RESULTADOS DAS ANÁLISES:")
print("="*60)
print("🔍 Resultado Base de Conhecimento:\n", resultado_base_conhecimento.content)
print("\n" + "-"*40)
print("📝 Resultado Histórico de Conversas:\n", resultado_historico_conversas.content)
print("\n" + "-"*40)
print("🎯 Resultado Final Combinado:\n", resultado_final.content)

⏱️ Iniciando execução das chains otimizadas...
⚡ Análises paralelas (GPT-3.5) executadas em: 1.18s
⚡ Análises paralelas (GPT-3.5) executadas em: 1.18s
🎯 Resposta final (GPT-4) executada em: 3.29s
🏁 TEMPO TOTAL OTIMIZADO: 4.48s

📊 RESULTADOS DAS ANÁLISES:
🔍 Resultado Base de Conhecimento:
 Aguarde 30 segundos após conectar a bateria para que o sistema inicialize e verifique se o interruptor liga/desliga está na posição correta. Se o problema persistir, contate o suporte técnico pelo 0800 555 5555.

----------------------------------------
📝 Resultado Histórico de Conversas:
 Chatbot: Nesse caso, pode ser um problema com o interruptor de ligar/desligar da britadeira. Você já tentou verificar se ele está funcionando corretamente?

----------------------------------------
🎯 Resultado Final Combinado:
 Após conectar a bateria, aguarde 30 segundos para que o sistema inicialize. Durante esse tempo, verifique se o interruptor liga/desliga está na posição correta. Isso pode ser um problema com 

# 🎯 Resposta Final para o Cliente

In [32]:
# 🎯 Resposta Final com Streaming em Tempo Real
async def resposta_streaming():
    print("🤖 CHATBOT RAG OTIMIZADO - RESPOSTA EM TEMPO REAL")
    print("=" * 50)
    print(f"❓ Pergunta:\n{pergunta}")
    print("\n" + "=" * 50)
    print("💬 Resposta:")
    
    # Streaming da resposta final em tempo real
    resposta_completa = ""
    inicio_stream = time.time()
    
    async for chunk in chain_final.astream({
        "resposta_base_conhecimento": resultado_base_conhecimento,
        "resposta_historico_conversas": resultado_historico_conversas
    }):
        print(chunk.content, end="", flush=True)
        resposta_completa += chunk.content
    
    fim_stream = time.time()
    
    print(f"\n\n" + "=" * 50)
    print(f"⚡ Streaming executado em: {fim_stream - inicio_stream:.2f}s")
    print("✅ Resposta otimizada gerada com base na documentação\ntécnica e histórico de conversas")
    print("🔥 Sistema utilizando: Cache + Async + Modelos Híbridos + Streaming")
    
    return resposta_completa

# Executar resposta com streaming
resposta_final_streaming = await resposta_streaming()

🤖 CHATBOT RAG OTIMIZADO - RESPOSTA EM TEMPO REAL
❓ Pergunta:
Minha britadeira não liga. Eu já verifiquei e a bateria está carregada e conectada corretamente

💬 Resposta:
ApósApós conectar a conectar a bateria bateria, ag, aguardeuarde 30 segundos para 30 segundos para que o que o sistema inicial sistema inicialize.ize. Durante Durante esse tempo esse tempo, ver, verifique se o interruptifique se o interruptor lor liga/diga/desligaesliga está na está na posição cor posição correta,reta, como menc como mencionadoionado anteriormente, pode anteriormente, pode ser um ser um problema com problema com o interrupt o interruptor deor de ligar ligar/des/desligarligar da brit da britadeira. Seadeira. Se o problema o problema persistir persistir, cont, contate oate o suporte suporte técnico técnico pelo  pelo 0800 5550800 555 555 5555.

⚡ Streaming executado em: 3.26s
✅ Resposta otimizada gerada com base na documentação
técnica e histórico de conversas
🔥 Sistema utilizando: Cache + Async + Modelo