# 🧠 **Módulo 4: Memory - Lembrando das Conversas**

## **Aula 4.1: Memory Básica - Não Esqueça do Cliente**

---

### **Tá, mas o que é Memory?**

Imagina que você está conversando com um **garçom muito bom** vs um **garçom com amnésia**:

**Garçom com amnésia**:
- Você: "Quero um café"
- Garçom: "Aqui está seu café"
- Você: "Lembra que eu gosto sem açúcar?"
- Garçom: "Desculpe, não me lembro de você..." 😅

**Garçom com boa memória**:
- Você: "Quero um café"
- Garçom: "Aqui está seu café sem açúcar, como sempre!"
- Você: "Perfeito! E lembra que eu gosto quente?"
- Garçom: "Claro! Extra quente, como da última vez!" 😊

**Memory é exatamente isso!** É como dar **memória** para a IA, para ela lembrar do que vocês conversaram antes.

### **Por que Memory é Importante?**

**Sem Memory**: A IA esquece tudo a cada pergunta. É como conversar com alguém que tem **Alzheimer** - você tem que explicar tudo de novo.

**Com Memory**: A IA lembra do contexto, suas preferências, o que vocês falaram antes. É como ter um **amigo que nunca esquece**!

### **Tipos de Memory**

1. **ConversationBufferMemory** - Lembra de tudo (como uma vó com boa memória)
2. **ConversationSummaryMemory** - Faz resumos (como um assistente que anota)
3. **VectorStoreMemory** - Lembra por similaridade (como um cérebro organizado)
4. **EntityMemory** - Lembra de pessoas/coisas específicas (como um CRM)

---

**🖼️ Sugestão de imagem**: Comparação entre IA sem memória (caixa vazia) vs IA com memória (caixa cheia de informações)

### **Setup Inicial - Preparando o Terreno**

Vamos importar tudo que precisamos para trabalhar com Memory:

In [None]:
# Importando as bibliotecas necessárias para Memory
import os
from dotenv import load_dotenv
from langchain_openai import ChatOpenAI
from langchain.memory import ConversationBufferMemory, ConversationSummaryMemory
from langchain.chains import ConversationChain
from langchain.schema import HumanMessage, AIMessage

# Carregando variáveis de ambiente
load_dotenv()

# Criando nosso modelo base
llm = ChatOpenAI(
    model="gpt-3.5-turbo",
    temperature=0.7,
    api_key=os.getenv('OPENAI_API_KEY')
)

print("🧠 Setup completo! Modelo e bibliotecas prontos para trabalhar com Memory!")
print(f"🤖 Modelo: {llm.model_name}")
print(f"🌡️  Temperature: {llm.temperature}")

### **Teste 1: IA Sem Memory (Como Conversar com Alzheimer)**

Vamos ver como é conversar com uma IA que **não lembra de nada**. É como conversar com alguém que tem amnésia:

In [None]:
# Testando IA sem memory
# Como conversar com alguém que esquece tudo

print("❌ TESTE: IA SEM MEMORY (Como Alzheimer)")
print("=" * 60)

# Simulando uma conversa sem memory
perguntas = [
    "Olá! Meu nome é João e eu gosto de programar em Python.",
    "Qual linguagem de programação eu gosto?",
    "Qual é o meu nome?",
    "Você lembra o que eu disse sobre mim?"
]

for i, pergunta in enumerate(perguntas, 1):
    print(f"\n🤔 Pergunta {i}: {pergunta}")
    
    try:
        # Cada pergunta é independente (sem memory)
        response = llm.invoke([HumanMessage(content=pergunta)])
        print(f"🤖 Resposta: {response.content[:150]}...")
        
    except Exception as e:
        print(f"❌ Erro: {e}")
    
    print("-" * 40)

print("\n💭 Problema: A IA não lembra de nada! Cada pergunta é como a primeira.")

### **ConversationBufferMemory - A Vó com Boa Memória**

ConversationBufferMemory é como ter uma **vó com memória de elefante** - ela lembra de **TUDO** que vocês conversaram, palavra por palavra.

**Vantagens**:
- Lembra de tudo
- Contexto completo
- Precisão total

**Desvantagens**:
- Pode ficar pesado com conversas longas
- Consome mais tokens
- Pode ficar confuso com muito contexto

### **Criando Nossa Primeira Memory**

In [None]:
# Criando ConversationBufferMemory
# Como dar memória de elefante para a IA

memory = ConversationBufferMemory()

# Criando uma ConversationChain com memory
conversation = ConversationChain(
    llm=llm,
    memory=memory,
    verbose=True  # Para ver o que está acontecendo
)

print("🧠 ConversationBufferMemory criada!")
print("💭 Agora a IA vai lembrar de tudo que vocês conversarem")

In [None]:
# Testando a IA com memory
# Agora ela vai lembrar de tudo!

print("✅ TESTE: IA COM MEMORY (Como uma vó com boa memória)")
print("=" * 60)

# Mesmas perguntas, mas agora com memory
perguntas_com_memory = [
    "Olá! Meu nome é João e eu gosto de programar em Python.",
    "Qual linguagem de programação eu gosto?",
    "Qual é o meu nome?",
    "Você lembra o que eu disse sobre mim?"
]

for i, pergunta in enumerate(perguntas_com_memory, 1):
    print(f"\n🤔 Pergunta {i}: {pergunta}")
    
    try:
        # Agora a IA lembra do contexto anterior
        response = conversation.predict(input=pergunta)
        print(f"🤖 Resposta: {response}")
        
    except Exception as e:
        print(f"❌ Erro: {e}")
    
    print("-" * 40)

print("\n🎉 Agora a IA lembra de tudo! É como conversar com um amigo!")

In [None]:
# Vendo o que a memory guardou
# Como ver as anotações da vó

print("📝 CONTEÚDO DA MEMORY:")
print("=" * 50)

# Verificando o buffer de memória
buffer = memory.buffer
print(f"🧠 Memória atual:\n{buffer}")

# Verificando as variáveis de memória
print("\n📊 VARIÁVEIS DE MEMORY:")
print(f"📥 Input key: {memory.input_key}")
print(f"📤 Output key: {memory.output_key}")
print(f"🔄 Memory key: {memory.memory_key}")

### **Parou aqui e entendeu!** 🎯

**A diferença é BRUTAL, né?**

**Sem Memory**: A IA esquece tudo, como alguém com Alzheimer
**Com Memory**: A IA lembra de tudo, como uma vó com boa memória

**O que a Memory faz:**
- ✅ **Guarda o histórico** de conversas
- ✅ **Mantém o contexto** entre perguntas
- ✅ **Lembra de preferências** do usuário
- ✅ **Permite conversas naturais**

É como a diferença entre **conversar com um estranho** e **conversar com um amigo de longa data**! 👥

## **Aula 4.2: ConversationSummaryMemory - O Assistente que Anota**

### **O que é ConversationSummaryMemory?**

ConversationSummaryMemory é como ter um **assistente que faz anotações** durante a reunião. Em vez de lembrar de tudo palavra por palavra, ele faz **resumos inteligentes**.

**Analogia**: É como a diferença entre:
- **Vó com boa memória**: Lembra de tudo, mas pode ficar confusa com muita informação
- **Assistente que anota**: Faz resumos organizados, mantém o essencial

### **Vantagens da SummaryMemory**

1. **Mais eficiente** - Usa menos tokens
2. **Mais organizado** - Informações resumidas
3. **Melhor para conversas longas** - Não fica pesado
4. **Foco no essencial** - Mantém o que importa

### **Criando SummaryMemory**

In [None]:
# Criando ConversationSummaryMemory
# Como contratar um assistente que faz anotações

summary_memory = ConversationSummaryMemory(
    llm=llm,  # Modelo que vai fazer os resumos
    max_token_limit=1000  # Limite de tokens para o resumo
)

# Criando conversation chain com summary memory
conversation_summary = ConversationChain(
    llm=llm,
    memory=summary_memory,
    verbose=True
)

print("📝 ConversationSummaryMemory criada!")
print("💡 Agora a IA faz resumos inteligentes das conversas")

In [None]:
# Testando SummaryMemory com conversa longa
# Vamos ver como ela faz resumos

print("📝 TESTE: SUMMARY MEMORY (Assistente que anota)")
print("=" * 60)

# Conversa mais longa para testar o resumo
conversa_longa = [
    "Olá! Meu nome é Maria e eu trabalho como desenvolvedora frontend.",
    "Eu uso React e TypeScript no meu trabalho diário.",
    "Também gosto de UX/UI design e sempre procuro melhorar a experiência do usuário.",
    "Tenho 3 anos de experiência e estou sempre estudando novas tecnologias.",
    "Ultimamente tenho estudado Next.js e Tailwind CSS.",
    "Qual é o meu nome e o que eu faço?",
    "Quais tecnologias eu uso no trabalho?",
    "O que eu tenho estudado ultimamente?"
]

for i, mensagem in enumerate(conversa_longa, 1):
    print(f"\n💬 Mensagem {i}: {mensagem}")
    
    try:
        response = conversation_summary.predict(input=mensagem)
        print(f"🤖 Resposta: {response}")
        
    except Exception as e:
        print(f"❌ Erro: {e}")
    
    print("-" * 40)

In [None]:
# Vendo o resumo que a SummaryMemory fez
# Como ver as anotações do assistente

print("📋 RESUMO DA CONVERSA:")
print("=" * 50)

# Verificando o resumo atual
resumo_atual = summary_memory.buffer
print(f"📝 Resumo:\n{resumo_atual}")

# Comparando com buffer memory
print("\n🔄 COMPARAÇÃO: Buffer vs Summary")
print("=" * 40)

# Criando um novo buffer para comparação
buffer_memory = ConversationBufferMemory()
conversation_buffer = ConversationChain(
    llm=llm,
    memory=buffer_memory,
    verbose=False
)

# Adicionando as mesmas mensagens
for mensagem in conversa_longa:
    conversation_buffer.predict(input=mensagem)

print(f"📊 Buffer Memory (tamanho): {len(buffer_memory.buffer)} caracteres")
print(f"📊 Summary Memory (tamanho): {len(summary_memory.buffer)} caracteres")
print(f"📈 Economia: {((len(buffer_memory.buffer) - len(summary_memory.buffer)) / len(buffer_memory.buffer) * 100):.1f}% de economia!")

### **Chutando com Elegância!** ⚽

**O que aprendemos sobre SummaryMemory:**

1. ✅ **Faz resumos inteligentes** - Como um assistente experiente
2. ✅ **Economiza tokens** - Usa menos recursos
3. ✅ **Mantém o essencial** - Foco no que importa
4. ✅ **Ideal para conversas longas** - Não fica pesado

**Quando usar cada tipo:**
- **BufferMemory**: Conversas curtas, precisão total
- **SummaryMemory**: Conversas longas, eficiência

É como escolher entre **gravar tudo** vs **fazer anotações**! 📝

## **Aula 4.3: Memory Avançada - Contexto Inteligente**

### **EntityMemory - Lembrando de Pessoas e Coisas**

EntityMemory é como ter um **CRM inteligente** que lembra de pessoas específicas, suas preferências, informações importantes.

**Analogia**: É como a diferença entre:
- **Amigo genérico**: Lembra da conversa, mas não de detalhes específicos
- **Amigo próximo**: Lembra do seu nome, preferências, aniversário, etc.

### **Criando um Sistema de Atendimento Personalizado**

Vamos criar um sistema que:
1. **Lembra do nome** do cliente
2. **Lembra das preferências**
3. **Lembra do histórico** de compras
4. **Personaliza** as respostas

É como ter um **vendedor que conhece cada cliente**!

In [None]:
# Criando um sistema de atendimento com memory personalizada
# Como criar um vendedor que lembra de cada cliente

from langchain.memory import ConversationBufferWindowMemory
from langchain.prompts import PromptTemplate
from langchain.chains import LLMChain

# Template para atendimento personalizado
template_atendimento = PromptTemplate(
    input_variables=["history", "input"],
    template="""
    Você é um atendente de e-commerce muito atencioso.
    
    HISTÓRICO DA CONVERSA:
    {history}
    
    CLIENTE: {input}
    
    INSTRUÇÕES:
    - Use o histórico para personalizar sua resposta
    - Lembre-se do nome do cliente se mencionado
    - Lembre-se das preferências e interesses
    - Seja atencioso e prestativo
    - Use linguagem informal e amigável
    """
)

# Memory que guarda as últimas 5 interações
memory_atendimento = ConversationBufferWindowMemory(
    k=5,  # Guarda as últimas 5 interações
    return_messages=True
)

# Chain de atendimento
chain_atendimento = LLMChain(
    llm=llm,
    prompt=template_atendimento,
    memory=memory_atendimento,
    verbose=True
)

print("👨‍💼 Sistema de atendimento personalizado criado!")
print("💭 Memory que guarda as últimas 5 interações")

In [None]:
# Testando o sistema de atendimento personalizado
# Vamos ver o vendedor lembrando dos clientes

print("🛍️  TESTE: ATENDIMENTO PERSONALIZADO")
print("=" * 60)

# Simulando uma conversa com cliente
conversa_cliente = [
    "Olá! Meu nome é Ana e eu gosto muito de tecnologia.",
    "Estou procurando um smartphone bom para fotos.",
    "Qual você recomenda?",
    "Lembra do meu nome e o que eu gosto?",
    "E o que eu estava procurando mesmo?"
]

for i, mensagem in enumerate(conversa_cliente, 1):
    print(f"\n👤 Cliente {i}: {mensagem}")
    
    try:
        response = chain_atendimento.run(input=mensagem)
        print(f"👨‍💼 Atendente: {response}")
        
    except Exception as e:
        print(f"❌ Erro: {e}")
    
    print("-" * 40)

In [None]:
# Vendo o que a memory guardou
# Como ver o perfil do cliente

print("📋 PERFIL DO CLIENTE NA MEMORY:")
print("=" * 50)

# Verificando as mensagens na memory
mensagens = memory_atendimento.chat_memory.messages

print(f"💬 Total de mensagens: {len(mensagens)}")
print("\n📝 Histórico da conversa:")

for i, msg in enumerate(mensagens, 1):
    if hasattr(msg, 'content'):
        tipo = "👤 Cliente" if "Human" in str(type(msg)) else "👨‍💼 Atendente"
        print(f"{i}. {tipo}: {msg.content[:100]}...")

print("\n💡 A memory guardou o perfil completo do cliente!")
print("🎯 Nome, preferências, interesses e histórico de busca.")

### **Sistema de Chatbot com Memory Completo**

Agora vamos criar um **chatbot mais avançado** que combina diferentes tipos de memory. É como ter um **assistente pessoal inteligente**!

In [None]:
# Criando um chatbot avançado com memory
# Como criar um assistente pessoal inteligente

from langchain.memory import ConversationSummaryBufferMemory

# Memory híbrida: combina buffer e summary
memory_avancada = ConversationSummaryBufferMemory(
    llm=llm,
    max_token_limit=2000,  # Limite maior para conversas mais longas
    return_messages=True
)

# Template para assistente pessoal
template_assistente = PromptTemplate(
    input_variables=["history", "input"],
    template="""
    Você é o Pedro, um assistente pessoal descontraído e útil.
    
    HISTÓRICO DA CONVERSA:
    {history}
    
    USUÁRIO: {input}
    
    INSTRUÇÕES:
    - Use o histórico para personalizar suas respostas
    - Lembre-se de informações importantes sobre o usuário
    - Seja descontraído, use analogias e piadas leves
    - Fale como o Pedro Guth
    - Seja útil e prestativo
    """
)

# Chain do assistente
chain_assistente = LLMChain(
    llm=llm,
    prompt=template_assistente,
    memory=memory_avancada,
    verbose=True
)

print("🤖 Assistente pessoal Pedro criado!")
print("🧠 Memory híbrida: combina buffer e summary")
print("💡 Lembra de tudo e faz resumos quando necessário")

In [None]:
# Testando o assistente pessoal
# Vamos ver o Pedro em ação!

print("🤖 TESTE: ASSISTENTE PESSOAL PEDRO")
print("=" * 60)

# Conversa com o assistente
conversa_assistente = [
    "Oi Pedro! Meu nome é Carlos e eu sou programador.",
    "Eu trabalho com Python e JavaScript, mas quero aprender mais sobre IA.",
    "Você pode me ajudar com isso?",
    "Lembra do meu nome e o que eu faço?",
    "E o que eu quero aprender?",
    "Pode me dar algumas dicas de como começar com IA?",
    "Obrigado! Você é muito útil.",
    "Lembra de tudo que conversamos?"
]

for i, mensagem in enumerate(conversa_assistente, 1):
    print(f"\n👤 Carlos {i}: {mensagem}")
    
    try:
        response = chain_assistente.run(input=mensagem)
        print(f"🤖 Pedro: {response}")
        
    except Exception as e:
        print(f"❌ Erro: {e}")
    
    print("-" * 40)

In [None]:
# Vendo o resumo da conversa
# Como ver as anotações do assistente

print("📋 RESUMO DA CONVERSA COM PEDRO:")
print("=" * 50)

# Verificando o buffer atual
buffer_atual = memory_avancada.buffer
print(f"🧠 Buffer atual:\n{buffer_atual}")

# Verificando se há resumo
if hasattr(memory_avancada, 'moving_summary_buffer') and memory_avancada.moving_summary_buffer:
    print(f"\n📝 Resumo:\n{memory_avancada.moving_summary_buffer}")

print("\n💡 O assistente Pedro lembra de tudo e faz resumos quando necessário!")
print("🎯 Perfil completo do usuário mantido na memory.")

### **Na Prática, Meu Consagrado!** 💪

**O que aprendemos sobre Memory:**

1. ✅ **ConversationBufferMemory** - Lembra de tudo (vó com boa memória)
2. ✅ **ConversationSummaryMemory** - Faz resumos (assistente que anota)
3. ✅ **ConversationBufferWindowMemory** - Lembra das últimas N interações
4. ✅ **ConversationSummaryBufferMemory** - Combina buffer e summary
5. ✅ **Sistemas personalizados** - Atendimento e assistentes inteligentes

### **Comparação: Com vs Sem LangChain**

**Sem LangChain (código manual):**
```python
# Você teria que fazer isso manualmente:
class Chatbot:
    def __init__(self):
        self.conversation_history = []
        
    def chat(self, message):
        # Adicionar à história
        self.conversation_history.append({"user": message})
        
        # Criar contexto
        context = self.create_context()
        
        # Enviar para IA
        response = self.call_ai(context + message)
        
        # Adicionar resposta
        self.conversation_history.append({"ai": response})
        
        return response
    
    def create_context(self):
        # Implementar lógica de contexto...
        pass
```

**Com LangChain:**
```python
# Tudo isso em algumas linhas:
memory = ConversationBufferMemory()
conversation = ConversationChain(
    llm=llm,
    memory=memory
)
response = conversation.predict(input=message)
```

**Diferença**: Código mais limpo, funcionalidades avançadas prontas!

---

### **Desafio para Casa** 🏠

Crie um **sistema de tutor de idiomas** que:
1. **Lembra do nível** do aluno (iniciante, intermediário, avançado)
2. **Lembra dos erros** comuns que o aluno faz
3. **Adapta as explicações** ao nível do aluno
4. **Faz resumos** do progresso

**Dica**: Use ConversationSummaryBufferMemory com prompts personalizados!

**🖼️ Sugestão de imagem**: Um diagrama mostrando diferentes tipos de memory (buffer, summary, window) e como eles funcionam

**🎯 Próximo módulo**: Vamos aprender sobre **Agents** - os funcionários inteligentes que podem usar ferramentas!

---

**💡 Resumo do Módulo 4**:
- ✅ Memory básica (BufferMemory)
- ✅ Memory inteligente (SummaryMemory)
- ✅ Memory avançada (Window, SummaryBuffer)
- ✅ Sistemas personalizados
- ✅ Chatbots com contexto

**🧠 Agora você sabe fazer a IA lembrar como um amigo!**