# üß† M√≥dulo 5: Memory Systems - A Mem√≥ria dos Nossos Bots!

### *"Como fazer seu ChatBot lembrar das conversas anteriores (e n√£o repetir a mesma pergunta 300 vezes!)"*

---

Ea√≠, pessoal! Tudo tranquilo? üöÄ

T√°, mas o que diabos √© um **Memory System**? Imagina que voc√™ t√° conversando com seu amigo no WhatsApp e de repente ele esquece TUDO que voc√™s falaram 2 segundos atr√°s. Irritante, n√©?

√â exatamente isso que acontece com os LLMs por padr√£o - eles s√£o como aquele peixinho Dory do Nemo: sem mem√≥ria!

Neste m√≥dulo vamos aprender:
- ‚úÖ Por que LLMs s√£o "sem mem√≥ria"
- ‚úÖ Tipos de Memory no LangChain
- ‚úÖ Como implementar cada tipo
- ‚úÖ Quando usar cada um
- ‚úÖ Dicas pr√°ticas para produ√ß√£o

**Dica do Pedro**: Memory √© o que transforma um bot "burro" em um assistente inteligente!

## ü§î Por que precisamos de Memory?

T√°, vamos come√ßar com o b√°sico: **LLMs s√£o stateless**!

Isso significa que cada vez que voc√™ faz uma pergunta, √© como se fosse a primeira vez que voc√™ conversa com ele. √â tipo assim:

```
Voc√™: "Meu nome √© Jo√£o"
Bot: "Prazer, Jo√£o!"

Voc√™: "Qual √© o meu nome?"
Bot: "Desculpa, n√£o sei seu nome" ü§¶‚Äç‚ôÇÔ∏è
```

A **mem√≥ria** resolve isso mantendo o contexto da conversa. √â como dar um caderninho pro bot anotar tudo!

### Analogia do Restaurante üçï

Imagina um gar√ßom que:
- **Sem mem√≥ria**: Pergunta seu pedido a cada 2 minutos
- **Com mem√≥ria**: Lembra do seu pedido e suas prefer√™ncias

Qual voc√™ prefere? √ìbvio, n√©!

In [None]:
# Bora come√ßar! Primeiro, vamos instalar e importar tudo que precisamos
!pip install langchain langchain-google-genai python-dotenv matplotlib -q

import os
from dotenv import load_dotenv
import matplotlib.pyplot as plt
import numpy as np
from datetime import datetime

# Imports do LangChain
from langchain_google_genai import ChatGoogleGenerativeAI
from langchain.memory import (
    ConversationBufferMemory,
    ConversationBufferWindowMemory,
    ConversationSummaryMemory,
    ConversationSummaryBufferMemory
)
from langchain.chains import ConversationChain
from langchain.schema import BaseMessage, HumanMessage, AIMessage

print("‚úÖ Bibliotecas carregadas! Bora pro show!")

In [None]:
# Configurando nossa API do Google (lembra dos m√≥dulos anteriores?)
load_dotenv()

# Se n√£o tiver a API key, descomenta a linha abaixo e coloca sua chave
# os.environ["GOOGLE_API_KEY"] = "sua-api-key-aqui"

# Nosso modelo padr√£o do curso
llm = ChatGoogleGenerativeAI(
    model="gemini-2.0-flash-exp",
    temperature=0.7
)

print("ü§ñ Modelo configurado! Gemini 2.0 Flash pronto pra a√ß√£o!")

## üìä Visualizando o Problema da Mem√≥ria

Vamos criar um gr√°fico pra mostrar como funciona a conversa **SEM** mem√≥ria:

In [None]:
# Vamos visualizar o problema da falta de mem√≥ria
fig, (ax1, ax2) = plt.subplots(1, 2, figsize=(15, 6))

# Gr√°fico 1: Sem Mem√≥ria
conversas = ['Conversa 1', 'Conversa 2', 'Conversa 3', 'Conversa 4']
contexto_sem_memoria = [1, 1, 1, 1]  # Sempre volta ao zero
contexto_com_memoria = [1, 2, 3, 4]  # Acumula conhecimento

ax1.bar(conversas, contexto_sem_memoria, color='red', alpha=0.7)
ax1.set_title('üö´ SEM Mem√≥ria\n(Cada conversa √© isolada)', fontsize=14, fontweight='bold')
ax1.set_ylabel('Contexto Dispon√≠vel')
ax1.set_ylim(0, 5)

# Gr√°fico 2: Com Mem√≥ria
ax2.bar(conversas, contexto_com_memoria, color='green', alpha=0.7)
ax2.set_title('‚úÖ COM Mem√≥ria\n(Contexto acumulativo)', fontsize=14, fontweight='bold')
ax2.set_ylabel('Contexto Dispon√≠vel')
ax2.set_ylim(0, 5)

plt.tight_layout()
plt.show()

print("üìà Viu a diferen√ßa? Com mem√≥ria, o bot fica cada vez mais esperto!")

## üèóÔ∏è Arquitetura dos Memory Systems

```mermaid
graph TD
    A[üë§ Usu√°rio] --> B[üí¨ Nova Mensagem]
    B --> C[üß† Memory System]
    C --> D[üìö Contexto Hist√≥rico]
    D --> E[ü§ñ LLM]
    E --> F[üìù Resposta]
    F --> G[üíæ Salvar na Mem√≥ria]
    G --> C
    F --> A
```

### Como funciona na pr√°tica:

1. **Usu√°rio** envia mensagem
2. **Memory System** recupera hist√≥rico
3. **LLM** recebe mensagem + contexto
4. **Resposta** √© gerada
5. **Tudo √© salvo** na mem√≥ria

**Dica do Pedro**: √â tipo um loop infinito de aprendizado!

## üéØ Tipos de Memory no LangChain

O LangChain tem v√°rios tipos de mem√≥ria, cada um pra uma situa√ß√£o:

### 1. üóÉÔ∏è ConversationBufferMemory
- **O que faz**: Guarda TUDO da conversa
- **Pr√≥s**: Contexto completo
- **Contras**: Pode ficar gigante
- **Quando usar**: Conversas curtas

### 2. ü™ü ConversationBufferWindowMemory
- **O que faz**: Guarda s√≥ as √∫ltimas N mensagens
- **Pr√≥s**: Controla o tamanho
- **Contras**: Esquece coisas antigas
- **Quando usar**: Conversas longas com foco no recente

### 3. üìã ConversationSummaryMemory
- **O que faz**: Resume a conversa
- **Pr√≥s**: Muito eficiente
- **Contras**: Pode perder detalhes
- **Quando usar**: Conversas muito longas

### 4. üîÑ ConversationSummaryBufferMemory
- **O que faz**: Mistura resumo + buffer
- **Pr√≥s**: Melhor dos dois mundos
- **Contras**: Mais complexo
- **Quando usar**: Conversas longas que precisam de detalhes

**Dica do Pedro**: √â como escolher o tamanho da sua mochila pra viajem!

## üìä Comparando os Tipos de Memory

Vamos criar uma visualiza√ß√£o pra entender as diferen√ßas:

In [None]:
# Compara√ß√£o visual dos tipos de mem√≥ria
tipos_memoria = ['Buffer\nCompleto', 'Buffer\nWindow', 'Summary\nOnly', 'Summary+\nBuffer']
uso_tokens = [100, 40, 20, 50]  # Exemplo de uso de tokens
precisao_contexto = [100, 70, 60, 85]  # Precis√£o do contexto preservado

fig, (ax1, ax2) = plt.subplots(1, 2, figsize=(15, 6))

# Gr√°fico 1: Uso de Tokens
bars1 = ax1.bar(tipos_memoria, uso_tokens, color=['red', 'orange', 'green', 'blue'], alpha=0.7)
ax1.set_title('üí∞ Uso de Tokens (Custo)', fontsize=14, fontweight='bold')
ax1.set_ylabel('Tokens Utilizados')
ax1.set_ylim(0, 120)

# Adicionando valores nas barras
for bar, valor in zip(bars1, uso_tokens):
    ax1.text(bar.get_x() + bar.get_width()/2, bar.get_height() + 2, 
             f'{valor}', ha='center', va='bottom', fontweight='bold')

# Gr√°fico 2: Precis√£o do Contexto
bars2 = ax2.bar(tipos_memoria, precisao_contexto, color=['red', 'orange', 'green', 'blue'], alpha=0.7)
ax2.set_title('üéØ Precis√£o do Contexto', fontsize=14, fontweight='bold')
ax2.set_ylabel('Precis√£o (%)')
ax2.set_ylim(0, 120)

# Adicionando valores nas barras
for bar, valor in zip(bars2, precisao_contexto):
    ax2.text(bar.get_x() + bar.get_width()/2, bar.get_height() + 2, 
             f'{valor}%', ha='center', va='bottom', fontweight='bold')

plt.tight_layout()
plt.show()

print("üìä Trade-off cl√°ssico: Custo vs Precis√£o!")
print("üí° A escolha depende do seu caso de uso espec√≠fico!")

## üóÉÔ∏è 1. ConversationBufferMemory - O Arquivo Completo

Vamos come√ßar com o mais simples: guardar TUDO!

√â tipo aquela pessoa que guarda todos os WhatsApp desde 2010 üòÖ

In [None]:
# Criando um ConversationBufferMemory
from langchain.memory import ConversationBufferMemory

# Inicializando a mem√≥ria
buffer_memory = ConversationBufferMemory(
    return_messages=True,  # Retorna como objetos Message
    memory_key="chat_history"  # Nome da chave no contexto
)

# Criando uma chain com mem√≥ria
conversation_buffer = ConversationChain(
    llm=llm,
    memory=buffer_memory,
    verbose=True  # Pra ver o que t√° rolando nos bastidores
)

print("‚úÖ ConversationBufferMemory criada!")
print("üß† Esta mem√≥ria vai guardar TODA a conversa!")

In [None]:
# Testando o BufferMemory
print("üó£Ô∏è Iniciando conversa com BufferMemory...\n")

# Primeira mensagem
resposta1 = conversation_buffer.predict(input="Oi! Meu nome √© Jo√£o e eu adoro pizza.")
print(f"ü§ñ Bot: {resposta1}\n")

# Segunda mensagem - vamos ver se ele lembra
resposta2 = conversation_buffer.predict(input="Qual √© o meu nome e o que eu gosto de comer?")
print(f"ü§ñ Bot: {resposta2}\n")

# Terceira mensagem - mais contexto
resposta3 = conversation_buffer.predict(input="Eu tamb√©m trabalho como programador Python.")
print(f"ü§ñ Bot: {resposta3}\n")

In [None]:
# Vamos ver o que tem na mem√≥ria
print("üß† Conte√∫do da mem√≥ria BufferMemory:")
print("=" * 50)

# Acessando o buffer diretamente
historico = buffer_memory.chat_memory.messages

for i, mensagem in enumerate(historico, 1):
    tipo = "üë§ Usu√°rio" if mensagem.type == "human" else "ü§ñ Bot"
    print(f"{i}. {tipo}: {mensagem.content[:100]}...")

print(f"\nüìä Total de mensagens na mem√≥ria: {len(historico)}")
print(f"üíæ Tamanho aproximado: {sum(len(msg.content) for msg in historico)} caracteres")

## ü™ü 2. ConversationBufferWindowMemory - A Janela Deslizante

Agora vamos pro Buffer Window - ele mant√©m s√≥ as √∫ltimas N mensagens.

√â tipo aquela mem√≥ria RAM do seu computador: mant√©m s√≥ o que √© relevante agora!

In [None]:
# Criando um ConversationBufferWindowMemory
from langchain.memory import ConversationBufferWindowMemory

# Inicializando com janela de 4 mensagens (2 do usu√°rio + 2 do bot)
window_memory = ConversationBufferWindowMemory(
    k=4,  # Mant√©m as √∫ltimas 4 mensagens
    return_messages=True,
    memory_key="chat_history"
)

# Criando uma nova chain
conversation_window = ConversationChain(
    llm=llm,
    memory=window_memory,
    verbose=True
)

print("‚úÖ ConversationBufferWindowMemory criada!")
print("ü™ü Esta mem√≥ria mant√©m apenas as √∫ltimas 4 mensagens!")

In [None]:
# Testando o WindowMemory com v√°rias mensagens
print("üó£Ô∏è Testando WindowMemory com janela de 4 mensagens...\n")

mensagens_teste = [
    "Oi! Meu nome √© Maria.",
    "Eu tenho 25 anos.",
    "Trabalho como designer.",
    "Adoro viajar para a praia.",
    "Tenho um gato chamado Mimi.",
    "Qual √© o meu nome mesmo?"  # Vamos ver se ainda lembra!
]

for i, mensagem in enumerate(mensagens_teste, 1):
    print(f"üì® Mensagem {i}: {mensagem}")
    resposta = conversation_window.predict(input=mensagem)
    print(f"ü§ñ Bot: {resposta}\n")
    
    # Mostrando quantas mensagens est√£o na mem√≥ria
    qtd_memorias = len(window_memory.chat_memory.messages)
    print(f"üß† Mensagens na mem√≥ria: {qtd_memorias}/4\n")
    print("-" * 60)

## üìã 3. ConversationSummaryMemory - O Resumidor

Agora a coisa fica interessante! O SummaryMemory n√£o guarda as mensagens - ele faz um **resumo**!

√â tipo aquele amigo que conta a fofoca resumida: "Ah, rolou um drama, mas o importante √© que no final deu tudo certo" üòÇ

In [None]:
# Criando um ConversationSummaryMemory
from langchain.memory import ConversationSummaryMemory

# Inicializando - precisa de um LLM pra fazer os resumos!
summary_memory = ConversationSummaryMemory(
    llm=llm,  # Usa o mesmo LLM pra resumir
    return_messages=False,  # Retorna como string
    memory_key="chat_history"
)

# Criando uma nova chain
conversation_summary = ConversationChain(
    llm=llm,
    memory=summary_memory,
    verbose=True
)

print("‚úÖ ConversationSummaryMemory criada!")
print("üìã Esta mem√≥ria faz resumos autom√°ticos da conversa!")
print("ü§ñ O pr√≥prio LLM vai resumir conforme a conversa cresce!")

In [None]:
# Testando o SummaryMemory
print("üó£Ô∏è Testando SummaryMemory...\n")

# Vamos simular uma conversa longa
mensagens_longas = [
    "Oi! Meu nome √© Carlos, tenho 30 anos e sou engenheiro de software.",
    "Trabalho numa startup de fintech aqui em S√£o Paulo h√° 3 anos.",
    "Estou desenvolvendo um app de investimentos em Python e React.",
    "O app j√° tem 10.000 usu√°rios e est√° crescendo 20% ao m√™s.",
    "Estamos levantando uma rodada de investimento de R$ 2 milh√µes.",
    "Me fala um resumo de tudo que conversamos at√© agora?"
]

for i, mensagem in enumerate(mensagens_longas, 1):
    print(f"üì® Mensagem {i}: {mensagem}")
    resposta = conversation_summary.predict(input=mensagem)
    print(f"ü§ñ Bot: {resposta}\n")
    
    # Vamos espiar o resumo que est√° sendo mantido
    if i > 2:  # Depois de algumas mensagens
        resumo_atual = summary_memory.buffer
        print(f"üìã Resumo na mem√≥ria: {resumo_atual[:150]}...\n")
    
    print("-" * 80)

## üîÑ 4. ConversationSummaryBufferMemory - O H√≠brido

E agora o **melhor dos dois mundos**! O SummaryBufferMemory:

- Mant√©m as mensagens **recentes** completas
- **Resume** as mensagens antigas

√â tipo ter um assistente que anota tudo detalhado no dia, mas faz resumos do m√™s passado!

In [None]:
# Criando um ConversationSummaryBufferMemory
from langchain.memory import ConversationSummaryBufferMemory

# Inicializando com limite de tokens
summary_buffer_memory = ConversationSummaryBufferMemory(
    llm=llm,
    max_token_limit=200,  # Quando passar disso, resume as antigas
    return_messages=True,
    memory_key="chat_history"
)

# Criando uma nova chain
conversation_summary_buffer = ConversationChain(
    llm=llm,
    memory=summary_buffer_memory,
    verbose=True
)

print("‚úÖ ConversationSummaryBufferMemory criada!")
print("üîÑ Esta mem√≥ria combina resumo + buffer!")
print("üìä Limite: 200 tokens - depois disso resume as antigas!")

In [None]:
# Testando o SummaryBufferMemory
print("üó£Ô∏è Testando SummaryBufferMemory...\n")

mensagens_hibridas = [
    "Sou a Ana, m√©dica veterin√°ria de 28 anos.",
    "Trabalho numa cl√≠nica veterin√°ria em Belo Horizonte desde 2020.",
    "Tenho especializa√ß√£o em animais ex√≥ticos - papagaios, iguanas, etc.",
    "Atendo cerca de 50 animais por semana, a maioria c√£es e gatos.",
    "Estou pensando em abrir minha pr√≥pria cl√≠nica no ano que vem.",
    "Qual √© a minha profiss√£o e onde trabalho?"
]

for i, mensagem in enumerate(mensagens_hibridas, 1):
    print(f"üì® Mensagem {i}: {mensagem}")
    resposta = conversation_summary_buffer.predict(input=mensagem)
    print(f"ü§ñ Bot: {resposta}\n")
    
    # Verificando o estado da mem√≥ria
    memoria_vars = summary_buffer_memory.load_memory_variables({})
    print(f"üß† Estado da mem√≥ria ap√≥s mensagem {i}:")
    if hasattr(summary_buffer_memory, 'moving_summary_buffer') and summary_buffer_memory.moving_summary_buffer:
        print(f"üìã Tem resumo: {summary_buffer_memory.moving_summary_buffer[:100]}...")
    else:
        print("üìã Ainda n√£o tem resumo - s√≥ mensagens recentes")
    
    print("-" * 70)

## üìä Compara√ß√£o Pr√°tica dos Memory Types

Vamos fazer um teste pr√°tico pra ver como cada tipo se comporta:

In [None]:
# Fun√ß√£o para calcular tamanho aproximado da mem√≥ria
def calcular_tamanho_memoria(memory_obj):
    """Calcula o tamanho aproximado da mem√≥ria em caracteres"""
    try:
        # Tenta carregar as vari√°veis da mem√≥ria
        vars_memoria = memory_obj.load_memory_variables({})
        
        # Soma todos os caracteres
        tamanho_total = 0
        for key, value in vars_memoria.items():
            if isinstance(value, str):
                tamanho_total += len(value)
            elif isinstance(value, list):
                for item in value:
                    if hasattr(item, 'content'):
                        tamanho_total += len(item.content)
                    else:
                        tamanho_total += len(str(item))
        
        return tamanho_total
    except:
        return 0

# Testando com uma sequ√™ncia de mensagens
mensagens_comparacao = [
    "Oi, sou o Pedro, desenvolvedore Python de 35 anos.",
    "Trabalho com IA e Machine Learning h√° 8 anos.",
    "J√° criei mais de 100 modelos de ML em produ√ß√£o.",
    "Especialista em LangChain, FastAPI e AWS.",
    "Dou aulas online e j√° treinei mais de 5000 alunos."
]

# Criando memorias limpas para compara√ß√£o
memorias_teste = {
    'Buffer': ConversationBufferMemory(return_messages=True),
    'Window': ConversationBufferWindowMemory(k=4, return_messages=True),
    'Summary': ConversationSummaryMemory(llm=llm),
    'SummaryBuffer': ConversationSummaryBufferMemory(llm=llm, max_token_limit=150)
}

# Simulando as mensagens em todas as mem√≥rias
for mensagem in mensagens_comparacao:
    for nome, memoria in memorias_teste.items():
        # Simula uma conversa adicionando mensagem do usu√°rio e uma resposta padr√£o
        memoria.save_context(
            {"input": mensagem}, 
            {"output": f"Entendi! Obrigado por compartilhar isso, {mensagem.split()[2] if len(mensagem.split()) > 2 else 'usu√°rio'}!"}
        )

print("üìä Compara√ß√£o de tamanhos de mem√≥ria ap√≥s 5 intera√ß√µes:")
print("=" * 60)

tamanhos = {}
for nome, memoria in memorias_teste.items():
    tamanho = calcular_tamanho_memoria(memoria)
    tamanhos[nome] = tamanho
    print(f"{nome:15} : {tamanho:4d} caracteres")

print("\nüí° Conclus√µes:")
print(f"ü•á Mais eficiente: {min(tamanhos, key=tamanhos.get)}")
print(f"üìö Mais completo: {max(tamanhos, key=tamanhos.get)}")

## üìä Visualiza√ß√£o Final - Efici√™ncia vs Completude

In [None]:
# Gr√°fico de barras comparativo final
nomes = list(tamanhos.keys())
valores = list(tamanhos.values())
cores = ['red', 'orange', 'green', 'blue']

plt.figure(figsize=(12, 8))

# Gr√°fico de barras
bars = plt.bar(nomes, valores, color=cores, alpha=0.7, edgecolor='black', linewidth=2)

# Customiza√ß√£o
plt.title('üìä Compara√ß√£o de Uso de Mem√≥ria\n(Menor = Mais Eficiente)', 
          fontsize=16, fontweight='bold', pad=20)
plt.ylabel('Caracteres Utilizados', fontsize=12, fontweight='bold')
plt.xlabel('Tipos de Memory', fontsize=12, fontweight='bold')

# Adicionando valores nas barras
for bar, valor in zip(bars, valores):
    plt.text(bar.get_x() + bar.get_width()/2, bar.get_height() + max(valores)*0.01, 
             f'{valor}', ha='center', va='bottom', fontweight='bold', fontsize=11)

# Adicionando linha de refer√™ncia
plt.axhline(y=np.mean(valores), color='red', linestyle='--', alpha=0.7, 
            label=f'M√©dia: {int(np.mean(valores))}')

plt.legend()
plt.grid(axis='y', alpha=0.3)
plt.tight_layout()
plt.show()

print("üìà Liiindo! Agora voc√™ sabe exatamente qual memory usar!")

## üí° Dicas Pr√°ticas do Pedro

### üéØ Quando usar cada tipo?

| Tipo | Use quando | Exemplo |
|------|------------|--------|
| **Buffer** | Conversas curtas e precisas | Chat de suporte |
| **Window** | Conversas longas, contexto recente | Games, assistentes |
| **Summary** | Conversas muito longas | Terapia, consultoria |
| **SummaryBuffer** | Melhor dos dois mundos | Assistentes corporativos |

### üöÄ Dicas de Performance:

1. **Monitore o tamanho**: Use `len()` na mem√≥ria
2. **Defina limites**: Sempre coloque `max_token_limit`
3. **Teste em produ√ß√£o**: Cada caso √© um caso
4. **Combine tipos**: Use diferentes mem√≥rias pra diferentes usu√°rios

### ‚ö†Ô∏è Pegadinhas Comuns:

- **BufferMemory** pode explodir o contexto
- **SummaryMemory** pode perder detalhes importantes
- **WindowMemory** esquece coisas antigas
- Todos custam tokens! üí∞

**Dica do Pedro**: Sempre teste com dados reais do seu dom√≠nio!

## üîß Exerc√≠cio 1: Implementando Memory Customizada

Bora criar uma mem√≥ria personalizada que atende √†s suas necessidades espec√≠ficas!

**Desafio**: Criar uma mem√≥ria que:
1. Mant√©m as √∫ltimas 3 mensagens completas
2. Salva informa√ß√µes importantes do usu√°rio (nome, profiss√£o, etc.)
3. Mostra um resumo das informa√ß√µes salvas

In [None]:
# EXERC√çCIO 1: Implemente uma MemoryCustomizada
class MemoryCustomizada:
    def __init__(self):
        self.mensagens_recentes = []  # √öltimas 3 mensagens
        self.info_usuario = {}        # Informa√ß√µes importantes
        self.max_mensagens = 3
    
    def adicionar_mensagem(self, usuario_msg, bot_msg):
        """Adiciona uma nova troca de mensagens"""
        # TODO: Implementar l√≥gica para:
        # 1. Adicionar mensagem √† lista
        # 2. Manter apenas as √∫ltimas 3
        # 3. Extrair informa√ß√µes importantes (nome, idade, profiss√£o)
        pass
    
    def get_contexto(self):
        """Retorna o contexto atual para o LLM"""
        # TODO: Implementar l√≥gica para:
        # 1. Formatar mensagens recentes
        # 2. Incluir informa√ß√µes do usu√°rio
        # 3. Retornar string formatada
        pass

# Teste sua implementa√ß√£o aqui:
# memory_custom = MemoryCustomizada()
# memory_custom.adicionar_mensagem("Oi, sou Jo√£o", "Prazer, Jo√£o!")
# print(memory_custom.get_contexto())

print("üèóÔ∏è Seu turno! Implemente a MemoryCustomizada acima")
print("üí° Dica: Use regex ou split() para extrair informa√ß√µes")

## üéÆ Exerc√≠cio 2: Sistema de Memory Inteligente

**Desafio Avan√ßado**: Criar um sistema que **escolhe automaticamente** o tipo de mem√≥ria baseado no contexto!

**Regras**:
- Se conversa < 5 mensagens ‚Üí BufferMemory
- Se conversa entre 5-15 mensagens ‚Üí WindowMemory
- Se conversa > 15 mensagens ‚Üí SummaryBufferMemory

In [None]:
# EXERC√çCIO 2: Sistema Inteligente de Memory
class MemoryInteligente:
    def __init__(self, llm):
        self.llm = llm
        self.contador_mensagens = 0
        self.memory_atual = None
        self.tipo_atual = None
    
    def escolher_memory_tipo(self):
        """Escolhe o tipo de mem√≥ria baseado no n√∫mero de mensagens"""
        # TODO: Implementar l√≥gica de escolha
        # Retorna: 'buffer', 'window', ou 'summary_buffer'
        pass
    
    def processar_mensagem(self, input_msg):
        """Processa uma nova mensagem com a mem√≥ria apropriada"""
        # TODO: Implementar l√≥gica para:
        # 1. Incrementar contador
        # 2. Escolher tipo de mem√≥ria
        # 3. Migrar dados se necess√°rio
        # 4. Processar mensagem
        pass
    
    def migrar_memoria(self, memoria_antiga, tipo_novo):
        """Migra dados entre diferentes tipos de mem√≥ria"""
        # TODO: Implementar migra√ß√£o de dados
        pass

# Teste seu sistema aqui:
# memory_smart = MemoryInteligente(llm)
# for i in range(20):
#     resultado = memory_smart.processar_mensagem(f"Mensagem {i+1}")
#     print(f"Mensagem {i+1}: Usando {memory_smart.tipo_atual}")

print("üß† Desafio avan√ßado! Crie um sistema que se adapta automaticamente")
print("üéØ Objetivo: Otimizar performance baseado no tamanho da conversa")

## üéØ Casos de Uso Reais

Vamos ver onde cada tipo de mem√≥ria brilha na vida real:

In [None]:
# Simulando casos de uso reais
casos_uso = {
    "üè• Suporte M√©dico": {
        "memory": "SummaryBuffer",
        "motivo": "Precisa lembrar hist√≥rico m√©dico completo + sintomas recentes",
        "exemplo": "Paciente com diabetes menciona novos sintomas"
    },
    "üõí E-commerce": {
        "memory": "Window",
        "motivo": "Foco nos produtos vistos recentemente",
        "exemplo": "Cliente comparando smartphones nas √∫ltimas mensagens"
    },
    "üìö Tutor Educacional": {
        "memory": "Buffer",
        "motivo": "Conversas curtas e focadas em exerc√≠cios espec√≠ficos",
        "exemplo": "Explicando um conceito de matem√°tica"
    },
    "üíº Assistente Executivo": {
        "memory": "SummaryBuffer",
        "motivo": "Precisa lembrar decis√µes passadas + contexto atual",
        "exemplo": "Acompanhando projeto de 6 meses com reuni√µes semanais"
    }
}

print("üéØ CASOS DE USO REAIS")
print("=" * 60)

for caso, info in casos_uso.items():
    print(f"\n{caso}")
    print(f"   Memory: {info['memory']}")
    print(f"   Por qu√™: {info['motivo']}")
    print(f"   Exemplo: {info['exemplo']}")

print("\nüí° A escolha da mem√≥ria pode fazer ou quebrar seu produto!")

## üîÆ Preparando para os Pr√≥ximos M√≥dulos

Liiiindo! Agora que dominamos Memory Systems, vamos ver como isso se conecta com o que vem por a√≠:

### üóÇÔ∏è M√≥dulo 6 - Document Loading
- **Conex√£o**: Vamos usar mem√≥ria para lembrar de documentos processados
- **Prepara√ß√£o**: Memory vai guardar contexto de m√∫ltiplos documentos

### üîç M√≥dulo 7 - Vector Store
- **Conex√£o**: Memory + Vector Store = busca sem√¢ntica com contexto
- **Prepara√ß√£o**: Combinar mem√≥ria conversacional com busca em documentos

### ü§ñ M√≥dulo 8 - RAG
- **Conex√£o**: Memory √© ESSENCIAL no RAG para conversas contextuais
- **Prepara√ß√£o**: "Lembre do que discutimos sobre este documento"

**Dica do Pedro**: Memory √© a base para construir assistentes inteligentes de verdade!

In [None]:
# Preview do que vem no pr√≥ximo m√≥dulo
print("üîÆ PREVIEW - PR√ìXIMO M√ìDULO")
print("=" * 40)
print("üìö Document Loading & Splitters")
print("")
print("Vamos aprender a:")
print("‚Ä¢ Carregar PDFs, Word, websites")
print("‚Ä¢ Dividir documentos grandes")
print("‚Ä¢ Combinar com Memory Systems")
print("‚Ä¢ Preparar dados para RAG")
print("")
print("üöÄ Com Memory + Documents = Assistente que lembra E aprende!")

# Salvando um exemplo de memory para usar no pr√≥ximo m√≥dulo
import pickle

# Criando uma mem√≥ria de exemplo para carregar no pr√≥ximo m√≥dulo
memory_exemplo = ConversationBufferMemory(return_messages=True)
memory_exemplo.save_context(
    {"input": "Vou analisar alguns documentos sobre IA"}, 
    {"output": "Perfeito! Vou lembrar que voc√™ est√° interessado em documentos sobre IA!"}
)

print("üíæ Mem√≥ria de exemplo salva para o pr√≥ximo m√≥dulo!")

## üéä Resumo Final - O que Aprendemos

### ‚úÖ Conceitos Dominados:

1. **üß† Por que Memory √© Essencial**
   - LLMs s√£o stateless por padr√£o
   - Memory transforma bots em assistentes

2. **üóÉÔ∏è ConversationBufferMemory**
   - Guarda tudo
   - Perfeito para conversas curtas

3. **ü™ü ConversationBufferWindowMemory**
   - Mant√©m √∫ltimas N mensagens
   - Controla o tamanho do contexto

4. **üìã ConversationSummaryMemory**
   - Resume conversas automaticamente
   - Muito eficiente em tokens

5. **üîÑ ConversationSummaryBufferMemory**
   - Melhor dos dois mundos
   - Buffer recente + resumo antigo

### üéØ Quando Usar Cada Um:

| Cen√°rio | Memory Ideal | Por qu√™ |
|---------|-------------|--------|
| Chat suporte | Buffer | Conversas curtas e precisas |
| Game/App | Window | Contexto recente mais importante |
| Consultoria | Summary | Conversas muito longas |
| Assistente corporativo | SummaryBuffer | Equilibrio perfeito |

### üöÄ Pr√≥ximos Passos:
- M√≥dulo 6: Document Loading (como dar "conhecimento" pro bot)
- M√≥dulo 7: Vector Store (busca sem√¢ntica inteligente) 
- M√≥dulo 8: RAG (combinando tudo!)

**Dica Final do Pedro**: Memory √© o primeiro passo para criar assistentes que realmente **entendem** e **lembram**. No pr√≥ximo m√≥dulo vamos dar "conhecimento" pra eles!

![](/Users/pedroguth/Downloads/Projetos/Book Maker/5-Imagens/langchain---usando-vers√£o-v0.2-modulo-05_img_01.png)