# üß† Memory Systems - A Mem√≥ria que Faltava na sua IA!

**M√≥dulo 7 de 17 - LangChain v0.3**

Eai pessoal! Tudo certo? üöÄ

At√© agora a gente viu Chains, Prompts, OutputParsers... mas cara, tem um problem√£o! Toda vez que voc√™ faz uma pergunta pro seu modelo, ele esquece completamente da conversa anterior. √â como se voc√™ tivesse um amigo com amn√©sia total!

**T√°, mas o que √© Memory System mesmo?**

√â literalmente dar mem√≥ria pro seu chatbot! Imagina que voc√™ t√° conversando com algu√©m e a pessoa esquece seu nome a cada 2 minutos... chato n√©? √â exatamente isso que acontece sem Memory Systems.

Bora resolver isso! üî•

## üéØ O que vamos aprender hoje?

1. **Por que precisamos de mem√≥ria?** (spoiler: LLMs s√£o meio "esquecidos")
2. **Tipos de Memory no LangChain**
3. **ConversationBufferMemory** - A mais simples
4. **ConversationSummaryMemory** - Quando a conversa fica longa
5. **ConversationBufferWindowMemory** - Mem√≥ria com "janela"
6. **Implementando na pr√°tica**
7. **Preparando pro RAG** (m√≥dulo 10)

**Dica!** Mem√≥ria vai ser FUNDAMENTAL quando a gente chegar no RAG e nos Agents!

In [None]:
# Setup inicial - Bora instalar o que precisamos!
!pip install langchain langchain-google-genai python-dotenv matplotlib -q

import os
from dotenv import load_dotenv
import matplotlib.pyplot as plt
import numpy as np

# Carregando vari√°veis de ambiente
load_dotenv()

print("‚úÖ Tudo instalado! Bora pro pr√≥ximo passo!")

In [None]:
# Configurando o modelo que vamos usar (nosso querido Gemini!)
from langchain_google_genai import ChatGoogleGenerativeAI
from langchain.schema import HumanMessage, AIMessage

# Usando o Gemini 2.0 Flash (como vimos no m√≥dulo 2)
model = ChatGoogleGenerativeAI(
    model="gemini-2.0-flash-exp",
    google_api_key=os.getenv("GOOGLE_API_KEY"),
    temperature=0.7
)

print("ü§ñ Modelo configurado! Vamos testar sem mem√≥ria primeiro...")

# Teste simples sem mem√≥ria
response1 = model.invoke("Oi! Meu nome √© Jo√£o")
print(f"Resposta 1: {response1.content}")

response2 = model.invoke("Qual √© o meu nome?")
print(f"\nResposta 2: {response2.content}")

print("\nüòÖ Viu s√≥? Ele esqueceu seu nome! √â por isso que precisamos de mem√≥ria!")

## üß© Entendendo o Problema

**T√°, mas por que isso acontece?**

Os LLMs (Large Language Models) s√£o **stateless** - isso significa que eles n√£o guardam nada entre as conversas. √â como se voc√™ ligasse pro atendimento e a cada pergunta te transferissem pra uma pessoa diferente que n√£o sabe de nada!

### Como funciona sem mem√≥ria:

```
Voc√™: "Oi, meu nome √© Jo√£o"
IA: "Ol√° Jo√£o! Como posso ajudar?"

Voc√™: "Qual meu nome?"
IA: "Desculpe, n√£o sei seu nome" ü§¶‚Äç‚ôÇÔ∏è
```

### Como funciona COM mem√≥ria:

```
Voc√™: "Oi, meu nome √© Jo√£o"
IA: "Ol√° Jo√£o! Como posso ajudar?"
[MEM√ìRIA SALVA: Usuario se chama Jo√£o]

Voc√™: "Qual meu nome?"
IA: "Seu nome √© Jo√£o!" ‚úÖ
```

**Dica!** A mem√≥ria no LangChain funciona como um "caderninho" que vai anotando toda a conversa!

## üìö Tipos de Memory no LangChain

O LangChain tem v√°rios tipos de mem√≥ria, cada um pra uma situa√ß√£o:

### 1. **ConversationBufferMemory** üìù
- Guarda TODA a conversa
- Simples e direta
- Problema: Pode ficar muito longa

### 2. **ConversationSummaryMemory** üóûÔ∏è
- Resume conversas longas
- Economiza tokens
- Ideal pra conversas extensas

### 3. **ConversationBufferWindowMemory** ü™ü
- Mant√©m apenas as √∫ltimas N mensagens
- Tipo "mem√≥ria de peixinho"
- Boa pra conversas focadas

### 4. **ConversationSummaryBufferMemory** üéØ
- Combina resumo + buffer
- A mais sofisticada

**Analogia:** √â como escolher entre um caderno completo, um resumo do caderno, ou s√≥ as √∫ltimas p√°ginas!

**Dica!** Vamos come√ßar pela mais simples e ir evoluindo!

In [None]:
# Importando as mem√≥rias que vamos usar
from langchain.memory import (
    ConversationBufferMemory,
    ConversationSummaryMemory,
    ConversationBufferWindowMemory
)
from langchain.chains import ConversationChain

print("üì¶ Imports feitos! Agora vamos ver cada tipo na pr√°tica...")

# Visualizando os tipos de mem√≥ria
memory_types = ['Buffer\n(Completa)', 'Summary\n(Resumida)', 'Window\n(Janela)']
memory_sizes = [100, 30, 50]  # Tamanho relativo da mem√≥ria
colors = ['#FF6B6B', '#4ECDC4', '#45B7D1']

plt.figure(figsize=(10, 6))
bars = plt.bar(memory_types, memory_sizes, color=colors, alpha=0.8)
plt.title('Tipos de Memory Systems - Compara√ß√£o de Tamanho', fontsize=16, fontweight='bold')
plt.ylabel('Tamanho da Mem√≥ria (relativo)', fontsize=12)
plt.xlabel('Tipos de Mem√≥ria', fontsize=12)

# Adicionando valores nas barras
for bar, size in zip(bars, memory_sizes):
    plt.text(bar.get_x() + bar.get_width()/2, bar.get_height() + 1, 
             f'{size}%', ha='center', fontweight='bold')

plt.grid(axis='y', alpha=0.3)
plt.tight_layout()
plt.show()

print("üìä Cada tipo tem seu uso espec√≠fico! Vamos testar cada um...")

## üéØ ConversationBufferMemory - A B√°sica

**T√°, mas como funciona a Buffer Memory?**

√â bem simples! Ela salva literalmente TUDO que foi falado. Imagina um gravador que nunca para de gravar.

### Estrutura da Buffer Memory:

$$\text{Memory} = \{\text{Human}_1, \text{AI}_1, \text{Human}_2, \text{AI}_2, ..., \text{Human}_n, \text{AI}_n\}$$

Onde cada par (Human, AI) √© uma intera√ß√£o completa.

**Vantagens:**
- ‚úÖ Contexto completo
- ‚úÖ F√°cil de implementar
- ‚úÖ Nada se perde

**Desvantagens:**
- ‚ùå Pode ficar muito longa
- ‚ùå Cara em tokens
- ‚ùå Pode passar do limite do modelo

**Dica!** Use quando voc√™ tem conversas curtas ou quando o contexto completo √© crucial!

In [None]:
# Criando nossa primeira mem√≥ria - ConversationBufferMemory
buffer_memory = ConversationBufferMemory()

# Criando uma chain com mem√≥ria (lembra das chains do m√≥dulo 6?)
conversation_chain = ConversationChain(
    llm=model,
    memory=buffer_memory,
    verbose=True  # Pra ver o que t√° rolando por baixo dos panos
)

print("üéâ Chain com mem√≥ria criada! Bora testar...")

# Teste 1 - Apresenta√ß√£o
response1 = conversation_chain.predict(input="Oi! Meu nome √© Pedro e eu sou instrutor de IA")
print(f"\nü§ñ Resposta 1: {response1}")

# Teste 2 - Pergunta sobre a informa√ß√£o anterior
response2 = conversation_chain.predict(input="Qual √© meu nome e minha profiss√£o?")
print(f"\nü§ñ Resposta 2: {response2}")

print("\nüéØ Liiindo! Agora ele lembra! Vamos ver o que tem na mem√≥ria...")

In [None]:
# Investigando o que tem dentro da mem√≥ria
print("üîç O que tem na mem√≥ria Buffer:")
print("=" * 50)
print(buffer_memory.buffer)
print("=" * 50)

# Vamos ver as vari√°veis da mem√≥ria tamb√©m
print("\nüìù Vari√°veis da mem√≥ria:")
memory_variables = buffer_memory.load_memory_variables({})
print(memory_variables)

# Adicionando mais uma intera√ß√£o pra ver como cresce
response3 = conversation_chain.predict(input="Quais s√£o suas linguagens de programa√ß√£o favoritas?")
print(f"\nü§ñ Resposta 3: {response3}")

print("\nüìà Vamos ver como a mem√≥ria cresceu:")
print("=" * 50)
print(buffer_memory.buffer)
print("=" * 50)

## üóûÔ∏è ConversationSummaryMemory - A Inteligente

**E quando a conversa fica muito longa?**

A√≠ que entra a Summary Memory! Ao inv√©s de guardar tudo palavra por palavra, ela vai fazendo um resumo da conversa. √â como ter uma secret√°ria que vai anotando s√≥ o importante!

### Como funciona:

1. **Conversa acontece** üí¨
2. **IA resume o que foi dito** üìÑ 
3. **Pr√≥xima pergunta usa o resumo** üîÑ

### F√≥rmula da Summary Memory:

$$\text{Summary}_{n+1} = \text{Summarize}(\text{Summary}_n + \text{New Interaction})$$

**Vantagens:**
- ‚úÖ Economiza tokens
- ‚úÖ N√£o estoura limite do modelo
- ‚úÖ Mant√©m informa√ß√µes importantes

**Desvantagens:**
- ‚ùå Pode perder detalhes
- ‚ùå Gasta tokens pra fazer resumo
- ‚ùå Resumo pode n√£o ser perfeito

**Dica!** Ideal pra conversas longas onde voc√™ precisa do contexto geral, mas n√£o de cada palavra!

In [None]:
# Criando Summary Memory
summary_memory = ConversationSummaryMemory(
    llm=model,  # Precisa do modelo pra fazer os resumos
    return_messages=True
)

# Chain com summary memory
summary_chain = ConversationChain(
    llm=model,
    memory=summary_memory,
    verbose=True
)

print("üìÑ Summary Memory criada! Vamos simular uma conversa longa...")

# Simulando v√°rias intera√ß√µes
interactions = [
    "Oi! Sou Maria, tenho 30 anos e trabalho como desenvolvedora Python em S√£o Paulo",
    "Estou aprendendo IA e machine learning h√° 6 meses",
    "Meu projeto atual √© um sistema de recomenda√ß√£o para e-commerce",
    "Uso principalmente scikit-learn e tensorflow no meu trabalho",
    "Qual √© meu nome, idade e em que cidade trabalho?"
]

responses = []
for i, interaction in enumerate(interactions):
    response = summary_chain.predict(input=interaction)
    responses.append(response)
    print(f"\nüîÑ Intera√ß√£o {i+1}:")
    print(f"Voc√™: {interaction}")
    print(f"IA: {response[:100]}...")

print("\nüéØ Vamos ver o resumo que foi criado!")

In [None]:
# Investigando o resumo criado
print("üìã Resumo da conversa:")
print("=" * 60)
summary_variables = summary_memory.load_memory_variables({})
print(summary_variables['history'])
print("=" * 60)

# Comparando tamanhos - Buffer vs Summary
buffer_size = len(buffer_memory.buffer) if hasattr(buffer_memory, 'buffer') else 0
summary_size = len(str(summary_variables['history']))

print(f"\nüìä Compara√ß√£o de tamanhos:")
print(f"Buffer Memory: {buffer_size} caracteres")
print(f"Summary Memory: {summary_size} caracteres")

if summary_size < buffer_size:
    reduction = ((buffer_size - summary_size) / buffer_size) * 100
    print(f"\nüéâ Summary Memory √© {reduction:.1f}% menor!")

print("\nüí° Viu a diferen√ßa? O resumo mant√©m o essencial mas economiza espa√ßo!")

## ü™ü ConversationBufferWindowMemory - A Focada

**E se eu quiser s√≥ as √∫ltimas conversas?**

Perfeito! √â exatamente pra isso que serve a Window Memory. Ela funciona como uma "janela deslizante" - mant√©m apenas as √∫ltimas N intera√ß√µes.

### Analogia da Janela:
Imagina que voc√™ t√° olhando pela janela de um trem em movimento. Voc√™ s√≥ v√™ a paisagem que t√° passando agora, n√£o o que j√° passou l√° atr√°s!

### Funcionamento:

```
Window Size = 3

Mensagem 1, 2, 3 ‚Üí [1, 2, 3]
Mensagem 4 ‚Üí [2, 3, 4] (remove a 1)
Mensagem 5 ‚Üí [3, 4, 5] (remove a 2)
```

**Vantagens:**
- ‚úÖ Tamanho fixo e previs√≠vel
- ‚úÖ Foco no contexto recente
- ‚úÖ N√£o estoura limites

**Desvantagens:**
- ‚ùå Perde informa√ß√µes antigas
- ‚ùå Pode quebrar contexto longo

**Dica!** Ideal pra conversas onde s√≥ o contexto recente importa (tipo um chatbot de suporte)!

In [None]:
# Criando Window Memory com janela de 3 intera√ß√µes
window_memory = ConversationBufferWindowMemory(
    k=3,  # Mant√©m apenas as 3 √∫ltimas intera√ß√µes
    return_messages=True
)

# Chain com window memory
window_chain = ConversationChain(
    llm=model,
    memory=window_memory,
    verbose=True
)

print("ü™ü Window Memory criada (janela = 3)! Vamos testar...")

# Simulando 6 intera√ß√µes pra ver a janela deslizar
test_messages = [
    "Msg 1: Oi, sou Carlos",
    "Msg 2: Trabalho com dados", 
    "Msg 3: Moro no Rio de Janeiro",
    "Msg 4: Tenho 25 anos",
    "Msg 5: Gosto de futebol",
    "Msg 6: Qual meu nome? (deve lembrar)",
    "Msg 7: Onde eu trabalho? (deve esquecer - muito antiga!)"
]

for i, msg in enumerate(test_messages):
    response = window_chain.predict(input=msg)
    
    print(f"\n--- Intera√ß√£o {i+1} ---")
    print(f"Entrada: {msg}")
    print(f"Resposta: {response[:80]}...")
    
    # Mostrando o que tem na janela atual
    current_window = window_memory.load_memory_variables({})
    window_size = len(str(current_window['history']))
    print(f"Tamanho da janela: {window_size} chars")
    
    if i >= 2:  # Ap√≥s 3 mensagens, mostrar que a janela desliza
        print("ü™ü Janela deslizando - informa√ß√µes antigas sendo removidas!")

In [None]:
# Visualizando como a Window Memory funciona
import matplotlib.pyplot as plt
import numpy as np

# Simulando o deslizamento da janela
messages = list(range(1, 8))  # Mensagens 1 a 7
window_size = 3

fig, ax = plt.subplots(figsize=(12, 8))

# Criando visualiza√ß√£o do deslizamento
for i, msg_num in enumerate(messages):
    # Calculando quais mensagens est√£o na janela
    if msg_num <= window_size:
        window_start = 1
        window_end = msg_num
    else:
        window_start = msg_num - window_size + 1
        window_end = msg_num
    
    # Plotando todas as mensagens
    y_pos = len(messages) - i - 1
    
    # Mensagens fora da janela (cinza)
    for m in range(1, window_start):
        ax.add_patch(plt.Rectangle((m-0.4, y_pos-0.4), 0.8, 0.8, 
                                  facecolor='lightgray', alpha=0.5))
    
    # Mensagens na janela (colorido)
    colors = ['#FF6B6B', '#4ECDC4', '#45B7D1']
    for j, m in enumerate(range(window_start, window_end + 1)):
        color = colors[j % len(colors)]
        ax.add_patch(plt.Rectangle((m-0.4, y_pos-0.4), 0.8, 0.8, 
                                  facecolor=color, alpha=0.7))
    
    # Mensagens futuras (vazio)
    for m in range(window_end + 1, 8):
        ax.add_patch(plt.Rectangle((m-0.4, y_pos-0.4), 0.8, 0.8, 
                                  facecolor='white', edgecolor='gray', alpha=0.3))

# Configurando o plot
ax.set_xlim(0, 8)
ax.set_ylim(-1, len(messages))
ax.set_xlabel('Mensagens', fontsize=12)
ax.set_ylabel('Momento da Conversa', fontsize=12)
ax.set_title('Window Memory - Como a Janela Desliza (Window Size = 3)', fontsize=14, fontweight='bold')

# Labels
ax.set_xticks(range(1, 8))
ax.set_xticklabels([f'Msg {i}' for i in range(1, 8)])
ax.set_yticks(range(len(messages)))
ax.set_yticklabels([f'Ap√≥s Msg {i+1}' for i in range(len(messages))][::-1])

# Legenda
from matplotlib.patches import Patch
legend_elements = [
    Patch(facecolor='#FF6B6B', alpha=0.7, label='Na Janela (lembrada)'),
    Patch(facecolor='lightgray', alpha=0.5, label='Fora da Janela (esquecida)'),
    Patch(facecolor='white', edgecolor='gray', alpha=0.3, label='Ainda n√£o enviada')
]
ax.legend(handles=legend_elements, loc='upper right')

plt.grid(True, alpha=0.3)
plt.tight_layout()
plt.show()

print("üìä Assim funciona a Window Memory! Vai deslizando e esquecendo o passado...")

## ‚öñÔ∏è Comparando os Tr√™s Tipos

**T√°, mas qual usar quando?**

Cada tipo de mem√≥ria tem seu lugar! Vamos fazer um comparativo pr√°tico:

| Tipo | Quando Usar | Pr√≥s | Contras |
|------|-------------|------|----------|
| **Buffer** | Conversas curtas, contexto completo necess√°rio | Nada se perde | Pode ficar muito grande |
| **Summary** | Conversas longas, contexto geral importante | Economiza tokens | Pode perder detalhes |
| **Window** | Contexto recente √© o que importa | Tamanho previs√≠vel | Esquece o passado |

### F√≥rmula de Escolha:

$$\text{Memory Type} = \begin{cases} 
\text{Buffer} & \text{se } \text{conversa} < 10 \text{ intera√ß√µes} \\
\text{Summary} & \text{se } \text{contexto hist√≥rico importante} \\
\text{Window} & \text{se } \text{s√≥ contexto recente importa}
\end{cases}$$

**Dica!** Na d√∫vida, comece com Buffer pra conversas simples e Window pra chatbots!

In [None]:
# Vamos fazer um teste comparativo lado a lado!
from langchain.memory import ConversationBufferMemory, ConversationBufferWindowMemory
from langchain.chains import ConversationChain

# Criando tr√™s chains diferentes
buffer_mem = ConversationBufferMemory()
window_mem = ConversationBufferWindowMemory(k=2)  # Janela pequena pra ver diferen√ßa

buffer_chain = ConversationChain(llm=model, memory=buffer_mem, verbose=False)
window_chain = ConversationChain(llm=model, memory=window_mem, verbose=False)

# Teste com sequ√™ncia de mensagens
test_sequence = [
    "Meu nome √© Ana",
    "Tenho 28 anos", 
    "Moro em Bras√≠lia",
    "Trabalho como engenheira",
    "Qual meu nome e idade?"
]

print("ü•ä BATTLE ROYALE - Buffer vs Window!")
print("=" * 60)

buffer_responses = []
window_responses = []

for i, msg in enumerate(test_sequence):
    print(f"\nüì© Mensagem {i+1}: {msg}")
    
    # Testando Buffer
    buffer_response = buffer_chain.predict(input=msg)
    buffer_responses.append(buffer_response)
    
    # Testando Window  
    window_response = window_chain.predict(input=msg)
    window_responses.append(window_response)
    
    print(f"\nüß† Buffer: {buffer_response[:100]}...")
    print(f"ü™ü Window: {window_response[:100]}...")
    
    # Mostrando tamanho da mem√≥ria
    buffer_size = len(buffer_mem.buffer)
    window_vars = window_mem.load_memory_variables({})
    window_size = len(str(window_vars['history']))
    
    print(f"üìä Tamanhos - Buffer: {buffer_size}, Window: {window_size}")

print("\nüèÜ Resultado: Ambos t√™m seus m√©ritos! Depende do caso de uso.")

## üîß Memory Systems Customizadas

**E se eu quiser criar minha pr√≥pria mem√≥ria?**

Claro que d√°! O LangChain √© super flex√≠vel. Voc√™ pode:

1. **Customizar prompts das mem√≥rias**
2. **Combinar diferentes tipos**
3. **Adicionar filtros e regras**
4. **Integrar com bancos de dados**

### Exemplo Pr√°tico: Mem√≥ria com Filtro de Import√¢ncia

Vamos criar uma mem√≥ria que s√≥ guarda informa√ß√µes "importantes"!

**Dica!** Isso vai ser √∫til quando chegarmos no m√≥dulo de RAG - voc√™ vai querer filtrar o que vale a pena lembrar!

In [None]:
# Criando uma mem√≥ria customizada com filtro de import√¢ncia
from langchain.schema import BaseMessage
from langchain.memory.chat_message_histories import ChatMessageHistory

# Palavras-chave que consideramos "importantes"
important_keywords = [
    'nome', 'idade', 'trabalho', 'profiss√£o', 'empresa', 'projeto', 
    'problema', 'erro', 'help', 'ajuda', 'importante', 'urgente'
]

def is_important_message(message_text):
    """Verifica se uma mensagem cont√©m informa√ß√µes importantes"""
    message_lower = message_text.lower()
    return any(keyword in message_lower for keyword in important_keywords)

# Mem√≥ria customizada que filtra por import√¢ncia
class FilteredMemory(ConversationBufferMemory):
    def save_context(self, inputs, outputs):
        """Salva apenas contextos importantes"""
        input_text = inputs.get('input', '')
        output_text = outputs.get('response', '')
        
        # Verifica se √© importante
        if is_important_message(input_text) or is_important_message(output_text):
            print(f"üéØ Mensagem importante detectada! Salvando...")
            super().save_context(inputs, outputs)
        else:
            print(f"üòê Mensagem comum, n√£o salvando...")

# Testando nossa mem√≥ria customizada
filtered_memory = FilteredMemory()
filtered_chain = ConversationChain(llm=model, memory=filtered_memory, verbose=False)

print("üéõÔ∏è Mem√≥ria customizada criada! Vamos testar o filtro...")

test_messages = [
    "Oi, como voc√™ est√°?",  # Comum
    "Meu nome √© Roberto",   # Importante (nome)
    "Que dia bonito hoje",  # Comum  
    "Trabalho na Google",   # Importante (trabalho)
    "Gosto de caf√©",        # Comum
    "Preciso de ajuda com Python"  # Importante (ajuda)
]

for i, msg in enumerate(test_messages):
    print(f"\n--- Teste {i+1} ---")
    print(f"Mensagem: {msg}")
    response = filtered_chain.predict(input=msg)

print(f"\nüìã Mem√≥ria final (s√≥ o importante):")
print(filtered_memory.buffer)

## üöÄ Integrando Memory com Chains Avan√ßadas

**Lembra das Chains do m√≥dulo 6?** Agora vamos turbinar elas com mem√≥ria!

Podemos combinar:
- ‚úÖ **PromptTemplate** (m√≥dulo 4) + Memory
- ‚úÖ **OutputParser** (m√≥dulo 5) + Memory  
- ‚úÖ **Chains customizadas** (m√≥dulo 6) + Memory

Isso vai ser a base pro RAG que vamos ver no m√≥dulo 10!

**Dica!** Memory + Chains √© a combina√ß√£o perfeita pra criar chatbots inteligentes!

In [None]:
# Combinando Memory com PromptTemplate e OutputParser
from langchain.prompts import PromptTemplate
from langchain.output_parsers import PydanticOutputParser
from langchain.schema import OutputParserException
from pydantic import BaseModel, Field
from typing import List

# Modelo pra estruturar as respostas (do m√≥dulo 5)
class UserInfo(BaseModel):
    name: str = Field(description="Nome do usu√°rio")
    interests: List[str] = Field(description="Lista de interesses mencionados")
    questions: List[str] = Field(description="Perguntas feitas pelo usu√°rio")
    
# Parser estruturado
parser = PydanticOutputParser(pydantic_object=UserInfo)

# Prompt customizado que usa mem√≥ria
prompt = PromptTemplate(
    template="""Voc√™ √© um assistente que coleta informa√ß√µes sobre usu√°rios.
    
Hist√≥rico da conversa:
{history}

Pergunta atual: {input}

Com base no hist√≥rico e pergunta atual, extraia:
1. Nome do usu√°rio (se mencionado)
2. Interesses mencionados
3. Perguntas feitas

{format_instructions}

Se alguma informa√ß√£o n√£o foi mencionada, use valores padr√£o apropriados.""",
    input_variables=["history", "input"],
    partial_variables={"format_instructions": parser.get_format_instructions()}
)

# Mem√≥ria pra nossa chain avan√ßada
advanced_memory = ConversationBufferMemory(memory_key="history")

# Chain avan√ßada (do m√≥dulo 6 + mem√≥ria)
advanced_chain = ConversationChain(
    llm=model,
    prompt=prompt,
    memory=advanced_memory,
    verbose=True
)

print("üöÄ Chain avan√ßada com mem√≥ria criada! Testando...")

# Testando a chain avan√ßada
test_inputs = [
    "Oi! Sou Lucas e adoro programa√ß√£o",
    "Tamb√©m gosto muito de machine learning", 
    "Como posso aprender mais sobre IA?"
]

for i, user_input in enumerate(test_inputs):
    print(f"\nüîÑ Teste {i+1}: {user_input}")
    try:
        response = advanced_chain.predict(input=user_input)
        print(f"Raw response: {response[:200]}...")
        
        # Tentando parsear a resposta
        # parsed_info = parser.parse(response)
        # print(f"‚úÖ Info estruturada: {parsed_info}")
    except Exception as e:
        print(f"‚ùå Erro no parsing: {e}")
        print(f"Resposta bruta: {response}")

## üìä Exerc√≠cio Pr√°tico - Sistema de Atendimento

**Bora colocar a m√£o na massa!** üî•

Vamos criar um sistema de atendimento ao cliente que:
1. Lembra do hist√≥rico da conversa
2. Identifica o tipo de problema
3. Oferece solu√ß√µes personalizadas
4. Usa diferentes tipos de mem√≥ria

**Seu desafio:**
- Escolha o tipo de mem√≥ria mais adequado
- Crie prompts eficazes
- Teste com casos reais

**Dica!** Pense em como isso vai ajudar quando criarmos RAG com documentos de help!

In [None]:
# EXERC√çCIO: Sistema de Atendimento com Memory
# Sua miss√£o: completar este sistema!

from langchain.prompts import PromptTemplate
from langchain.memory import ConversationBufferWindowMemory  # Voc√™ pode mudar!

# 1. Escolha o tipo de mem√≥ria (complete aqui)
# TODO: Experimente diferentes tipos e veja qual funciona melhor
customer_memory = ConversationBufferWindowMemory(
    k=5,  # Ajuste este n√∫mero!
    memory_key="chat_history"
)

# 2. Crie um prompt para atendimento (complete aqui)
customer_service_prompt = PromptTemplate(
    template="""Voc√™ √© um atendente virtual experiente e emp√°tico.

Hist√≥rico da conversa:
{chat_history}

Cliente: {input}

Instru√ß√µes:
- Seja sempre educado e prestativo
- Use informa√ß√µes do hist√≥rico para personalizar respostas
- Identifique o tipo de problema (t√©cnico, comercial, d√∫vida)
- Ofere√ßa solu√ß√µes pr√°ticas
- Se n√£o souber algo, seja honesto

Resposta:""",
    input_variables=["chat_history", "input"]
)

# 3. Crie a chain de atendimento
customer_service_chain = ConversationChain(
    llm=model,
    prompt=customer_service_prompt,
    memory=customer_memory,
    verbose=False
)

print("üéß Sistema de Atendimento Online! Como posso ajudar?")

# 4. Simule uma conversa de atendimento
customer_conversation = [
    "Oi, estou com problema no meu pedido",
    "Meu nome √© Sandra Silva, CPF 123.456.789-00", 
    "Comprei um notebook mas n√£o chegou ainda",
    "O pedido foi feito h√° 15 dias, n√∫mero #12345",
    "Preciso do notebook urgente para trabalhar",
    "Voc√™s podem me dar uma previs√£o?"
]

for i, message in enumerate(customer_conversation):
    print(f"\nüë§ Cliente: {message}")
    response = customer_service_chain.predict(input=message)
    print(f"üéß Atendente: {response}")
    print("-" * 50)

print("\n‚úÖ Conversa√ß√£o finalizada!")

# DESAFIO EXTRA: Modifique o c√≥digo acima para:
# - Usar ConversationSummaryMemory 
# - Adicionar categoriza√ß√£o autom√°tica de problemas
# - Incluir um sistema de escala√ß√£o para problemas complexos

## üîó Preparando para o RAG (M√≥dulo 10)

**T√°, mas como Memory se conecta com RAG?**

√ìtima pergunta! No RAG (Retrieval-Augmented Generation) que vamos ver no m√≥dulo 10, a mem√≥ria √© FUNDAMENTAL:

### RAG + Memory = üöÄ

1. **Contexto de Consultas** ‚Üí Mem√≥ria lembra o que o usu√°rio j√° perguntou
2. **Refinamento de Busca** ‚Üí Usa hist√≥rico pra melhorar retrieval
3. **Conversas Longas** ‚Üí Mant√©m contexto em documentos grandes
4. **Personaliza√ß√£o** ‚Üí Adapta respostas baseado no hist√≥rico

### Pipeline RAG + Memory:

```
Pergunta + Hist√≥rico ‚Üí Busca Documentos ‚Üí Gera Resposta ‚Üí Atualiza Mem√≥ria
```

**Pr√≥ximos m√≥dulos:**
- **M√≥dulo 8:** Document Loading (pra alimentar o RAG)
- **M√≥dulo 9:** Vector Stores (pra buscar documentos)
- **M√≥dulo 10:** RAG completo com mem√≥ria!

**Dica!** A mem√≥ria que voc√™ aprendeu hoje vai ser a base pra criar chatbots que conversam sobre documentos!

In [None]:
# Preview: Como vai ser RAG + Memory (s√≥ um gostinho!)
# Vamos simular como seria sem implementar RAG completo ainda

# Simulando uma "base de conhecimento" simples
knowledge_base = {
    "python": "Python √© uma linguagem de programa√ß√£o vers√°til e f√°cil de aprender.",
    "machine learning": "ML √© um subcampo da IA que permite sistemas aprenderem automaticamente.", 
    "langchain": "LangChain √© um framework para desenvolver aplica√ß√µes com LLMs."
}

def simple_retrieval(query):
    """Simula√ß√£o simples de retrieval"""
    query_lower = query.lower()
    for topic, info in knowledge_base.items():
        if topic in query_lower:
            return info
    return "Informa√ß√£o n√£o encontrada na base de conhecimento."

# Prompt que combina retrieved info + memory
rag_prompt = PromptTemplate(
    template="""Voc√™ √© um assistente especializado em tecnologia.

Hist√≥rico da conversa:
{history}

Informa√ß√£o relevante encontrada:
{retrieved_info}

Pergunta do usu√°rio: {input}

Use o hist√≥rico da conversa e a informa√ß√£o encontrada para dar uma resposta completa e contextualizada.
Se j√° falamos sobre o assunto antes, referencie isso na resposta.

Resposta:""",
    input_variables=["history", "retrieved_info", "input"]
)

# Memory pro RAG
rag_memory = ConversationBufferMemory(memory_key="history")

# Chain simulando RAG + Memory
rag_chain = ConversationChain(
    llm=model,
    prompt=rag_prompt, 
    memory=rag_memory
)

print("üîÆ Preview: RAG + Memory em a√ß√£o!")

# Simulando consultas com retrieval + memory
rag_queries = [
    "O que √© Python?",
    "E machine learning?", 
    "Qual a diferen√ßa entre Python e ML que voc√™ mencionou?"
]

for query in rag_queries:
    # Simular retrieval
    retrieved = simple_retrieval(query)
    
    print(f"\nüîç Pergunta: {query}")
    print(f"üìÑ Retrieved: {retrieved}")
    
    # Usar a chain com info recuperada
    response = rag_chain.predict(
        input=query,
        retrieved_info=retrieved
    )
    print(f"ü§ñ Resposta: {response}")
    print("-" * 60)

print("\nüöÄ Isso √© s√≥ um preview! No m√≥dulo 10 vamos fazer RAG completo com vector stores!")

## üéØ Exerc√≠cio Final - Desafio Completo

**Hora do desafio final!** üèÜ

Crie um **Personal Assistant** que:

1. **Lembra informa√ß√µes pessoais** (nome, prefer√™ncias, etc.)
2. **Adapta respostas baseado no hist√≥rico**
3. **Usa diferentes tipos de mem√≥ria conforme necess√°rio**
4. **Integra com prompts customizados**

**Requisitos:**
- [ ] Use pelo menos 2 tipos de mem√≥ria diferentes
- [ ] Crie prompts personalizados 
- [ ] Implemente filtros de import√¢ncia
- [ ] Teste com conversas longas

**Dica!** Este exerc√≠cio vai preparar voc√™ pra criar assistentes mais complexos nos pr√≥ximos m√≥dulos!

In [None]:
# DESAFIO FINAL: Personal Assistant com Memory Systems
# Complete este c√≥digo criando um assistente pessoal completo!

print("ü§ñ DESAFIO: Personal Assistant com Memory Systems")
print("=" * 60)
print("Sua miss√£o: Completar este assistente pessoal inteligente!\n")

# TODO 1: Escolha e configure diferentes tipos de mem√≥ria
# Dica: Use Buffer para info pessoal e Window para conversas casuais

personal_info_memory = None  # Configure aqui!
conversation_memory = None   # Configure aqui!

# TODO 2: Crie prompts customizados
# Dica: Um prompt pra capturar info pessoal, outro pra conversa geral

personal_prompt = None  # Configure aqui!
general_prompt = None   # Configure aqui!

# TODO 3: Implemente l√≥gica de decis√£o
# Quando usar cada tipo de mem√≥ria/prompt?

def choose_memory_type(user_input):
    """Decide qual tipo de mem√≥ria usar baseado na entrada"""
    # TODO: Implementar l√≥gica aqui
    pass

# TODO 4: Crie o assistente completo
class PersonalAssistant:
    def __init__(self):
        # TODO: Inicializar chains, mem√≥rias, etc.
        pass
    
    def process_message(self, message):
        """Processa mensagem escolhendo mem√≥ria e prompt adequados"""
        # TODO: Implementar l√≥gica completa
        pass

# TODO 5: Teste seu assistente
test_conversation = [
    "Oi! Meu nome √© Alex",
    "Trabalho como designer", 
    "Gosto muito de caf√© pela manh√£",
    "Como est√° o tempo hoje?",
    "Voc√™ lembra qual √© minha profiss√£o?",
    "E o que eu gosto de beber de manh√£?"
]

print("üß™ Testando seu assistente...")
print("Implemente o c√≥digo acima e descomente os testes!\n")

# assistant = PersonalAssistant()
# for msg in test_conversation:
#     print(f"Voc√™: {msg}")
#     response = assistant.process_message(msg)
#     print(f"Assistant: {response}\n")

print("üí° Dicas para implementar:")
print("- Use ConversationBufferMemory para info pessoal")
print("- Use ConversationBufferWindowMemory para conversas casuais")
print("- Crie prompts que referenciam o tipo de informa√ß√£o")
print("- Implemente keywords para decidir qual chain usar")
print("\nüöÄ Boa sorte! Este exerc√≠cio vai te preparar para os pr√≥ximos m√≥dulos!")

## üéâ Resumo do M√≥dulo - O que Aprendemos

**Liiindo! Chegamos ao final!** üöÄ

### ‚úÖ O que voc√™ domina agora:

1. **Por que precisamos de mem√≥ria** ‚Üí LLMs s√£o stateless
2. **ConversationBufferMemory** ‚Üí Guarda tudo, boa pra conversas curtas
3. **ConversationSummaryMemory** ‚Üí Resume conversas, economiza tokens
4. **ConversationBufferWindowMemory** ‚Üí Janela deslizante, foco no recente
5. **Memory customizada** ‚Üí Filtros e regras personalizadas
6. **Integra√ß√£o com Chains** ‚Üí Combinando com prompts e parsers
7. **Preview do RAG** ‚Üí Como mem√≥ria vai ser crucial

### üîó Conectando com outros m√≥dulos:

- **M√≥dulos 1-6** ‚Üí Base s√≥lida pra usar memory
- **M√≥dulo 8-10** ‚Üí Document Loading, Vector Stores e RAG
- **M√≥dulo 11** ‚Üí Agents v√£o usar memory pra ser mais inteligentes

### üéØ Pr√≥ximos passos:

No **m√≥dulo 8** vamos aprender **Document Loading** - como carregar e processar documentos pra alimentar nossos sistemas de IA. A mem√≥ria que voc√™ aprendeu hoje vai ser fundamental pra criar conversas sobre documentos!

**Dica!** Pratique criando diferentes tipos de chatbots com memory. Vai te ajudar muito nos pr√≥ximos m√≥dulos!

**Bora pro pr√≥ximo m√≥dulo?** üî•

In [None]:
# Visualiza√ß√£o final - Resumo dos tipos de Memory
import matplotlib.pyplot as plt
import numpy as np

# Dados para compara√ß√£o final
memory_types = ['Buffer', 'Summary', 'Window']
metrics = ['Completude', 'Efici√™ncia', 'Simplicidade']

# Scores de 0 a 5 para cada m√©trica
scores = {
    'Buffer': [5, 2, 5],    # Completa, pouco eficiente, muito simples
    'Summary': [3, 5, 3],   # Moderada, muito eficiente, moderada
    'Window': [3, 4, 4]     # Moderada, eficiente, simples
}

# Criando gr√°fico radar
fig, ax = plt.subplots(figsize=(10, 10), subplot_kw=dict(projection='polar'))

# √Çngulos para cada m√©trica
angles = np.linspace(0, 2 * np.pi, len(metrics), endpoint=False).tolist()
angles += angles[:1]  # Fechar o c√≠rculo

# Cores para cada tipo
colors = ['#FF6B6B', '#4ECDC4', '#45B7D1']

# Plotar cada tipo de mem√≥ria
for i, (memory_type, color) in enumerate(zip(memory_types, colors)):
    values = scores[memory_type] + scores[memory_type][:1]  # Fechar o c√≠rculo
    ax.plot(angles, values, 'o-', linewidth=2, label=memory_type, color=color)
    ax.fill(angles, values, alpha=0.25, color=color)

# Configurar gr√°fico
ax.set_xticks(angles[:-1])
ax.set_xticklabels(metrics)
ax.set_ylim(0, 5)
ax.set_yticks([1, 2, 3, 4, 5])
ax.set_title('Compara√ß√£o dos Tipos de Memory Systems\n(Maior = Melhor)', 
             size=16, fontweight='bold', pad=20)
ax.legend(loc='upper right', bbox_to_anchor=(0.1, 0.1))
ax.grid(True)

plt.tight_layout()
plt.show()

print("üìä Resumo Visual Completo!")
print("\nüéì Voc√™ agora domina Memory Systems no LangChain!")
print("\nüöÄ Pr√≥ximo m√≥dulo: Document Loading e Splitters")
print("   Vamos aprender a carregar e processar documentos!")
print("\nüí™ Continue praticando e nos vemos no pr√≥ximo m√≥dulo!")