
# ü§ñ Aula 6: Criando um Chatbot que Aprende Sozinho

Neste notebook, vamos construir um chatbot que aprende com as intera√ß√µes dos usu√°rios.

## üìå O que faremos:
1. **Entender como funciona o aprendizado em AI Agents**.
2. **Fundamenta√ß√£o matem√°tica**: Aprendizado por Refor√ßo e Fun√ß√µes de Atualiza√ß√£o.
3. **Implementar um chatbot que ajusta respostas com base em feedback do usu√°rio**.
4. **Armazenar conhecimento de longo prazo com embeddings**.
5. **Testar personaliza√ß√£o e adapta√ß√£o do chatbot**.

---

## üìñ Como um Chatbot Aprende?

Chatbots tradicionais n√£o aprendem de verdade, pois apenas processam a entrada do usu√°rio e geram respostas com base em modelos pr√©-treinados. No entanto, podemos implementar aprendizado utilizando:

1. **Mem√≥ria e Feedback do Usu√°rio**: Guardar intera√ß√µes anteriores e modificar respostas futuras.
2. **Ajuste Probabil√≠stico**: Ajustar pesos para respostas diferentes com base na satisfa√ß√£o do usu√°rio.
3. **Embeddings e Vetores Sem√¢nticos**: Criar um banco de mem√≥ria que permite ao chatbot lembrar informa√ß√µes com base na similaridade de texto.

### Matem√°tica do Aprendizado por Refor√ßo

Seja um chatbot com um conjunto de respostas poss√≠veis $ R $. Quando um usu√°rio interage, podemos definir uma fun√ß√£o de recompensa $ Q(s, a) $ para cada resposta $ a $ dada um estado $ s $:

- Se o usu√°rio d√° **feedback positivo**, aumentamos a probabilidade de repetir essa resposta.
- Se o usu√°rio d√° **feedback negativo**, reduzimos a probabilidade dessa resposta e buscamos alternativas melhores.

A atualiza√ß√£o pode ser modelada como:

$$
Q(s, a) = Q(s, a) + \alpha \cdot (r - Q(s, a))
$$

onde:
- $ \alpha $ √© a taxa de aprendizado.
- $ r $ √© a recompensa dada pelo usu√°rio.
- $ Q(s, a) $ √© o valor atualizado da resposta no estado.



In [None]:

# Instale a biblioteca OpenAI se ainda n√£o estiver instalada
!pip install openai json


In [None]:

import openai
import json

# Defina sua chave de API (substitua 'SUA_CHAVE_AQUI' pela chave real)
openai.api_key = "SUA_CHAVE_AQUI"


In [None]:

# Criando um hist√≥rico de intera√ß√µes para aprendizado cont√≠nuo
historico = []

def chatbot_aprendiz(pergunta):
    historico.append({"role": "user", "content": pergunta})
    resposta = openai.ChatCompletion.create(
        model="gpt-4",
        messages=historico
    )
    mensagem = resposta["choices"][0]["message"]["content"]
    historico.append({"role": "assistant", "content": mensagem})
    
    # Salvando hist√≥rico em um arquivo JSON
    with open("historico.json", "w") as f:
        json.dump(historico, f, indent=4)
    
    return mensagem

# Teste do chatbot
print(chatbot_aprendiz("Qual √© a capital da Fran√ßa?"))
print(chatbot_aprendiz("E qual √© a minha cor favorita?"))


In [None]:

# Instale as bibliotecas necess√°rias
!pip install openai faiss-cpu numpy json

import openai
import numpy as np
import faiss
import json

# Defina sua chave de API aqui (substitua 'SUA_CHAVE_AQUI' pela chave real)
openai.api_key = "SUA_CHAVE_AQUI"

# Criar banco de mem√≥ria vetorial com FAISS
dimensao = 1536  # Tamanho dos embeddings da OpenAI
indice_memoria = faiss.IndexFlatL2(dimensao)  # Banco de dados vetorial
memorias = []  # Lista de strings armazenadas
respostas_personalizadas = {}  # Dicion√°rio para aprendizado por refor√ßo

# Fun√ß√£o para obter embedding de um texto
def obter_embedding(texto):
    resposta = openai.Embedding.create(input=texto, model="text-embedding-ada-002")
    return np.array(resposta["data"][0]["embedding"], dtype=np.float32)

# Fun√ß√£o para armazenar mem√≥ria
def armazenar_memoria(texto, resposta):
    vetor = obter_embedding(texto)
    memorias.append((texto, resposta))
    indice_memoria.add(np.array([vetor]))
    respostas_personalizadas[texto] = resposta

# Fun√ß√£o para recuperar mem√≥ria mais pr√≥xima
def recuperar_memoria(texto):
    if len(memorias) == 0:
        return None
    
    vetor = obter_embedding(texto)
    D, I = indice_memoria.search(np.array([vetor]), k=1)
    return memorias[I[0][0]][1] if D[0][0] < 0.5 else None  # Se a dist√¢ncia for pequena, retornamos

# Fun√ß√£o de aprendizado por refor√ßo
def atualizar_aprendizado(texto, resposta, feedback):
    if feedback == "sim":
        respostas_personalizadas[texto] = resposta
    else:
        respostas_personalizadas[texto] = "Ainda estou aprendendo. Poderia reformular a pergunta?"

# Chatbot com aprendizado baseado em feedback
def chatbot_aprendizagem(pergunta):
    memoria_relevante = recuperar_memoria(pergunta)
    if memoria_relevante:
        return memoria_relevante
    
    historico = [{"role": "system", "content": "Voc√™ √© um assistente que aprende com o usu√°rio."},
                 {"role": "user", "content": pergunta}]
    
    resposta = openai.ChatCompletion.create(
        model="gpt-4",
        messages=historico
    )["choices"][0]["message"]["content"]

    armazenar_memoria(pergunta, resposta)
    
    # Solicitar feedback do usu√°rio
    print(f"Bot: {resposta}")
    feedback = input("Isso ajudou? (Sim/N√£o) ").strip().lower()
    atualizar_aprendizado(pergunta, resposta, feedback)

    return resposta

# Teste de aprendizado
print(chatbot_aprendizagem("Me fale sobre aprendizado por refor√ßo."))
print(chatbot_aprendizagem("O que √© machine learning?"))


In [None]:

# Criando um chatbot que lembra do usu√°rio
usuarios = {}

def chatbot_personalizado(nome, pergunta):
    if nome not in usuarios:
        usuarios[nome] = []
    
    usuarios[nome].append(pergunta)
    
    resposta = chatbot_aprendiz(pergunta)
    
    return f"{nome}, baseado no que j√° conversamos, aqui est√° minha resposta: {resposta}"

# Teste de personaliza√ß√£o
print(chatbot_personalizado("Carlos", "Qual celular devo comprar?"))
print(chatbot_personalizado("Carlos", "Qual minha prefer√™ncia de marca?"))



## üéØ Desafio para os alunos!
1. Criar um chatbot que lembra informa√ß√µes do usu√°rio ao longo do tempo.
2. Implementar um mecanismo de feedback para melhorar respostas.
3. Testar personaliza√ß√£o e adapta√ß√£o do chatbot em conversas mais longas.

---
