# 0.3 - Agente Reflexivo com Modelo Interno (Estado Atual)

Neste notebook, vamos explorar um agente que **usa um modelo interno** para representar o **estado atual do ambiente**, mas **não possui memória de longo prazo**.

---

## O que é um modelo interno?

Um **modelo interno** permite que o agente:

✅ Tenha uma “visão” mais completa do ambiente (não apenas um sensor direto).  
✅ Tome decisões melhores em situações mais complexas.  
✅ Mas **ainda não aprende nem lembra de passos passados**.

---

## Exemplo: um aspirador com sensores de proximidade

Vamos criar um agente que:

- **Recebe um “mapa local”** (modelo interno) com as posições de sujeira e obstáculos.  
- Age de forma **reflexiva**: cada ação depende **apenas** desse mapa, sem lembrar das ações anteriores.

---

## Implementação em Python

In [1]:
class AgenteReflexivoComModelo:
    def __init__(self):
        pass  # Sem memória persistente

    def agir(self, modelo_ambiente):
        """
        modelo_ambiente: dict com a situação local
        Exemplo:
            {
                "frente": "livre",
                "esquerda": "obstaculo",
                "direita": "sujeira"
            }
        """
        if modelo_ambiente["frente"] == "sujeira":
            return "aspirar"
        elif modelo_ambiente["frente"] == "obstaculo":
            return "desviar"
        elif modelo_ambiente["direita"] == "sujeira":
            return "girar-direita"
        elif modelo_ambiente["esquerda"] == "sujeira":
            return "girar-esquerda"
        else:
            return "andar"

## 🔬 Simulação de percepções e decisões

In [2]:
# Instanciando o agente
agente = AgenteReflexivoComModelo()

# Exemplo de situações (modelos internos diferentes em cada passo)
modelos_ambiente = [
    {"frente": "livre", "esquerda": "livre", "direita": "livre"},
    {"frente": "sujeira", "esquerda": "livre", "direita": "livre"},
    {"frente": "obstaculo", "esquerda": "livre", "direita": "sujeira"},
    {"frente": "livre", "esquerda": "sujeira", "direita": "livre"},
]

# Ações do agente
for i, modelo in enumerate(modelos_ambiente):
    acao = agente.agir(modelo)
    print(f"Passo {i+1}: modelo={modelo} => ação={acao}")

Passo 1: modelo={'frente': 'livre', 'esquerda': 'livre', 'direita': 'livre'} => ação=andar
Passo 2: modelo={'frente': 'sujeira', 'esquerda': 'livre', 'direita': 'livre'} => ação=aspirar
Passo 3: modelo={'frente': 'obstaculo', 'esquerda': 'livre', 'direita': 'sujeira'} => ação=desviar
Passo 4: modelo={'frente': 'livre', 'esquerda': 'sujeira', 'direita': 'livre'} => ação=girar-esquerda


In [None]:
from transformers import pipeline

class AgenteLLM:
    def __init__(self):
        # Vamos usar um pipeline de classificação de texto simples
        self.classificador = pipeline("text-classification", model="distilbert-base-uncased-finetuned-sst-2-english")

    def agir(self, descricao):
        """
        descricao: texto descrevendo o ambiente
        Exemplo: "Há sujeira à esquerda e obstáculo à frente."
        """
        # O modelo vai classificar se a descrição parece "positiva" (caminho livre) ou "negativa" (obstáculo)
        resultado = self.classificador(descricao)[0]

        if resultado["label"] == "POSITIVE":
            return "andar"
        else:
            return "desviar"

# Teste
agente = AgenteLLM()
descricao_ambiente = "Há sujeira à esquerda e obstáculo à frente."
print("Ação:", agente.agir(descricao_ambiente))

  from .autonotebook import tqdm as notebook_tqdm
Xet Storage is enabled for this repo, but the 'hf_xet' package is not installed. Falling back to regular HTTP download. For better performance, install the package with: `pip install huggingface_hub[hf_xet]` or `pip install hf_xet`
To support symlinks on Windows, you either need to activate Developer Mode or to run Python as an administrator. In order to activate developer mode, see this article: https://docs.microsoft.com/en-us/windows/apps/get-started/enable-your-device-for-development
Device set to use cpu


Ação: andar


In [4]:
from transformers import pipeline

class AgenteLLM_Gerador:
    def __init__(self):
        # Pipeline de geração de texto
        self.gerador = pipeline("text-generation", model="distilgpt2")

    def agir(self, descricao):
        prompt = f"Descrição do ambiente: {descricao}\n Qual ação devo tomar?"
        resposta = self.gerador(prompt, max_length=20, num_return_sequences=1)[0]["generated_text"]
        return resposta.strip()

# Teste
agente = AgenteLLM_Gerador()
descricao_ambiente = "Há sujeira à esquerda e obstáculo à frente."
print("Ação:", agente.agir(descricao_ambiente))

To support symlinks on Windows, you either need to activate Developer Mode or to run Python as an administrator. In order to activate developer mode, see this article: https://docs.microsoft.com/en-us/windows/apps/get-started/enable-your-device-for-development
Xet Storage is enabled for this repo, but the 'hf_xet' package is not installed. Falling back to regular HTTP download. For better performance, install the package with: `pip install huggingface_hub[hf_xet]` or `pip install hf_xet`
Device set to use cpu
Truncation was not explicitly activated but `max_length` is provided a specific value, please use `truncation=True` to explicitly truncate examples to max length. Defaulting to 'longest_first' truncation strategy. If you encode pairs of sequences (GLUE-style) with the tokenizer you can select this strategy more precisely by providing a specific strategy to `truncation`.
Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.
Both `max_new_tokens` (=256) and `max_le

Ação: Descrição do ambiente: Há sujeira à esquerda e obstáculo à frente.
 Qual ação devo tomar?sticos.


### Fazendo o mesmo processo em Ingles para facilitar para os modelos

In [6]:
from transformers import pipeline

class AgenteLLM:
    def __init__(self):
        # Usando um pipeline de classificação de texto simples em inglês
        self.classificador = pipeline("text-classification", model="distilbert-base-uncased-finetuned-sst-2-english")

    def agir(self, descricao):
        """
        description
        Exemplo: "There is dirt to the left and an obstacle in front."
        """
        resultado = self.classificador(descricao)[0]

        if resultado["label"] == "POSITIVE":
            return "move forward"
        else:
            return "avoid"

# Teste em inglês
agente = AgenteLLM()
descricao_ambiente = "There is dirt to the left and an obstacle in front."
print("Action:", agente.agir(descricao_ambiente))

Device set to use cpu


Action: avoid


In [5]:
from transformers import pipeline

class AgenteLLM_Gerador:
    def __init__(self):
        self.gerador = pipeline("text-generation", model="distilgpt2")

    def agir(self, descricao):
        # Prompt em inglês!
        prompt = f"Environment: {descricao}\nWhat action should I take?"
        resposta = self.gerador(prompt, max_new_tokens=20, truncation=True, num_return_sequences=1)[0]["generated_text"]
        return resposta.strip()

agente = AgenteLLM_Gerador()
descricao_ambiente = "There is dirt to the left and an obstacle in front."
print("Action:", agente.agir(descricao_ambiente))

Device set to use cpu
Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


Action: Environment: There is dirt to the left and an obstacle in front.
What action should I take?
I want to make sure that the world is not going to be the place where I was born
