### Resumen

Este proyecto implica desarrollar un simulador de entorno destinado a evaluar el desempeño de un agente que actúa como una "aspiradora". El propósito del simulador es analizar cómo el agente se desempeña en diferentes situaciones y con distintos ajustes. Se busca que el simulador sea modular, lo que implica que se pueda modificar fácilmente distintos componentes del sistema sin afectar el funcionamiento global. Por ejemplo, se deben poder cambiar los sensores, actuadores y características del entorno, como el tamaño, la forma y la ubicación de la suciedad, de manera sencilla. En resumen, el desafío de este ejercicio radica en crear un entorno de simulación versátil y adaptable para evaluar el rendimiento de un agente "aspiradora" en un contexto específico.

Imports

### Introduccion

In [93]:
from vacuum_environment import *
from notebook1 import psource
from __future__ import annotations

Un agente puede entenderse como un sistema que interactúa con su entorno a través de la percepción y la acción. Esto se puede ilustrar con diversos ejemplos, como un ser humano que utiliza sus ojos y oídos para percibir el entorno y sus manos y piernas para actuar sobre él, un robot que emplea cámaras y sensores infrarrojos para percibir su entorno y motores para realizar acciones, o un programa informático que recibe datos de entrada, como pulsaciones de teclas, contenido de archivos y paquetes de red, y produce salidas, como visualizaciones en la pantalla, escritura de archivos y envío de paquetes de red.

![68747470733a2f2f64726976652e676f6f676c652e636f6d2f75633f69643d31515f49462d66772d515639675558796d3849325a44495a5375356b76316e5266.png](attachment:68747470733a2f2f64726976652e676f6f676c652e636f6d2f75633f69643d31515f49462d66772d515639675558796d3849325a44495a5375356b76316e5266.png)

Según lo descrito en el libro [1], se pueden identificar las siguientes características del agente, tal como se muestra en la Figura 2.2:

a) El entorno se representa como una cuadrícula bidimensional dividida en dos áreas, A y B, donde cada una puede estar sucia o limpia.

b) Las percepciones del agente consisten en determinar si la ubicación actual está sucia o limpia.

c) El agente cuenta con un sensor simple que detecta si la ubicación actual está sucia o limpia.

d) El actuador del agente es su capacidad para moverse por el entorno y limpiar una ubicación si está sucia.

Entonces, el objetivo de esta tarea es abordar la pregunta fundamental:

¿Cómo desarrollar una implementación versátil que evalúe el rendimiento de una aspiradora en un entorno de dos dimensiones?

### Ejercicio 2.11 (que corresponde al ejercicio 2.8 en Russell & Norvig's textboo  3rd Edition)

Este proyecto implica crear un simulador de entorno para evaluar el rendimiento de un agente tipo "aspiradora" en un mundo específico, como se describe en la Figura 2.2 del libro de texto de Russell & Norvig 3ª edición [1].

![68747470733a2f2f64726976652e676f6f676c652e636f6d2f75633f69643d3134615567355548455f6e743436397a6e616d7656382d726d7959396e6a587274.png](attachment:68747470733a2f2f64726976652e676f6f676c652e636f6d2f75633f69643d3134615567355548455f6e743436397a6e616d7656382d726d7959396e6a587274.png)

El propósito del simulador de entorno es evaluar el rendimiento del agente (aspiradora) en diversas configuraciones y con distintos parámetros. Se busca que el simulador sea modular, lo que implica que su diseño permita cambiar fácilmente diferentes componentes del sistema sin afectar el resto del código. Por ejemplo, los sensores, actuadores y características del entorno, como el tamaño, la forma y la ubicación de la suciedad, deben ser configurables de manera sencilla.

En resumen, el desafío de este ejercicio radica en crear un entorno de simulación flexible y personalizable para probar y evaluar el rendimiento de un agente "aspiradora" en un contexto específico.

#### Implementacion

Dado que hay una implementación existente en el repositorio de códigos de UC Berkeley [2] para Python, nos centraremos en comprender el problema y el código implementado. Ahora explicaremos cómo funciona esta implementación.

El archivo agent.py contiene un módulo en Python que implementa varios tipos de agentes diseñados para diferentes entornos, los cuales se corresponden con el problema presentado en la Figura 2.2. Estos agentes incluyen:

- a) Agentes reflejos simples (clase ReflexVacuumAgent)
- b) Agentes reflejos basados en modelos (clase ModelBasedVacuumAgent)
- c) Agentes basados en objetivos (clase GoalBasedAgent)
- d) Agentes basados en utilidades (clase UtilityBasedAgent)
- e) Agentes de aprendizaje (clase LearningAgent)

Además de estas clases de agentes, la implementación también ofrece otras clases y funciones para facilitar la implementación y simulación de agentes en varios entornos.

- Clase Agent: proporciona una clase base para todos los agentes, con métodos y propiedades básicos.

- Clase VacuumEnvironment: representa el entorno de la aspiradora, contiene métodos para agregar agentes, mover agentes y limpiar la suciedad.

- Clase Environment: es una clase base para todos los entornos y define los métodos y propiedades básicos que debe tener un entorno.

- Clase GraphEnvironment: representa un entorno basado en gráficos y proporciona métodos para agregar nodos y bordes al gráfico.

- Clase TrivialVacuumEnvironment: representa un entorno de aspiradora simple con una sola ubicación. Se puede utilizar para probar agentes reflejos simples como el TrivialVacuumAgent.

- Clase TrivialVacuumAgent: representa un agente reflejo simple para TrivialVacuumEnvironment. Se puede utilizar para probar la funcionalidad básica de VacuumEnvironment.

- Clase ReflexVacuumAgent: representa un agente reflejo simple para el entorno de la aspiradora, con un proceso de toma de decisiones basado en reglas. Se puede utilizar para probar el rendimiento del agente en diferentes entornos.

- Clase ModelBasedVacuumAgent: representa un agente reflejo basado en modelos para el entorno de la aspiradora, con un proceso de toma de decisiones basado en el estado. Se puede utilizar para probar el rendimiento del agente en diferentes entornos.

- Clase TableDrivenVacuumAgent: representa un agente basado en tablas para el entorno de la aspiradora, con un proceso de toma de decisiones basado en una tabla de búsqueda. Se puede utilizar para probar el rendimiento del agente en diferentes entornos.

- Clase RandomVacuumAgent: representa un agente aleatorio para el entorno de la aspiradora, con un proceso de toma de decisiones basado en acciones aleatorias. Se puede utilizar para probar el rendimiento del agente en diferentes entornos.

- Clase VacuumWorld: representa un entorno de la aspiradora basado en cuadrículas, con métodos para agregar agentes, mover agentes y limpiar la suciedad.

- Clase Direction: define las direcciones posibles para el movimiento en un entorno basado en cuadrícula.

- Clase Grid: representa una cuadrícula en un entorno basado en cuadrícula, con métodos para agregar y eliminar objetos, obtener ubicaciones de objetos y verificar colisiones de objetos.

- Clase GridEnvironment: representa un entorno basado en cuadrículas, con métodos para agregar agentes, mover agentes y limpiar la suciedad.

- Clase XYEnvironment: representa un sistema de coordenadas cartesianas bidimensional, con métodos para agregar y eliminar objetos, obtener ubicaciones de objetos y verificar colisiones de objetos.

La clase VacuumEnviroment modela un entorno de dos estados con dos ubicaciones, donde cada una puede estar limpia o sucia, tal como se muestra en la Figura 2.2. Esta clase define las acciones disponibles para el agente, que incluyen moverse hacia la izquierda, moverse hacia la derecha, limpiar y no hacer nada ('Right', 'Left', 'Suck', 'NoOp'). En este entorno, el agente no tiene un razonamiento específico, por lo que sus acciones son aleatorias.

Las acciones de moverse hacia la izquierda y hacia la derecha están penalizadas con -1, mientras que la acción de limpiar está premiada con +10 siempre que la ubicación esté sucia. Si se intenta limpiar una ubicación que ya está limpia o si no se realiza ninguna acción, la penalización es de 0. Esto se puede observar con más detalle en el fragmento de programa a continuación.

In [94]:
# Environment that expands horizontally (left to right).
width = 2
height = 1
test_environment = VacuumEnvironment(width, height)
print(f'The environment has been successfully created')
print()
print(f'Dirty locations: {test_environment.dirt}')

The environment has been successfully created

Dirty locations: [(1, 0)]


In [95]:
# Number of actions allowed
limit = 50
actions = 0
reflex_agent = VacuumAgent('Reflex')

# Action loop
while(test_environment.dirt and actions < limit):
    actions = actions + 1
    reflex_agent.act(test_environment)
    print(f'Remaining dirty locations: {test_environment.dirt}')


print(f'Reflex Agent performance after {actions} actions is: {reflex_agent.performance}')

Remaining dirty locations: [(1, 0)]
Remaining dirty locations: []
Reflex Agent performance after 2 actions is: 9


### Ejercicio 2.14 (que corresponde al ejercicio 2.11 en Russell & Norvig's textbook 3rd Edition)

El ejercicio 2.11 presenta una versión alterada del entorno en el que opera el agente "aspiradora", basada en el ejercicio 2.8 del libro de Russell & Norvig 3ª edición. En esta nueva versión, la configuración del ambiente, incluyendo su extensión, límites y posibles obstáculos, es desconocida. Además, no se tiene información sobre la disposición inicial de la suciedad. Además, se permite al agente moverse en todas las direcciones: arriba, abajo, izquierda y derecha. Con estas modificaciones en mente, se plantean varias preguntas para explorar este nuevo escenario.

#### a. ¿Puede un agente de reflejo simple ser perfectamente racional para este ambiente? Explique. 

Los agentes reflejos simples tienen la ventaja de ser simples, pero su inteligencia es limitada. Por ejemplo, un agente aspiradora de este tipo solo puede tomar decisiones basadas en la percepción actual, es decir, solo puede actuar en base a lo que ve en el momento presente, lo que significa que necesita que el entorno sea completamente observable. Sin embargo, incluso una pequeña falta de información puede causar problemas significativos. Por ejemplo, imaginemos un agente aspiradora con un sensor de suciedad pero sin un sensor de ubicación; este agente solo puede percibir si una ubicación está "Sucia" o "Limpia". En este caso, podría realizar la acción "suck" cuando está sucio, pero tendría dificultades para cambiar de ubicación. Además, existe el riesgo de que entre en un bucle infinito si siempre elige moverse a la izquierda, por ejemplo, cuando se encuentra en el cuadrado A.

#### b. ¿Puede un agente de reflejo simple con una función de agente aleatoria superar a un agente de reflejo simple? Diseñe tal agente y mida su rendimiento en varios ambientes. 


La eficacia de un agente reflejo simple frente a uno con una función de agente aleatorio depende en gran medida de la complejidad, la previsibilidad y la observabilidad del entorno. En entornos complejos, impredecibles o poco observables, un agente reflejo simple con una función aleatoria puede superar a un agente reflejo simple. Por otro lado, en entornos observables, un agente reflejo simple con una función aleatoria puede, en el mejor de los casos, igualar a un agente simple. Esto se debe a que, en un agente simple, las acciones están determinadas por condiciones específicas, mientras que en el otro, las acciones son completamente aleatorias. Estas observaciones se corroboran mediante las implementaciones realizadas en las secciones A y B.

##### 1. Agente de reflejo simple con una función de agente aleatoria

In [96]:
'''Random Reflex Agent'''

'''
elif self.program == 'Random':
    #Sense current location
    #If dirty clean
    if self.sense(env) == 'Dirty':
        self.actuate('Suck', env)
        return 'Suck
    #Random Action to change location
    else:
        actions = ['Right','Left','Up','Down']
        randomAction = random.choice(actions)
        self.actuate(randomAction, env)
        return randomAction
'''

"\nelif self.program == 'Random':\n    #Sense current location\n    #If dirty clean\n    if self.sense(env) == 'Dirty':\n        self.actuate('Suck', env)\n        return 'Suck\n    #Random Action to change location\n    else:\n        actions = ['Right','Left','Up','Down']\n        randomAction = random.choice(actions)\n        self.actuate(randomAction, env)\n        return randomAction\n"

In [97]:
# Environment that expands on a 2 dimensional plane (3x3).
width = 3
height = 3
xy_environment_2 = VacuumEnvironment(width, height)

print(f'The environment has been successfully created')
print()
print(f'Dirty locations: {xy_environment_2.dirt}')
print()

# Number of actions allowed
limit = 50
actions = 0
random_reflex_agent_2d = VacuumAgent('Random')


while(xy_environment_2.dirt and actions < limit):
    actions = actions + 1
    random_reflex_agent_2d.act(xy_environment_2)
    #print(f'Remaining dirty locations: {xy_environment_2.dirt}')


print(f'Reflex Agent performance after {actions} actions is: {random_reflex_agent_2d.performance}')
print(f'Remaining dirty locations: {xy_environment_2.dirt}')

The environment has been successfully created

Dirty locations: [(0, 2), (1, 0), (2, 0), (2, 2)]

Reflex Agent performance after 43 actions is: 1
Remaining dirty locations: []


In [98]:
# Environment that expands on a 2 dimensional plane (5x5).
width = 5
height = 5
xy_environment_3 = VacuumEnvironment(width, height)

print(f'The environment has been successfully created')
print()
print(f'Dirty locations: {xy_environment_3.dirt}')
print()

# Number of actions allowed
limit = 125
actions = 0
random_reflex_agent_2d1 = VacuumAgent('Random')

while(xy_environment_3.dirt and actions < limit):
    actions = actions + 1
    random_reflex_agent_2d1.act(xy_environment_3)
    #print(f'Remaining dirty locations: {xy_environment_3.dirt}')


print(f'Reflex Agent performance after {actions} actions is: {random_reflex_agent_2d1.performance}')
print(f'Remaining dirty locations: {xy_environment_3.dirt}')

The environment has been successfully created

Dirty locations: [(0, 0), (0, 1), (0, 2), (0, 3), (0, 4), (1, 0), (1, 1), (1, 4), (2, 0), (2, 2), (2, 4), (3, 1), (3, 2), (3, 4)]

Reflex Agent performance after 103 actions is: 51
Remaining dirty locations: []


##### 2. Agente de reflejo simple

In [99]:
# Environment that expands on a 2 dimensional plane (3x3).
width = 3
height = 3
xy_environment = VacuumEnvironment(width, height)

print(f'The environment has been successfully created')
print()
print(f'Dirty locations: {xy_environment.dirt}')
print()

# Number of actions allowed
limit = 50
actions = 0
reflex_agent_2d = VacuumAgent('Reflex_2D')

while(xy_environment.dirt and actions < limit):
    actions = actions + 1
    reflex_agent_2d.act(xy_environment)
    #print(f'Remaining dirty locations: {xy_environment.dirt}')


print(f'Reflex Agent performance after {actions} actions is: {reflex_agent_2d.performance}')
print(f'Remaining dirty locations: {xy_environment.dirt}')

The environment has been successfully created

Dirty locations: [(0, 1), (0, 2), (1, 0), (2, 1)]

Reflex Agent performance after 43 actions is: 1
Remaining dirty locations: []


In [100]:
# Environment that expands on a 2 dimensional plane (5x5).
width = 5
height = 5
xy_environment_1 = VacuumEnvironment(width, height)

print(f'The environment has been successfully created')
print()
print(f'Dirty locations: {xy_environment_1.dirt}')
print()

# Number of actions allowed
limit = 125
actions = 0
reflex_agent_2d1 = VacuumAgent('Reflex_2D')

while(xy_environment_1.dirt and actions < limit):
    actions = actions + 1
    reflex_agent_2d1.act(xy_environment_1)
    #print(f'Remaining dirty locations: {xy_environment_1.dirt}')


print(f'Reflex Agent performance after {actions} actions is: {reflex_agent_2d1.performance}')
print(f'Remaining dirty locations: {xy_environment_1.dirt}')

The environment has been successfully created

Dirty locations: [(0, 4), (1, 0), (1, 1), (1, 2), (1, 3), (2, 2), (2, 3), (3, 1), (3, 3), (3, 4), (4, 0), (4, 1), (4, 2), (4, 3)]

Reflex Agent performance after 125 actions is: -15
Remaining dirty locations: [(3, 3), (3, 4), (4, 2), (4, 3)]


#### c. ¿Puede diseñar un ambiente en el que su agente aleatorio tenga un mal desempeño? Muestre sus resultados.

In [4]:
# Environment that expands on a 2 dimensional plane.
width = 6
height = 6
xy_environment_1 = VacuumEnvironment(width, height)

print(f'The environment has been successfully created')
print()
print(f'Dirty locations: {xy_environment_1.dirt}')
print()

# Number of actions allowed
limit = 125
actions = 0
reflex_agent_2d1 = VacuumAgent('Random')

while(xy_environment_1.dirt and actions < limit):
    actions = actions + 1
    reflex_agent_2d1.act(xy_environment_1)
    #print(f'Remaining dirty locations: {xy_environment_1.dirt}')


print(f'Reflex Agent performance after {actions} actions is: {reflex_agent_2d1.performance}')
print(f'Remaining dirty locations: {xy_environment_1.dirt}')

The environment has been successfully created

Dirty locations: [(0, 4), (1, 0), (1, 2), (1, 3), (1, 5), (2, 1), (2, 3), (2, 5), (3, 0), (3, 2), (4, 2), (4, 3), (5, 0), (5, 1), (5, 3), (5, 5)]

Reflex Agent performance after 125 actions is: 7
Remaining dirty locations: [(0, 4), (1, 2), (1, 3), (5, 5)]


#### d.¿Puede un agente de reflejo con estado superar a un agente de reflejo simple? Diseñe tal agente y mida su rendimiento en varios ambientes. ¿Puede diseñar un agente racional de este tipo?

In [121]:
# Environment that expands on a 2 dimensional plane.
width = 50
height = 50
xy_environment_5 = VacuumEnvironment(width, height)

print(f'The environment has been successfully created')
print()
print(f'Dirty locations: {xy_environment_5.dirt}')
print()

# Number of actions allowed
limit = 1000
actions = 0
state_reflex_agent_2d1 = VacuumAgent('State')

while(xy_environment_5.dirt and actions < limit):
    actions = actions + 1
    state_reflex_agent_2d1.act(xy_environment_5)
    #print(f'Remaining dirty locations: {xy_environment_1.dirt}')


print(f'Reflex Agent performance after {actions} actions is: {state_reflex_agent_2d1.performance}')
print(f'Remaining dirty locations: {xy_environment_5.dirt}')

The environment has been successfully created

Dirty locations: [(0, 2), (0, 3), (0, 10), (0, 13), (0, 16), (0, 20), (0, 22), (0, 24), (0, 26), (0, 27), (0, 32), (0, 33), (0, 38), (0, 42), (0, 45), (1, 0), (1, 5), (1, 8), (1, 9), (1, 11), (1, 12), (1, 14), (1, 15), (1, 16), (1, 17), (1, 19), (1, 21), (1, 22), (1, 23), (1, 25), (1, 26), (1, 27), (1, 29), (1, 32), (1, 34), (1, 35), (1, 37), (1, 40), (1, 42), (1, 46), (1, 47), (2, 1), (2, 3), (2, 4), (2, 5), (2, 6), (2, 7), (2, 13), (2, 15), (2, 21), (2, 22), (2, 26), (2, 28), (2, 29), (2, 33), (2, 36), (2, 37), (2, 38), (2, 40), (2, 41), (2, 42), (2, 46), (2, 47), (2, 48), (2, 49), (3, 0), (3, 3), (3, 4), (3, 5), (3, 6), (3, 7), (3, 11), (3, 12), (3, 13), (3, 14), (3, 15), (3, 18), (3, 19), (3, 22), (3, 24), (3, 29), (3, 30), (3, 33), (3, 35), (3, 36), (3, 39), (3, 40), (3, 41), (3, 42), (3, 47), (3, 48), (4, 1), (4, 3), (4, 4), (4, 5), (4, 6), (4, 9), (4, 10), (4, 12), (4, 15), (4, 16), (4, 18), (4, 20), (4, 21), (4, 23), (4, 24), (4, 2

In [122]:
# Environment that expands on a 2 dimensional plane.
width = 100
height = 100
xy_environment_7 = VacuumEnvironment(width, height)

print(f'The environment has been successfully created')
print()
print(f'Dirty locations: {xy_environment_7.dirt}')
print()

# Number of actions allowed
limit = 1000
actions = 0
state_reflex_agent_2d2 = VacuumAgent('State')

while(xy_environment_7.dirt and actions < limit):
    actions = actions + 1
    state_reflex_agent_2d2.act(xy_environment_7)
    #print(f'Remaining dirty locations: {xy_environment_1.dirt}')


print(f'Reflex Agent performance after {actions} actions is: {state_reflex_agent_2d2.performance}')
print(f'Remaining dirty locations: {xy_environment_7.dirt}')

The environment has been successfully created

Dirty locations: [(0, 1), (0, 2), (0, 5), (0, 6), (0, 7), (0, 9), (0, 10), (0, 11), (0, 17), (0, 19), (0, 20), (0, 23), (0, 25), (0, 27), (0, 29), (0, 33), (0, 35), (0, 38), (0, 41), (0, 44), (0, 46), (0, 47), (0, 48), (0, 52), (0, 55), (0, 59), (0, 61), (0, 64), (0, 66), (0, 69), (0, 70), (0, 72), (0, 73), (0, 76), (0, 78), (0, 82), (0, 86), (0, 87), (0, 88), (0, 96), (0, 98), (0, 99), (1, 1), (1, 7), (1, 8), (1, 10), (1, 12), (1, 13), (1, 16), (1, 17), (1, 18), (1, 19), (1, 20), (1, 21), (1, 23), (1, 24), (1, 26), (1, 30), (1, 31), (1, 32), (1, 34), (1, 35), (1, 36), (1, 37), (1, 38), (1, 39), (1, 40), (1, 43), (1, 44), (1, 46), (1, 49), (1, 52), (1, 53), (1, 55), (1, 56), (1, 58), (1, 59), (1, 63), (1, 69), (1, 70), (1, 71), (1, 72), (1, 74), (1, 78), (1, 81), (1, 82), (1, 87), (1, 88), (1, 90), (1, 91), (1, 92), (1, 93), (1, 94), (1, 95), (1, 96), (1, 99), (2, 3), (2, 4), (2, 12), (2, 14), (2, 15), (2, 16), (2, 17), (2, 22), (2, 23), (

In [123]:
# Environment that expands on a 2 dimensional plane.
width = 50
height = 50
xy_environment_6 = VacuumEnvironment(width, height)

print(f'The environment has been successfully created')
print()
print(f'Dirty locations: {xy_environment_6.dirt}')
print()

# Number of actions allowed
limit = 1000
actions = 0
reflex_agent_2d3 = VacuumAgent('Reflex_2D')

while(xy_environment_6.dirt and actions < limit):
    actions = actions + 1
    reflex_agent_2d3.act(xy_environment_6)
    #print(f'Remaining dirty locations: {xy_environment_1.dirt}')


print(f'Reflex Agent performance after {actions} actions is: {reflex_agent_2d3.performance}')
print(f'Remaining dirty locations: {xy_environment_6.dirt}')

The environment has been successfully created

Dirty locations: [(0, 4), (0, 5), (0, 6), (0, 7), (0, 10), (0, 11), (0, 12), (0, 15), (0, 16), (0, 17), (0, 19), (0, 24), (0, 25), (0, 28), (0, 29), (0, 30), (0, 31), (0, 34), (0, 35), (0, 36), (0, 37), (0, 38), (0, 40), (0, 41), (0, 42), (0, 43), (0, 47), (0, 49), (1, 0), (1, 1), (1, 3), (1, 4), (1, 8), (1, 9), (1, 10), (1, 11), (1, 19), (1, 20), (1, 21), (1, 23), (1, 24), (1, 25), (1, 28), (1, 30), (1, 31), (1, 32), (1, 36), (1, 40), (1, 41), (1, 42), (1, 43), (1, 44), (1, 45), (1, 48), (2, 0), (2, 3), (2, 4), (2, 8), (2, 10), (2, 14), (2, 19), (2, 24), (2, 25), (2, 27), (2, 29), (2, 35), (2, 39), (2, 42), (2, 43), (2, 46), (2, 49), (3, 0), (3, 1), (3, 3), (3, 4), (3, 5), (3, 8), (3, 9), (3, 11), (3, 16), (3, 17), (3, 18), (3, 27), (3, 28), (3, 29), (3, 31), (3, 32), (3, 33), (3, 36), (3, 37), (3, 38), (3, 40), (3, 41), (3, 44), (3, 46), (3, 49), (4, 1), (4, 3), (4, 4), (4, 8), (4, 9), (4, 10), (4, 12), (4, 13), (4, 14), (4, 15), (4, 17)

In [124]:
# Environment that expands on a 2 dimensional plane.
width = 100
height = 100
xy_environment_8 = VacuumEnvironment(width, height)

print(f'The environment has been successfully created')
print()
print(f'Dirty locations: {xy_environment_8.dirt}')
print()

# Number of actions allowed
limit = 1000
actions = 0
reflex_agent_2d4 = VacuumAgent('Reflex_2D')

while(xy_environment_8.dirt and actions < limit):
    actions = actions + 1
    reflex_agent_2d4.act(xy_environment_8)
    #print(f'Remaining dirty locations: {xy_environment_1.dirt}')


print(f'Reflex Agent performance after {actions} actions is: {reflex_agent_2d4.performance}')
print(f'Remaining dirty locations: {xy_environment_8.dirt}')

The environment has been successfully created

Dirty locations: [(0, 4), (0, 6), (0, 7), (0, 8), (0, 9), (0, 17), (0, 21), (0, 24), (0, 27), (0, 29), (0, 33), (0, 34), (0, 35), (0, 36), (0, 38), (0, 39), (0, 45), (0, 47), (0, 48), (0, 50), (0, 51), (0, 56), (0, 62), (0, 65), (0, 66), (0, 67), (0, 68), (0, 70), (0, 71), (0, 73), (0, 75), (0, 76), (0, 77), (0, 78), (0, 79), (0, 81), (0, 82), (0, 85), (0, 87), (0, 90), (0, 91), (0, 93), (0, 94), (0, 95), (0, 96), (0, 97), (1, 2), (1, 4), (1, 5), (1, 9), (1, 10), (1, 13), (1, 14), (1, 15), (1, 17), (1, 19), (1, 23), (1, 24), (1, 26), (1, 29), (1, 30), (1, 32), (1, 34), (1, 41), (1, 42), (1, 43), (1, 47), (1, 48), (1, 49), (1, 55), (1, 56), (1, 58), (1, 61), (1, 62), (1, 63), (1, 64), (1, 68), (1, 71), (1, 73), (1, 76), (1, 80), (1, 81), (1, 82), (1, 83), (1, 84), (1, 85), (1, 90), (1, 92), (1, 94), (1, 95), (1, 96), (1, 98), (1, 99), (2, 0), (2, 2), (2, 3), (2, 4), (2, 11), (2, 12), (2, 13), (2, 14), (2, 15), (2, 18), (2, 19), (2, 20), (2,

### Discusiones

En la implementacion del agente de reflejo simple y del agente de reflejo con una funcion aleatoria se observo que el que tuvo mucho mayor rendimiento fue el agente de reflejo simple, esto se debe a que el agente de reflejo simple tiene una funcion de agente que le permite tomar decisiones basadas en la percepcion actual, mientras que el agente de reflejo con una funcion aleatoria toma decisiones completamente aleatorias, lo que hace que su rendimiento sea muy bajo. 

Cierto, una desventaja significativa de un agente simple es su incapacidad para mantener un registro de eventos pasados, lo que limita su capacidad para tomar decisiones informadas en situaciones cambiantes. En contraste, un agente de reflejo con estado puede superar esta limitación al mantener un registro de ubicaciones previas y acciones realizadas. Esto le permite al agente evitar dirigirse a las mismas ubicaciones repetidamente, lo que puede conducir a una mejor eficiencia y rendimiento en entornos dinámicos. En resumen, la capacidad de mantener un estado interno y recordar observaciones pasadas puede proporcionar una ventaja significativa en situaciones donde la memoria es crucial para la toma de decisiones óptimas.

### Conclusiones


En este proyecto, hemos explorado el concepto de agentes reflejos, los cuales son agentes simples que perciben su entorno a través de sensores y actúan sobre él mediante actuadores basados en un conjunto de reglas o condicionales. Hemos observado que, aunque los agentes reflejos son fáciles de implementar, pueden no ser efectivos en entornos complejos o impredecibles.

Para abordar algunas de las limitaciones de los agentes reflejos simples, hemos examinado dos extensiones: agentes reflejos aleatorios, que toman decisiones aleatorias basadas en un conjunto de reglas, y agentes reflejos con estado, que mantienen un estado interno para tomar decisiones basadas en observaciones pasadas. Hemos implementado estas extensiones utilizando el módulo agent.py del repositorio de aimacode y hemos evaluado su rendimiento en diferentes entornos.

Observamos que los agentes reflejos aleatorios pueden superar a los agentes reflejos simples en ciertas situaciones, especialmente cuando el entorno es impredecible y el agente puede beneficiarse de la exploración y la experimentación con diferentes acciones. Sin embargo, los agentes reflejos aleatorios también pueden tener un rendimiento deficiente si sus acciones aleatorias conducen a resultados subóptimos.

Por otro lado, los agentes reflejos con estado pueden mejorar su rendimiento al mantener un estado interno y tomar decisiones basadas en observaciones pasadas. Sin embargo, el diseño de un agente reflejo con estado óptimo puede requerir un conocimiento significativo del dominio y experimentación.

En resumen, los agentes reflejos son un punto de partida simple y útil para la creación de agentes inteligentes. Sin embargo, en entornos complejos e impredecibles, pueden necesitarse técnicas más avanzadas, como la búsqueda, la planificación y el aprendizaje, para crear agentes que funcionen de manera efectiva.

### Referencias

[1] S. Russell, P. Norvig, “Artificial Intelligence”, 3st ed., Pearson, Ed. Pearson, 2010.

[2] UC Berkeley code repository, “aimacode” https://github.com/aimacode, (accessed: 02.03.2023).