# Desarrolo de Entornos y Agentes

## Tarea 1: Nueve Cuartos

#### Mirka Galilea Dennis Vargas

##### 23 de Enero del 2025

### Objetivos:
1. Crear un entorno llamado "Nueve Cuartos"
2. Diseñar agentes reactivos y racionales
3. Comparar el desempeño de agentes en diferentes variantes del entorno

In [7]:
%%writefile doscuartos_f.py
#!/usr/bin/env python
# -*- coding: utf-8 -*-

"""
doscuartos_f.py
----------------

Ejemplo de un entorno muy simple y agentes idem

"""

import entornos_f
from random import choice


__author__ = 'juliowaissman'


class DosCuartos(entornos_f.Entorno):
    """
    Clase para un entorno de dos cuartos.
    Muy sencilla solo regrupa métodos.

    El estado se define como (robot, A, B)
    donde robot puede tener los valores "A", "B"
    A y B pueden tener los valores "limpio", "sucio"

    Las acciones válidas en el entorno son
        ("ir_A", "ir_B", "limpiar", "nada").

    Todas las acciones son válidas en todos los estados.

    Los sensores es una tupla (robot, limpio?)
    con la ubicación del robot y el estado de limpieza

    """
    def accion_legal(self, _, accion):
        return accion in ("ir_A", "ir_B", "limpiar", "nada")

    def transicion(self, estado, acción):
        robot, a, b = estado

        c_local = 0 if a == b == "limpio" and acción == "nada" else 1

        return ((estado, c_local) if a == "nada" else
                (("A", a, b), c_local) if acción == "ir_A" else
                (("B", a, b), c_local) if acción == "ir_B" else
                ((robot, "limpio", b), c_local) if robot == "A" else
                ((robot, a, "limpio"), c_local))

    def percepcion(self, estado):
        return estado[0], estado[" AB".find(estado[0])]


class AgenteAleatorio(entornos_f.Agente):
    """
    Un agente que solo regresa una accion al azar entre las acciones legales

    """
    def __init__(self, acciones):
        self.acciones = acciones

    def programa(self, _):
        return choice(self.acciones)


class AgenteReactivoDoscuartos(entornos_f.Agente):
    """
    Un agente reactivo simple

    """
    def programa(self, percepcion):
        robot, situacion = percepcion
        return ('limpiar' if situacion == 'sucio' else
                'ir_A' if robot == 'B' else 
                'ir_B')


class AgenteReactivoModeloDosCuartos(entornos_f.Agente):
    """
    Un agente reactivo basado en modelo

    """
    def __init__(self):
        """
        Inicializa el modelo interno en el peor de los casos

        """
        self.modelo = ['A', 'sucio', 'sucio']

    def programa(self, percepción):
        robot, situación = percepción

        # Actualiza el modelo interno
        self.modelo[0] = robot
        self.modelo[' AB'.find(robot)] = situación

        # Decide sobre el modelo interno
        a, b = self.modelo[1], self.modelo[2]
        return ('nada' if a == b == 'limpio' else
                'limpiar' if situación == 'sucio' else
                'ir_A' if robot == 'B' else 'ir_B')


def prueba_agente(agente):
    entornos_f.imprime_simulacion(
        entornos_f.simulador(
            DosCuartos(),
            agente,
            ["A", "sucio", "sucio"],
            100
        ),
        ["A", "sucio", "sucio"]
    )

def test():
    """
    Prueba del entorno y los agentes

    """
    print("Prueba del entorno con un agente aleatorio")
    prueba_agente(AgenteAleatorio(['ir_A', 'ir_B', 'limpiar', 'nada']))

    print("Prueba del entorno con un agente reactivo")
    prueba_agente(AgenteReactivoDoscuartos())

    print("Prueba del entorno con un agente reactivo con modelo")
    prueba_agente(AgenteReactivoModeloDosCuartos())
    

if __name__ == "__main__":
    test()

Overwriting doscuartos_f.py


In [13]:
_author_ = 'Mirka Galilea Dennis Vargas'

In [6]:
import entornos_f
from random import choice

class NueveCuartos(entornos_f.Entorno):
    def acciones_legales(self, _, accion):
        acciones_legales =  ("ir_A", "ir_B", "ir_C", "ir_D", "ir_E", "ir_F", "ir_G", "ir_H", "ir_I", 
                          "limpiar", "nada", "subir", "bajar")
        return accion in acciones_legales
        
    def transicion(self, estado, accion):
        robot, A, B, C, D, E, F, G, H, I = estado
        pisos = [ "A", "B", "C", "D", "E", "F", "G", "H", "I"]

        print(f"Acción: {accion}, Estado antes de la transición: {estado}")
        if accion.startswith("ir_"):
            destino = accion.split("_")[1]
            if destino in pisos:
                nuevo_estado = (destino, A, B, C, D, E, F, G, H, I)
                print(f"Nuevo estado: {nuevo_estado}")
                return nuevo_estado, 0 
                
        elif accion == "limpiar":
            if robot == "A":
                A = "limpio"
            elif robot == "B":
                B = "limpio"
            elif robot == "C":
                C = "limpio"
            elif robot == "D":
                D = "limpio"
            elif robot == "E":
                E = "limpio"
            elif robot == "F":
                F = "limpio"
            elif robot == "G":
                G = "limpio"
            elif robot == "H":
                H = "limpio"
            elif robot == "I":
                I = "limpio"

            nuevo_estado = (robot, A, B, C, D, E, F, G, H, I)
            print(f"Nuevo estado tras limpiar: {nuevo_estado}")
            return nuevo_estado, 0 
  

        elif accion == "subir":
            if robot in ["C", "D", "F", "G"]:
                return estado, 0

        elif accion == "bajar":
            if robot in ["A", "B", "E", "F"]:
                return estado, 0
            
        elif accion == "nada":
            return estado, 0

    def percepcion(self, estado):
        robot, A, B, C, D, E, F, G, H, I = estado
        return (robot, A, B, C, D, E, F, G, H, I)
        
    
            

In [8]:
class AgenteAleatorio(entornos_f.Agente):
    def __init__(self, acciones):
        self.acciones = acciones
    def programa(self, percepcion):
        accion = choice(self.acciones)
        if accion == "limpiar":
            print("El agente está limpiando la casilla.")
        elif accion.startswith("ir_"):
            print(f"El agente se mueve a la casilla {accion[3:]}.")
        else:
            print("El agente no hace nada.")
        
        return accion

In [10]:
class AgenteReactivoNueveCuartos(entornos_f.Agente):
    def programa(self, percepcion):
        robot, A, B, C, D, E, F, G, H, I = percepcion
        
        if (robot == "A" and A == "sucio") or \
           (robot == "B" and B == "sucio") or \
           (robot == "C" and C == "sucio") or \
           (robot == "D" and D == "sucio") or \
           (robot == "E" and E == "sucio") or \
           (robot == "F" and F == "sucio") or \
           (robot == "G" and G == "sucio") or \
           (robot == "H" and H == "sucio") or \
           (robot == "I" and I == "sucio"):
            return "limpiar"  
        
       
        elif robot == "A":
            return "ir_B"
        
        elif robot == "B":
            return "ir_C"
      
        elif robot == "C":
            return "ir_D"
        
        else:
            return "nada"  


In [12]:
class AgenteReactivoModeloNueveCuartos(entornos_f.Agente):
    def __init__(self):
        self.modelo = ['A', 'sucio', 'sucio', 'sucio', 'sucio', 'sucio', 'sucio', 'sucio', 'sucio', 'sucio']

    def programa(self, percepcion):
        robot, A, B, C, D, E, F, G, H, I = percepcion
        self.modelo[0] = robot
        self.modelo[1] = A
        self.modelo[2] = B
        self.modelo[3] = C
        self.modelo[4] = D
        self.modelo[5] = E
        self.modelo[6] = F
        self.modelo[7] = G
        self.modelo[8] = H
        self.modelo[9] = I

        if self.modelo['ABCDEFGHI'.find(robot)] == 'sucio':
            return 'limpiar'

        if all(x == 'limpio' for x in self.modelo[1:]):
            return 'nada'

        for i in range(1, len(self.modelo)):
            if self.modelo[i] == 'sucio' and 'ABCDEFGHI'[i-1] != robot:
                return f"ir_{'ABCDEFGHI'[i-1]}"

        return 'nada'
    
def prueba_agente(agente):
    simulacion = entornos_f.simulador(
        NueveCuartos(),
        agente,
        ["A", "sucio", "sucio", "sucio", "sucio", "sucio", "sucio", "sucio", "sucio", "sucio"],
        100
    )
    print("\nSimulación de la ejecución del agente:\n")
    for i, (accion, estado, costo) in enumerate(simulacion):
        print(f"Paso {i + 1}:")
        print(f"  Acción tomada: {accion}")
        print(f"  Estado después de la acción: {estado}")
        print(f"  Costo acumulado: {costo}\n")


def test():
    print("\nPrueba del entorno con un agente aleatorio")
    prueba_agente(AgenteAleatorio(['ir_A','ir_B', 'ir_C', 'ir_D', 'ir_E', 
                                   'ir_F', 'ir_G', 'ir_H', 'ir_I', 'limpiar', 'nada']))
    print("\nPrueba del entorno con un agente reactivo")
    prueba_agente(AgenteReactivoNueveCuartos())
        
    print("\nPrueba del entorno con un agente reactivo con modelo")
    prueba_agente(AgenteReactivoModeloNueveCuartos())
        
if __name__ == "__main__":
    test()



Prueba del entorno con un agente aleatorio
El agente no hace nada.
Acción: nada, Estado antes de la transición: ['A', 'sucio', 'sucio', 'sucio', 'sucio', 'sucio', 'sucio', 'sucio', 'sucio', 'sucio']
El agente se mueve a la casilla I.
Acción: ir_I, Estado antes de la transición: ['A', 'sucio', 'sucio', 'sucio', 'sucio', 'sucio', 'sucio', 'sucio', 'sucio', 'sucio']
Nuevo estado: ('I', 'sucio', 'sucio', 'sucio', 'sucio', 'sucio', 'sucio', 'sucio', 'sucio', 'sucio')
El agente está limpiando la casilla.
Acción: limpiar, Estado antes de la transición: ('I', 'sucio', 'sucio', 'sucio', 'sucio', 'sucio', 'sucio', 'sucio', 'sucio', 'sucio')
Nuevo estado tras limpiar: ('I', 'sucio', 'sucio', 'sucio', 'sucio', 'sucio', 'sucio', 'sucio', 'sucio', 'limpio')
El agente se mueve a la casilla B.
Acción: ir_B, Estado antes de la transición: ('I', 'sucio', 'sucio', 'sucio', 'sucio', 'sucio', 'sucio', 'sucio', 'sucio', 'limpio')
Nuevo estado: ('B', 'sucio', 'sucio', 'sucio', 'sucio', 'sucio', 'sucio', 'su