<a href="https://colab.research.google.com/github/FernandoIGD/UTEC_Machine-learning/blob/main/Clase_1/Agentes_Inteligentes.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Agentes Inteligentes

In [None]:
# @title Libro: Artificial Intelligence: A Modern Approach
# https://aima.cs.berkeley.edu/

import requests, html
from IPython.display import display, HTML

URL = "https://aima.cs.berkeley.edu/"
TITLE = "AIMA: Artificial Intelligence: A Modern Approach (Berkeley)"

# 1) IFRAME DIRECTO
iframe_directo = f"""
<div style="border:1px solid #ddd;border-radius:10px;overflow:hidden;margin-bottom:12px;">
  <div style="padding:10px 14px;background:#f7f7f7;font-weight:600;">
    {TITLE} ‚Äî Iframe directo
    <span style="float:right;">
      <a href="{URL}" target="_blank" style="text-decoration:none;">Abrir en pesta√±a nueva ‚Üó</a>
    </span>
  </div>
  <iframe src="{URL}" style="width:100%;height:800px;border:0;" allowfullscreen></iframe>
</div>
"""

display(HTML(iframe_directo))

# 2) FALLBACK CON SRCDOC
try:
    resp = requests.get(URL, timeout=20)
    resp.raise_for_status()
    html_text = resp.text

    if "<head" in html_text.lower():
        # Inserta justo despu√©s de la etiqueta <head ...>
        html_text = html_text.replace(
            "<head>",
            '<head><base href="https://aima.cs.berkeley.edu/" />',
        ).replace(
            "<HEAD>",
            '<HEAD><base href="https://aima.cs.berkeley.edu/" />',
        )
    else:
        html_text = (
            '<head><base href="https://aima.cs.berkeley.edu/" /></head>\n' + html_text
        )

    # Escapar para usar en srcdoc
    escaped = html.escape(html_text, quote=True)

    iframe_srcdoc = f"""
    <div style="border:1px solid #ddd;border-radius:10px;overflow:hidden;">
      <div style="padding:10px 14px;background:#f7f7f7;font-weight:600;">
        {TITLE} ‚Äî Fallback (srcdoc)
        <span style="float:right;">
          <a href="{URL}" target="_blank" style="text-decoration:none;">Abrir original ‚Üó</a>
        </span>
      </div>
      <iframe srcdoc="{escaped}" style="width:100%;height:800px;border:0;"></iframe>
    </div>
    """
    display(HTML(iframe_srcdoc))

except Exception as e:
    display(HTML(f"""
    <div style="padding:12px;border:1px solid #f99;background:#fff5f5;">
      No se pudo construir el fallback srcdoc: {html.escape(str(e))}
      <br>Abre el sitio aqu√≠: <a href="{URL}" target="_blank">{URL}</a>
    </div>
    """))


## ¬øQu√© es un Agente Inteligente?

De acuerdo con Russell y Norvig, un **agente inteligente** es **cualquier entidad que percibe su entorno a trav√©s de sensores y act√∫a sobre ese entorno mediante actuadores**.  

El comportamiento de un agente inteligente se caracteriza por su capacidad para tomar decisiones **racionales**, es decir, elegir las acciones que maximizan la probabilidad de alcanzar sus metas o de obtener el mayor rendimiento esperado, en funci√≥n de la informaci√≥n disponible.

### Elementos principales
- **Agente**: la entidad que toma decisiones.
- **Entorno**: todo lo que rodea al agente y con lo que interact√∫a.
- **Sensores**: permiten percibir el entorno.
- **Actuadores**: permiten realizar acciones que modifican el entorno.
- **Funci√≥n de agente**: mapea percepciones a acciones.
- **Racionalidad**: seleccionar la acci√≥n que maximiza el rendimiento esperado.



# Clasificaci√≥n de Agentes Inteligentes (Russell & Norvig) con ejemplos

Un **agente** percibe su entorno mediante **sensores** y act√∫a sobre √©l con **efectores**.  
Russell y Norvig distinguen cinco tipos principales, ordenados (aprox.) por complejidad.

---

## 1) Agente Reactivo Simple (Simple Reflex Agent)
**Idea clave:** act√∫a solo con base en el **percepto actual** siguiendo reglas **condici√≥n ‚Üí acci√≥n**. No tiene memoria del pasado.

- **Mecanismo:** `si condici√≥n entonces acci√≥n`
- **Ventaja:** r√°pido y simple.
- **Limitaci√≥n:** no funciona bien en entornos parcialmente observables.
- **Ejemplo:** **Termostato** que enciende/apaga la calefacci√≥n si la temperatura medida est√° bajo/encima de un umbral.

---

## 2) Agente Reactivo Basado en Modelo (Model-based Reflex Agent)
**Idea clave:** mantiene un **modelo interno del mundo** para inferir el **estado** cuando el entorno no es totalmente observable.

- **Mecanismo:** actualiza un **estado interno** a partir del percepto y el modelo; luego aplica reglas.
- **Ventaja:** maneja **informaci√≥n parcial** o ruidosa.
- **Limitaci√≥n:** el modelo puede ser costoso o impreciso.
- **Ejemplo:** **Robot aspirador** que **recuerda** d√≥nde hay paredes/obst√°culos ya detectados y evita chocar aun si el sensor moment√°neamente no los ve.

---

## 3) Agente Basado en Metas (Goal-based Agent)
**Idea clave:** elige acciones para **alcanzar una meta**; requiere **b√∫squeda/planificaci√≥n**.

- **Mecanismo:** usa el estado actual + una **meta** y busca un plan (secuencia de acciones).
- **Ventaja:** flexible para distintos objetivos.
- **Limitaci√≥n:** la planificaci√≥n puede ser costosa computacionalmente.
- **Ejemplo:** **Navegaci√≥n GPS** que calcula la **ruta** hasta un destino minimizando distancia o evitando peajes.

---

## 4) Agente Basado en Utilidad (Utility-based Agent)
**Idea clave:** entre m√∫ltiples metas o planes, elige el que **maximiza una funci√≥n de utilidad** (preferencias, trade-offs).

- **Mecanismo:** eval√∫a resultados por su **utilidad esperada** (beneficio, costo, riesgo).
- **Ventaja:** resuelve **conflictos entre objetivos** y maneja incertidumbre.
- **Limitaci√≥n:** definir y calibrar la utilidad puede ser dif√≠cil.
- **Ejemplo:** **Sistema de recomendaci√≥n** que ordena opciones (pel√≠culas/productos) para **maximizar la satisfacci√≥n** del usuario, equilibrando novedad y relevancia.

---

## 5) Agente que Aprende (Learning Agent)
**Idea clave:** mejora su desempe√±o con la **experiencia**. Integra:
- **Elemento de desempe√±o** (toma decisiones),
- **Cr√≠tico** (eval√∫a el resultado),
- **Elemento de aprendizaje** (ajusta el comportamiento),
- **Generador de problemas** (explora nuevas acciones).

- **Ventaja:** **adapta** reglas, modelos y utilidades al entorno.
- **Limitaci√≥n:** requiere datos, tiempo de exploraci√≥n y manejo de sesgos.
- **Ejemplo:** **Filtro de spam** que **actualiza** su modelo con los correos marcados por el usuario, mejorando la detecci√≥n con el tiempo.

---

## Categor√≠as

| Tipo de agente | ¬øEn qu√© se basa? | Ventaja principal | Limitaci√≥n t√≠pica | Ejemplo |
|---|---|---|---|---|
| Reactivo simple | Reglas sobre percepto actual | Muy r√°pido y sencillo | No maneja incertidumbre/oclusiones | Termostato |
| Reactivo con modelo | Estado interno + reglas | Maneja parcial observabilidad | Modelo puede ser costoso | Robot aspirador con mapa interno |
| Basado en metas | B√∫squeda/planificaci√≥n hacia objetivo | Flexible ante objetivos nuevos | Planificaci√≥n costosa | GPS con c√°lculo de ruta |
| Basado en utilidad | Maximizaci√≥n de utilidad esperada | Gestiona trade-offs y riesgo | Dif√≠cil definir utilidad | Recomendador personalizado |
| Que aprende | Mejora guiada por datos (cr√≠tico/aprendiz) | Se adapta y perfecciona | Requiere datos y control de sesgos | Filtro de spam que se entrena |

---


Esta clasificaci√≥n no es excluyente: sistemas reales a menudo **combinan** elementos (p. ej., un agente que **planea** con metas, **eval√∫a** con utilidad y adem√°s **aprende** para mejorar su modelo).


# Actividad

Describa las caracter√≠sticas de la siguiente aplicaci√≥n e identifique a qu√© categor√≠a pertenece:

In [None]:
# @title Agente
# Jupyter cell: Animaci√≥n de b√∫squeda de caminos con Backtracking usando PILA (DFS iterativo)
# Controles:
# - "Generar": crea una grilla aleatoria con obst√°culos, start y goal
# - "Paso": ejecuta UN paso del algoritmo (push/pop)
# - "Auto": corre pasos autom√°ticos (seg√∫n velocidad)
# - "Reiniciar": limpia y vuelve al estado inicial (misma grilla)
# - Sliders para velocidad, filas/columnas y densidad de obst√°culos
#
# Visualizaci√≥n:
#   ‚ñ™Ô∏è Gris oscuro = pared/obst√°culo
#   üü¶/azul (path) = en la pila (camino actual)
#   üü©/verde = visitado (explorado y descartado)
#   ‚≠ê inicio, üéØ meta
#   Mensajes muestran PUSH/POP, tama√±o de pila y estado
#
# Requisitos: ipywidgets y matplotlib habilitados.

import time
import random
import numpy as np
import ipywidgets as widgets
from IPython.display import display, clear_output
import matplotlib.pyplot as plt
from matplotlib.patches import Rectangle

# --------------------------
# Modelo y utilidades
# --------------------------
FREE  = 0
WALL  = 1

class BacktrackingDFS:
    def __init__(self, grid, start, goal):
        self.grid = grid            # 0 libre, 1 pared
        self.start = start          # (r,c)
        self.goal = goal            # (r,c)
        self.rows, self.cols = grid.shape
        self.visited = set()
        self.stack = []             # pila de celdas (r,c)
        self.done = False
        self.found = False
        self.log = []
        # para vecinos deterministas
        self._dirs = [(-1,0),(0,1),(1,0),(0,-1)]  # N, E, S, O

        # Inicializaci√≥n: push start
        self._push(self.start)

    def neighbors(self, r, c):
        for dr, dc in self._dirs:
            nr, nc = r + dr, c + dc
            if 0 <= nr < self.rows and 0 <= nc < self.cols:
                if self.grid[nr, nc] == FREE and (nr, nc) not in self.visited:
                    yield (nr, nc)

    def step(self):
        """Ejecuta un paso de backtracking con pila (PUSH o POP)."""
        if self.done:
            return

        if not self.stack:
            # sin camino
            self.done = True
            self.found = False
            self.log.append("‚öë Pila vac√≠a ‚Üí no hay camino.")
            return

        top = self.stack[-1]
        if top == self.goal:
            self.done = True
            self.found = True
            self.log.append("‚úì ¬°Meta encontrada! (en el tope de la pila)")
            return

        # Intentar expandir vecinos no visitados
        r, c = top
        next_candidates = list(self.neighbors(r, c))

        if next_candidates:
            # Elegir el primero por orden N-E-S-O (determinista)
            nxt = next_candidates[0]
            self._push(nxt)
        else:
            # Retroceder (POP)
            popped = self._pop()
            if popped == self.start and not self.stack:
                # regresamos al inicio y ya no hay m√°s
                self.done = True
                self.found = False
                self.log.append("‚öë Retroceso al inicio y pila vac√≠a ‚Üí no hay camino.")

    def _push(self, cell):
        self.stack.append(cell)
        self.visited.add(cell)
        self.log.append(f"PUSH {cell} | tama√±o pila = {len(self.stack)}")

    def _pop(self):
        cell = self.stack.pop()
        self.log.append(f"POP  {cell} | tama√±o pila = {len(self.stack)}")
        return cell

# --------------------------
# Generaci√≥n de grilla
# --------------------------
def generate_grid(rows, cols, density=0.25, rng_seed=None):
    rng = random.Random(rng_seed)
    grid = np.zeros((rows, cols), dtype=int)

    # Sembrar paredes seg√∫n densidad (pero no en start/goal)
    for r in range(rows):
        for c in range(cols):
            if rng.random() < density:
                grid[r, c] = WALL

    # Escoger start y goal en celdas libres distintas
    def random_free_cell():
        while True:
            rr = rng.randrange(rows)
            cc = rng.randrange(cols)
            if grid[rr, cc] == FREE:
                return (rr, cc)

    start = random_free_cell()
    goal  = random_free_cell()
    while goal == start:
        goal = random_free_cell()

    # Asegurar libres
    grid[start] = FREE
    grid[goal] = FREE
    return grid, start, goal

# --------------------------
# Render de la grilla
# --------------------------
def draw_grid(ax, grid, algo: BacktrackingDFS, show_numbers=False):
    rows, cols = grid.shape
    ax.clear()
    ax.set_aspect('equal')
    ax.set_xticks([])
    ax.set_yticks([])
    ax.invert_yaxis()  # (0,0) arriba-izquierda

    # Pintar celdas
    for r in range(rows):
        for c in range(cols):
            # capas: pared, visitado, en pila, start/goal
            # pared
            if grid[r, c] == WALL:
                ax.add_patch(Rectangle((c, r), 1, 1, facecolor='#666666', edgecolor='black', linewidth=0.5))
            else:
                ax.add_patch(Rectangle((c, r), 1, 1, facecolor='white', edgecolor='black', linewidth=0.5))

    # visitados (excluyendo los que a√∫n est√°n en pila)
    on_stack = set(algo.stack)
    for (vr, vc) in algo.visited:
        if (vr, vc) not in on_stack:
            ax.add_patch(Rectangle((vc, vr), 1, 1, facecolor='#b8e3b1', edgecolor='black', linewidth=0.5))  # verde claro

    # pila (camino actual)
    for (pr, pc) in algo.stack:
        ax.add_patch(Rectangle((pc, pr), 1, 1, facecolor='#89b4fa', edgecolor='black', linewidth=0.5))  # azul claro

    # inicio y meta
    sr, sc = algo.start
    gr, gc = algo.goal
    ax.add_patch(Rectangle((sc, sr), 1, 1, facecolor='#ffd166', edgecolor='black', linewidth=1.0))  # start (√°mbar)
    ax.text(sc+0.5, sr+0.5, "‚≠ê", ha='center', va='center', fontsize=12)
    ax.add_patch(Rectangle((gc, gr), 1, 1, facecolor='#06d6a0', edgecolor='black', linewidth=1.0))  # goal (verde)
    ax.text(gc+0.5, gr+0.5, "üéØ", ha='center', va='center', fontsize=12)

    # Opcional: numerar celdas
    if show_numbers:
        for r in range(rows):
            for c in range(cols):
                ax.text(c+0.5, r+0.5, f"{r},{c}", ha='center', va='center', fontsize=6, color='black')

    ax.set_xlim(0, cols)
    ax.set_ylim(0, rows)

# --------------------------
# Widgets y Estado
# --------------------------
rows_slider   = widgets.IntSlider(value=10, min=5, max=30, step=1, description="Filas:")
cols_slider   = widgets.IntSlider(value=14, min=5, max=40, step=1, description="Columnas:")
density_slider= widgets.FloatSlider(value=0.25, min=0.0, max=0.6, step=0.05, description="Densidad:")
seed_box      = widgets.IntText(value=42, description="Seed:")

speed_slider  = widgets.FloatSlider(value=0.15, min=0.02, max=0.8, step=0.01, description="Velocidad (s):")
btn_gen       = widgets.Button(description="Generar", icon="shuffle")
btn_step      = widgets.Button(description="Paso", icon="forward")
btn_auto      = widgets.ToggleButton(value=False, description="Auto", icon="play")
btn_reset     = widgets.Button(description="Reiniciar", icon="rotate-right")
show_nums     = widgets.Checkbox(value=False, description="Mostrar coordenadas")

out_plot = widgets.Output()
out_log  = widgets.Output(layout={'height': '140px', 'overflow': 'auto', 'border': '1px solid #ddd', 'padding': '6px'})

# Estado global de la demo
_state = {"grid": None, "algo": None, "snapshot": None}

def init_demo():
    grid, start, goal = generate_grid(rows_slider.value, cols_slider.value, density_slider.value, seed_box.value)
    algo = BacktrackingDFS(grid, start, goal)
    _state["grid"] = grid
    _state["algo"] = algo
    _state["snapshot"] = (grid.copy(), start, goal)

    with out_plot:
        clear_output(wait=True)
        fig, ax = plt.subplots(figsize=(6, 4.5))
        draw_grid(ax, grid, algo, show_numbers=show_nums.value)
        ax.set_title("Backtracking con PILA (DFS iterativo)")
        plt.show()

    with out_log:
        clear_output(wait=True)
        print("Grilla generada. Usa 'Paso' o activa 'Auto' para ver PUSH/POP.\n")
        print("\n".join(algo.log[-5:]))

def redraw():
    grid = _state["grid"]
    algo = _state["algo"]
    with out_plot:
        clear_output(wait=True)
        fig, ax = plt.subplots(figsize=(6, 4.5))
        draw_grid(ax, grid, algo, show_numbers=show_nums.value)
        status = "‚úì OBJETIVO ENCONTRADO" if algo.found else ("‚öë SIN CAMINO" if algo.done else "Buscando‚Ä¶")
        ax.set_title(f"Backtracking con PILA ‚Äî {status} ‚Äî tama√±o pila: {len(algo.stack)}")
        plt.show()
    with out_log:
        # Mostrar las √∫ltimas l√≠neas del log
        print("\n".join(algo.log[-8:]))

def on_generate(_):
    # Si Auto estaba corriendo, pararlo
    btn_auto.value = False
    init_demo()

def on_reset(_):
    btn_auto.value = False
    snap = _state["snapshot"]
    if snap is None:
        init_demo()
        return
    grid, start, goal = snap
    algo = BacktrackingDFS(grid.copy(), start, goal)
    _state["grid"] = grid.copy()
    _state["algo"] = algo
    with out_log:
        clear_output(wait=True)
        print("Estado reiniciado (misma grilla).")
    redraw()

def one_step(_=None):
    algo = _state["algo"]
    if algo is None:
        return
    if algo.done:
        # detener auto si termin√≥
        btn_auto.value = False
        redraw()
        return
    # limpiar mensaje antes del paso
    redraw()
    # ejecutar paso
    algo.step()
    redraw()

def on_auto_change(change):
    if change["name"] == "value":
        running = change["new"]
        if running:
            # loop
            while btn_auto.value:
                algo = _state["algo"]
                if algo is None or algo.done:
                    btn_auto.value = False
                    break
                algo.step()
                redraw()
                time.sleep(speed_slider.value)

def on_show_coords(change):
    redraw()

btn_gen.on_click(on_generate)
btn_step.on_click(one_step)
btn_reset.on_click(on_reset)
btn_auto.observe(on_auto_change)

show_nums.observe(on_show_coords, names='value')

# Inicializar interfaz
toolbar = widgets.HBox([btn_gen, btn_step, btn_auto, btn_reset])
controls = widgets.HBox([rows_slider, cols_slider, density_slider, seed_box, speed_slider, show_nums])

display(widgets.VBox([controls, toolbar, out_plot, widgets.HTML("<b>Eventos (PUSH/POP):</b>"), out_log]))

# Primer render
init_demo()


VBox(children=(HBox(children=(IntSlider(value=10, description='Filas:', max=30, min=5), IntSlider(value=14, de‚Ä¶