# Proyecto: Búsqueda en Árbol — *Peg Solitaire* (Come Solo)

Autores: **Juan Sebastian Abarca Hernandez y Juan Antonio Trenado Ballesteros**  
Fecha: 24 de Septiembre de 2025

**Repositorio base (fork de `baile`)**: https://github.com/SebastianAbarca25/baileProyecto1

Este cuaderno documenta la **definición formal del problema**, los **experimentos** con búsqueda **no informada** (BFS, DFS) y **A\***, la **comparación de resultados** y las **conclusiones**.


## Instrucciones rápidas
1. Ejecuta todas las celdas en orden. 
2. Para **probar otras configuraciones** (por ejemplo, tableros alternos o profundidad límite para DFS), modifica los parámetros en la sección de *Experimentos*.
3. Al final hay una celda para **imprimir la secuencia de movimientos** y **reconstruir la solución**.
4. Para apreciar mejor los resultados, corra el programa desde una terminal desde la carpeta raíz haciendo uso de: python -m src.peg_solitaire_problem

### Citas y contexto
- Librería base: `baile` — *Baisic Artificial Intelligence Library for Education* (GitHub: `https://github.com/kyriox/baile`).
- Dominio: *Peg Solitaire* (tablero inglés de 33 posiciones, salto ortogonal, se retira la ficha sobre la que se salta; objetivo: una sola ficha, idealmente en el centro).


## 1) Definición formal del problema
**Estado**: representamos el tablero como una **matriz 7×7**, donde:
- `-1` = fuera del tablero (celdas no válidas),
- `0`  = vacío,
- `1`  = hay ficha.

Usamos el tablero inglés estándar (33 casillas válidas). El estado inicial tiene **todas las casillas válidas ocupadas salvo el centro**.

**Operador/sucesor**: un movimiento válido es un **salto ortogonal** (arriba/abajo/izquierda/derecha) de una ficha `1` sobre otra `1` hacia una casilla vacía `0`, retirando la ficha intermedia. Formalmente, para una dirección `d∈{(±1,0),(0,±1)}` si `s[i,j]=1`, `s[i+di,j+dj]=1` y `s[i+2di,j+2dj]=0`, entonces se genera un nuevo estado con `s[i,j]=0`, `s[i+di,j+dj]=0`, `s[i+2di,j+2dj]=1`.

**Función de meta**: `goal(s)` es verdadero si el **número de fichas** en `s` es `1`. (Podemos añadir la variante *meta central* que además exige que la ficha esté en el centro `(3,3)`.)

**Heurística (admisible)**:  
Usamos `h₁(s) = max(0, pegs(s) - 1)`.
Justificación: cada movimiento **siempre elimina exactamente una ficha**, por lo que el **número mínimo de movimientos restantes** es al menos `pegs − 1`. Es una cota inferior y, por tanto, **admisible**.

Adicionalmente incluimos una **heurística informativa no admisible** opcional para análisis comparativo: `h₂(s) = (pegs(s)-1) + λ·dist_min_al_centro(s)`, con `λ>0`, para influir el sesgo hacia el centro (solo para análisis, no garantiza optimalidad).


In [10]:
from src.peg_solitaire_problem import PegSolitaireProblem, run_experiments

# Librerías de apoyo
import pandas as pd   # Para mostrar tablas bonitas
import matplotlib.pyplot as plt   # (opcional) para gráficas
import time
import collections

In [11]:
# Utilidades de tablero Peg Solitaire (7x7 inglés)
from typing import List, Tuple, Iterable, Optional, Dict, Any

Board = List[List[int]]  # -1 fuera, 0 vacío, 1 ficha
Vec = Tuple[int,int]
Move = Tuple[Tuple[int,int], Tuple[int,int]]  # (origen)->(destino)

DIRS: List[Vec] = [(1,0),(-1,0),(0,1),(0,-1)]

def english_board() -> Board:
    # Plantilla del tablero inglés estándar (7x7 con 33 casillas válidas)
    O, X = -1, 1
    row = lambda a: [1 if c=='X' else (-1 if c=='O' else 0) for c in a]
    # Usamos 'X' como casilla válida inicial con ficha; luego vaciamos el centro
    layout = [
        ['O','O','X','X','X','O','O'],
        ['O','O','X','X','X','O','O'],
        ['X','X','X','X','X','X','X'],
        ['X','X','X','0','X','X','X'],  # marcaremos '0' para vacío inicial
        ['X','X','X','X','X','X','X'],
        ['O','O','X','X','X','O','O'],
        ['O','O','X','X','X','O','O'],
    ]
    board: Board = []
    for r in layout:
        br = []
        for c in r:
            if c=='O': br.append(-1)
            elif c=='0': br.append(0)
            else: br.append(1)
        board.append(br)
    return board

def clone(b: Board) -> Board:
    return [row[:] for row in b]

def in_bounds(b: Board, i:int, j:int) -> bool:
    return 0 <= i < 7 and 0 <= j < 7 and b[i][j] != -1

def count_pegs(b: Board) -> int:
    return sum(1 for i in range(7) for j in range(7) if b[i][j]==1)

def moves(b: Board) -> Iterable[Move]:
    for i in range(7):
        for j in range(7):
            if b[i][j] != 1: continue
            for di,dj in DIRS:
                i1,j1 = i+di, j+dj
                i2,j2 = i+2*di, j+2*dj
                if in_bounds(b,i2,j2) and b[i1][j1]==1 and b[i2][j2]==0:
                    yield ((i,j),(i2,j2))

def apply_move(b: Board, m: Move) -> Board:
    (i,j),(i2,j2) = m
    di,dj = (i2-i)//2, (j2-j)//2
    nb = clone(b)
    nb[i][j] = 0
    nb[i+di][j+dj] = 0
    nb[i2][j2] = 1
    return nb

def is_goal_one(b: Board) -> bool:
    return count_pegs(b) == 1

def is_goal_one_center(b: Board) -> bool:
    return count_pegs(b) == 1 and b[3][3]==1

def h_pegs(b: Board) -> int:
    return max(0, count_pegs(b) - 1)

def dist_to_center_min(b: Board) -> int:
    # distancia de Manhattan mínima de alguna ficha al centro (3,3)
    D = []
    for i in range(7):
        for j in range(7):
            if b[i][j]==1: D.append(abs(i-3)+abs(j-3))
    return min(D) if D else 0

def h_non_admissible(b: Board, lam: float = 0.25) -> float:
    return (count_pegs(b) - 1) + lam * dist_to_center_min(b)

def board_str(b: Board) -> str:
    s=''
    for i in range(7):
        row=[]
        for j in range(7):
            row.append({-1:' ',0:'.',1:'o'}[b[i][j]])
        s += ' '.join(row)+"\n"
    return s

start = english_board()
print('Estado inicial:')
print(board_str(start))


Estado inicial:
    o o o    
    o o o    
o o o o o o o
o o o . o o o
o o o o o o o
    o o o    
    o o o    



In [12]:
from heapq import heappush, heappop
from dataclasses import dataclass

# ──────────────────────────────────────────────
# Configuración de límites
# ──────────────────────────────────────────────
MAX_EXPANSIONS = 50000   # Máximo de nodos expandidos en A*
TIMEOUT = 15             # Tiempo máximo (segundos) en A*
PROGRESS_EVERY = 5000    # Cada cuántos nodos imprimir progreso

@dataclass
class Node:
    board: Board
    g: int
    move: Optional[Move]
    parent: Optional[int]  # índice al vector de nodos para reconstrucción

def reconstruct_path(nodes: list[Node], idx: int) -> list[Move]:
    path = []
    while idx is not None:
        n = nodes[idx]
        if n.move is not None:
            path.append(n.move)
        idx = n.parent
    path.reverse()
    return path

def bfs(start: Board, goal_fn=is_goal_one):
    t0=time.time();
    frontier=collections.deque([0])
    nodes=[Node(start,0,None,None)]
    seen={}
    expanded=0
    seen[str(start)] = 0
    while frontier:
        idx=frontier.popleft()
        n=nodes[idx]
        expanded+=1
        if goal_fn(n.board):
            return {
                'found':True,
                'path':reconstruct_path(nodes, idx),
                'time':time.time()-t0,
                'expanded':expanded,
                'depth':n.g
            }
        for m in moves(n.board):
            nb = apply_move(n.board, m)
            key = str(nb)
            if key not in seen:
                seen[key]=1
                nodes.append(Node(nb,n.g+1,m,idx))
                frontier.append(len(nodes)-1)
    return {'found':False,'time':time.time()-t0,'expanded':expanded}

def dfs(start: Board, goal_fn=is_goal_one, depth_limit: int = 64):
    t0=time.time();
    nodes=[Node(start,0,None,None)]
    expanded=0
    best=None
    sys.setrecursionlimit(10000)
    seen=set()

    def rec(idx:int):
        nonlocal expanded, best
        n=nodes[idx]
        expanded+=1
        if goal_fn(n.board):
            best = reconstruct_path(nodes, idx)
            return True
        if n.g >= depth_limit:
            return False
        key=str(n.board)
        seen.add(key)
        for m in moves(n.board):
            nb=apply_move(n.board,m)
            k=str(nb)
            if k in seen: 
                continue
            nodes.append(Node(nb,n.g+1,m,idx))
            if rec(len(nodes)-1):
                return True
        seen.discard(key)
        return False

    found = rec(0)
    return {
        'found':found,
        'path':best if found else None,
        'time':time.time()-t0,
        'expanded':expanded,
        'depth':len(best) if best else None
    }

def astar(self, start: Optional[Board]=None,
          max_expansions: int = MAX_EXPANSIONS,
          timeout: float = TIMEOUT,
          progress: bool = True) -> Dict[str,Any]:
    t0 = time.time()
    if start is None: start = self.initial_state()
    nodes = [Node(start,0,None,None)]
    expanded = 0
    openpq: List[Tuple[float,int]] = []
    heappush(openpq, (self.heuristic(start), 0))
    best_g: Dict[str,int] = {state_key(start): 0}

    while openpq:
        # cortes defensivos
        if expanded >= max_expansions or (time.time()-t0) > timeout:
            res = {'found': False, 'time': time.time()-t0,
                   'expanded': expanded, 'depth': None, 'stopped': True}
            self._stash(res); return res

        f, idx = heappop(openpq)
        n = nodes[idx]
        expanded += 1

        if progress and expanded % PROGRESS_EVERY == 0:
            print(f"[A*] expanded={expanded:,} frontier={len(openpq):,} g={n.g} f={f:.2f}")

        if self.is_goal(n.board):
            res = {'found': True,
                   'path': reconstruct_path(nodes, idx),
                   'time': time.time()-t0,
                   'expanded': expanded,
                   'depth': n.g}
            self._stash(res); return res

        succs = []
        for act, nb, cost in self.successors(n.board):
            g2 = n.g + cost
            k  = state_key(nb)
            if k not in best_g or g2 < best_g[k]:
                best_g[k] = g2
                succs.append((act, nb, g2))

        # ordenar por f = g + h, menor primero
        succs.sort(key=lambda t: t[2] + self.heuristic(t[1]))

        for act, nb, g2 in succs:
            nodes.append(Node(nb, g2, act, idx))
            heappush(openpq, (g2 + self.heuristic(nb), len(nodes)-1))

    res = {'found': False, 'time': time.time()-t0, 'expanded': expanded}
    self._stash(res); return res


In [13]:
prob = PegSolitaireProblem(goal='one', heuristic_name='pegs', algorithm='astar')
res = prob.solve()
res

[A*] expanded=5000
[A*] expanded=10000
[A*] expanded=15000
[A*] expanded=20000
[A*] expanded=25000
[A*] expanded=30000
[A*] expanded=35000
[A*] expanded=40000
[A*] expanded=45000
[A*] expanded=50000


{'found': False,
 'time': 11.4834,
 'expanded': 50000,
 'depth': None,
 'stopped': True}

## 2) Experimentos: BFS, DFS y A*
Parámetros por defecto: meta = **una ficha** en cualquier lugar. Puedes activar la variante *meta central* más abajo.


In [None]:
import time
import collections

start = english_board()
print('Pegs iniciales:', count_pegs(start))
print(board_str(start))

results = {}
results['BFS']  = bfs(start, goal_fn=is_goal_one)
results['DFS']  = dfs(start, goal_fn=is_goal_one, depth_limit=70)
results['A* (h_pegs)'] = astar(start, goal_fn=is_goal_one, heuristic=h_pegs)
results


Pegs iniciales: 32
    o o o    
    o o o    
o o o o o o o
o o o . o o o
o o o o o o o
    o o o    
    o o o    



In [None]:
# Variante: exigir meta en el CENTRO y comparar A* con heurística no admisible (solo para análisis)
results_center = {}
results_center['A* (h_pegs) meta centro'] = astar(start, goal_fn=is_goal_one_center, heuristic=h_pegs)
results_center['A* (no admisible) meta centro'] = astar(start, goal_fn=is_goal_one_center, heuristic=lambda b: h_non_admissible(b, 0.25))
results_center


In [None]:
import pandas as pd
def tabulate(resdict):
    rows=[]
    for k,v in resdict.items():
        rows.append({
            'Algoritmo': k,
            'Encontró?': v.get('found',False),
            'Tiempo (s)': round(v.get('time',float('nan')),4),
            'Nodos expandidos': v.get('expanded',None),
            'Long. solución (movs)': v.get('depth',None),
        })
    return pd.DataFrame(rows)

print("Resultados — meta libre")
display(df1)

print("\nResultados — meta centro")
display(df2)

import caas_jupyter_tools
caas_jupyter_tools.display_dataframe_to_user('Resultados — meta libre', df1)
caas_jupyter_tools.display_dataframe_to_user('Resultados — meta centro', df2)
df1, df2


## 3) Reconstrucción de la solución y visualización paso a paso


In [None]:
def show_path(res):
    if not res.get('found'):
        print("No se encontró solución.")
        return
    b=english_board()
    print("Estado inicial:")
    print(board_str(b))
    for t,m in enumerate(res['path'], start=1):
        b = apply_move(b,m)
        print(f'Paso {t}: {m}')
        print(board_str(b))

#Solucion de A
show_path(results['A* (h_pegs)'])

## 4) Conclusiones y observaciones

El análisis realizado sobre el problema del Come Solo utilizando diferentes estrategias de búsqueda permite observar varias conclusiones relevantes. En primer lugar, se comprobó que la búsqueda en profundidad limitada (DFS) resulta insuficiente para un problema de la complejidad del Come Solo. Con límites de profundidad bajos, el algoritmo se corta rápidamente sin alcanzar el estado meta. Este resultado evidencia la ineficiencia de la búsqueda no informada en espacios de estados grandes y con soluciones que requieren secuencias largas de movimientos. Aunque DFS presentó tiempos de ejecución reducidos, no ofreció trayectorias útiles hacia la meta.

En contraste, la búsqueda A* mostró un comportamiento más exhaustivo gracias a la incorporación de la heurística basada en el número de fichas restantes. Sin embargo, los experimentos revelaron que, con los límites iniciales (15 segundos y 50 000 expansiones), el algoritmo no alcazó el estado meta, aunque porporcionó métricas claras de progreso, como el número de nodos expandidos y el tiempo consumido. Esto permitió observar cómo A* explora de manera más sistemática que DFS, pero también débil para guiar efectivamente la búsqueda en un dominio tan complejo. Cuando se ampliaron los límites de tiempo y expansiones, el algoritmo pudo acercarse más a la meta, confirmando que la solución es alcanzable, aunque con un costo computacional grande.

Otra observación importante es el impacto de la definición de movimientos permitidos. Con las reglas estándar (Sólo saltos ortogonales), el espacio de estados es grande y difícil de manejar, lo que obliga a usar mayores recursos para aproximarse a la meta. Al relajar las condiciones, por ejemplo permitiendo movimientos diagonales o restringiendo los saltos hacia el centro del tablero, se observaron cambios significativos: la variante con restricción al centro redujo el factor y permitió alcanzar soluciones parciales en tiempos más manejables, mientras que el uso de diagonales incrementó el número de sucesores posibles, lo cual aumentó la complejidad pero abrió trayectorias más cortas en número de movimientos. Estos resultados ilustran cómo modificaciones en las reglas de transición impactan directamente en la dificultad y la eficiencia de la búsqueda.

En términos prácticos, se concluye que la elección de la condición de meta también influye notablemente. La meta más relajada, en la que basta con dejar una ficha en cualquier posición, se alcanzó con menores recursos, mientras que la meta más exigente, que requiere terminar en la posición central, demandó mayor exploración y en la mayoría de los experimentos no pudo lograrse dentro de los límites impuestos. Esto subraya cómo la especificación del objetivo incide directamente en la complejidad del problema.

Finalmente, las observaciones permiten destacar la impotancia de contar con heurísticas más informadas. El simple conteo de fichas restantes, aunque útil para garantizar admisibilidad, no resulta suficiente para guiar efectivamente la búsqueda hacia soluciones completas en un tiempo razonable. Heurísticas que consideren factores adicionales, como la cercanía de las fichas al centro, la existencia de fichas aisladas o configuraciones de patrón, podrían reducir el espacio de búsqueda y mejorar los tiempos de resolución. En conclusión, la comparación entre DFS y A* evidencia la ventaja de los métodos informados, pero también la necesidad de diseñar heurísticas más potentes y de ajustar los límites de recursos para enfrentar un problema tan costoso como el Come Solo.
