# Búsqueda - Search
---

## Contenidos
---

1. Introducción
2. Tipos de la Búsqueda
3. Búsquedas Desinformadas
    - Búsqueda en Amplitud
    - Búsqueda en Profundidad
    - Búsuqeda en Profundidad Acotada
    - Búsqueda en Profundidad Iterativa
    - Búsqueda de Coste Uniforme
4. Búsquedas Informadas
    - Búsqueda Mejor el Primero
    - A*

## 1 - Introducción
---

### El mundo de los estados
En el mundo de la IA, la toma de decisiones en función de las condiciones del **entorno** es llevada a cabo por lo que denominamos un **agente**. Para hacerlo más visual, este agente puede ser entendido como un robot que se programa.  

Entonces, ¿cómo se programa este robot para que tome una decisión? La solución está en la **búsqueda** entre las posibles acciones (y combinaciones de acciones consecutivas) que puede tomar desde su **estado inicial** hasta su **estado objetivo**. A cada decisión que tome, realizará una **acción** que le llevará hasta el estado siguiente, que pasará a ser su **estado actual**.  

<img src='./Imagenes/espacio_estados.png'>

Los elementos que permiten la transacción entre estados reciben el nombre de **operadores**.  
Por tanto, para resolver un problema mediante búsqueda, debe quedar definido:

###### Descriptores de estado
Estructura simbólica que representa un estado

###### Descriptores de operación
Herramientas computaciones capaz de transformar la representación del estado

###### Descriptores del algoritmo de búsqueda
Orden en que se aplican los operadores sobre los estados.  


### Problemas de Búsqueda
¿Qué forma tienen los problemas que se resuelven por búsqueda?  
Por ejemplo, un robot que es un brazo móvil tiene una serie bloques que debe desplazar desde un estado inicial hasta un estado final; y tiene un repertorio finito de acciones para alcanzar un objetivo.  

El planteamiento del problema modelo propuesto para el generador de planes automático utilizado en robótica [**STRIPS**](https://es.wikipedia.org/wiki/STRIPS), que es un referentes para toda la investigación posterior en el mundo del **Planning** y los algoritmos de **Search (búsqueda)**.  

```
Una instancia de STRIPS se compone de:
(1) Un estado inicial
(2) Un estado objetivo
(3) Un conjunto de acciones:
    (3.1) Precondiciones -> prerrequisitos que se han de cumplir en el entorno para poder realizar la accion
    (3.2) Postcondiciones -> consecuencias sobre los estados tras realizar la acciónÇ
```

Una **abstracción** es el proceso de remover los detalles de una representación. Por eso, la definición de problema debe de darse en forma de abstracción cuando programamos, ya que queremos utilizar las mismas funcionalidades independientemente del problema en concreto.

In [1]:
class Problem:
    '''
    Abstracción de un problema. 
    '''
    def __init__(self, inicial, objetivo=None):
        '''
        Al iniciar un problema, indicamos su estado inicial y un posible objetivo.
        '''
        self.inicial = inicial
        self.objetivo = objetivo

    def acciones(self, estado):
        '''
        Método que devuelve la *list* de las posibles acciones que pueden ser 
        ejecutadas en el estado inicial
        '''
        raise NotImplementedError

    def resultado(self, estado, accion):
        '''
        Devuelve el estado resultande de aplicar una acción en el estado actual
        Debe de ser una de las que se encuentren en la lista self.acciones(estado)
        '''
        raise NotImplementedError

    def es_objetivo(self, estado):
        '''
        Devuelve si el estado actual es el objetivo o no. Para ello compara el estado que
        recibe como parámetro con self.objetivo
        '''
        if isinstance(self.objetivo, list):
            return is_in(estado, self.objetivo)
        else:
            return estado == self.objetivo

    def path_cost(self, c, estado1, accion, estado2):
        '''
        Devuelve el coste de una solcuón desde el estado 1 al estado 2, asumiendo coste c.
        Si en la formulación del problema es camino seguido no es importante, esta función
        mirará solo el estado2. Si sí que importa, considerará c, estado1 y la acción. 
        '''
        return c + 1

    def valor(self, estado):
        '''
        Para problemas de optimización, cada estado tiene un valor.
        Un ejemplo es el problema escalada simple (Hill-Climbing), 
        que intentará maximizar este valor.
        '''
        raise NotImplementedError

### Medidas de Rendimiento de Ejecución de una Búsqueda
Antes de entrar a ver los diferentes algoritmos de búsqueda, necesitamos definir los criterios que hacen que un algoritmo sea mejor que otro.  

**Integridad *(completeness)*:**  
Garantiza el algoritmo encontrar una solución, en caso de haberla?  
**Optimalidad**:  
Encuentra el algoritmo la solución optima?  
**Complejidad de tiempo**:  
Cuánto tarda el algoritmo en encontrar la solución?   
**Complejidad de espacio**:  
Cuánta memoria se necesita para llevar acabo la búsqueda?  

### Código de la Clase Nodo:
Podemos definir la estructura de un nodo y definir una clase Nodo, para utilizarla en la construcción de objetos nodo, cada vez que se expanda un nodo en la búsqueda.  

In [2]:
class Nodo:
    '''
    Nodo en un árbol de búsqeda. Los nodos contienen punteros a los padres (el nodo predecesor) 
    y al estado actual para dicho nodo. Los nodos son estructuras de datos que actúan como 
    registros usado para representar al árbol de búsqueda
    
    Si se llega al mismo estado por dos caminos distintos, los árboles de búsqueda los entienden
    como dos nosods distintos, con información sobre el mismo estado.
    
    También incluyen información sobre la acción que se tomó para llegar a dicho nodo y el coste
    total del camino acumulado (g). Otras funciones como A* pueden también incluir el valor de 
    otras funciones (h).
    '''
    def __init__(self, estado, padre=None, accion=None, coste_camino=0):
        '''
        Crea un nodo de un SEARCH-TREE, resultante de aplicar una acción en un padre
        '''
        self.estado = estado
        self.padre = padre
        self.accion = accion
        self.coste_camino = coste_camino
        self.profundidad = 0
        if padre:
            self.profundidad = padre.profundidad + 1

    def __repr__(self):
        return "<Nodo %s>" % (self.estado,)

    def __lt__(self, nodo):
        return self.estado < nodo.estado

    def expandir(self, problema):
        '''
        Lista de los dondos alcanzables a una acción de este nodo
        '''
        return [self.nodo_hijo(problema, accion)
                for accion in problema.acciones(self.estado)]

    def nodo_hijo(self, problema, accion):
        '''
        Crear un nodo hijo dado una acción
        '''
        next = problema.resultado(self.estadp, accion)
        return Nodo(next, self, accion,
                    problema.coste_camino(self.coste_camino, self.estado, action, next))

    def solucion(self):
        '''
        Devuelve la secuencia de acciones para llegar desde el nodo raíz hasta este nodo
        '''
        return [node.action for node in self.path()[1:]]

    def camino(self):
        '''
        Devuelven la lista de nodos formando el camino desde el nodo raíz hasta este nodo.
        '''
        nodo, camino_de_vuelta = self, []
        while nodp:
            camino_de_vuelta.append(nodo)
            nodo = nodo.parent
        return list(reversed(camino_de_vuelta))


## Búsqueda de Soluciones
---
Ahora que sabemos la forma que tienen los problemas, es el momento de encontrar soluciones.  
Una **solución** es una **secuencia de acciones**. Entonces, los algoritmos de búsqueda encuentran la solución tras considerar distintas secuencias de acciones.  

El conjunto de secuencias que comienzan desde un mismo estado forma un **árbol de búsqueda *(search-tree)***. Las **ramas** de dicho árbol son acciones y cada uno de los **nodos** son cada uno de los estados en el espacio de estados.  

La construcción del árbol se realiza a través de la **expansión** de los nodos aplicando las posibles acciones en el estado actual, gerenado nuevos **nodos hijos** desde los **nodos padres**.  

Esta es la esencia de la búsqueda. Los nodos al final de cada rama reciben el nombre de **nodos hoja *(leaf nodes)***. El conjunto de todos los nodos hoja forma la **frontera *(frotier)*** la cual se va expandiendo.
<img src='http://artint.info/figures/ch03/searchsp.gif'>  

Podemos definir un algirtmo ```TREE-SEARCH``` sobre el cual se construirán los distintos tipos de búsquedas que veremos a continuación, los cuales variarán las preferencias en el paso de expansión; lo que define la **estrategia de búsqueda**.  

In [3]:
def tree_search(problema, frontera):
    '''
    Busca a través de crear sucesores hasta encontrar el objetivo.
    :frontera --> Queue (cola) vacía
    No se preocupa de estados repetidos
    '''
    frontera.append(Nodo(problema.inicial))
    while frontera:
        nodo = frontera.pop()
        if problema.es_objetivo(nodo.estado):
            return nodo
        frontera.extend(nodo.expandir(problema))
    return None

Hay un matix que es importante. En algunos problemas, existe el riesgo de caer en bucles infinitos. Por ejemplo, si buscamos la manera de ir de Madrid a Barcelona, podemos caer en el bucle de ir de Madrid a Valencia y de Valencia a Madrid de forma repetida. Esto es así porque los nodos en un árbol de búsqueda no entienden del estado.  

Para evitar esto, debemos tener la memoria de los estados ya explorados. Esto se consigue aumentando ```TREE-SEARCH``` con una estructura llamada **conjunto explorado**. Este nuevo algoritmo recibe el nombre de **grafo de búsqueda**, ```GRAPH-SEARCH```.

In [4]:
def graph_search(problema, frontera):
    '''
    Busca a través de crear sucersores hasta encontrar el objetivo.
    :frontera --> Queue vacía
    Si dos caminos llegan al mismo estado, usa solo 1 de ellos.
    '''
    frontera.append(Nodo(problema.inicial))
    explorados = set()
    while frontera:
        nodo = frontera.pop()
        if problema.es_objetivo(nodo.estado):
            return nodo
        explorados.add(nodo.estados)
        frontera.expandir(hijo for hijo in nodo.expandir(problema)
                        if hijo.estado not in explorados and hijo not in frontera)
    return None

## 2 - Tipos de búsqueda
---

El objetivo de la búsqueda es encontrar un camino a trabes del conjunto de estados entre el estado inicial y el objetivo. 

Existen diferentes criterios para clasificiar las búsqueda, una de ella es la **dirección** que toma. La búsqueda puede realizarse en dos direcciones:  

#### Búsqueda hacia adelante - Forward Search:
Se trata de una búsqueda guiada por datos. Aplicando las operaciones disponibles en cada estado para ir avanzando de uno a otro hasta encontrar el estado objetivo.



#### Búsqueda hacia atrás - Backward Search:
Se trata de partir del estado objetivo hasta llegar al estado inicial.  

Entonces, **¿cuál método de búsqueda elegir?**  
Existen diferentes criterios:  

- **Número de estados**:  
Normalmente es preferible ir de un conjunto con menor número de estados a uno con mayor número de estados.  

- **Factor de ramificación (branching factor)**:  
Es preferible tomar la dirección con menor factor de ramificación, lo cual quiere decir que el número (medio) de nodos que salen de cada nodo en la dirección de la búsqueda sea menor.  

- **Interpretabilidad**:  
Proceder en la dirección que más se aproxima a cómo pensará el futuro usuario.  
Por ejemplo, en un sistema de detección de fallos, se querrá saber cual ha sido la secuencia de acciones desde el fallo, y por tanto, razonando hacia atrás hasta llegar a la causa.  


Otro criterio para la clasificación de las reglas es el **conocimiento en la estrategia de control** de un sistema de búsqueda.  


## 3 - Búsqueda Desinformada
---
También llamada búsqueda exhausitiva o a ciegas.  
Estos algoritmos no utilizan ninguna ingormación del problema e ignorar hacia dónde se dirigen hasta que encuentran el objetivo. No se tiene en cuenta la posible localización del objetivo.  

Entonces, la manera de encontrar la solución es **generar todos los estados** aplicando una regla de forma sistmática *(algoritmo)*, sin tener en cuenta ninguna información del problema ni del objetivo que se busca.  

Exiten diferentes algoritmos de este tipo de búsqueda, las cuales se diferencian por el orden en el que dichos hijos son generados:  

### Búsqueda en Amplitud - Breadth-First Search
Se va generendo un grafo de estados. A partir de cada nodo se generan **todos los hijos**. Se pasa al siguiente nivel una vez que se han completados todos los nodos del nivel presente.
<img src='./Imagenes/amplitud.png'>

La regla de creación de este grafo es **FIFO** *(First-In, First-Out)*, expandiendo primero el nodo menos recientemente creado.  

**NOTA**: En el archivo [Queues](http://localhost:8888/notebooks/2%20-%20Búsqueda/Queues.ipynb) está el código del libro ***Artificiail Intelligence, a Modern Approach (AIMA)*** provided for the different types of queues. They will be used over the different search algorithms. 

La **ventaja** de esta estrategia es que genera todas las posibilidad, por lo tanto es seguro encontrar el camino más óptimo (el más corto).  
La **desventaja** de esta estrategia es la cantidad de memoria necesaria (hay que almacenar la información de todos los nodos creados) y el tiempo computacional (es una estrategia lenta).

In [5]:
def breadth_first_tree_search(problema):
    '''
    Algoritmo Búsqueda en Amplitud para el enfoque SEARCH-TREE
    Busca el árbol más plano posible. Mira todos los nodos del presente nivel 
    (misma profundidad) antes de aumentar la profundidad hasta el siguiente nivel.
    '''
    return tree_search(problema, FIFOQueue())


### Búsqueda en Profundidad - Depth-First Search
De igual manera se va generando un grafo de estados, generendo **todos los hijos** en cada nodo. Sin embargo, la estratregia de creación es **LIFO** *(Last-In, First-Out)*. Es decir, antes de completar el nivel actual, se da preferencia a continuar con los hijos del mejor de los hijos de estado principal. El equivalente al grafo anterior sería por tanto:  
<img src='./Imagenes/profundidad.png'>

La **ventaja** de esta estrategia es que si la tasa de generación de hijos es muy alta, se mitigan los problemas de memoria y el tiempo de encontrar el óptimo. Es por eso una estrategia muy recomendable cuando hay muchos estados objetivos igualmente deseables.  
La **desventaja** es que no ganaratiza que se encuentre la solución por el camino má corto. Por lo tanto, **no es óptimo**.  

Es común implementar el algoritmo en profundidad mediante una **función recursiva** que se llama así misma en cada hijo en cada iteración:

In [6]:
def depth_first_tree_search(problema):
    '''
   Algoritmo Búsqueda en Profundidad para el enfoque SEARCH-TREE
    '''
    "Search the deepest nodes in the search tree first."
    return tree_search(problema, Stack())


def depth_first_graph_search(problema):
    '''
    Algoritmo Búsqueda en Profundidad para el enfoque GRAPH-TREE
    '''
    return graph_search(problema, Stack())

### Búsqueda en Profundidad Acotada - Depth Limited Search
Estrategia de búsqueda en profundidad pero, se aplica hasta una profundidad determinada y, si la solución no se ha encontrado, se vuelve al nivel superior y se inicia la búsqueda en profundidad desde otro nodo de ese nivel.  

Este algoritmo alivia el proble de Búsqueda en Profundidad de bucles infinitos, pero introduce una **desintegridad** adicional si escogemos la cota límite l < d. Es decir, si el objetivo menos profundo, tiene un camino más largo que el límte escogido. Problema al cual estamos expuesto cuando no conocemos d.  

También sera **no óptimna** si elegimos l > d.

In [7]:
def depth_limited_search(problema, limite=50):
    '''
    Algoritmo de Búsqueda en Profundidad Acotada
    Implementación recursiva
    '''
    def recursive_dls(nodo, problema, limite):
        if problem.es_objetivo(nodo.estado):
            return nodo
        elif limite == 0:
            return 'parar'
        else:
            parado = False
            for hijo in nodo.expandir(problema):
                resultado = recursive_dls(hijo, problema, limite - 1)
                if resultado == 'parar':
                    parado = True
                elif resultado is not None:
                    return resultado
            return 'parar' if parado else None

    return recursive_dls(Nodo(problema.inicial), problema, limite)


### Búsqueda en Profundidad Iterativa
Estrategia de búsqueda en profundidad acotada, pero la conta inicial se va incrementeando en 1 hasta que se llega a la solución.  

**Combina las ventajas** de búsqueda en amplitud y profundidad, encontrando siempre el camino más corto sin necesidad de almacenar todos los nodos en la memoria. La analogía con búsqueda en amplitud es porque explora todos los nodos de un nivel en cada iteración. 

En general es la opción elegida cuando el espacio de búsqueda es grande y no se conoce la profundidad de la solución.  

In [8]:
def iterative_deepening_search(problema):
    '''
    Algorimtmo de búsqueda en Profundidad Iterativa
    '''
    for profundidad in range(sys.maxsize):
        resultado = depth_limited_search(problema, profundidad)
        if resultado != 'parar':
            return resultado

### Búsqueda de Coste Uniforme - Uniform Cost Search
Estrategia de búsqueda que expande el nodo *n* con el **coste de camino más bajo** *g(n)*.  
Esto se consigue almacenando la frontiera como una **cola de prioridad *(priority queue)*** por *g*. 

Este algoritmo de búsqueda es **óptimo**, ya que encontrará el camino más corto. Coste Uniforme no tiene en cuenta el número de pasos dados, sino solo su coste. Por tanto, puede quedar estancado en un bucle infinito si el coste entre sus acciones es 0, como por ejemplo en una secuencia *NoOp*.  
El algoritmo también es integral, puesto que siempre encontrará una solución 

In [9]:
def uniform_cost_search(problema):
    return best_first_graph_search(problema, lambda nodo: nodo.coste_camino)

## 3 - Búsqueda Informadas - Heurísiticas
---
Estos algoritmos utilizan información del problema para localizar al estado objetivo. Se tiene una **estimación** de lo que falta para llegar al estado objetivo. Por tanto, se utilizan técnicas para acelerar la búsqueda de la solución.  

Para aplicar esta estrategia se emplea una función denominada **heurístico**, encargada de medir esta **proximidad** de los nodos al nodo objetivo. El objetivo de esta estrategia es, por tanto, **reducir el número de nodos examinados** y la efectividad de la estrategia depende del heurístico seleccionado.  




### Escalada Simple - Hill Climbing
Es la interpretación más sencilla. Esta regla avanza al siguiente estado en cuando se encuentra un estado más favorable que el estado actual. 

Es un algoritmo muy sensible a óptimos locales o mesetas.

### Búsqueda Mejor el Primero - Best-First Search
---
Es una instancia general de los algoritmos ```TREE-SEARCH```y ```GRAPH-SEARCH``` en donde la selección del nodo que se va a expandir se hace en función del valor resultante de una **función de evaluación *f(n)***.  


In [10]:
def best_first_graph_search(problema, f):
    '''
    Algoritmo de Búsqueda Mejor el Primero
    Busca los nodos con el menor valor f. 
    La línea f = memoize(f, 'f') significa que los valores f se cachen en los nodos una vez
    son calculado. De esta menra, tras realizar la búsqueda se pueden examinas los valores f
    en el camino de vuelta.
    '''
    f = memoize(f, 'f')
    nodo = Nodo(problema.inicial)
    if problema.es_objetivo(nodo.estado):
        return nodo
    frontera = PriorityQueue(min, f)
    frontera.append(nodo)
    explorados = set()
    while frontera:
        nodo = frontera.pop()
        if problema.es_objetivo(nodo.estado):
            return nodo
        explorados.add(nodo.estado)
        for hijo in nodo.expandir(problema):
            if hijo.estado not in explorados and hijo not in frontera:
                frontera.append(hijo)
            elif hijo in frontera:
                titular = frontera[hijo]
                if f(hijo) < f(titular):
                    # del frontera[titular]
                    frontera.append(hijo)
    return None

## Búsqueda A* 
Evalua los nodos combinando el coste del camino hasta el nodo *g(n)*, con ina heurística elegida *h(n)* para calcular el valor de *f(n)*:

```
f(n) = g(n) + h(n)
```

h(n) es una **estimación** de lo que falta para llegar al objetivo.  

**Condiciones para optimalidad: Admisibilidad y Consitencia**
La primera condiciones es que ```h(n)``` ha de ser una **heurística admisible**. Es decir, una heurística que **nunca sobreestime** el coste de llegar al objetivo. Al ser ```g(n)```el coste de llegar al nodo actual, ```h(n)```nuenca puede ser sobreestimadora.  
Las heurísticas admisibles son por naturaleza **optimistas**, porque piensan siempre que el coste de resolver un problema es menor que el que en realidad es.  

La segunda condición es requerida únicamente cuando A* se aplica como ```GRAPH-SEARCH```. Una heurística ```h(n)```es **consistente** sim oara cada nono *n* y cada sucesor *n'* de *n* generado por cualquier accion *a*, el coste estimado de llegar al objetivo desde *n* es menor que la suma del coste estimado de llegar de *n* a *n'*, y el de llegar de *n'* al objetivo.  

In [11]:
def astar_search(problem, h=None):
    '''
    Búsqueda A*. 
    Es necesario definir h en A* o bien en la definición del problema.
    '''
    h = memoize(h or problema.h, 'h')
    return best_first_graph_search(problema, lambda n: n.coste_camino + h(n))