# Introducción a las técnicas de optimización
Uno de los principios más fundamentales de nuestro mundo es la búsqueda de los estados óptimos. Un claro ejemplo de ello son los átomos que componen la materia, los cuales intentan formar enlaces entre ellos para minimizar la energía de sus electrones. De la misma forma, estas moléculas se agrupan en estructuras cristalinas de energía óptima para formar cuerpos sólidos.

En la medida en que la humanidad existe, nos esforzamos por alcanzar la perfección en muchas áreas. Queremos llegar a un máximo grado de felicidad con el menor esfuerzo. En nuestra economía, las ganancias y las ventas deben ser maximizadas y los costos deben ser lo más bajos posible. Por ello, la optimización es una de las ciencias más antiguas que incluso se extiende a la vida cotidiana.

A lo largo de este tema intentaremos entender, desde un punto de vista matemático, qué supone un problema de optimización, cómo definirlo y qué técnicas se pueden emplear para resolverlo

## ¿Qué es un problema de optimización?
Como se ha comentando anteriormente, un problema de optimización consiste en encontrar un estado óptimo dentro de un dominio conocido. Esta definición es poco formal, por lo que resulta necesario tener una definición más formal sobre qué es un problema de optimización. Pero antes de definirlo de forma matemática, hay que hacer una distinción entre los tipos de optimización que existen: __local__ y __global__.

### Optimización local vs. Optimización global
Antes de enfrentarnos a un problema de optimización, tenemos que decidir si nos basta con obtener un estado óptimo local (__optimización local__) o, por el contrario, buscamos el estado más óptimo de entre todos los estados posibles (__optimización global__).

![Función con mínimo local y global](https://i.imgur.com/IXx2PiQ.gif)

Como se puede observar en la imagen, el punto $x^0$ es un mínimo local, puesto que es el valor más bajo que alcanza la función en un entorno determinado. Si estuviésemos ante un problema de optimización local, ya habríamos terminado. Sin embargo, si lo que realmente queremos es obtener el mínimo global, la técnica de resolución debería ser capaz de detectar que nos encontramos ante un mínimo local y seguir con la búsqueda del mínimo global $x^1$.

En esta asignatura obviaremos los problemas de optimización local, ya que son fáciles de resolver, y nos centraremos en los __problemas de optimización global__.

### Definición formal de problema de optimización global
El objetivo de la optimización global consiste en seleccionar los mejores elementos $x^*$ de entre un conjunto $\mathbb{X}$ de acuerdo a un conjunto de criterios $F=\left \{ f_1, f_2, \ldots, f_n \right \}$. En principio, y hasta que lleguemos al tema de optimización multiobjetivo, supondremos que nuestros problemas solo tienen un criterio. Cada uno de estos criterios se expresan como una función matemática, dando lugar a lo que se conoce como __función objetivo__:


---

__(Definición) Función objetivo.__ Una función objetivo $f : \mathbb{X} \rightarrow Y$ con $Y \subseteq \mathbb{R}$ es una función matemática que está sujeta a optimización.

---

El co-dominio $Y$ de una función objetivo así como su rango deben ser un subconjunto de los números reales ($Y \subseteq \mathbb{R}$). El dominio $\mathbb{X}$ de $f$ se conoce como espacio del problema, y puede resperentar un conjunto de cualquier tipo de elementos, tales como números, listas, tipos derivados, etc. El tipo del espacio del problema se elige de acuerdo al problema que se quiera resolver con el proceso de optimización. Cabe decir que las funciones objetivos no son necesariamente expresiones matemáticas, sino que en algunos casos pueden ser algoritmos complejos que involucran, por ejemplo, múltiples simulaciones.

Por lo tanto, la **optimización global** comprende todas aquellas técnicas que pueden ser utilizadas para encontrar los mejores elementos $x^*$ de $\mathbb{X}$ con respecto al criterio $f \in F$.

## Técnicas de optimización global
Las técnicas o algoritmos de optimización global se pueden encuadrar básicamente en dos grandes grupos, dependiendo de su modo de funcionamiento:

* Algoritmos exactos
* Algoritmos aproximados

Los algoritmos exactos se usan normalmente cuando existe una relación clara entre las características de las posibles soluciones y su utilidad para un problema dado. Cuando esto sucede, se puede explorar de forma eficiente el espacio de búsqueda usando, por ejemplo, un algoritmo de ramificación y poda. Por el contrario, si la relación entre una solución candidata y su utilidad no es obvia, o si la dimensionalidad del espacio de búsqueda es muy elevada, resulta imposible en la práctica aplicar este tipo de algoritmos, pues resultaría en recorrer prácticamente todo el espacio de soluciones para dar con el óptimo.

Si bien en esta asignatura nos centraremos en el segundo grupo, vamos a ver un caso de estudio en el que se utiliza un algoritmo exacto para resolver un problema de optimización global.

### Caso de estudio: optimización global exacta con fuerza bruta y Branch & Bound
Para ver cómo funciona un método exacto de optimización, se plantea el siguiente problema:

> Dada una mochila con una capacidad máxima de $W$ y un conjunto de $n$ objetos, cada uno de ellos con un peso $w_i$ y un valor $v_i$ conocido: encontrar el valor máximo que se puede conseguir rellenando la mochila de objetos sin que la suma de los pesos supere la capacidad $W$ de la misma.
> Los objetos no se pueden dividir; o lo metes en la mochila o lo dejas fuera. Es por esto por lo que a este problema se le conoce como el **Problema de la Mochila 0/1 (Knapsapp 0/1)**, y es un problema clásico de optimización.

Matemáticamente, el problema de la mochila se definiría como:

>Maximizar $\sum_{i=1}^{n} v_i x_i$ sujeto a $\sum_{i=1}^{n}w_i x_i \leq W$, donde $x_i \in \left \{0,1\right \}$ indica si el elemento i-ésimo se incluye o no en la mochila.

Un primer enfoque a seguir sería utilizar fuerza bruta, generando las $2^n$ posibles combinaciones, descartando aquellas que superen la capacidad de la mochila, y eligiendo de entre las restantes aquella que tiene un valor mayor:

In [0]:
import itertools
import numpy as np

def mochila_bruta(W, wi, vi):
    # Nos aseguramos que tenemos los pesos y valores del mismo número de items
    assert wi.shape == vi.shape
    
    n = wi.shape[0]
    
    # Generamos todas las posibles permutaciones (soluciones)
    combinaciones = np.array(tuple(itertools.product((0,1), repeat=n)))
    
    # Calculamos los pesos de cada solución...
    pesos = combinaciones @ wi.transpose()
    #... y el valor total de cada mochila solución
    valores = combinaciones @ vi.transpose()
    
    # Obtenemos los índices donde el peso NO supera al máximo W
    idx = np.where(pesos < W)
    
    # y devolvemos el mayor valor alcanzado así como el vector solución
    mejor = valores[np.where(pesos <= 10)].max()
    mejor_idx = np.where(valores == mejor)
    
    return mejor, pesos[mejor_idx], combinaciones[mejor_idx,:]

Una vez definido el método de fuerza bruta, podemos probarlo con distintas instancias del _problema de la mochila 0/1_. Una primera instancia a probar sería una mochila de 5 elementos:

In [0]:
capacidad = 10.0
pesos = np.array([2.0, 3.14, 1.98, 5.0, 3.0])
valores = np.array([40, 50, 100, 95, 30])

v, p, sol = mochila_bruta(capacidad, pesos, valores)
print('El valor máximo alcanzable es %d, con un peso de %.2f' % (v, p))
print('La solucion es ', sol)

El valor máximo alcanzable es 235, con un peso de 8.98
La solucion es  [[[1 0 1 1 0]]]


El mayor problema de este enfoque de _fuerza bruta_ es que el algoritmo tiene una complejidad exponencial. Como se ha dicho anteriormente, el algoritmo explora **todas** las soluciones posibles, es decir, tiene que generar y explorar $2^n$ soluciones, donde $n$ es el número de objetos posibles. Esto quiere decir que conforme intentemos resolver instancias del problema con un elevado número de objetos, el tiempo de ejecución del mismo aumentará exponencialmente.

Para comprobar esto, vamos a ejecutar el algoritmo de fuerza bruta con instancias de tamaño creciente, para medir el tiempo de ejecución de cada uno de ellos y ver cómo se incrementa dependiendo del tamaño de la entrada $n$. Para ello crearemos instancias sintéticas generando de forma aleatoria los valores y pesos de los objetos, mientras que la capacidad de la mochila dependerá de los pesos calculados anteriormente:

In [0]:
import altair as alt
import pandas as pd
import time

current_milli_time = lambda: int(round(time.time() * 1000))

n = list(range(5,21))
times = []
for k in n:
    pesos = np.random.randn(k)
    valores = np.random.randn(k)
    capacidad = np.quantile(pesos, 0.75)
    start_time = current_milli_time()
    mochila_bruta(capacidad, pesos, valores)
    time_diff = current_milli_time() - start_time
    times.append(time_diff)

resultados = pd.DataFrame({'n': n, 'time': times})
alt.Chart(resultados).mark_line().encode(x='n', y='time')

Como era de esperar, el tiempo de ejecución del algoritmo crece exponencialmente, lo que significa que es prácticamente imposible resolver una instancia con 30 objetos usando este método.

El método **Branch & Bound** es un método de exploración de soluciones que se planteó como una mejora de la exploración por fuerza bruta. Un algoritmo de ramificación y poda consiste en una enumeración sistemática de soluciones candidatas por medio de la búsqueda en el espacio de estados: el conjunto de soluciones candidatas se considera como la formación de un árbol enraizado con el conjunto completo en la raíz. El algoritmo explora las ramas de este árbol, que representan subconjuntos del conjunto de soluciones. Antes de enumerar las soluciones candidatas de una rama, la rama se comprueba con los límites superiores e inferiores estimados de la solución óptima, y se descarta si no puede producir una solución mejor que la mejor encontrada hasta ahora por el algoritmo.

Como era de esperar, la eficiencia de este algoritmo está directamente relacionada con las funciones para calcular los límites superiores e inferiores de cada nodo. Si no se utilizan estas funciones, el algoritmo se convierte en una búsqueda por fuerza bruta como ya hemos visto anteriormente. El algoritmo se define de la siguiente forma:



```
1. Inicializa una cola para guardar los nodos que quedan por explorar
2. Añade un nodo inicial vacío a la cola
3. Calcula el límite superior con la función heurística
4. Mientras la cola no esté vacía:
    4.1 Saca un nodo de la cola
    4.2 Si el nodo es una solución completa y mejora el límite superior actual, actualizar dicho límite
    4.3 En caso contrario, descomponer el nodo y añadir a la cola aquellos cuyo límite superior iguale o mejore al actual
```


Para resolver el problema de la mochila 0/1 necesitaremos una función que calcule un límite superior del valor máximo que podemos obtener desde una solución intermedia, que se representará como un nodo de nuestro árbol. Una posible opción es elegir un **método voraz** para calcular este límite, de forma que va añadiendo a la mochila los objetos ordenados según su ratio $\frac{v_i}{w_i}$ siempre que no se supere el peso máximo $W$ de la mochila.

A continuación se encuentra una implementación del algoritmo **Branch & Bound** para la resolución del _problema de la mochila 0/1_ definido anteriormente:





In [0]:
from collections import namedtuple, deque
import itertools

# Nodo de nuestro árbol de exploración de soluciones
Nodo = namedtuple('Nodo', 'peso valor nivel solucion')

# Tupla que representa un objeto de la mochila, con su peso, valor y el ratio
Item = namedtuple('Item', 'peso valor ratio')


# Nuestra función para estimar el límite superior de una solución parcial será
# utilizar un algoritmo voraz que va añadiendo los elementos que queden por
# seleccionar. La función recibe el nodo actual (solución parcial) y la
# colección de items que se pueden añadir a la mochila, ordenados de mayor a
# menor ratio, así como la capacidad W de la mochila
def bound(W, nodo, items):
    # Extraemos los objetos que no han sido seleccionados todavía en esta
    # solución parcial
    candidatos = list(items[nodo.nivel:])
    peso = nodo.peso
    valor = nodo.valor
    while candidatos and peso + candidatos[0].peso <= W:
        i = candidatos.pop(0)
        peso += i.peso
        valor += i.valor
    # Añadimos el siguiente objeto fraccionado si quedan candidatos
    # if candidatos:
    #     i = candidatos.pop(0)
    #     valor += (W - peso) * i.ratio
    return valor


def branch(nodo, items):
    solucion = list(nodo.solucion)
    solucion[nodo.nivel] = 1
    nodo_left = Nodo(peso=nodo.peso+items[nodo.nivel].peso,
                     valor=nodo.valor+items[nodo.nivel].valor,
                     nivel=nodo.nivel+1,
                     solucion=tuple(solucion))
    nodo_right = Nodo(peso=nodo.peso,
                      valor=nodo.valor,
                      nivel=nodo.nivel+1,
                      solucion=nodo.solucion)
    return nodo_left, nodo_right,


def mochila_bnb(W, wi, vi):
    # Construimos la colección de items, calculando su ratio y ordenandolos
    # de forma descendente
    items = zip(wi, vi, map(lambda x: float(x[0]) / x[1], zip(vi, wi)))
    items = tuple(map(lambda it: Item(it[0], it[1], it[2]), items))
    items = sorted(items, key=lambda x: x.ratio, reverse=True)

    N = len(items)

    pendientes = deque()
    # Primer nodo, tenemos que calcular el bound manualmente
    raiz = Nodo(peso=0.0, valor=0.0, nivel=0, solucion=tuple([0]) * N)

    # Inicializamos el mejor bound con el resultado del algoritmo voraz
    best = bound(W, raiz, items)
    best_sol = ()

    # Inicializamos la cola de nodos pendientes con el nodo raíz
    pendientes.append(raiz)

    while pendientes:
        nodo = pendientes.popleft()
        # Si estamos en nodo hoja, es decir, es una solución completa
        if nodo.nivel >= N:
            # actualizamos el mejor valor encontrado si supera al anterior
            best = max(best, bound(W, nodo, items))
            best_sol = nodo.solucion
        else:
            ns = branch(nodo, items)
            # Solo exploraremos los nuevos nodos que no superen la capacidad 
            # de la mochila y su bound iguale o mejore
            # al mejor bound encontrado
            for n in ns:
                if n.peso <= W and bound(W, n, items) >= best:
                    pendientes.append(n)
        pass

    return best, itertools.compress(items, best_sol)


Si utilizamos el método recientemente definido para resolver la primera instancia del problema que ya hemos visto anteriormente, se obtiene el siguiente resultado:

In [0]:
wi = [2.0, 3.14, 1.98, 5.0, 3.0]
vi = [40, 50, 100, 95, 30]
W = 10.0
best_value, best_items = mochila_bnb(W, wi, vi)
print('Mejor valor = %.2f' % best_value)
print('Items:')
for i in tuple(best_items):
    print(i)


Mejor valor = 235.00
Items:
Item(peso=1.98, valor=100, ratio=50.505050505050505)
Item(peso=2.0, valor=40, ratio=20.0)
Item(peso=5.0, valor=95, ratio=19.0)


Como se puede observar, el resultado obtenido es el mismo que usando fuerza bruta. Este resultado era esperable, pues el método de **Ramificación y poda** es una mejora con respecto a la búsqueda por fuerza bruta. Donde realmente se ve la mejora con respecto al método de fuerza bruta es en los tiempos de ejecución.

Vamos a probar nuestro algoritmo con una instancia del problema sacada de la web de [Rosetta Code](https://www.rosettacode.org/wiki/Knapsack_problem/0-1). Esta instancia cuenta con 22 objetos, cada uno de ellos con su correspondiente peso y valor. La capacidad de la mochila es de 400 unidades. En resumen, estamos ante una instancia con $N=22, W=400$.

In [0]:
# Datos de los objetos sacados de la web de Rosetta Code
items = (
    ("map", 9, 150), ("compass", 13, 35), ("water", 153, 200), 
    ("sandwich", 50, 160),
    ("glucose", 15, 60), ("tin", 68, 45), ("banana", 27, 60), 
    ("apple", 39, 40),
    ("cheese", 23, 30), ("beer", 52, 10), ("suntan cream", 11, 70), 
    ("camera", 32, 30),
    ("t-shirt", 24, 15), ("trousers", 48, 10), ("umbrella", 73, 40),
    ("waterproof trousers", 42, 70), ("waterproof overclothes", 43, 75),
    ("note-case", 22, 80), ("sunglasses", 7, 20), ("towel", 18, 12),
    ("socks", 4, 50), ("book", 30, 10),
    )

# Nos quedamos con los pesos y valores, que es lo que necesita nuestro método
# Branch & Bound como entrada
W = 400.0
wi = tuple(map(lambda x: x[1], items))
vi = tuple(map(lambda x: x[2], items))

best_value, best_items = mochila_bnb(W, wi, vi)
print('Mejor valor = %.2f' % best_value)
print('Items:')
for i in tuple(best_items):
    print(i)

Mejor valor = 1030.00
Items:
Item(peso=9, valor=150, ratio=16.666666666666668)
Item(peso=4, valor=50, ratio=12.5)
Item(peso=11, valor=70, ratio=6.363636363636363)
Item(peso=15, valor=60, ratio=4.0)
Item(peso=22, valor=80, ratio=3.6363636363636362)
Item(peso=50, valor=160, ratio=3.2)
Item(peso=7, valor=20, ratio=2.857142857142857)
Item(peso=13, valor=35, ratio=2.6923076923076925)
Item(peso=27, valor=60, ratio=2.2222222222222223)
Item(peso=43, valor=75, ratio=1.744186046511628)
Item(peso=42, valor=70, ratio=1.6666666666666667)
Item(peso=153, valor=200, ratio=1.3071895424836601)


Por último, vamos a comprobar que el nuevo método se ejecuta más rápido que el método de búsqueda por fuerza bruta, repitiendo el _benchmark_ que hicimos anteriormente y viendo cómo se comportan ambos algoritmos en función del tamaño de la instancia del problema:

In [0]:
n = list(range(5,21))
ns = []
times = []
method = []
for k in n:
    pesos = np.random.randn(k)*50
    valores = np.random.randn(k)*50
    capacidad = np.quantile(pesos, 0.75)
    start_time = current_milli_time()
    mochila_bruta(capacidad, pesos, valores)
    time_diff = current_milli_time() - start_time
    ns.append(k)
    times.append(time_diff)
    method.append('Fuerza bruta')
    start_time = current_milli_time()
    mochila_bnb(capacidad, pesos, valores)
    time_diff = current_milli_time() - start_time
    ns.append(k)
    times.append(time_diff)
    method.append('B&B')

resultados = pd.DataFrame({'n': ns, 'time': times, 'method': method})
alt.Chart(resultados).mark_line(strokeWidth=1).encode(x='n', 
                                                      y='time', 
                                                      color='method')


Se observa que, en general, el tiempo de ejecución del segundo método es mejor. Este resultado no debería sorprendernos, pues como ya se ha dicho, el segundo método es una mejora con respecto al primero.

### Clasificación de técnicas de optimización global
Las técnicas de optimización pueden categorizarse en base a sus características diferenciadoras. A continuación se pueden observar algunos ejemplos de técnicas de optimización muy conocidas distribuidas en una organización jerárquica:

* Algoritmos de optimización
    * Exactos
        * Basados en cálculo numérico
            * [Método de Newton](https://en.wikipedia.org/wiki/Newton%27s_method_in_optimization)
            * [Descenso del gradiente](https://en.wikipedia.org/wiki/Gradient_descent)
        * Enumerativos
            * [Programación dinámica](https://en.wikipedia.org/wiki/Dynamic_programming)
            * [Ramificación y poda](https://en.wikipedia.org/wiki/Branch_and_bound)
    * Aproximados
        - Basados en trayectoria
            - [Temple simulado](https://en.wikipedia.org/wiki/Simulated_annealing)
            - [Tabu search](https://en.wikipedia.org/wiki/Tabu_search)
            - [GRASP](https://en.wikipedia.org/wiki/Greedy_randomized_adaptive_search_procedure)
        - Basados en población
            - [Algoritmos evolutivos](https://en.wikipedia.org/wiki/Evolutionary_algorithm)
            - [Ant Colony Optimization](https://en.wikipedia.org/wiki/Ant_colony_optimization_algorithms)
            - [Particle Swarm Optimization](https://en.wikipedia.org/wiki/Particle_swarm_optimization)
 
 Esta asignatura se centra en los algoritmos que pertenecen a la segunda categoría, es decir, a los **algoritmos de optimización aproximados**. Una gran multitud de técnicas pueden encuadrarse dentro de esta categoría:
 
 ![Clasificación de algoritmos aproximados](https://upload.wikimedia.org/wikipedia/commons/c/c3/Metaheuristics_classification.svg)
 

---

**Problema 1.1.** Según se ha visto en el apartado del método _branch and bound_, el elemento que afecta en mayor medida al comportamiento del algoritmo es la función que se utilice para estimar el límite superior. Esta función, que se conoce comúnmente como heurística, reduce la complejidad del algoritmo permitiendo descartar ramas completas del árbol de exploración. En la implementación vista anteriormente, la función utilizada ha sido una técnica _greedy_ (voraz) para resolver el problema de la mochila 0/1, consistente en ir añadiendo a la mochila los objetos en orden descendente del ratio $\frac{v_i}{w_i}$.

Define una función heurística distinta a la utilizada anteriormente. Crea una nueva versión del algoritmo _branch and bound_ que permita recibir como parámetro la función para calcular el límite superior. Esta nueva versión debe devolver el número de nodos explorados adicionalmente al valor máximo encontrado y la solución que lo consigue.

Por último, realiza una comparación entre el heurístico ya utilizado y el que acabas de definir con respecto al resultado obtenido y el número de nodos que se explora en cada caso.

---

In [0]:
from collections import namedtuple, deque
import itertools

# Nodo de nuestro árbol de exploración de soluciones
Nodo = namedtuple('Nodo', 'peso valor nivel solucion')

# Tupla que representa un objeto de la mochila, con su peso, valor y el ratio
Item = namedtuple('Item', 'peso valor ratio')

# Nueva instancia del problema de la mochila 0/1 (optimo=3984)
vi = (360, 83, 59, 130, 431, 67, 230, 52, 93,
      125, 670, 892, 600, 38, 48, 147, 78, 256)

wi = (7, 0, 30, 22, 80, 94, 11, 81, 70,
      64, 59, 18, 0, 36, 3, 8, 15, 42)

W = 300

# Función heurística greedy utilizada anteriormente
def greedy_ratio(W, nodo, items):
    # Extraemos los objetos que no han sido seleccionados todavía en esta
    # solución parcial
    candidatos = list(items[nodo.nivel:])
    peso = nodo.peso
    valor = nodo.valor
    while candidatos and peso + candidatos[0].peso <= W:
        i = candidatos.pop(0)
        peso += i.peso
        valor += i.valor
    return valor


##################################################
# TODO: Definir otra función heurística distinta #
##################################################
def mi_heuristica(W, nodo, items):
    # sum_valor = sum(i.valor for i in unsorted_items)
    # new_items = tuple(map(lambda it: Item(it[0], it[1], (it[0] * it[1]) / sum_valor), unsorted_items))
    # items = sorted(new_items, key=lambda x: x.ratio, reverse=True)
    candidatos = list(items[nodo.nivel:])
    peso = nodo.peso
    valor = nodo.valor
    while candidatos and peso + candidatos[0].peso <= W:
        i = candidatos.pop(0)
        peso += i.peso
        valor += i.valor
    return valor


# El método para ramificar no cambia
def branch(nodo, items):
    solucion = list(nodo.solucion)
    solucion[nodo.nivel] = 1
    nodo_left = Nodo(peso=nodo.peso+items[nodo.nivel].peso,
                     valor=nodo.valor+items[nodo.nivel].valor,
                     nivel=nodo.nivel+1,
                     solucion=tuple(solucion))
    nodo_right = Nodo(peso=nodo.peso,
                      valor=nodo.valor,
                      nivel=nodo.nivel+1,
                      solucion=nodo.solucion)
    return nodo_left, nodo_right




##################################################################################
# TODO: Modificar la implementación del método para que devuelva en el resultado #
# el número de nodos explorados. También debe recibir como parámetro la función  #
# para calcular el límite superior                                               #
##################################################################################
def mochila_bnb_parametrizable(W, wi, vi, fbound):
    sum_valor = sum(vi)
    items = zip(wi, vi, map(lambda x: float(x[0]) / (x[1] if x[1] > 0 else 1), zip(vi, wi)))
    items = tuple(map(lambda it: Item(it[0], it[1], (it[0] * it[1]) / sum_valor), items))
    items = sorted(items, key=lambda x: x.ratio, reverse=True)

    N = len(items)

    pendientes = deque()
    # Primer nodo, tenemos que calcular el bound manualmente
    raiz = Nodo(peso=0.0, valor=0.0, nivel=0, solucion=tuple([0]) * N)

    # Inicializamos el mejor bound con el resultado del algoritmo voraz
    best = fbound(W, raiz, items)
    best_sol = ()

    # Inicializamos la cola de nodos pendientes con el nodo raíz
    pendientes.append(raiz)
    total_nodos = 0

    while pendientes:
        nodo = pendientes.popleft()
        total_nodos += 1
        # Si estamos en nodo hoja, es decir, es una solución completa
        if nodo.nivel >= N:
            # actualizamos el mejor valor encontrado si supera al anterior
            best = max(best, fbound(W, nodo, items))
            if fbound(W, nodo, items) > best:
                best_sol = nodo.solucion
        else:
            ns = branch(nodo, items)
            # Solo exploraremos los nuevos nodos que no superen la capacidad 
            # de la mochila y su bound iguale o mejore
            # al mejor bound encontrado
            for n in ns:
                if n.peso <= W and fbound(W, n, items) >= best:
                    pendientes.append(n)
        pass

    return best, itertools.compress(items, best_sol), total_nodos




# Comparamos los resultados para ambas heurísticas:
best_value, best_items, nodos = mochila_bnb_parametrizable(W, wi, vi, greedy_ratio)
print('GREEDY RATIO\tMejor valor: %.2f (visitando %d nodos y guardando %d items)' % (best_value, nodos, len(tuple(best_items))))
best_value, best_items, nodos = mochila_bnb_parametrizable(W, wi, vi, mi_heuristica)
print('MI HEURÍSTICA\tMejor valor: %.2f (visitando %d nodos y guardando %d items)' % (best_value, nodos, len(tuple(best_items))))

GREEDY RATIO	Mejor valor: 3842.00 (visitando 389 nodos y guardando 0 items)
MI HEURÍSTICA	Mejor valor: 3842.00 (visitando 389 nodos y guardando 0 items)


# Metaheurísticas

## Simulated Annealing
La técnica del **Recocido Simulado (Simulated Annealing)** es un algoritmo probabilístico para calcular una aproximación al máximo/mínimo global de una función determinada. En otras palabras, es una metaheurística capaz de obtener aproximaciones al máximo/mínimo global de problemas cuyo espacio de estados sea de tamaño considerable. El nombre de la técnica así como la inspiración de su funcionamiento proviene del proceso físico de recocido de los metales en la industria metalúrgica. Mediante este proceso, se somete al metal a un proceso de calentamiento y enfriamiento controlado para aumentar el tamaño de los cristales que forman las moléculas del mismo, mejorando sus características y reduciendo sus fallos estructurales.

Desde el punto de vista del algoritmo, esta noción de enfriamiento lento se interpreta como una disminución lenta en la probabilidad de aceptar soluciones peores a medida que se explora el espacio de solución. Como metaheurística que es, el algoritmo puede pasar de una solución a otra que es peor que la primera, incrementando de esta forma la capacidad de exploración del algoritmo, esperando escapar de óptimos locales.

Los parámetros que necesitamos definir para usar este algoritmo son los siguientes:

1. La función de energía (función objetivo): $E(s)$
2. La función que elige al azar un candidato vecino: $vecino(s)$
3. La función de probabilidad de transitar a otro estado: $P(E(s_t), E(s_{t+1}), T)$
4. La función que actualiza la temperatura en cada iteración: $temp(T)$
5. La temperatura inicial: $T_0$

Una vez definidos estos parámetros, el pseudo-código del algoritmo es el siguiente:

- Se elige un estado inicial $s \leftarrow s_0$
- Se inicializa la temperatura $T \leftarrow T_0$
- Mientras $T > 0$:
    - Se actualiza la temperatura $T \leftarrow temp(T)$
    - Se elige un estado vecino al azar $s' \leftarrow vecino(s)$
    - Si $P(E(s),E(s'),T)\geq random(0,1)$, entonces $s = s'$

Como se puede comprobar, la función de energía así como el cálculo de un estado vecino depende del problema que estemos resolviendo; es necesario saber medir la calidad (energía) de una determinada solución además de saber generar un nuevo estado del problema a partir de uno dado. Por otro lado, las funciones que actualizan la temperatura así como la de probabilidad de aceptación son independientes del problema. De hecho, es muy común utilizar una función de probabilidad de aceptación análoga al sistema físico que se intenta simular en este algoritmo:

$P(s,s',T) = \begin{cases}
 & 1 \text{ si } E(s')>E(s) \\ 
 & \exp(\frac{-(E(s')-E(s))}{T}) \text{ en otro caso }
\end{cases}$



In [0]:
import random
import math

prob_boltzmann = lambda e0, e1, t: 1.0 if e1 > 0 else math.exp((e0 - e1)/t)

# Método aproximado de optimización Recocido Simulado
# Parámetros:
#   e:      función de energía
#   vecino: función para seleccionar un estado vecino
#   p:      función de probabilidad de aceptación
#   temp:   función decreciente de actualización de la temperatura
#   t0:     temperatura inicial
#   e0:     estado inicial
# Salida: mejor estado encontrado, traza de energías alcanzadas
def recocido(e, vecino, p, temp, t0, s0):
    estado = s0
    t = t0
    # Estadística de energía para analizar la convergencia
    es = [e(s0)]
    while t > 1:
        t = temp(t)
        estado2 = vecino(estado)
        if p(e(estado), e(estado2), t) >= random.uniform(0.0, 1.0):
            estado = estado2
        es.append(e(estado))
    return estado, es



---

** Problema 1.2.** Hasta ahora, el problema de optimización que hemos estado resolviendo no permite que se repitan los objetos incorporados a la mochila, por lo que un objeto podrá estar o no incluído en la solución óptima, de ahí el nombre de 0/1.

Hay una generalización de este problema, que se conoce como _Unbounded Knapsack Problem_, en el cual tenemos un número infinito de objetos de cada tipo. Es decir, el problema se convierte en:

$ \mbox{maximizar}  \sum_{j=1}^{n} p_jx_j \\ \mbox{s.a.} \sum_{j=1}^{n} w_jx_j \leq W, x_j \geq 0, j \in \left \{ 1, \ldots,\right \}$

Resuelve la siguiente instancia de este problema mediante el algoritmo de **Recorrido Simulado**. Utiliza la función de probabilidad clásica de este enfoque para resolverlo. Recuerda que necesitas definir los siguientes parámetros:

- Temperatura inicial y cómo decae a lo largo del tiempo
- Función de energía, codificación del estado y estado inicial
- Función para elegir un estado vecino al azar

---


In [0]:
import random
import altair as alt
import pandas as pd

# Instancia de Unbounded Knapsack Problem
wi = (0.98, 1.12, 20.0, 3.14, 15.0, 7.2, 5.5, 14.9, 17.3, 10.0)
vi = (12.0, 7.8, 25.4, 10.0, 13.0, 7.2, 19.7, 15.0, 12.4, 7.2)
W = 250.0

# TODO: función de actualización de la temperatura
temp = lambda t: t - 1

# TODO: función de energía
energia = lambda s: sum(map(lambda x: x[0] * x[1], zip(s, vi)))

# TODO: función de vecino aleatorio
def vecino(s):
    i = random.randrange(len(s))
    if W - sum(map(lambda x: x[0]*x[1], zip(s, wi))) >= wi[i]:
        return s[:i] + (s[i]+1,) + s[i+1:]
    else:
        return s[:i] + (max(s[i]-1, 0),) + s[i+1:]

# TODO: estado y temperatura iniciales
s0 = tuple([5] * len(vi))
t0 = 5000

best, traza = recocido(energia, vecino, prob_boltzmann, temp, t0, s0)

resultados = pd.DataFrame({'iteracion': range(len(traza)), 'energia': traza})
alt.Chart(resultados).mark_line().encode(x='iteracion', y='energia')


## Tabu-search
Siguiendo con las metaheurísticas clásicas, la **búsqueda tabú** es un algoritmo aproximado de optimización que basa su funcionamiento en dos pilares fundamentales:

- El algoritmo es capaz de seleccionar un estado vecino con peor calidad que el actual para escapar de los óptimos locales
- Mantiene una memoria de estados _tabú_ que evita explorar cíclicamente los óptimos locales que ya se hayan visitado

Este algoritmo es bastante similar al **Simulated Annealing**, ya que tenemos potenciales movimientos a estados de peor calidad y movimientos a estados vecinos del estado actual. De hecho, el algoritmo **Simulated Annealing** puede verse como un caso especial en el que un estado cualquiera es un estado _tabú_ con cierta probabilidad (lo que resultaría de restar a 1 la probabilidad de seleccionar un estado vecino del algoritmo visto anteriormente).

El algoritmo **Tabu-search** queda definido de la siguiente forma:

1. Inicializar $s \in S, s^* \leftarrow s_0, T \leftarrow \emptyset$, donde $S$ representa el conjunto de todas las posibles soluciones, $s$ es la solución inicial, $s^*$ la mejor solución encontrada y $T$ el conjunto de soluciones _tabú_
2. Mientras $vecinos(s) - T \neq \emptyset$ y no se haya alcanzado el máximo de iteraciones:

    3. Elegir el $s_k \in vecinos(s) - T$ óptimo, es decir, el vecino que tenga mayor calidad $c(s_k)$
    4. $s \leftarrow s_k$
    5. Si $c(s)>c(s^*)$ entonces $s^* \leftarrow s$
    6. Actualizar $T$, añadiendo $s$ y eliminando elementos de $T$ hasta que vuelva a tener su tamaño máximo
    

La idea principal del algoritmo para escapar de los óptimos locales es, precisamente, que dichos óptimos locales se añadirán en algún momento a $T$, por lo que habrá ocasiones en las que se elija una solución peor de entre los vecinos, ya que se selecciona el mejor vecino de entre $vecinos(s) - T$. Una posible implementación para $T$ es utilizar una cola, de manera que los elementos que se eliminan cuando se alcanza el tamaño máximo son aquellos más antiguos.