# Introducción
Los algoritmos evolutivos (_EAs: Evolutionary Algorithms_) son técnicas metaheurísticas para resolver problemas de optimización, búsqueda y aprendizaje computacional (_Machine Learning_). Estas técnicas se inspiran en procesos que suceden en la naturaleza, como la selección natural, la supervivencia del más fuerte y la transmisión genética de los rasgos de los padres a sus hijos.

- Desde un punto de vista **matemático**, los EAs se consideran métodos numéricos
- Desde un punto de vista **computacional**, estas técnicas se consideran programas software
- Desde el punto de vista de **otras aplicaciones**, los EAs son simplemente herramientas disponibles para su uso.

Una de las principales ventajas que aportan este tipo de técnicas es su **gran aplicabilidad** a la resolución de multitud de tareas y problemas de optimización. Sirvan de ejemplo algunos de las siguientes familias de problemas de optimización para los cuales se han aplicado algoritmos evolutivos:

- Optimización numérica, como el problema de la mochila que ya hemos tratado en el tema anterior, o el problema del viajante de comercio que trataremos más adelante.
- [Particionado de grafos](https://en.wikipedia.org/wiki/Graph_partition)
- Diseño de circuitos VLSI (_Very Large Scale Integration_): es el proceso de crear un circuito integrado compuesto por cientos de miles de transistores en un único chip.
- Diseño y entrentamiento de redes neuronales y arquitecturas profundas
- Telecomunicaciones: redes de sensores, distribución de antenas de telecomunicación, etc.

Dentro del ámbito académico, los algoritmos evolutivos se enmarcan en lo que se conoce como [Soft Computing](https://es.wikipedia.org/wiki/Soft_Computing), o Inteligencia Computacional. En esta familia de algoritmos se encuentran, además de los EAs, las redes neuronales artificiales y la lógica difusa, entre otros.

A continuación se encuentra la definición más simple de un algoritmo evolutivo:

```
t = 0
inicializar población
evaluar población
mientras no se cumpla la condición de terminación:
    población* = variación(población)
    evaluar población*
    población(t+1) = selección(población*)
    t = t+1
fin mientras
```




In [0]:
# Implementación de un algoritmo evolutivo básico y parametrizable
def evolutivo(n_iters, evaluar, variacion, seleccion, N, crear_solucion):
    t = 0
    pop = [crear_solucion() for _ in range(N)]
    fitness = map(evaluar, pop)
    while t < n_iters:
        pop2 = map(variacion, pop)
        fitness2 = map(evaluar, pop2)
        pop = seleccion(pop + pop2)
        t += 1
    return pop


Como se puede observar en el pseuco-código anterior, los algoritmos evolutivos son extremadamente simples. Si bien todavía no hemos hablado de población, variación, recombinación ni evaluación de poblaciones, terminología que se detallará más adelante en este mismo tema, el equema general del algoritmo es bastante simple.

En resumen, las principales ventajas e inconvenientes de los algoritmos evolutivos son los siguientes:

- Ventajas:
  - Trabajan sobre la codificación de un problema
  - Aplicabilidad muy alta, basta con encontrar una codificación apropiada para tu problema
  - No se obtiene solo una buena solución, sino que se obtiene toda una población de buenas soluciones
  - Explotación y exploración del espacio de búsqueda configurable
- Inconvenientes:
  - No está asegurado encontrar un óptimo
  - Hay muchas líneas de investigación abiertas
  - Alta demanda computacional

# Elementos de un Algoritmo Evolutivo
A continuación se describen uno por uno los diferentes elementos que conforman un Algoritmo Evolutivo, y por tanto hay que definir y, en algunos casos, implementar siempre que se pretenda resolver un problema de optimización con alguna de estas técnicas.

## El individuo (o cómo codificar la solución)
La idea principal de los algoritmos evolutivos es que las posibles soluciones a un problema de optimización se codifican como si del individuo de una determinada población se tratase. Desde el punto de vista de la teoría de la evolución de Darwin, los individuos que son capaces de adaptarme mejor al medio que les rodea son aquellos que sobreviven y se reproducen, transmitiendo su información genética a su progenie. Pequeñas mutaciones a nivel genético hacen que determinados individuos desarrollen capacidades especiales para adaptarse mejor o peor al medio que les rodea, y estas mutaciones son las que se transmiten a los descendientes.

Por tanto, el primer paso es buscar una codificación adecuada para las soluciones candidatas a nuestro problema de optimización en forma de individuo, el cual deberá tener un cromosoma formado por distintos genes. Cada gen puede tomar una serie de valores, los cuales se codifican en el alelo de dicho gen:


![Esquema de un individuo](https://i.imgur.com/oDzywrt.png)

Un detalle importante es que los alelos pueden ser tan simples o complejos como requiera tu problema de optimización, desde valores enteros y reales, pasando por arrays e incluso tipos derivados.

### Algunos ejemplos de codificación de soluciones

![Posible solución al problema de las n reinas en tablero 8x8](https://miro.medium.com/max/630/1*Zm2pbDR5CS2w2xeUbTBxQQ.png)

El **problema de las ocho reinas** es un pasatiempo que consiste en poner ocho reinas en el tablero de ajedrez sin que se amenacen. Fue propuesto por el ajedrecista alemán Max Bezzel en 1848. En el juego del ajedrez la reina amenaza a aquellas piezas que se encuentren en su misma fila, columna o diagonal. El juego de las 8 reinas consiste en poner sobre un tablero de ajedrez ocho reinas sin que estas se amenacen entre ellas. Este problema se puede generalizar variando el tamaño del tablero y el número de reinas que hay que colocar. A esto se le conoce como **el problema de las $n$ reinas**, donde hay que colocar $n$ reinas en un tablero de $n \times n$ de forma que no se amenacen entre ellas.

Una posible codificación de las soluciones al problema de las $n$ reinas sería un cromosoma con $n \times n$ genes, cuyos alelos podrían tomar valores 0 y 1, dependiendo de si en esa casilla colocamos una reina o no. En otras palabras, tratamos el tablero de ajedrez bidimensional como un array unidimensional:

$$
I=\langle x_1, x_2, \ldots, x_{n \times n} \rangle, x_i \in \left \{0, 1 \right\}
$$


![Esquema de red neuronal artificial](https://cdn-images-1.medium.com/max/1600/1*Gh5PS4R_A5drl5ebd_gNrg@2x.png)

El problema del **entrenamiento de una red neuronal artificial** supone determinar los mejores pesos sinápticos entre unidades de forma que se optimice la función objetivo que se está intentando modelar (un clasificador, una regresión, etc.). Podemos utilizar un algoritmo de entrenamientos clásico de la literatura, como por ejemplo el _back propagation_, o bien podríamos usar un algoritmo evolutivo para determinar esos pesos. Por lo tanto, una posible codificación de las soluciones de este problema en forma de individuo sería tener un único cromosoma con $\sum_{i=1}^{k} n_i$ genes, donde $n_i$ es el número de pesos a entrenar en la capa $i$. Al igual que pasaba con el problema de las $n$ reinas, 'aplanamos' nuestras matrices de pesos sinápticos en un único vector unidimensional por pura conveniencia.

Otra posible codificación sería emplear individuos con $k$ cromosomas, donde $k$ es el número de capas del modelo a entrenar. De esta forma haríamos una distinción en el proceso evolutivo entre las diferentes capas neuronales.

![Problema del viajante](https://optimization.mccormick.northwestern.edu/images/e/ea/48StatesTSP.png)

El **problema del viajante/comercial** (conocido como _TSP: Travelling Salesman Problem_) plantea la siguiente pregunta:

> Dada una lista de ciudades y las distancias entre cada par de ciudades, ¿cuál es la ruta más corta posible que visita cada ciudad y vuelve a la ciudad de origen?

Es un problema de optimización combinatoria NP-hard que se usa normalmente como _benchmark_ para comparar diferentes técnicas de optimización. El problema se formuló por primera vez en 1930 y es uno de los problemas de optimización más estudiados. Aunque el problema es difícil de calcular, se conoce un gran número de heurísticas y algoritmos exactos, de modo que algunos casos con decenas de miles de ciudades pueden ser resueltos completamente e incluso los problemas con millones de ciudades pueden ser aproximados.

El TSP tiene varias aplicaciones incluso en su formulación más pura, como la planificación, la logística y la fabricación de microchips. Ligeramente modificado, aparece como un subproblema en muchas áreas, como la secuenciación del ADN. En estas aplicaciones, el concepto de ciudad representa, por ejemplo, clientes, puntos de soldadura o fragmentos de ADN, y el concepto de distancia representa tiempos o costes de viaje, o una medida de similitud entre fragmentos de ADN. El TSP también aparece en astronomía, los astrónomos que observan muchas fuentes querrán minimizar el tiempo que pasan moviendo el telescopio entre las fuentes. En muchas aplicaciones, pueden imponerse restricciones adicionales, como recursos limitados o ventanas de tiempo.

Desde el punto de vista de la codificación de las soluciones de este problema, hay que pensar en las restricciones que nos impone el problema. Una de ellas nos dice que tenemos que recorrer todas las ciudades, y la otra que tenemos que empezar y acabar en la misma ciudad. Por lo tanto, lo que realmente importa en nuestras soluciones es el orden en el que visitamos las ciudades. Y como estamos obligados a pasar por todas, podemos concluir que una posible representación de las soluciones para este problema serían permutaciones de las ciudades, es decir, un cromosoma con tantos genes como ciudades haya en el problema, y en el cual cada alelo puede tomar el valor de una ciudad:

$$
I = \langle x_1, x_2, \ldots, x_n \rangle \\
{\Large \forall} i,j \in \left \{1, \ldots, n \right \}, x_i \neq x_j, x_i \in CIUDADES
$$

## La función de _fitness_ (calidad)
Como ya se ha dicho antes, los algoritmos evolutivos basan su funcionamiento en la teoría de la evolución de Darwin, en la cual los elementos mejor adaptados son los que sobreviven, mejorando así generación tras generación la calidad de la población al completo. Por tanto, parece razonable que a al hora de resolver un problema de optimización con un algoritmo evolutivo haya que definir, de alguna forma, cómo de bien adaptado está un determinado individuo al medio. O lo que es lo mismo, qué calidad tiene la solución codificada en mi individuo.

Una función de _fitness_ se aplica sobre un individuo de la población para obtener un valor de su calidad, generalmente un valor numérico real:

$$
f: \mathbb{S} \rightarrow \mathbb{R}
$$

La importancia de esta función con respecto al funcionamiento de un algoritmo evolutivo es **enorme**, pues si el algoritmo no es capaz de medir la calidad de las soluciones parciales que va explorando generación tras generación, no será capaz de realizar una búsqueda guiada y por tanto se transformará en una búsqueda aleatoria. Por tanto, uno de los **pasos más importantes** en el uso de los algoritmos evolutivos es, precisamente, elegir la función de _fitness_ adecuada.

También hay que tener en cuenta que la función de _fitness_ dependerá en gran medida del problema que se intente resolver. Por tanto no hay una regla de oro para elegir una buena función. Lo que si que se ha estudiado son características y transformaciones que se pueden realizar a las funciones de _fitness_ para que el algoritmo funcione mejor. Son las siguientes:

- **Escalado**: intenta separar al máximo los distintos valores de _fitness_ que se asignan a los individuos para facilitar la selección. Suele funcionar bien elevar al cuadrado los valores de la función.
- **Compartición**: soluciones parecidas deben tener valores de _fitness_ similares, de esta forma se agrupan en el espacio de búsqueda y es más fácil aprovechar la faceta exploratoria del mismo.
- **Ranking**: de la misma forma, la función debe servir para ordenar una población de soluciones dependiendo de su calidad.

Es importante destacar que se pueden configurar los algoritmos evolutivos para que busquen soluciones tanto con un valor alto de _fitness_ como con uno bajo. Es decir, este valor de calidad se puede **maximizar** y **minimizar**.

### Ejemplos de funciones de _fitness_
Siguiendo con los ejemplos de problemas para los cuales ya hemos buscado una codificación en individuos de las soluciones candidatas, vamos a analizar y determinar posibles funciones de _fitness_ para estos problemas:

- **Problema de las n reinas**: Lo que buscamos en este problema es que no haya ningúna reina amenazándose con otra. Por lo tanto una posible función de fitness podría ser el número de reinas amenazándose de una determinada solución. Habría que configurar el algoritmo evolutivo para que minimizase el _fitness_.
- **Problema del entrenamiento de una red neuronal artificial**: Si queremos mejorar el desempeño de la red neuronal artificial, habría que intentar minimizar el error existente entre el resultado esperado y el proporcionado por la red. En estos casos se suele utilizar el error cuadrático medio como función de _fitness_. De nuevo, estamos ante un _fitness_ que hay que minimizar.
- **Problema del viajante**: En este caso había que recorrer todas las ciudades, minimizando la distancia recorrida. Por lo tanto, la función de _fitness_ será el sumatorio de las ditancias entre ciudades, según se recorran las ciudades en el orden que determina el individuo.

## Recombinación
El operador de recombinación se utiliza para generar nuevas soluciones a partir de otras ya existentes, de forma que las nuevas soluciones generadas comparten parte de su carga genética con las soluciones que han servido para generarlas. En otras palabras, el operador de recombinación coge dos o más soluciones (padres) y recombina los genes de sus cromosomas, de forma que los nuevos individuos (hijos) están formado por una combinación de los genes de los padres.

Estos operadores se basan en la siguiente premisa:

> Si tenemos dos buenas soluciones, las socluiones que generemos a partir de ellas también serán buenas. O lo que es lo mismo, si dos soluciones son buenas, la combinación de ellas tambén será buena (incluso mejor).

Dependiendo de la codificación utilizada para los individuos, se tendrá que elegir alguno de los operadores de recombinación disponibles en la literatura, o bien desarrollar uno propio. A continuación se encuentra un listado de los operadores de recombinación más utilizados en la literatura, así como una explicación de su funcionamiento:

### Cruce en 1 o n punto(s):
Este método de recombinación funciona de la siguiente manera:

![One-point Crossover](https://upload.wikimedia.org/wikipedia/commons/thumb/5/56/OnePointCrossover.svg/462px-OnePointCrossover.svg.png)

La elección del punto de corte es aleatoria. Se puede generalizar para $n$ padres, aumentando entonces el número de hijos generados. En algunas ocasiones, el algoritmo evolutivo solo se queda con uno de los dos hijos.

También se puede generalizar en el cruce en $n$ puntos. A continuación se puede ver el funcionamiento del cruce en 2 puntos:

![n-point crossover](https://www.tutorialspoint.com/genetic_algorithms/images/multi_point_crossover.jpg)

### Cruce uniforme
En el cruce uniforme, se recorren en paralelo cada uno de los genes de los padres, y se decide aleatoriamente cuál de ellos se va a transmitir al hijo. La selección aleatoria se realiza de forma equiprobable, por lo que hay una probabilidad $p=0.5$ de elegir el gen de cada uno de los padres para transmitirlo al hijo.

Generalmente, lo que se suele utilizar es generar una máscara binaria del tamaño del cromosoma de los padres, de forma que se crean dos hijos a partir de los padres, seleccionando los genes de cada una de las posiciones en función de la máscara aleatoria obtenida:

![Uniform crossover](https://i.imgur.com/dWIK4G8.jpg)



## Mutación
Al igual que los operadores de recombinación, la mutación se utliliza para introducir diversidad en la población de soluciones. El funcionamiento de estos operadores se inspira en las mutaciones genéticas que sufren las especies. A partir de un individuo (solución candidata) puede generarse uno nuevo realizando una pequeña modificación a su cromosoma. De esta forma obtenemos una solución muy parecida, pero diferente.

De nuevo, el operador de mutación tiene una fuerte dependencia de la codificación utilizada, en especial de los valores que pueden tomar los alelos. Por ejemplo, si tenemos alelos binarios, el operador de mutación realizaría una inversión del mismo a nivel de bit. En el caso de valores reales, un posible operador de mutación sería aquel que añade al valor de un alelo una pequeña perturbación aleatoria.

A continuación se describen algunos de los operadores de mutación más conocidos:

### Mutación bit-flip
Esta mutación tiene sentido cuando tenemos individuos cuyos alelos pueden tomar valores binarios. El operador recorre cada uno de los genes del cromosoma, e invierte su valor con una probabilidad $p=\frac{1}{n}$, donde $n$ es el número total de genes. De esta forma, a lo largo de las generaciones se mutarán 1 gen por iteración, aproximadamente.

Este operador se puede extender para alelos que pueden tomar valores de un tipo enumerado, de forma que en lugar de realizar una inversión binaria, lo que se aplica en la mutación es un desplazamiento al siguiente valor del enumerado, de forma circular.

### Mutación Gaussiana
Operador de mutación para alelos con valores reales. Al igual que el anterior, recorre cada gen del cromosoma, aplicando una perturbación al mismo muestreada de una distribución Gaussiana. La probabilidad de mutación es parametrizable.

$$
mg_{\{p_m\}}:I \rightarrow I, (s_1, s_2, \ldots, s_n) = (s'_1, s'_2, \ldots, s'_n) \\ {\Large \forall} j \in \left \{ 1, \ldots, n\right \} s'_j=\begin{Bmatrix} s_j & \mbox{ if } \alpha > p_m\\ s_j + \sigma_j ·N(0,1)  & \mbox{ if } \alpha \leq p_m \end{Bmatrix}
$$

Como se puede observar en la formulación matemática, este operador admite varios hiper-parámetros:

- La probabilidad de mutación de un gen $p_m$
- El tamaño de la perturbación $\sigma_j$

Estos parámetros pueden estar fijados al inicio del algoritmo evolutivo, o bien ir adaptándose a la situación actual dentro del proceso evolutivo. Por ejemplo, el tamaño de la perturbación podría ser alto al principio de la ejecución para potenciar la exploración, e ir reduciéndose con el paso de las generaciones para ir aprovechando la explotación. En el caso de la probabilidad de mutación, ésta también podría ir adaptándose a las condiciones del proceso evolutivo, como por ejemplo la diversidad de la población o el histórico de las últimas mejoras obtenidas.


## Selección
Como hemos visto anteriormente, existen operadores de variación para obtener nuevas soluciones (individuos) a partir de otras. Mediante la aplicación iterativa de estos operadores a subconjuntos de la población de soluciones, el algoritmo evolutivo va mejorando progresivamente la calidad general de dicha población. Pero para garantizar esto, no se debería seleccionar este subconjunto de soluciones de forma arbitraria, ya que son soluciones que nos servirán como semillas para las nuevas. El mecanismo mediante el cual se selecciona un subconjunto de individuos de la población se conoce como el **mecanismo de selección**. Y, si bien es cierto que hay operadores de selección totalmente arbitrarios, lo normal es que aprovechen la valiosa información que nos da la función de _fitness_ para guiar, de algún modo, esa selección de soluciones que sirven como semilla para generar otras nuevas.

### Selección proporcional al _fitness_, o ruleta
Como su propio nombre indica, esta selección se basa en el valor de _fitness_ de los individuos de la población. De esta manera, si $f_i$ es el valor de calidad del i-ésimo individuo, entonces su probabilidad de ser seleccionado es:

$$
p_i = \frac{f_i}{\sum_{j=1}^{N} f_j}
$$

El nombre de ruleta se refiere a que el mecanismo de selección puede ser visto como hacer girar una ruleta en la que sus huecos representan cada uno de los individuos de la población, y en la cual los tamaños de los huecos son proporcionales al valor de _fitness_ de dicho individuo.

### Selección por torneo
En este caso, el mecanismo funciona seleccionando al azar un número determinado de soluciones, generalmente dos, y seleccionando aquella que tiene un mejor valor de _fitness_. De esta forma se simula una competición por el medio de varios individuos de la población.

### Selección elitista o truncado
Este mecanismo de selección es bastante simple. Su funcionamiento consiste en seleccionar siempre los $k$ individuos con mejores valores de _fitness_. Hay que tener mucho cuidado con el elitismo en los algoritmos evolutivos, pues un exceso del mismo puede llevar a que el algoritmo evolutivo se comporte en una búsqueda demasiado guiada, por lo que se podría estancar fácilmente en óptimos locales.

## Reemplazo
En la última fase de cada generación de un algoritmo evolutivo es donde se encuentra la parte más importante de todo: el mecanismo de reemplazo. Este mecanismo es el encargado de decidir qué individuos se mantendrán en la población para la siguiente generación. En otras palabras, **qué individuos sobreviven**. Al tratarse de un proceso selectivo, pueden utilizarse las mismas técnicas de selección que se han descrito en la sección anterior.

De hecho, es muy común combinar un reemplazo elitista de pequeño tamaño con otro de los mecanismos, para buscar un equilibrio entre exploración y explotación, garantizando que una pequeña cantidad de los mejores individuos pasan a la siguiente generación.

# Uniendo las piezas
Una vez hemos definido las piezas que conforman un algoritmo evolutivo, a continuación se analiza cómo se combinan estas piezas entre sí, formando un algoritmo evolutivo. La forma en la que se unan dichas piezas, así como los distintos hiper-parámetros que se utilicen, caracterizan a las diferentes familias de algoritmos evolutivos.


## El _breeding pipeline_
El proceso lineal por el cual se selecciona un subconjunto de individuos y se generan nuevas soluciones a partir de ellos, aplicando los operadores de variación se conoce como _breeding pipeline_. Este proceso lineal determina el comportamiento del algoritmo evolutivo, por lo que es clave pensar en su diseño a la hora de enfrentarnos a un problema de optimización.

![Ejemplo de Breeding Pipeline](https://www.researchgate.net/profile/Raul_Lara-Cabrera/publication/233732668/figure/fig3/AS:300012874551301@1448540051675/Genetic-algorithms-breeding-pipeline.png)

Por ejemplo, el pipeline anterior define que los dos padres que necesita el operador de cruce se elegirán mediante una selección por torneo. Una vez se realiza el cruce, los individuos cruzados se someten a un proceso de mutación y se añaden al _pool_ de candidatos a sobrevivir hasta la siguiente generación.



---

**Problema 2.1** Implementa un algoritmo evolutivo con operadores parametrizables para resolver el problema de optimización _Max Ones_ que se define de la siguiente forma: el problema consiste en encontrar en array binario de tamaño $n$ con mayor número de unos. Implementa los operadores de mutación, recombinación y selección que consideres oportunos. 

---

In [1]:
import itertools
import pandas as pd
import numpy as np
import altair as alt
import statistics
from random import random, choice, sample

# Tamaño de la instancia
n = 10

# Codificación del individuo: ¿Cómo codificamos las posibles soluciones al problema?
# individuo_maxones = ([0, 1, 1, 0, 0], 2)

# Función de fitness
def fitness_maxones(cromosoma):
    # TODO: Implementar la función de fitness para resolver el problema
    return sum(cromosoma)

# Operadores
def mutacion_maxones(ind, pmg):
    for gen in range(len(ind[0])):
        if random() <= pmg:
            ind[0][gen] = (ind[0][gen] + 1) % 2

def recombinacion_maxones(ind1, ind2):
    # Seleccionar punto de corte aleatorio
    px = choice(range(len(ind1[0])))
    
    hijo1 = (ind1[0][:px] + ind2[0][px:], -1)
    hijo2 = (ind2[0][:px] + ind1[0][px:], -1)
    
    return hijo1, hijo2

def seleccion_torneo(poblacion, k=2):
    luchadores = sample(poblacion, k)
    return sorted(luchadores, key=lambda ind: ind[1], reverse=True)[0]

def seleccion_elitista(poblacion, k):
    ordenada = sorted(poblacion, key=lambda ind: ind[1], reverse=True)
    return ordenada[:k], ordenada[k:]

# def seleccion_ruleta(poblacion, k):
#     supervivientes = []
#     candidatos = list(poblacion)
    
#     for _ in range(k):
#         calidades = map(lambda ind: ind[1], candidatos)
#         calidad_total = sum(calidades)
#         calidades_relativas = map(lambda c: float(c)/calidad_total, calidades)
#         calidades_acumuladas
#         posicion
        

def simple_ea(num_gens, npob, lambda_, px, pmut, pmg, elite):
    poblacion = [([choice([0,1]) for _ in range(n)], -1) for _ in range(npob)]
    historico_fitness = []
    fitness_medio = []
    desviaciones = []
    gen = 0
    
    # Evaluar la población inicial
    for individuo in poblacion:
        # ([0, 1, 1, 0], -1)
        individuo = (individuo[0], fitness_maxones(individuo[0]))
    
    historico_fitness.append(sorted(poblacion, key=lambda ind: ind[1], reverse=True)[0][1])
    fitness_medio.append(statistics.mean([i[1] for i in poblacion]))
    desviaciones.append(statistics.stdev([i[1] for i in poblacion]))
    
    while gen <= num_gens and historico_fitness[-1] < n:
        descendientes = []
        for _ in range(lambda_):
            # Seleccion de padres
            padre1 = seleccion_torneo(poblacion)
            padre2 = seleccion_torneo(poblacion)
            # Generamos los descendientes (cruce)
            if random() <= px:
                hijo1, hijo2 = recombinacion_maxones(padre1, padre2)
            else:
                hijo1, hijo2 = padre1, padre2
            # Sometemos a mutación a los descendientes
            if random() <= pmut:
                mutacion_maxones(hijo1, pmg)
                mutacion_maxones(hijo2, pmg)
            # Evaluamos los descendientes
            hijo1 = (hijo1[0], fitness_maxones(hijo1[0]))
            hijo2 = (hijo1[0], fitness_maxones(hijo1[0]))
            # Añadimos los descendientes a nuestra subpoblación
            descendientes.append(hijo1)
            descendientes.append(hijo2)

        # Seleccionamos los supervivientes
        top, resto = seleccion_elitista(poblacion + descendientes, elite)
        poblacion = top + sample(resto, npob - elite)
        #poblacion = sample(poblacion + descendientes, npob)
        
        
        # Guardar el mejor valor de fitness de la población
        historico_fitness.append(top[0][1])
        fitness_medio.append(statistics.mean([i[1] for i in poblacion]))
        desviaciones.append(statistics.stdev([i[1] for i in poblacion]))
        mejor_ind = top[0]
        gen += 1
    
    return mejor_ind, poblacion, historico_fitness, fitness_medio, desviaciones

best, pob, hist, medio, desv = simple_ea(num_gens=1000, 
                                         npob=100, 
                                         lambda_=50, 
                                         px=1.0, 
                                         pmut=0.5, 
                                         pmg=1.0/n, 
                                         elite=50)

print('El mejor fitness es ', best[1])
print('Se han computado %d evaluaciones' % len(hist))

resultados = pd.DataFrame({'gen': range(len(hist)), 
                           'media': medio,
                           #'sd': desv,
                           'mejor': hist
                          })
resultados = resultados.melt(id_vars=['gen'])
alt.Chart(resultados).mark_line().encode(x='gen', y='value', color='variable')

El mejor fitness es  10
Se han computado 7 evaluaciones


## Familias de algoritmos evolutivos
Dependiendo de los hiper-parámetros y operadores que se utilicen, los algoritmos evolutivos se dividen en diferentes familias. Estas familias fueron surgiendo de forma paralela conforme se popularizaban estos algoritmos. A continuación se detallan algunas de las familiar más representativas.

### Algoritmos genéticos
Es el algoritmo evolutivo más conocido y utilizado. La evolución suele partir de una población de individuos generados aleatoriamente, y es un proceso iterativo, en el cual la población en cada iteración llamada una generación. En cada generación, se evalúa la aptitud de cada individuo de la población; la aptitud es generalmente el valor de la función objetiva en el problema de optimización que se está resolviendo. Los individuos más aptos son seleccionados estocásticamente de la población actual, y el genoma de cada individuo es modificado (recombinado y posiblemente mutado al azar) para formar una nueva generación. La nueva generación de soluciones candidatas se utiliza en la siguiente iteración del algoritmo. Comúnmente, el algoritmo termina cuando se ha producido un número máximo de generaciones, o cuando se ha alcanzado un nivel de aptitud satisfactorio para la población.

Tradicionalmente, las soluciones candidatas se representaban como cadenas de bits, aunque se permiten otras codificaciones. La principal propiedad que hace que estas representaciones genéticas sean convenientes es que sus partes son fácilmente alineadas debido a su tamaño fijo, lo que facilita las operaciones de cruce. También se pueden utilizar representaciones de longitud variable, pero la implementación del cruce es más compleja en este caso.

### Estrategias de evolución
Las estrategias de evolución utilizan representaciones dependientes del problema, y principalmente mutación y selección como operadores de búsqueda. Al igual que los algoritmos genéticos, los operadores se aplican en un bucle.

La particularidad de estos algoritmos radica en la forma que tienen de aplicar la mutación, la cual se realiza añadiendo un valor aleatorio normalmente distribuido a cada componente vectorial. El tamaño del paso o la intensidad de la mutación (es decir, la desviación estándar de la distribución normal) se adapta automáticamente teniendo en cuenta el estado de ejecución particular del algoritmo. Otra de las peculiaridades de esta familia de algoritmos es que la selección se realiza de forma determinista, basándose únicamente en los valores de _fitness_ de los individuos.

Por último, las estrategias de evolución se caracterizan en base a dos parámetros $\mu$ y $\lambda$. El parámetro $\mu$ se corresponde con el número de individuos que se utilizan como padres para generar $\lambda$ hijos. Una vez establecidos estos parámetros, solo queda por decidir si los individuos que pasarán a la siguiente generación se seleccionarán exclusivamente de entre los hijos generados $(\mu, \lambda)$ o de entre el conjunto que forman tanto padres como hijos $(\mu + \lambda)$.

### Programación genética
La programación genética es una familia de algoritmos evolutivos con una codificación especial de las soluciones: árboles. Estos árboles representan programas, ya que los nodos de los mismos se corresponden con funciones y operadores, cuyos resultados sirven como entradas para otros operadores.

![Genetic Programming Tree](https://upload.wikimedia.org/wikipedia/commons/7/77/Genetic_Program_Tree.png)

La parte más compleja a la hora de utilizar estos algoritmos es, precisamente, definir las operaciones que formarán parte del lenguaje de dominio específico que codifican las soluciones. Como contrapartida, la flexibilidad de las soluciones encontradas hacen de este grupo de algoritmos una herramienta muy potente, sobre todo cuando no se sabe a ciencia cierta la forma que tienen las soluciones.

Como es de esperar, los operadores de variación de la programación genética son específicos para codificaciones en forma de árbol. Generalmente el cruce intercambia dos subárboles de cada uno de los padres, mientras que la mutación cambia un nodo al azar.

# Problemas



---

**Problema 2.2** Utiliza un algoritmo genético para resolver el problema de optimización de la **Mochila ilimitada** que planteamos en el tema anterior y compara los resultados con los obtenidos por el algoritmo del temple simulado

---



In [0]:
# Instancia de Unbounded Knapsack Problem
wi = (0.98, 1.12, 20.0, 3.14, 15.0, 7.2, 5.5, 14.9, 17.3, 10.0)
vi = (12.0, 7.8, 25.4, 10.0, 13.0, 7.2, 19.7, 15.0, 12.4, 7.2)
W = 250.0



---

**Problema 2.3** Utiliza un algoritmo genético para resolver el problema de las **n reinas** para $n \geq 20$


---



In [0]:
# Problema de las n reinas
n = 20



---

**Problema 2.4** Resuelve la siguiente instancia del problema del **viajante de comercio** mediante un algoritmo genético.


---



In [0]:
import numpy as np
from random import random, randint
from itertools import permutations

N = 100
ciudades = np.random.randint(100,1000,size=(N,N))
ciudades = (ciudades + ciudades.T)/2
np.fill_diagonal(ciudades, 0)
ciudades.shape

def cxPartialyMatched(ind1, ind2):
    ind1, ind2 = ind1[0], ind2[0]
    size = min(len(ind1), len(ind2))
    p1, p2 = [0] * size, [0] * size

    # Initialize the position of each indices in the individuals
    for i in range(size):
        p1[ind1[i]] = i
        p2[ind2[i]] = i
    # Choose crossover points
    cxpoint1 = randint(0, size)
    cxpoint2 = randint(0, size - 1)
    if cxpoint2 >= cxpoint1:
        cxpoint2 += 1
    else:  # Swap the two cx points
        cxpoint1, cxpoint2 = cxpoint2, cxpoint1

    # Apply crossover between cx points
    for i in range(cxpoint1, cxpoint2):
        # Keep track of the selected values
        temp1 = ind1[i]
        temp2 = ind2[i]
        # Swap the matched value
        ind1[i], ind1[p1[temp2]] = temp2, temp1
        ind2[i], ind2[p2[temp1]] = temp1, temp2
        # Position bookkeeping
        p1[temp1], p1[temp2] = p1[temp2], p1[temp1]
        p2[temp1], p2[temp2] = p2[temp2], p2[temp1]

    return (ind1, -1), (ind2, -1)

def mutacion_permutacion(ind1):
    pos = random.sample(range(len(ind1[0])), k=2)
    tmp = ind1[pos[0]]
    ind1[0][pos[0]] = ind1[0][pos[1]]
    ind1[0][pos[1]] = tmp
    

def fitness_tsp(ind):
    dist = 0
    for i in range(len(ind)):
        dist += ciudades[ind[i-1]][ind[i]]
    return -dist
    

def simple_ea(num_gens, npob, lambda_, px, pmut, pmg, elite):
    poblacion = [np.random.permutation(N) for _ in range(npob)]
    fitness = map(fitness_tsp, poblacion)
    poblacion = list(zip(poblacion, fitness))
    historico_fitness = []
    fitness_medio = []
    desviaciones = []
    gen = 0
    
    historico_fitness.append(sorted(poblacion, key=lambda ind: ind[1], reverse=True)[0][1])
    fitness_medio.append(statistics.mean([i[1] for i in poblacion]))
    desviaciones.append(statistics.stdev([i[1] for i in poblacion]))
    
    while gen <= num_gens:
        descendientes = []
        for _ in range(lambda_):
            # Seleccion de padres
            padre1 = seleccion_torneo(poblacion)
            padre2 = seleccion_torneo(poblacion)
            # Generamos los descendientes (cruce)
            if random() <= px:
                hijo1, hijo2 = cxPartialyMatched(padre1, padre2)
            else:
                hijo1, hijo2 = padre1, padre2
            # Sometemos a mutación a los descendientes
            if random() <= pmut:
                mutacion_maxones(hijo1, pmg)
                mutacion_maxones(hijo2, pmg)
            # Evaluamos los descendientes
            hijo1 = (hijo1[0], fitness_tsp(hijo1[0]))
            hijo2 = (hijo1[0], fitness_tsp(hijo1[0]))
            # Añadimos los descendientes a nuestra subpoblación
            descendientes.append(hijo1)
            descendientes.append(hijo2)

        # Seleccionamos los supervivientes
        top, resto = seleccion_elitista(poblacion + descendientes, elite)
        poblacion = top + sample(resto, npob - elite)
        #poblacion = sample(poblacion + descendientes, npob)
        
        
        # Guardar el mejor valor de fitness de la población
        historico_fitness.append(top[0][1])
        fitness_medio.append(statistics.mean([i[1] for i in poblacion]))
        desviaciones.append(statistics.stdev([i[1] for i in poblacion]))
        mejor_ind = top[0]
        gen += 1
    
    return mejor_ind, poblacion, historico_fitness, fitness_medio, desviaciones

best, pob, hist, medio, desv = simple_ea(num_gens=300, 
                                         npob=100, 
                                         lambda_=50, 
                                         px=0.8, 
                                         pmut=0.4, 
                                         pmg=1.0/N, 
                                         elite=1)

print('El mejor fitness es ', best[1])
print('Se han computado %d evaluaciones' % len(hist))

resultados = pd.DataFrame({'gen': range(len(hist)), 
                           'media': medio,
                           #'sd': desv,
                           'mejor': hist
                          })
resultados = resultados.melt(id_vars=['gen'])
alt.Chart(resultados).mark_line().encode(x='gen', y='value', color='variable')

In [0]:
permutations(range(4))