# Memoria
## Grupo 10
### Integrantes
- Xiao Peng Ye
- Zhengyu Ye
- Juan Diego Valencia Marin

## Índice
1. Introducción
2. Algoritmo implementado
3. Funcionamiento específico
4. Comparación con otro algoritmo
5. Conclusiones
6. Bibliografía

## Introducción
Esta práctica se basa en la implementación de un algoritmo evolutivo y de su comparación con otro de una biblioteca estudiada en esta asignatura, en concreto se realizará el algoritmo de [**Evolución Diferencial (DE)**](https://es.wikipedia.org/wiki/Evoluci%C3%B3n_diferencial) y la biblioteca [**SciPy**](https://docs.scipy.org/doc/scipy/reference/) donde encontraremos este mismo algoritmo de evolución diferencial.

El algoritmo Evolución Diferencial es un método de optimización que está dentro de la computación evolutiva (rama de la inteligencia artificial inspirada en los mecanismos de la evolución biológica).

La biblioteca SciPy, que viene de las siglas Scientific Python, es una biblioteca de cálculo científico que proporciona funciones de utilidad para optimización, estadísticas y procesamiento de señales.


## Algoritmo implementado
El algoritmo de **Evolución Diferencial (DE)** ha sido el realizado en esta práctica, este algoritmo tiene una configuración específica, la *mutación se utiliza la estrategia (de/rand/1)*, *selección de forma uniforme*, *cruzamiento binomial* y un *reemplazo elitista y posición a posición*.

La idea del DE es generar una población de nuevas soluciones a partir de perturbar soluciones pertenecientes a la población de ese momento.

El funcionamiento de este algoritmo es el siguiente:

1. Crear una población inicial.
2. Determinar un individuo de la población en función de la estrategia de selección.
3. Generar nuevos individuos según el operador de mutación.
4. Aplicar el cruzamiento/recombinación.
5. Reemplazar el individuo seleccionado.
6. Volver al paso 2 hasta obtener la mejor solución.

## Funcionamiento específico
- **Uniform Selection.**

    Se escogen tres vectores diferentes de forma aleatoria dentro de la población obtenida, con los que trabajaremos junto al **Target vector** del que se hablará más adelante. A estos tres vectores se les llama **Donor vectors**.
    
	
- **Mutation (de/rand/1).**
	
    Se utiliza la estrategia de/rand/1, donde se escogen tres vectores diferentes de forma aleatoria, . A continuación se realiza la siguiente operación:
    
    V<sub>i,g</sub> = x<sub>r<sub>0</sub>,g</sub> + F(x<sub>r<sub>1</sub>,g</sub> − x<sub>r<sub>2</sub>,g</sub>)
         Donde:
         - F es una constante entre 0 y 2, 1 en nuestro caso.
         - V<sub>i,g</sub> es el resultado de la mutación.


- **Binomial Crossover.**

  En el cruzamiento binomial, en donde aparece el **trial vector (u<sub>i,g</sub>)**, creado por los elementos del target vector (x<sub>i,g</sub>) y del donor vector (v<sub>i,g</sub>), además de una probabilidad **CR**, 0.1 en nuestro caso.
  
  u<sub>i,g</sub> =
  
  v<sub>i,g</sub> si rand <= CR
         o
  x<sub>i,g</sub> si rand > CR
      Donde:
      - *rand* es un número aleatorio comprendido entre 0 y 1.
      - *CR* es la probabilidad antes descrita.


- **Elitist Replacement.**

	Este reemplazo es el más habitual, en el que se compara el *target vector* con el *trial vector* y aquel con la función de menor valor es el admitido en la siguiente generación.
    

## Comparación

En este apartado se procederá a realizar la comparación del algoritmo **DE** implementado por nosotros, con otras implementaciones provenientes de una biblioteca. Se incluirán los resultados de ambas implementaciones respresentados mediante tablas y algunos comentarios explicativos.

En los siguientes fragmentos, se importan las librerías y las funciones a utilizar, junto con la creación de ambos algoritmos.
En particular, se utilizan la optimización de **SciPy** y **Pyade (SADE en particular)** que proporcionan funciones para maximizar o minimizar funciones objetivas. Y algunas de las [funciones de optimización](https://en.wikipedia.org/wiki/Test_functions_for_optimization) como la *sphere, ackley, rosenbrock,...* entre otras, dentro de la librería [Benchmarks](https://deap.readthedocs.io/en/master/api/benchmarks.html#deap.benchmarks.sphere). 

In [20]:
from scipy.optimize import differential_evolution
from group10.EA import EA
from benchmarks.functions import sphere, ackley, rosenbrock, rastrigin, griewank, schwefel_2_21,schwefel_2_22, schwefel_1_2, extended_f_10, bohachevsky, schaffer
import pandas as pd
import numpy as np
import pyade.sade as sade

In [21]:
def DE_scipy(m_function,bounds,p_size,iteration):
    result = differential_evolution(m_function, bounds, popsize=p_size, polish=False, maxiter=iteration,strategy="rand1bin")
    return result

In [22]:
def DE_propio(m_function,bounds,p_size,iteration):
    miEA = EA(m_function, bounds, p_size)
    miEA.run(iteration)
    bestGenome = miEA.best()
    return bestGenome

In [23]:
def DE_SADE(m_function,bounds,probsize,p_size,iteration):
    params = sade.get_default_params(dim=probsize)
    params['bounds'         ] = np.array([[bounds[0], bounds[1]]] * probsize)
    params['max_evals'      ] = p_size*iteration
    params['population_size'] = p_size
    params['func'           ] = m_function
    results = []
    # for i in range(iteration):
    _, fitness = sade.apply(**params)
    results.append(fitness)

    return results

En esta parte, se procede a utilizar todas las funciones de optimización dentro de la librería benchmarks, junto con el algoritmo DE implementado por nuestra parte y las librerías SciPy y SADE.

In [24]:
benchmark=[sphere, ackley, rosenbrock, rastrigin, griewank, schwefel_2_21,
             schwefel_2_22, schwefel_1_2, extended_f_10, bohachevsky, schaffer]

In [25]:
resultMI={}

for func in benchmark:
    resultMI[func.__name__] = DE_propio(func, [(-100, 100)] * 10,50,100).solution

In [26]:
resultDE={}
for func in benchmark:
    resultDE[func.__name__] = DE_scipy(func, [(-100, 100)] * 10,50,1).x



In [27]:
resultSADE={}
for func in benchmark:
    resultSADE[func.__name__] = DE_SADE(func, (-100, 100), 10,50,1)



Ahora se procede a obtener los resultados y almacenarlos en un par de tablas para falicitar su visualización y comprensión. Se obtendrán algunos valores estadísticos como la media, desviación, mínimo, máximo y mediana.

In [28]:
ind=['sphere', 'ackley', 'rosenbrock', 'rastrigin', 'griewank', 'schwefel_2_21',
             'schwefel_2_22', 'schwefel_1_2', 'extended_f_10', 'bohachevsky', 'schaffer']
col=['avg','std','min','max','med']

In [29]:
df_b=pd.DataFrame(index=ind,columns=col)

In [30]:
df_m=pd.DataFrame(index=ind,columns=col)

In [31]:
df_d=pd.DataFrame(index=ind,columns=col)

Una vez creadas las tablas, se procede a guardar los datos para poder visualizarlos.

In [32]:
algNames = ["MI", "DE","SADE"]

results_avg = {}
results_std = {}
results_min = {}
results_max = {}
results_median = {}


for n in algNames:
    results_avg[n] = []
    results_std[n] = []
    results_min[n] = []
    results_max[n] = []
    results_median[n] = []


for func in benchmark:
    f = func.__name__
    results_avg["MI"].append(np.mean(resultMI[f]))
    results_avg["DE"].append(np.mean(resultDE[f]))
    results_avg["SADE"].append(np.mean(resultSADE[f]))
    results_std["MI"].append(np.std(resultMI[f]))
    results_std["DE"].append(np.std(resultDE[f]))
    results_std["SADE"].append(np.std(resultSADE[f]))
    results_min["MI"].append(np.min(resultMI[f]))
    results_min["DE"].append(np.min(resultDE[f]))
    results_min["SADE"].append(np.min(resultSADE[f]))
    results_max["MI"].append(np.max(resultMI[f]))
    results_max["DE"].append(np.max(resultDE[f]))
    results_max["SADE"].append(np.max(resultSADE[f]))
    results_median["MI"].append(np.median(resultMI[f]))
    results_median["DE"].append(np.median(resultDE[f]))
    results_median["SADE"].append(np.median(resultSADE[f]))

In [33]:
df_b.loc[:,'avg']=results_avg["MI"]
df_m.loc[:,'avg']=results_avg["DE"]
df_d.loc[:,'avg']=results_avg["SADE"]
df_b.loc[:,'std']=results_std["MI"]
df_m.loc[:,'std']=results_std["DE"]
df_d.loc[:,'std']=results_std["SADE"]
df_b.loc[:,'max']=results_max["MI"]
df_m.loc[:,'max']=results_max["DE"]
df_d.loc[:,'max']=results_max["SADE"]
df_b.loc[:,'min']=results_min["MI"]
df_m.loc[:,'min']=results_min["DE"]
df_d.loc[:,'min']=results_min["SADE"]
df_b.loc[:,'med']=results_median["MI"]
df_m.loc[:,'med']=results_median["DE"]
df_d.loc[:,'med']=results_median["SADE"]

### Visualización de las tablas

- **Tabla de DE de la biblioteca SciPy:**

In [34]:
df_b

Unnamed: 0,avg,std,min,max,med
sphere,0.641641,2.606762,-4.19751,5.803624,0.766813
ackley,14.4,55.776698,-100.0,100.0,28.0
rosenbrock,-2.689587,6.792811,-21.650989,3.947488,-0.889215
rastrigin,-0.307791,2.421437,-3.881863,4.981679,0.130965
griewank,-0.125413,2.436944,-5.075182,2.895386,0.748658
schwefel_2_21,-3.697642,11.543395,-20.196946,17.645014,-8.180161
schwefel_2_22,0.340378,5.964925,-8.260805,16.065632,-0.443881
schwefel_1_2,1.101189,26.228444,-38.649372,40.21271,-2.611263
extended_f_10,2.338286,12.949442,-19.968145,23.511633,3.034524
bohachevsky,0.732569,2.481358,-5.041945,3.683843,1.376465


- **Tabla de DE de la biblioteca SADE:**

In [35]:
df_b

Unnamed: 0,avg,std,min,max,med
sphere,0.641641,2.606762,-4.19751,5.803624,0.766813
ackley,14.4,55.776698,-100.0,100.0,28.0
rosenbrock,-2.689587,6.792811,-21.650989,3.947488,-0.889215
rastrigin,-0.307791,2.421437,-3.881863,4.981679,0.130965
griewank,-0.125413,2.436944,-5.075182,2.895386,0.748658
schwefel_2_21,-3.697642,11.543395,-20.196946,17.645014,-8.180161
schwefel_2_22,0.340378,5.964925,-8.260805,16.065632,-0.443881
schwefel_1_2,1.101189,26.228444,-38.649372,40.21271,-2.611263
extended_f_10,2.338286,12.949442,-19.968145,23.511633,3.034524
bohachevsky,0.732569,2.481358,-5.041945,3.683843,1.376465


- **Tabla de DE con nuestra implementación:**

In [36]:
df_m


Unnamed: 0,avg,std,min,max,med
sphere,15.035242,22.856162,-19.448965,75.359528,14.928972
ackley,10.560903,50.135965,-55.950992,91.802279,2.426694
rosenbrock,3.41045,34.021167,-45.043129,78.26334,0.901301
rastrigin,8.241397,28.968507,-48.57129,43.659001,20.500043
griewank,7.885754,27.664531,-36.395524,50.301786,9.8768
schwefel_2_21,-3.149187,29.221475,-44.735784,38.690275,5.034403
schwefel_2_22,14.83134,42.302366,-42.905633,81.173089,1.488086
schwefel_1_2,5.465273,38.1982,-48.2885,72.106901,-4.455516
extended_f_10,2.965053,32.550555,-48.88193,57.558998,-1.502722
bohachevsky,9.268896,21.32001,-23.626976,45.003958,7.275431


Kruskal

In [37]:
from scipy.stats import kruskal

for func in benchmark:
    f = func.__name__
    res = kruskal(resultMI[f], resultDE[f], resultSADE[f])
    print("Results for the "+f+" function: "+str(res.pvalue))


Results for the sphere function: 0.04481578736066588
Results for the ackley function: 0.8870360039118241
Results for the rosenbrock function: 0.17593118800104007
Results for the rastrigin function: 0.19723159662080514
Results for the griewank function: 0.9107321035621679
Results for the schwefel_2_21 function: 0.955563036268283
Results for the schwefel_2_22 function: 0.5389234080937939
Results for the schwefel_1_2 function: 0.9896641751808726
Results for the extended_f_10 function: 0.7854029022781085
Results for the bohachevsky function: 0.17411279406164157
Results for the schaffer function: 0.4739027027804147


Friedman

In [38]:
from scipy.stats import friedmanchisquare

friedmanchisquare(results_avg["MI"], results_avg["DE"], results_avg["SADE"])



FriedmanchisquareResult(statistic=8.909090909090907, pvalue=0.011625603038838514)

Por último, utilizaremos la librería [scikit-posthocs](https://scikit-posthocs.readthedocs.io/en/latest/) para realizar una comparación directa de las tres posibles implementaciones. Esta comparación se realizará mediante el método de comparación por pares, en donde se comparan los algoritmos dos a dos obteniendo unos resultados más específicos.

En la tabla se puede observar que los resultados son mejores cuando el valor se acerca mas a 0, siendo la comparación de un algoritmo consigo mismo 1. Por lo que podemos afirmar que nuestra implementación no es tan eficiente como las demas porque los valores son ligeramente mayores a los de las librerías. Y con este mismo razonamienteo, el algoritmo SADE es un poco mejor que el de DE.
# Modificar y mejorar

In [39]:
import scikit_posthocs as sp

data = pd.DataFrame({"algs": ["MI" ]*len(results_avg["MI"]) +
                             ["DE"]*len(results_avg["DE"]) +
                            ["SADE"]*len(results_avg["SADE"]),
                     "vals": results_avg["MI"] +
                             results_avg["DE"] +
                            results_avg["SADE"]})

sp.posthoc_wilcoxon(data, val_col='vals', group_col='algs', p_adjust = 'holm')




Unnamed: 0,MI,DE,SADE
MI,1.0,0.134766,0.055664
DE,0.134766,1.0,0.519531
SADE,0.055664,0.519531,1.0


## Conclusiones
Este trabajo se ha enfocado en la comparación de los resultados del algoritmo de **Evolución Diferencial (DE)** implementado por nosotros con unas estrategias y  métodos específicos, con el mismo algoritmo (DE) proveniente de la librería SciPy. En los resultados, observamos... (poner algo)

En cuanto al algoritmo DE, vemos su utilidad y nos damos cuenta de que los resultados son bastante buenos, aunque no los utilicemos de una forma óptima. Además, como ya veníamos de realizar el algoritmo genético (GA) del anterior trabajo, vemos que hay bastantes algoritmos dentro de la computación evolutiva y nos percatamos de la gran utilidad de ellos.

(Pasando a un enfoque más personal sobre este trabajo) (cambiar) sobre este trabajo, encontramos interesante la posibilidad de comparar estos algoritmos, de este modo hemos podido adentrarnos e indagar más en profundidad sobre ellos, conociendo así las soluciones óptimas y las que no son tan óptimas. 

## Bibliografía
https://es.wikipedia.org/wiki/Evoluci%C3%B3n_diferencial

https://docs.scipy.org/doc/scipy/reference/

https://docs.scipy.org/doc/scipy/reference/optimize.html

https://en.wikipedia.org/wiki/Differential_evolution

https://www.sciencedirect.com/science/article/pii/S2215098618323401#e0025

https://www.sciencedirect.com/science/article/abs/pii/S1568494609000325

https://www.hindawi.com/journals/jcse/2013/462706/