<a href="https://colab.research.google.com/github/Andresito-oficial/Pr-ctica-IA/blob/main/AI_2025_26_practica.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Enunciado de la práctica

## 1. Objetivos de la práctica
El desarrollo de esta práctica pretende que el alumnado analice, diseñe e implemente soluciones a un problema usando las técnicas de exploración en espacios de estados y computación evolutiva impartidas en la asignatura Inteligencia Artificial (IA). Para ello, el alumnado desarrollará un proyecto de programación en lenguaje Python mediante el uso del entorno de programación Google Colab y cuadernos de Python.

## 2. Caso de estudio
Vamos a trabajar con un problema clásico, el problema de coloreado de grafos, pero con un variación fundamental. Dada una serie de vértices $V$ y aristas $A$ que forman un grafo conexo $G$ no dirigido, se busca encontrar el número mínimo de colores de tal manera que todos los vecinos de un vértice cualquiera sean de un color diferente al de dicho vértice.

Toma como ejemplo un grafo de cuatro vértices como el siguiente:

<img src="https://upload.wikimedia.org/wikipedia/commons/thumb/b/b7/Graph_with_all_three-colourings_2.svg/2560px-Graph_with_all_three-colourings_2.svg.png" alt="drawing" width=250>

Estas son las combinaciones de soluciones que se pueden encontrar al problema, pero siempre tienen una cosa en común: el número mínimo de colores es de 3 y solo de 3.



El problema viene dado por un grafo que sabemos que es conexo y no dirigido. Debemos colorear cada vértice. El anterior grafo se puede representar con la siguiente matriz de adyacencia:

```python
problem_exmple = [[0, 1, 1, 0],
                  [1, 0, 1, 0],
                  [1, 1, 0, 1],
                  [0, 0, 1, 0],]
```

Para este grafo es necesario un minimo de 3 colores.

## 3. Desarrollo
El desarrollo de esta práctica supone completar este cuaderno de python para resolver el problema para varias configuraciones diferentes usando técnicas de Búsqueda y Algoritmos genéticos. Además, usando este cuaderno de python, se requiere mostrar resultados de la ejecución de los algoritmos para extraer conclusiones sobre las configuraciones del problema.

Es posible que la configuración del problema sea demasiado grande para alguno de los algoritmos. Como regla general, si el algoritmo tarda más de 5 minutos en completar su ejecución se puede declarar que el algoritmo no ha encontrado solución en un tiempo razonable (y lo indicamos en el análisis de resultados)

Se proporcionan 5 configuraciones distintas del problema, organizadas en diccionarios como el del ejemplo.
    
Se desea aplicar A* y un algoritmo genético. En el apartado del algoritmo genético hay instrucciones concretas para construir dicho algoritmo.

Para cada configuración y algoritmo se debe estudiar una tabla de estas características (Puede usarse un generador de tablas https://www.tablesgenerator.com/markdown_tables o pandas https://pandas.pydata.org/docs/user_guide/index.html):

| Problema | Algoritmo | Tiempo | Beneficio |
|----------|-----------|--------|-----------|
| P1       |  A*       | 3s     | 2         |
| P2       |  Gen      | 5s     | 3         |
| P3       |  A*       | 10s    | 7         |

(**ATENCION** los valores de esta tabla han sido decididos arbitrariamente, no reflejan el resultado del problema.)

Para completar la práctica es estrictamente necesario completar este último paso, existirán preguntas en el examen relativas a estos resultados.


### Checklist
Esta es una lista de las tareas necesarias para completar la practica

- Búsqueda
  - Diseñar la representacion del problema
  - Diseñar la expansión del espacio de estados
  - Diseñar una función de coste adecuada al problema
  - Diseñar una heurística adecuada al problema (y al coste)
  - Codificar un algoritmo de búsqueda genérico
- Genéticos
  - Codificar un cromosoma
  - Codificar la selección por ruleta
  - Codificar el cruce por punto
  - Codificar la mutación uniforme
  - Codificar un algoritmo genético genérico
- General
  - Probar todas las combinciones de Problemas y Algoritmos
  - Representar el tiempo de ejecución y el beneficio obtenido para cada par de algoritmo-problema.
  - Es **imprescindible** explorar otros parámetros.

### Consejo práctico y pistas acerca de la práctica
- Se recomienda desarrollar este cuaderno en un IDE para mejorar la experiencia de desarrollo. Todo se puede desarrollar en Colab, pero es mucho más cómodo en local.
- Una heurística informada es capaz de ofrecer buenas soluciones en tiempo razonable incluso en el problema 5, aunque no encuentre el valor óptimo.
- Durante la evaluación, se tendrá en cuenta que se han explorado variaciones en los parámetros, explorar algunas heurísticas, ver qué ocurre cuando no hay heurística, etc. Es importante explorar el problema en su totalidad, no solo desarrollar los apartados. Estas exploraciones deben ser reportadas también en eel cuadernillo.
- Presta atención a cada apartado, lo que se pide y los consejos incorporados.
- Experimenta libremente con los parámetros de cada problema. Por ejemplo ¿Qué ocurre si la heurística es $h(x)=0$?

## 4. Normativa de la práctica
Para el desarrollo del proyecto de programación se proporciona este cuaderno que sirve a modo de proyecto de programación. Se han propuesto varias configuraciones del problema para utilizar en las distintas pruebas. Se permiten crear todas las funciones adicionales que sea necesario siempre y cuando se respete la estructura general de este cuaderno. Este cuaderno es el único entregable, por tanto desarrollar código fuera de él no es recomendable.

Además de explicar las decisiones tomadas, será necesario realizar una comparativa de resultados en una o varias tablas, así como incluir una comparativa  final.

La práctica debe realizarse teniendo en cuenta la siguiente normativa:
* NO está permitido alterar los nombres, parámetros ni tipo de retorno de ninguno de los métodos proporcionados.
* No está permitido el uso de librerías externas excepto numpy y pandas.
* La práctica se realizará de forma individual.
* El plagio de la práctica queda estrictamente prohibido. La detección de plagio supondrá una calificación de 0 en la convocatoria de la asignatura para todos los alumnos implicados, así como la posibilidad de apertura de expediente académico disciplinar.
* Para ser evaluado de la práctica es obligatorio entregarla en plazo, habiendo realizado correctamente al menos una funcionalidad de las pedidas. Una entrega fuera de plazo será evaluada como 0.
* Para ser evaluado de la práctica es obligatorio haberla entregado en plazo previamente al examen tipo test. La práctica se evaluará en su totalidad mediante una prueba tipo test.
* Usa este cuaderno a modo de memoria.
* De cara a la entrega es estrictamente necesario entregar el cuaderno ejecutado al completo. Una entrega que no haya sido ejecutada con éxito hasta la última celda será evaluada como 0. (Entregad el archivo .ipynb)

# Búsqueda
Usa las siguientes celdas para desarrollar todo el código relativo a búsqueda. Recuerda respetar esta estructura general y añadir celdas siempre dentro de cada apartado.

Todo el esqueleto de código debe respetarse para ejecutar la práctica correctamente. De lo contrario es posible dar un paso en falso y acabar con las conclusiones equivocadas.

## Gestión de estados

### Estado inicial
Buscamos una función que, dado un problema concreto (representado en `dataset`) nos devuelva todo lo necesario para representar el problema. "Todo lo necesario" es la parte clave, necesitas una estructura de datos que permita almacenar la información necesaria.

#### Consejos:
- Si necesitas incluir varios grupos de datos, o datos de distintos tipos, es recomendable usar un diccionario.
- Los estados no deberían modificarse nunca una vez se han creado, considera usar tuplas siempre que sea posible.

In [891]:
problem_example = [	
	[0, 1, 1, 0, 1],
	[1, 0, 1, 0, 0],
	[1, 1, 0, 1, 1],
	[0, 0, 1, 0, 0],
	[1, 0, 1, 0, 0]
]

from copy import deepcopy

def initial_state(dataset):
	#the states are represented for each each vertex, it's color
	# Initialize all vertices to color 0
	return ((deepcopy(dataset), 0, 0))  # Return the initial state as a tuple (graph, current_vertex, max_color)


def copy(state):
	#duplicates the state given as parameter and returns the duplicate as a new state
	#the state is a matrix containig a vertex's color and adyacency list in each row
	
	return deepcopy(state)

### Expansion de estados
Vamos a desarrollar una funcion que, dado un estado `state` desarrolle todos los estados legales del problema. "Legales" significa que deberíamos prevenir estados no validos en este paso, ahorrando computo y simplificando la función solución.

#### Consejos:
- Este árbol de estados se puede modelar como una toma de decisiones. Puedo elegir un color y pintar cualquier vértice; o al contrario, elegir cualquier vértice y asignarle un color. ¡Hay varias aproximaciones correctas usando este planteamiento!

In [892]:
def expand(state):
	states = [] # Crea una lista vacía de estados
	#recorrer las aristas del grafo creando un nuevo estado para cada arista en coflicto, las aristas a recorrer son las que se encuentran en la submatiz triangular superior de la matriz de adyacencias
	#print(state)

	estado = state[0]
	vertice = state[1] + 1
	max_color = state[2]
	#print("Estado actual:")
	#print(estado)
	#print("Expandiendo vértice:", vertice)
	#print("Color máximo actual:", max_color)
	# Recorrer las aristas en la submatriz triangular inferior
	for i in range(0, max_color + 2):
		
		if not conflicto(estado, vertice, i):
			# Asignar el color i al vértice vertice en la copia del estado
			new_state = copy(estado)
			new_state[vertice][vertice] = i
			states.append((new_state, vertice, max(max_color, i)))
	
	#print("Estados generados:")
	#print(states)
	return states

In [893]:
def conflicto(matriz, vértice, color):
	
	for j in range(0, vértice):
		if matriz[vértice][j] == 1 and matriz[j][j] == color:
				return True
	return False

### Solucion alcanzada
La función solución es el criterio de parada. Describe qué es una solucion a un problema dado. Recuerda: En cuanto detectemos una solución, el algoritmo de búsqueda genérico SIEMPRE para; significa que para búsqueda óptima (con costes) se detendrá independientemente de si ha encontrado la mejor solución o no.

Por ejemplo, el algoritmo Branch and Bound garantiza encontrar la solución óptima, pero A* no.

#### Consejos:
- Piensa detenidamente cuándo el algoritmo ofrece una solución. Ten en cuenta que el árbol (si está bien diseñado) nunca tiene estados no válidos.

In [894]:
def is_solution(state):
	# Devuelve True si el estado es solucion, False en otro caso
	h = heuristic(state)
	sol = (h == 0)
	return sol

## Métricas

### Funcion de coste
Dado un camino completo, se computa el coste. `path` al contrario que `state` será necesariamente una lista. El camino es una lista de estados. Queremos diseñar una función $c(P)$ que fielmente represente el objetivo del problema. El coste es algo exacto y objetivo, basado en la observación de las decisiones que ya hemos tomado.

#### Consejo:
- El coste es una de las partes más sensibles del algoritmo. Un coste malo hará que sea imposible de resolver.
- Piensa en lo que intenta hacer el problema. ¿Qué movimientos de `expand` causan que la solución empeore?

In [895]:
def cost(path): # path debe contener VARIOS estados
	# Calcula el coste de un camino
	# Esto debería ser posible: state = path[-1]
	#print( "Path en cost:", path)
	last = path[-1]

	#colors = []
	#for i in range(0,len(last)):
	#	color = last[i][i]
	#	if color not in colors:
	#		colors.append(color)

	#cost = len(colors)
	# Calcula el coste de un camino completo

	return last[2] + 1  # Número de colores usados

### Heurística(s)
La heurística mide el coste que queda por aportar al problema para llegar hasta la meta. Si tenemos una función de coste $c(P)$ para el camino $P = \{S_0, S_1 .. S_{N-1}\}$, queremos encontrar una función heurística $h(S_{N-1})$ que estime **aproximadamente** lo que queda por añadir al coste tras tomar las decisiones óptimas hasta el estado meta.

Más concretamente, considera $c(P^*)$ el camino óptimo a partir del camino $P$. Independientemente de que $P$ sea óptimo hasta ese punto, $P^*$ tiene una serie de pasos adicionales que sí son óptimos. Entonces, una heurística óptima $h^*(S_{N-1})$ mide la siguiente expresión:

$$c(P^*) = h^*(S_{N-1}) + c(P)$$

Como la heurística óptima no se conoce, tenemos que actuar con una heurística que ayude a estimar todo lo que sea posible esa función $h^*$ ideal. Cuanto más se aproxime $h$ a $h^*$, más informada será la heurística. Pero cuidado, porque dar información con $h$ tiene un coste en tiempo que puede ser mucho más elevado que una heurística menos informada (p. ej. $h(S_{N-1}) = 0$). Si hacemos muchos cómputos para hallar $h(S_{N-1})$ entonces la heurística será más lenta. Necesitamos encontrar un balance entre lo informada y rápida que es nuestra heurística.

Además, consideraremos que una heurística es admisible cuando, a la hora de estimar el coste óptimo $c(P^*)$ sea cota superior de $h(S_{N-1}) + c(P)$. Esto sigue esta expresión:

$$c(P^*) \geq h(S_{N-1}) + c(P)$$

#### Consejos:
- No es necesario encontrar una heurística admisible, pero sí justificar si la heurística dada es admisible o no.
- Una heurística informada es capaz de acelear considerablemente la ejecución en problemas más grandes.
- Recuerda que la heurística y el coste están relacionados. En este problema hay que pensar: ¿Cuantos colores nuevos tendré que añadir en el futuro?

In [896]:
def heuristic(state):
	# Calcula una heurística para un estado
	heuristic = 0
	
	# Calcula la heurística de un estado
	estado = state[0]
	# calcular el número de conflictos en ese estado y multiplicarlo por la constante 2*len(state)
	# ¿Cuanto coste tenemos que aportar para llegar al estado meta?
	#penalization = len(estado) * 2
	conflicts = 0
	for i in range(0,len(estado)):
		adj = estado[i]  # estado[i] es la lista de adyacencias del vértice i
		for j in range(0,i):  # Corrección: j < len(adj) en lugar de i < len(adj)
			if adj[j] == 1 and estado[i][i] == estado[j][j]:
				conflicts += 1
				break
	heuristic = conflicts #* penalization
	return heuristic

## Algoritmo de búsqueda

### Poda
Una poda compara dos caminos, observando los estados finales de cada uno. `path[-1]` es dicho estado que queremos observar. Tras comparar la igualdad entre dos estados, tenemos que comparar $c(P_a)$ con $c(P_b)$. Solo nos quedamos el de menor coste. En caso de ser iguales, elige uno cualquiera.

#### Consejo:
- La función `eq` existe para comparar dos estados, utilizala para comparar los últimos estados en la poda.
- `prune` recibe una lista ordenada, recuerda esto a la hora de quitar los estados repetidos.

In [897]:
from os import path


def eq(s1, s2):
	# Comprueba si dos estados son iguales
	if s1[2] != s2[2]:
		return False
	s1_groups = grouping(s1[0], s1[2])
	#print("Grupos del primer estado: ")
	#print(s1_groups)
	s2_groups = grouping(s2[0],s2[2])
	#print("Grupos del segundo estado: ")
	#print(s2_groups)
	for group in s1_groups:
		if group not in s2_groups:
			return False
	return True

def grouping(state, max_color):
	groups = [[] for _ in range(max_color + 1)]
	#print("Grupos vacios")
	#print(groups)
	for i in range(0,len(state)):
		color = state[i][i]
		groups[color].append(i)
	#	print("añadido el vertice ", i, "al color ", color)
	#	print("Grupos actuales:")
	#	print(groups)
	return groups

def p(path1, path2):
	if eq(path1[-1], path2[-1]):
		if cost(path1) > cost(path2):
			return True
	return False

def prune(path_list):
	jajk = heuristic(path_list[0][0])
	abab = cost(path_list[0])
	comk = jajk + abab
	prune_list = [path_list[0]]
	for i in range(1,len(path_list)):
		c = cost(path_list[i])
		if c < comk:
			prune_list.append(path_list[i])
	return prune_list

def prune1(path_list):
	# Si detecta que dos caminos llevan al mismo estado,
	# solo nos interesa aquel camino de menor coste
	# Recuerda que prune_list llega ordenada por coste
	# 1. comparar si son iguales o isomorfos, si lo son desechar el camino con mayor longitud
	# 2. si no se ha podado todavía, comprobar el coste de cada camino
	# 3. desechar el camino con mayor coste

	#return path_list
	prune_list = []

	for i in range(0,len(path_list)):
		firstpath = path_list[i]
		addit = True
		for prune in prune_list:
			if p(firstpath,prune):
				addit = False
				print("poda")
				break
		if addit:
			prune_list.append(firstpath)
		#print("Lista de Poda: ", prune_list)

	
	return prune_list # Devuelve una lista de caminos

### Ordenacion
Debes orderar los estados de tal manera que el primero sea aquel cuyo coste más heurística sea menor. Las variables `c` y `h` son, en realidad, funciones que se pueden llamar.

La función de ordenadción determina el algoritmo que ejecutamos. Por ejemplo podríamos crear un `order_depth` que contenga:

```python
def order_depth(old_paths, new_paths, *args, **kwargs):
  return new_paths + old_paths
```

#### Consejo
- Python cuenta con funciones integradas como `sort` y `sorted`. Consulta la documentación para ver cómo funcionan y aprovecharlas al máximo.
- Usa la función `prune` anterior para hacer la poda al final de A*.

In [898]:
# *args y **kwargs son argumentos variables, si el argumento no es reconocido es almacenado en estas variables.
# Aquí se utilizan para ignorar argumentos innecesarios.

def order_astar(old_paths, new_paths, c, h, *args, **kwargs):
	# Ordena la lista de caminos segun la heuristica y el coste
	# para ordenar los caminos:
	# 1. calcular la función objetivo de cada camino y almacenrla en una lista junto al camino
	# 2. ordenar los caminos en función del valor de la función
	# para juntar los caminos:
	# old_path = CP (Caminos pendientes)
	# new_path = Expansión

	paths = old_paths + new_paths
	#print("Before order")
	#for path in paths:
	#	print(objective(path))
	#	print(path)
	paths.sort(key=objective)
	#print("After order")
	#for path in paths: 
	#	print(objective(path))
	#	print(path)
	new_list = prune(paths)
	return new_list

def objective(path):
	return cost(path) * len(path[-1][0]) + heuristic(path[-1])

### Algoritmo de búsqueda
FInalmente codificamos el algoritmo de búsqueda en esta sección. Se trata de implementar un algoritmo de búsqueda genérico.

Las entradas van a ser las funciones que hemos ido desarrollando. Primero están las partes específicas de este problema concreto:
- `initial_state`: Inicializa un estado a partir del problema
- `expansion`: Expande un estado, dando lugar a todos los estados legales.
- `cost`: Función de coste del problema
- `heuristic`: Función heurística del problema
- `solution`: Determina cuando un problema ha llegado a la solución.
Pero también podemos cambiar el algoritmo de búsqueda que ejecutamos
- `ordering`: Función de ordenación, determina qué algoritmo utilizamos.

Podríamos declarar un nuevo problema reemplazando todas las funciones anteriores y, si está correctamente programado, `search` no tendría que cambiar en ninguno de los casos. Esto es lo que significa **genérico**, sirve para cualquier problema y es independiente del dominio.

In [899]:
def search(dataset, initial_state, expansion, cost, heuristic, ordering, solution):
	# Realiza una búsqueda en el espacio de estados
	paths = [[initial_state(dataset)]] # Crea la lista de caminos, inicialmente el estado inicial
	sol = None # Este es el estado solucion
	
	# 1 - Mientras haya caminos y no se haya encontrado solución
	# 2 - Extraer el primer camino
	# 3 - Comprobar si estamos ante un estado solución
	# 4.1 - Si no es solución, expandir el camino
	# 4.2 - Si es solucion, detenemos y vamos al paso END.
	# 5 - Para cada estado expandido nuevo, añadirlo al camino lo que genera una lista de nuevos caminos
	# 6 - Ordenar los nuevos caminos y viejos caminos, y realizar poda. Volver al paso 1.
	# END - Devolver el camino si es solución, si no devolver None
	#print("Paths antes del bucle: ", paths)
	while len(paths) > 0 and sol == None:
		path = paths.pop(0)
		state = path[-1]
		if not is_solution(state):
			new_states = expand(state)
	#		print("Nuevos estados: ")
	#		print(new_states)
			new_paths = []
			for i in range(0,len(new_states)):
				#agregar el nuevo estado al final del camino
				new_path = path.copy()
				new_path.append(new_states[i])
				new_paths.append(new_path)
			paths = order_astar(paths, new_paths, cost, heuristic)
		else:
			sol = path #state
	#	print("Paths después de la iteración: ", paths)
	return sol # Devuelve solo la solucion, no el camino solucion

In [900]:
def measure_sol_search(solution):
	print("Solution en measure_sol_search:", solution)
	for i in range(len(solution[-1][0])):
		print("Vértice", i, "-> Color", solution[-1][0][i][i])
	coste = cost(solution)
	# Mide el coste de la solucion que haya encontrado el algoritmo search
	print("Coste de la solución encontrada:", coste)
	return coste

# Algoritmos genéticos
Usa las siguientes celdas para desarrollar todo el código relativo a algoritmos genéticos. Recuerda respetar esta estructura general y añadir celdas siempre dentro de cada apartado.

Todo el esqueleto de código debe respetarse para ejecutar la práctica correctamente. De lo contrario es posible dar un paso en falso y acabar con las conclusiones equivocadas.

## Representación y función de fitness

### Representación
Para la representación vamos a utilizar un cromosoma de longitud igual al número de vértices (de 0 a N-1). Cada vértice $V$ tiene un índice $i$. Un gen puede tomar valores entre 0 e $i$ (inclusive). Por ejemplo, el gen $i=2$ puede tomar colores 0, 1 y 2.

#### Consejo
- Esta representación es decente para el problema, pero no es la mejor; se puede mejorar en algunos casos. ¿Se te ocurre?

In [901]:
import random

import numpy as np

problem_example = (
	(0, 1, 1, 0, 1),
	(1, 0, 1, 0, 0),
	(1, 1, 0, 1, 1),
	(0, 0, 1, 0, 0),
	(1, 0, 1, 0, 0)
)
def generate_random_array(length):
	# Genera un array de elementos aleatorios dado el alfabeto
	random_array = np.random.uniform(0,1,length)
	return random_array

def generate_initial_population(pop_size, *args, **kwargs):
	dataset = kwargs['dataset'] # Dataset con la misma estructura que el ejemplo
	length = len(dataset) # Número de colores posibles
	random_array = generate_random_array((pop_size,length))
	# Obtener el alfabeto y la longitud a partir del dataset
	# Genera una población inicial de tamaño pop_size
	initial_pop = []
	for i in range(pop_size):
		individual = random_array[i]
		# Aquí puedes agregar lógica para convertir el array aleatorio en un individuo válido si es necesario
		replacement1 = 0
		y = 0
		while y < length:
			first = individual[0]
			if first < (y/length):
				replacement1 = y
				break
			y += 1
		individual[0] = replacement1
		replacement2 = 0
		z = 0
		while z < length:
			second = individual[1]
			if second < (z/length):
				replacement2 = z
				break
			z += 1
		individual[1] = replacement2
		initial_pop.append(individual)

	return initial_pop


### Fitness

Por otra parte la función de fitness será la siguiente. Considera el número de colores $c$ actual. Es un número que deseamos minimizar así que partiremos de:
$$q(x) = \frac{1}{c}$$

Como existen soluciones que no son válidas, haremos que la función de fitness sea penalizada por cada conflicto que observemos. En particular, declaramos $p$ que es un conteo de cada arista $A_i$ cuyos vértices tengan color idéntico. Por ejemplo, si en un grafo conexo de 3 vertices, tenemos dos colores, hay una arista cuyos colores son idénticos, por tanto $p=1$

la función de fitness será:
$$q'(x) = \frac{1}{c*(p+1)}$$

In [902]:
def fitness(solution, *args, **kwargs):
	dataset = kwargs['dataset']
	# Calcula el beneficio representado en 'solution'
	# Considera que p es al menos 1 para evitar dividir entre 0
	conflicts = 1
	colors = []
	for color in solution:
		if color not in colors:
			colors.append(color)
	for i in range(0,len(dataset)):
		adj = dataset[i]  # dataset[i] es la lista de adyacencias del vértice i
		for j in range(0,i):  # Corrección: j < len(adj) en lugar de i < len(adj)
			if adj[j] == 1 and solution[i] == solution[j]:
				conflicts += 1
				break
	q = 1/(len(colors)*conflicts)
	return q

## Operadores genéticos

### Selección por ruleta
La selección por ruleta es un algoritmo de selección en el que, dada una población, va a elegir una serie de padres. Normalmente podemos usar esta función de dos maneras:
1. `number_parents=2` Elegimos dos padres, cruzamos y mutamos; repitiendo ese bucle.
2. `number_parents=pop_size` Elegimos todos los padres a la vez, luego cruzamos y mutamos iterativamente.

En la asignatura enseñamos cómo se hace de la primera manera, pero de cara al código (y resultados) no importa cómo se seleccione.

In [903]:
def roulette_selection(population, fitness, number_parents, *args, **kwargs):
	population_fitness = sum(fitness)
	chromosome_probabilities = [f/population_fitness for f in fitness]
	indices = np.random.choice(range(len(fitness)), number_parents, p=chromosome_probabilities)
	return [population[i] for i in indices]
	#Selecciona number_parents individuos de la población mediante selección por ruleta

### Cruce de un punto
El cruce por punto necesita dos predecesores, eligiendo un punto de corte al azar estos predecesores se separan en dos partes: una parte izquierda y una a la derecha. El hijo 1 se queda la parte izquierda del padre 1 y la derecha del padre 2.

In [904]:
def one_point_crossover(parent1, parent2, p_cross, *args, **kwargs):
	# Realiza el cruce de dos padres con una probabilidad p_cross
	if np.random.random() < p_cross:
		point = np.random.randint(1,len(parent1)-1)
		child1 = np.append(parent1[:point],parent2[point:])
		child2 = np.append(parent2[:point],parent1[point:])
		return child1, child2
	else:
		return parent1, parent2

### Mutación uniforme
La mutación uniforme se comprueba gen a gen. Para cada gen veremos si se cumple la probabilidad `p_mut`. Cada mutación debe ser una elección sobre el alfabeto original descrito en la función `generate_random_array(...)`.

In [905]:
def uniform_mutation(chromosome, p_mut, *args, **kwargs):
	dataset = kwargs['dataset'] # Dataset con la misma estructura que el ejemplo
	#print("Nº colores", len(dataset))
	# Realiza la mutación gen a gen con una probabilidad p_mut
	# child = np.copy(chromosome)
	new_chromosome = chromosome.copy()
	random_values = np.random.uniform(0, 1, 2*len(chromosome)*2)
	mask = [k for k in range(len(chromosome)) if random_values[k] < p_mut]
	#print ("Mask de mutación:", mask)
	for i in mask:
		if random_values[i] < p_mut:
			# Realiza la mutación en el gen i
			new_val = random_values[(i+len(chromosome)-3)]
			replacement = 0
			y = 0
			while y < len(dataset):
				if new_val < y/len(dataset)*1.0:
					replacement = y
					break
				y += 1
			new_chromosome[i-2] = replacement
	return new_chromosome

### Selección ambiental (elitismo)
Elitismo consiste en perpetuar el/los mejores individuos de la anterior generación. Esto se consigue eligiendo los $k$ mejores individuos e insertándolos en la nueva población.

#### Consejos:
- Al igual que la ordenación en la parte de busqueda, aquí también es muy útil reordenar el array.

In [906]:
def elitism(population, fitness, offspring, fitness_offspring, *args, **kwargs):
	elite = kwargs['elite_n']
	# Realiza la sustitución generacional de la población con elitismo
	# Debe devolver tanto la nueva población como el fitness de la misma
	pop = tuple(population)
	off = tuple(offspring)
	fit = tuple(fitness)
	fit_off = tuple(fitness_offspring)
	dict1 = {}
	dict_offspring = {}
	for i in range(len(population)):
		keyp = tuple(pop[i])
		fitness_value = fit[i]
		dict1[keyp] = fitness_value
	for j in range(len(offspring)):
		keyo = tuple(off[j])
		fitness_value = fit_off[j]
		dict_offspring[keyo] = fitness_value
	#sotkp = np.array([dict1[tuple(row)] for row in pop ])
	#sotkoff = np.array([dict_offspring[tuple(row)] for row in off ])
	sotkp = np.argsort(fit)[::-1]
	sotkoff = np.argsort(fit_off)
	population_sorted = [population[i] for i in sotkp]
	offspring_sorted = [offspring[i] for i in sotkoff]
	fit_sorted = [fitness[i] for i in sotkp]
	fit_off_sorted = [fitness_offspring[i] for i in sotkoff]
	#population_sorting = np.argsort(sotkp)[::-1]
	#off_sorting = np.argsort(sotkoff)
	#population_sorted = [population[i] for i in population_sorting]
	#offspring_sorted = [offspring[i] for i in off_sorting]
	#population.sort(key=dict1[tuple], reverse=True)
	#offspring.sort(key=dict_offspring[tuple], reverse=False)
	new_pop = population_sorted[:elite]
	new_fit = fit_sorted[:elite]
	new_pop.extend(offspring_sorted[elite:])
	new_fit.extend(fit_off_sorted[elite:])
	#new_fit = [ fitness(ind, *args, **kwargs) for ind in new_pop]
	return new_pop, new_fit


## Algoritmo genético

## Condición de parada (número de generaciones)
En el momento que se alcance la generación objetivo, el algoritmo se detiene y la población de soluciones será el resultado.

In [907]:
def generation_stop(generation, fitness, *args, **kwargs):
	max_gen=kwargs['max_gen']
	# Comprueba si se cumple el criterio de parada (máximo número de generaciones)
	return generation >= max_gen

### Algoritmo genérico
De cara a ejecutar el algoritmo genético hay varios hiperparámetros que ajustar. Usa estos parámetros por defecto, pero no te olvides de explorar cada uno más adelante.

Parametro | Variable | Valor
--- | --- | ---
Tamaño de población | `pop_size` | 100
Tamaño de sucesores | `offspring_size` | 100
Probabilidad de cruce | `p_cross` | 0.8
Probabilidad de mutación | `p_mut` | 0.1
Generación máxima | `max_gen` | 100
Número de élites | `elite_n` | 2

Por ejemplo, se recomienda más adelante cambiar `p_mut` a $1/||V||$ (1 entre el numero de vértices). Es necesario explorar estos parámetros de cara a la práctica y observar cómo afecta a la fitness (así como el resultado).

In [908]:
import math
def genetic_algorithm(generate_population, pop_size, fitness_function, stopping_criteria, offspring_size,
						selection, crossover, p_cross, mutation, p_mut, environmental_selection, *args, **kwargs):
	# Aplica un algoritmo genético a un problema de maximización
	population = generate_population(pop_size, *args, **kwargs) # Crea la población de individuos de tamaño pop_size
	fitness_values = [fitness_function(item, *args, **kwargs) for item in population] # Contiene la evaluación de la población
	best_fitness = [] # Guarda el mejor fitness de cada generación
	mean_fitness = [] # Guarda el fitness medio de cada generación
	generation = 0 # Contador de generaciones

	# 1 - Inicializa la población con la función generate_population
	# 2 - Evalúa la población con la función fitness_function
	# 3 - Mientras no se cumpla el criterio de parada stopping_criteria
	# 4 - Selección de padres con la función selection
	# 5 - Cruce de padres mediante la función crossover con probabilidad p_cross
	# 6 - Mutación de los descendientes con la función mutation con probabilidad p_mut
	# 7 - Evaluación de los descendientes
	# 8 - Generación de la nueva población con la función environmental_selection
	

	# First fitness evaluation
	#print("Fitness values iniciales:", fitness_values)
	best_fitness.append(max(fitness_values))
	length = len(fitness_values)
	summun = sum(fitness_values)
	mean_fitness.append(summun/length)

	# Main loop, checking stopping criteria
	while not generation_stop(generation, fitness_values,*args, **kwargs):
		#print("Generación:", generation)

		# Select the parents and perform crossover and mutation
		parents = roulette_selection(population, fitness_values, offspring_size if (offspring_size%2==0) else offspring_size+1, *args, **kwargs)
		offspring = []
		k = 0
		while k < len(parents)-1:
			parent1 = parents[k]
			parent2 = parents[k+1]
			child1, child2 = one_point_crossover(parent1, parent2, p_cross, *args, **kwargs)
			child1 = mutation(child1, p_mut, *args, **kwargs)
			offspring.append(child1)
			child2 = mutation(child2, p_mut, *args, **kwargs)
			offspring.append(child2)
			k += 2

		# Build new population (replacing)
		offspring_fitness_values = [fitness_function(ind, *args, **kwargs) for ind in offspring]
		
		population, fitness_values = elitism(population, fitness_values, offspring, offspring_fitness_values, *args, **kwargs)
		#print("Fitness values de la generación", generation, ":", fitness_values)
		# Update best and mean fitness
		generation += 1
		best_fitness.append(max(fitness_values))
		length = len(fitness_values)
		summun = sum(fitness_values)
		mean_fitness.append(summun/length)
		

		# Get the fittest individual
	return population, fitness_values, generation, best_fitness, mean_fitness

In [909]:
def measure_sol_genetic(output):
	# output es la salida de genetic_algorithm. Es decir := (population, fitness, generation, best_fitness, mean_fitness)
	pop = output[0]
	fit = output[1]
	fitdict = {}
	for i in range(len(pop)):
		fitdict[tuple(pop[i])] = fit[i]
	def comk(chromosome):
		return fitdict[tuple(chromosome)]
	pop.sort(key=comk, reverse=True)
	fit.sort()
	benefit = fit[0]
	print("Best solution:", pop[0])
	#print("Best fitness:", benefit)
	# Mide el MEJOR fitness que haya encontrado el algoritmo genético
	# get index from fitness
	return benefit

# General
Usa las funciones `search_run` y `genetic_run` para extraer resultados.

## Utilidades
Usa estas funciones pre-programadas para ejecutar los experimentos y resumir el código.

- `search_run` recibe todas las funciones que anteriormente has programado de manera totalmente fija. Solo hay que explorar la heurística.
- `genetic_run` recibe dinamicamente las funciones anteriormente programadas. Explora cada parámetro libremente.

### Temporizador

In [910]:
################################# NO TOCAR #################################
#                                                                          #
import time

def timer(func):
    def wrapper(*args, **kwargs):
        start = time.time()
        res = func(*args, **kwargs)
        end = time.time()
        print("Execution time: ", end - start, " seconds")
        return res
    return wrapper
#                                                                          #
################################# NO TOCAR #################################

# Este codigo temporiza la ejecución de una función cualquiera

### Envoltorios

In [911]:
################################# NO TOCAR #################################
#                                                                          #
@timer
def search_run(dataset, heuristic):
    output = search(dataset, initial_state, expand, cost, heuristic, order_astar, is_solution)
    return measure_sol_search(output)

@timer
def genetic_run(generate_population, pop_size, fitness_function, stopping_criteria,
                offspring_size, selection, crossover, p_cross, mutation, p_mut,
                environmental_selection, dataset, *args, **kwargs):
    output =  genetic_algorithm(generate_population,
                                pop_size,
                                fitness_function,
                                stopping_criteria,
                                offspring_size,
                                selection,
                                crossover,
                                p_cross,
                                mutation,
                                p_mut,
                                environmental_selection,
                                dataset=dataset,
                                *args, **kwargs)
    return measure_sol_genetic(output)
#                                                                          #
################################# NO TOCAR #################################


### Problemas

Considera que, si un problema tarda más de 5 minutos en resolverse, el algoritmo tardará un tiempo demasiado grande como para ser resuelto.

In [912]:
#Grafo de 5 vértices:
problem_5=[
[0, 1, 1, 1, 1],
[1, 0, 1, 1, 1],
[1, 1, 0, 1, 1],
[1, 1, 1, 0, 1],
[1, 1, 1, 1, 0],
]

#Grafo de 8 vértices:
problem_8=[
[0, 1, 1, 1, 1, 1, 0, 1],
[1, 0, 1, 1, 1, 0, 1, 1],
[1, 1, 0, 1, 0, 1, 1, 0],
[1, 1, 1, 0, 1, 0, 0, 1],
[1, 1, 0, 1, 0, 1, 1, 1],
[1, 0, 1, 0, 1, 0, 1, 1],
[0, 1, 1, 0, 1, 1, 0, 1],
[1, 1, 0, 1, 1, 1, 1, 0],
]

#Grafo de 12 vértices:
problem_12=[
[0, 1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1],
[1, 0, 1, 0, 1, 1, 0, 0, 1, 0, 1, 1],
[1, 1, 0, 1, 0, 0, 0, 1, 1, 0, 1, 1],
[1, 0, 1, 0, 1, 0, 1, 0, 1, 1, 0, 0],
[1, 1, 0, 1, 0, 1, 0, 1, 0, 0, 1, 1],
[1, 1, 0, 0, 1, 0, 1, 1, 1, 0, 1, 0],
[1, 0, 0, 1, 0, 1, 0, 1, 0, 1, 1, 0],
[1, 0, 1, 0, 1, 1, 1, 0, 1, 0, 0, 0],
[0, 1, 1, 1, 0, 1, 0, 1, 0, 1, 1, 1],
[1, 0, 0, 1, 0, 0, 1, 0, 1, 0, 1, 0],
[1, 1, 1, 0, 1, 1, 1, 0, 1, 1, 0, 1],
[1, 1, 1, 0, 1, 0, 0, 0, 1, 0, 1, 0],
]

#Grafo de 18 vértices:
problem_18=[
[0, 1, 0, 0, 0, 1, 0, 1, 0, 0, 1, 0, 0, 1, 1, 0, 0, 1],
[1, 0, 1, 0, 1, 0, 0, 1, 1, 1, 0, 1, 0, 1, 1, 1, 0, 1],
[0, 1, 0, 1, 0, 1, 1, 0, 0, 1, 0, 1, 0, 1, 0, 0, 0, 0],
[0, 0, 1, 0, 1, 0, 0, 0, 1, 1, 0, 0, 1, 0, 0, 0, 1, 0],
[0, 1, 0, 1, 0, 1, 0, 1, 0, 1, 1, 0, 0, 1, 0, 1, 0, 1],
[1, 0, 1, 0, 1, 0, 1, 0, 0, 0, 0, 0, 0, 0, 1, 1, 0, 0],
[0, 0, 1, 0, 0, 1, 0, 1, 1, 0, 1, 0, 0, 0, 1, 0, 0, 0],
[1, 1, 0, 0, 1, 0, 1, 0, 1, 0, 0, 0, 0, 1, 1, 0, 1, 0],
[0, 1, 0, 1, 0, 0, 1, 1, 0, 1, 0, 1, 1, 1, 0, 0, 1, 0],
[0, 1, 1, 1, 1, 0, 0, 0, 1, 0, 1, 1, 1, 0, 0, 0, 0, 0],
[1, 0, 0, 0, 1, 0, 1, 0, 0, 1, 0, 1, 0, 1, 0, 0, 1, 1],
[0, 1, 1, 0, 0, 0, 0, 0, 1, 1, 1, 0, 1, 1, 0, 1, 0, 1],
[0, 0, 0, 1, 0, 0, 0, 0, 1, 1, 0, 1, 0, 1, 1, 1, 0, 1],
[1, 1, 1, 0, 1, 0, 0, 1, 1, 0, 1, 1, 1, 0, 1, 0, 0, 0],
[1, 1, 0, 0, 0, 1, 1, 1, 0, 0, 0, 0, 1, 1, 0, 1, 0, 1],
[0, 1, 0, 0, 1, 1, 0, 0, 0, 0, 0, 1, 1, 0, 1, 0, 1, 0],
[0, 0, 0, 1, 0, 0, 0, 1, 1, 0, 1, 0, 0, 0, 0, 1, 0, 1],
[1, 1, 0, 0, 1, 0, 0, 0, 0, 0, 1, 1, 1, 0, 1, 0, 1, 0],
]

#Grafo de 25 vértices:
problem_25=[
[0, 1, 0, 0, 0, 0, 1, 0, 0, 0, 0, 1, 0, 0, 0, 0, 1, 0, 0, 1, 0, 0, 0, 0, 1],
[1, 0, 1, 0, 0, 0, 0, 0, 1, 0, 0, 0, 1, 0, 0, 1, 1, 0, 0, 1, 0, 0, 1, 0, 0],
[0, 1, 0, 1, 1, 0, 0, 1, 0, 0, 1, 0, 0, 0, 1, 1, 0, 0, 1, 1, 0, 0, 1, 0, 0],
[0, 0, 1, 0, 1, 0, 0, 0, 0, 1, 0, 0, 0, 0, 1, 0, 1, 0, 0, 1, 0, 0, 1, 1, 0],
[0, 0, 1, 1, 0, 1, 1, 0, 0, 0, 1, 0, 0, 0, 1, 0, 0, 0, 0, 1, 1, 1, 1, 0, 0],
[0, 0, 0, 0, 1, 0, 1, 0, 0, 0, 1, 1, 0, 1, 0, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0],
[1, 0, 0, 0, 1, 1, 0, 1, 1, 1, 1, 0, 0, 0, 0, 0, 1, 1, 0, 0, 1, 0, 0, 0, 0],
[0, 0, 1, 0, 0, 0, 1, 0, 1, 0, 0, 0, 0, 0, 1, 1, 1, 1, 0, 0, 0, 0, 0, 0, 0],
[0, 1, 0, 0, 0, 0, 1, 1, 0, 1, 1, 1, 0, 1, 0, 0, 0, 0, 1, 0, 1, 1, 0, 0, 0],
[0, 0, 0, 1, 0, 0, 1, 0, 1, 0, 1, 1, 1, 0, 0, 0, 0, 0, 1, 0, 1, 0, 1, 1, 1],
[0, 0, 1, 0, 1, 1, 1, 0, 1, 1, 0, 1, 1, 0, 0, 0, 1, 0, 1, 0, 0, 0, 1, 1, 0],
[1, 0, 0, 0, 0, 1, 0, 0, 1, 1, 1, 0, 1, 0, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 1],
[0, 1, 0, 0, 0, 0, 0, 0, 0, 1, 1, 1, 0, 1, 0, 0, 1, 0, 0, 0, 1, 0, 0, 0, 0],
[0, 0, 0, 0, 0, 1, 0, 0, 1, 0, 0, 0, 1, 0, 1, 0, 0, 0, 0, 0, 0, 1, 0, 1, 0],
[0, 0, 1, 1, 1, 0, 0, 1, 0, 0, 0, 0, 0, 1, 0, 1, 0, 1, 0, 0, 1, 0, 0, 0, 1],
[0, 1, 1, 0, 0, 1, 0, 1, 0, 0, 0, 0, 0, 0, 1, 0, 1, 0, 0, 0, 0, 0, 0, 1, 0],
[1, 1, 0, 1, 0, 0, 1, 1, 0, 0, 1, 0, 1, 0, 0, 1, 0, 1, 0, 0, 0, 1, 1, 1, 0],
[0, 0, 0, 0, 0, 0, 1, 1, 0, 0, 0, 0, 0, 0, 1, 0, 1, 0, 1, 0, 0, 0, 0, 1, 0],
[0, 0, 1, 0, 0, 0, 0, 0, 1, 1, 1, 0, 0, 0, 0, 0, 0, 1, 0, 1, 1, 0, 0, 1, 1],
[1, 1, 1, 1, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 0, 1, 0, 1, 0, 0],
[0, 0, 0, 0, 1, 0, 1, 0, 1, 1, 0, 1, 1, 0, 1, 0, 0, 0, 1, 1, 0, 1, 0, 0, 0],
[0, 0, 0, 0, 1, 0, 0, 0, 1, 0, 0, 0, 0, 1, 0, 0, 1, 0, 0, 0, 1, 0, 1, 0, 0],
[0, 1, 1, 1, 1, 0, 0, 0, 0, 1, 1, 0, 0, 0, 0, 0, 1, 0, 0, 1, 0, 1, 0, 1, 0],
[0, 0, 0, 1, 0, 0, 0, 0, 0, 1, 1, 0, 0, 1, 0, 1, 1, 1, 1, 0, 0, 0, 1, 0, 1],
[1, 0, 0, 0, 0, 0, 0, 0, 0, 1, 0, 1, 0, 0, 1, 0, 0, 0, 1, 0, 0, 0, 0, 1, 0],
]
problems = [problem_5, problem_8, problem_12, problem_18, problem_25]

## Ejecuciones
Este espacio de la práctica está reservado a las ejecuciones de los algoritmos. Se recomienda el uso del método launch_experiment.

In [913]:
# Ejemplo de ejecución completa
for i, problem in enumerate(problems):
	print(f"Problem: {i}")
	search_benefit = search_run(problem, heuristic)
	print(f"Search: {search_benefit}")
	ga_benefit = genetic_run(generate_population=generate_initial_population, pop_size=500,
		fitness_function=fitness,
		stopping_criteria=generation_stop,
		offspring_size=500,
		selection=roulette_selection,
		crossover=one_point_crossover, p_cross=0.8,
		mutation=uniform_mutation, p_mut= 1/len(problem),
		environmental_selection= elitism,
		dataset=problem,
		max_gen=100,
		elite_n=1)
	print(f"Genetic: {ga_benefit}")
	print("-----")

# Ten en cuenta que genetic_run y search_run devuelven su tiempo de ejecucion automaticamente
# por pantalla, un print tras ejecutarlos.


Problem: 0
Solution en measure_sol_search: [([[0, 1, 1, 1, 1], [1, 0, 1, 1, 1], [1, 1, 0, 1, 1], [1, 1, 1, 0, 1], [1, 1, 1, 1, 0]], 0, 0), ([[0, 1, 1, 1, 1], [1, 1, 1, 1, 1], [1, 1, 0, 1, 1], [1, 1, 1, 0, 1], [1, 1, 1, 1, 0]], 1, 1), ([[0, 1, 1, 1, 1], [1, 1, 1, 1, 1], [1, 1, 2, 1, 1], [1, 1, 1, 0, 1], [1, 1, 1, 1, 0]], 2, 2), ([[0, 1, 1, 1, 1], [1, 1, 1, 1, 1], [1, 1, 2, 1, 1], [1, 1, 1, 3, 1], [1, 1, 1, 1, 0]], 3, 3), ([[0, 1, 1, 1, 1], [1, 1, 1, 1, 1], [1, 1, 2, 1, 1], [1, 1, 1, 3, 1], [1, 1, 1, 1, 4]], 4, 4)]
Vértice 0 -> Color 0
Vértice 1 -> Color 1
Vértice 2 -> Color 2
Vértice 3 -> Color 3
Vértice 4 -> Color 4
Coste de la solución encontrada: 5
Execution time:  0.0002980232238769531  seconds
Search: 5
Best solution: [0. 4. 1. 3. 2.]
Execution time:  0.5066483020782471  seconds
Genetic: 0.1111111111111111
-----
Problem: 1
Solution en measure_sol_search: [([[0, 1, 1, 1, 1, 1, 0, 1], [1, 0, 1, 1, 1, 0, 1, 1], [1, 1, 0, 1, 0, 1, 1, 0], [1, 1, 1, 0, 1, 0, 0, 1], [1, 1, 0, 1, 0, 1, 1, 