<a href="https://colab.research.google.com/github/ejherran/03MIAR---Algoritmos-de-Optimizacion/blob/main/Algoritmos_EdisonJavierHerranCortes_TrabajoPractico.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Algoritmos de optimización - Trabajo Práctico<br>
Nombre y Apellidos: Edison Javier Herran Cortes<br>
Url: https://github.com/ejherran/03MIAR---Algoritmos-de-Optimizacion/blob/main/Algoritmos_EdisonJavierHerranCortes_TrabajoPractico.ipynb<br>
Google Colab: https://colab.research.google.com/drive/1EOFidbwoSQRlwCwGdkT_FnTF6_W8WCCE?usp=sharing <br>
Problema:
>1. Sesiones de doblaje <br>

## Descripción del problema:
Se precisa coordinar el doblaje de una película. Los actores del doblaje deben coincidir en las tomas en las que sus personajes aparecen juntos en las diferentes tomas. Los actores de doblaje cobran todos la misma cantidad por cada día que deben desplazarse hasta el estudio de grabación independientemente del número de tomas que se graben. No es posible grabar más de 6 tomas por día. El objetivo es planificar las sesiones por día de manera que el gasto por los servicios de los actores de doblaje sea el menor posible.

Número de actores: 10 <br>
Número de tomas : 30 <br>
Actores/Tomas : https://bit.ly/36D8IuK









                                        

#Modelo
- ¿Como represento el espacio de soluciones?
- ¿Cual es la función objetivo?
- ¿Como implemento las restricciones?

## Consideraciones Iniciales:

1. Todos los actores cobran lo mismo, por tanto minimizar el costo del doblaje implica minimizar la suma de las sesiones de doblaje de todos los actores.

2. Ningún actor puede tener más tomas que la cantidad total de tomas de la película.

3. Las tomas se realizan una por una. Por tanto no existe impedimento para que un actor realice el máximo de tomas por día.

4. Teniendo en cuenta las consideraciones **2** y **3**, es posible realizar todo el doblaje en 5 días. Por tanto el costo máximo sería de **50**, llamando a sesión de doblaje a todos los actores todos los días.

5. El orden de las tomas que se realizan un mismo día es irrelevante. De igual forma el orden de los días de grabaciones es irrelevante.

## Espacio de Soluciones:

Teniendo en cuenta las premisas anteriores; las soluciones a este problemas pueden representarse como una lista de números, donde cada número representa la toma a realizar. Asumiendo que cada 6 número consecutivos representan un día completo de grabación.

Ahora bien, teniendo en cuenta la premisa 5, es posible disgregar la solución de un día puntual del resto, pudiendo representar la solución parcial de un día como un conjunto (SET) de número enteros.

## Función Objetivo

Para optimizar este problema, se busca minimizar la función $Fx(x)$ tal que $x$ sea la secuencia de tomas a realizar, y $F(x)$ el número total de sesiones de grabación de los actores.

## Restricciones

Las restricciones de este problema, son esencialmente  dos, a saber:

1. **El número máximo de tomas por día**: Esto puede representarse fácilmente como un parámetro o atributo, que condiciona el tamaño máximo de los conjuntos que representan las tomas realizadas en un mismo día.

2. **Los actores necesarios para realizar una toma**: Para representar esta restricción, se ha diseñado un estructura de datos, basada en un diccionario. Donde las claves representan los identificadores de las tomas y los valores son un conjunto de enteros con los identificadores de los actores. De esta forma en la función objetivo al recibir un conjunto de con los identificadores de las tomas, basta con obtener los conjuntos de sus actores correspondientes y realizar una unión de conjuntos.

El uso de conjuntos de Python, facilita enormemente la resolución de este problema, ya que permite realizar operaciones de conjuntos de forma directa, y adicionalmente garantiza dos propiedad básicas de este problema, a saber:

1. El orden de los elementos (tomas o actores) dentro del conjunto es irrelevante.
2. Dentro de un mismo conjunto no se pueden repetir elementos.





In [21]:
import random
from typing import List, Set, Dict, Tuple, Optional

# Ejemplo de solución.
SOLUTION_EXAMPLE: List[Set[int]] = [
    {14, 17, 18, 19, 23, 24},
    {7, 9, 13, 27, 28, 30},
    {1, 6, 16, 20, 22, 25},
    {3, 4, 8, 15, 21, 29},
    {2, 5, 10, 11, 12, 26}
]

# Restricción de actores por toma
MOVIE: Dict[int, Set[int]] = {
    1:{1, 2, 3, 4, 5},
    2:{3, 4, 5},
    3:{2, 5, 7},
    4:{1, 2, 7, 8},
    5:{2, 4, 8},
    6:{1, 2, 4, 5},
    7:{1, 2, 4, 5},
    8:{1, 2, 6},
    9:{1, 2, 4},
    10:{1, 2, 6, 9},
    11:{1, 2, 3, 5, 8},
    12:{1, 2, 3, 4, 6},
    13:{1, 4, 5},
    14:{1, 3, 6},
    15:{1, 2, 7},
    16:{4, 10},
    17:{1, 3},
    18:{3, 6},
    19:{1, 3},
    20:{1, 3, 4, 5},
    21:{6, 8},
    22:{1, 2, 3, 4},
    23:{1, 3},
    24:{3, 6},
    25:{1, 2, 4, 10},
    26:{1, 3, 5, 9},
    27:{4, 5},
    28:{1, 4},
    29:{1, 5, 6},
    30:{1, 4},
}

# Concepto de función objetivo
def target_function(
    movie: Dict[int, Set[int]],
    solution: List[Set[int]]
) -> int:
  total_actors_needed = 0

  for day in solution:
    necessary_actors = set()

    for shot in day:
      necessary_actors = necessary_actors.union(movie[shot])

    total_actors_needed += len(necessary_actors)

  return total_actors_needed

R = target_function(MOVIE, SOLUTION_EXAMPLE)

print(f"The necessary total number of sessions for the voice actors is: {R}")

The necessary total number of sessions for the voice actors is: 27


#Análisis
- ¿Que complejidad tiene el problema?. Orden de complejidad y Contabilizar el espacio de soluciones

## Orden de Complejidad

Abordando el problema desde la perspectiva previamente descrita, el orden de complejidad del problema es de carácter **factorial**. $O(n!)$, donde $n$ es el número de tomas.

## Espacio de Soluciones

Dado que la solución implica ordenar $30$ tomas, el número total de posibles permutaciones es de:

$$
30! ≈ 2.65  \times 10^{32}
$$

Sin embargo, dado que el orden de las tomas que se realizan en un mismo día es irrelevante, y de igual forma es irrelevante el orden en que se llevan a cabo los días de grabación, se tiene que el espacio de soluciones está dado por:

$$
\frac{{\binom{30}{6} \cdot \binom{24}{6} \cdot \binom{18}{6} \cdot \binom{12}{6} \cdot \binom{6}{6}}}{{5!}} ≈ 1.14 \times 10^{16}
$$


In [22]:
from math import comb, factorial

# Espacio de soluciones ingenuo
naive_solutions = factorial(30)
print("Naive Solutions:\t{:e}".format(naive_solutions))

# Espacio de soluciones significativamente diferentes
binomials = (comb(30, 6) * comb(24, 6) * comb(18, 6) * comb(12, 6) * comb(6, 6))
meaningful_solutions = binomials / factorial(5)
print("Meaningful solutions:\t{:e}".format(meaningful_solutions))

Naive Solutions:	2.652529e+32
Meaningful solutions:	1.142395e+16


#Diseño
- ¿Que técnica utilizo? ¿Por qué?

## Diseño Planteado

Se propone un diseño mixto, que combina las técnicas de Búsqueda Voraz y Algoritmos Evolutivos. Esto fundamentado en los siguientes aspectos:

La búsqueda voraz permite intensificar la precisión de las soluciones, y usada de forma secuencial permite reducir significativamente el espacio de soluciones al descartar las tomas que ya se hayan utilizado para definir un día de grabaciones.

El algoritmo evolutivo, ofrece una excelente aproximación para optimizar la configuración de un día de grabaciones, sin tener que explorar todas las posibles soluciones, las cuales son muchas especialmente en los primeros días. Gracias a este enfoque es posible obtener una muy buena configuración para un día de grabaciones, con tan solo unas miles de generaciones.

El enfoque evolutivo, por su naturaleza misma sirve de contrapeso a la búsqueda voraz, ya que al no ofrecer una solución perfectamente óptima, permite incrementar la diversificación de las soluciones, logrando que en conjunto se obtenga un solución la cual contempla más que solo mínimos locales para cada día y que por tanto sea mejor en general.

## Arquitectura

El sistema consta de dos capas, una capa interna la cual contiene un algoritmo evolutivo encargado de optimizar la configuración de un solo día de grabaciones; y un capa externa, la cual es un algoritmo de búsqueda voraz el cual trata de obtener la mejor configuración para un día de grabaciones, y va reduciendo el número de tomas a asignar a medida que estas van siendo usadas.

### Optimizador Evolutivo

Esta capa toma como entrada el diccionario de tomás de la película, y el máximo de tomas por día, así cómo algunos hiperparámetros para ajustar su rendimiento (número máximo de generaciones, tolerancia de estancamiento y semilla aleatoria).

El algoritmo sigue los siguientes pasos:

1. Construir un sujeto inicial de forma aleatoria, donde sus “genes” son los identificadores de las tomas. La cantidad de genes está dada por el máximo de tomas por día.

2. Calcular su puntaje de rendimiento, entre más bajo sea el valor, más óptimo se considera el sujeto. Este cálculo se hace en base a cuántos actores se requieren para grabar las tomas contenidas en el genoma del individuo.

3. Mutar al individuo, se toma un gen aleatorio del individuo y se cambia por otro, que no esté presente en el genoma.

4. Se calcula el puntaje de rendimiento del sujeto mutado, si este es mejor o igual que el del sujeto base, se actualiza el genoma del sujeto base. Solo si el rendimiento es mejor se anula el contador de estancamiento.

5. Se repiten los pasos 3 y 4 hasta agotar el máximo de generaciones o alcanzar el límite de tolerancia al estancamiento.

6. Como resultado se obtiene la configuración para un día de grabaciones y la cantidad de actores necesarios para llevar a cabo las tomas seleccionadas.


In [23]:
# Optimizador Evolutivo
class EvolutionaryOptimizer:
    def __init__(
        self,
        *,
        movie: Dict[int, Set[int]],
        shots_per_day: int,
        max_generations: int = 10000,
        max_stagnation: int = 1000,
        random_seed: Optional[int] = None
    ) -> None:
        random.seed(random_seed)

        self.movie = movie
        self.shots_per_day = shots_per_day
        self.max_generations = max_generations
        self.max_stagnation = max_stagnation

        self.shots = list(movie.keys())
        self.subject = self.generate_subject()

    def fitness(self, shots: List[int]) -> int:
        actors = set()
        for shot in shots:
            actors = actors.union(self.movie[shot])

        return len(actors)

    def generate_subject(self) -> Tuple[int, Set[int]]:
        genes = set(random.sample(self.shots, self.shots_per_day))
        score = self.fitness(genes)
        return (score, genes)

    def evolve(self) -> bool:
        base_genes = self.subject[1]
        posible_genes = list(set(self.shots) - base_genes)
        base_genes = list(base_genes)

        target_gene = random.choice(range(len(base_genes)))
        base_genes[target_gene] = random.choice(posible_genes)

        new_genes = set(base_genes)
        new_score = self.fitness(new_genes)

        has_evolved = new_score < self.subject[0]

        if new_score <= self.subject[0]:
            self.subject = (new_score, new_genes)

        return has_evolved

    def run(self):
        stagnant_generations = 0
        for _ in range(self.max_generations):
            has_evolved = self.evolve()
            if has_evolved:
                stagnant_generations = 0
            else:
                stagnant_generations += 1

            if stagnant_generations == self.max_stagnation:
                break

### Manejador Voraz

Esta capa recibe los mismos parámetros que el Optimizador Evolutivo, pues su trabajo es básicamente configurar la ejecución de este y consolidar sus resultados.

El algoritmo sigue los siguientes pasos:

1. Configurar las estructuras de datos necesarias para el problema: Diccionario de tomás, lista de identificadores de las tomas y contador de actores.

2. Llamar al optimizador con la lista de tomas pendientes. Para el día 1 están todas las tomas de la película.

3. Almacenar el resultado del optimizador en la lista de días.

4. Eliminar de las tomas que haya seleccionado optimizador, de forma que se reduzca el espacio de soluciones.

5. Repetir los pasos 2 a 4, mientras que la cantidad de toma pendientes sea mayor a la cantidad máxima de tomas por día.

Dado que el orden de las tomas dentro de un mismo día no importa, cuando la cantidad de tomas pendientes es menor o igual a la cantidad máxima de tomas por día, existe solo una solución significativa y por tanto no es necesario llamar al optimizador.


In [24]:
class GreedyManager:
    def __init__(
        self,
        *,
        movie: Dict[int, Set[int]],
        shots_per_day: int,
        max_generations: int = 10000,
        max_stagnation: int = 1000,
        random_seed: Optional[int] = None
    ) -> None:
        self.movie = movie.copy()
        self.shots_per_day = shots_per_day
        self.max_generations = max_generations
        self.max_stagnation = max_stagnation
        self.random_seed = random_seed

    def optimize(self) -> None:
        movie = self.movie.copy()
        shots = list(movie.keys())
        self.days = []
        self.total_actors = 0

        while len(shots) > self.shots_per_day:
            optimizer = EvolutionaryOptimizer(
                movie=movie,
                shots_per_day=self.shots_per_day,
                max_generations=self.max_generations,
                max_stagnation=self.max_stagnation,
                random_seed=self.random_seed
            )

            optimizer.run()
            self.days.append(optimizer.subject)

            for shot in optimizer.subject[1]:
                shots.remove(shot)
                del movie[shot]

        score = optimizer.fitness(shots)
        self.days.append((score, set(shots)))
        self.total_actors = sum([day[0] for day in self.days])

    def print_result(self) -> None:
        for i, day in enumerate(self.days):
            print(f"Day {i+1} shots: {day[1]}\t|\tNecessary actors: {day[0]}")
        print(f"\n\t\t\tTotal actor sessions: [{self.total_actors}]")

    def print_actor_sessions(self) -> None:
        for i, day in enumerate(self.days):
            actors = set()
            for shot in day[1]:
                actors = actors.union(self.movie[shot])
            print(f"Day {i+1} actors: {actors}")

### Pruebas.

Es posible ejecutar el sistema utilizando semillas aleatorias fijas, para reproducir los mismos resultados. Resultan interesantes las siguiente semillas:

- Semilla 25: Resultado 32.
- Semilla 12: Resultado 30.
- Semilla 42: Resultado 29.
- Semilla 19: Resultado 28.
- Semilla 29: Resultado 27.




In [31]:
manager = GreedyManager(
    movie=MOVIE,
    shots_per_day=6,
    random_seed=29
)
manager.optimize()
manager.print_result()

Day 1 shots: {14, 17, 18, 19, 23, 24}	|	Necessary actors: 3
Day 2 shots: {7, 9, 13, 27, 28, 30}	|	Necessary actors: 4
Day 3 shots: {1, 6, 16, 20, 22, 25}	|	Necessary actors: 6
Day 4 shots: {3, 4, 8, 15, 21, 29}	|	Necessary actors: 6
Day 5 shots: {2, 5, 10, 11, 12, 26}	|	Necessary actors: 8

			Total actor sessions: [27]


In [28]:
manager.print_actor_sessions()

Day 1 actors: {1, 3, 6}
Day 2 actors: {1, 2, 4, 5}
Day 3 actors: {1, 2, 3, 4, 5, 10}
Day 4 actors: {1, 2, 5, 6, 7, 8}
Day 5 actors: {1, 2, 3, 4, 5, 6, 8, 9}


## Conclusiones

A partir de este proyecto se pueden extraer las siguientes conclusiones:

1. Aun en el contexto de un problema con una espacio de soluciones abrumador, una buena selección de técnicas algorítmicas puede dar lugar a soluciones eficaces con márgenes de gasto computacional aceptables.

2. Al enfrentar cualquier problema, resulta enriquecedor abordarlo desde diferentes puntos de vista. Originalmente se trató de atacar este problema solo con un algoritmo genético, definiendo los genes como los actores necesarios para cumplir las tomas, sin embargo esto resultó ser completamente inmanejable. Solo cuando se abordó el problema desde la perspectiva de la combinatoria de tomas como base de la solución, se logró vislumbrar un camino prometedor para solucionar el problema.

3. Ninguna técnica es infalible o ideal para cualquier escenario; sin embargo, la capacidad que tenemos de combinar diferentes enfoques para atacar cada aspecto de un problema, es la herramienta más valiosa de la que podemos disponer para enfrentarnos a problemas desafiantes.

4. Al implementar algoritmos evolutivos o genéticos, es fundamental definir cuál es el factor de adaptación que más beneficia a la mejora de los individuos. En un determinado punto se trató de realizar el optimizador en base a un algoritmo genético, pero la técnica de cruce no proporcionaba suficiente diversidad y se requería una población muy grande para lograr mejoras en los individuos, lo que hacía al sistema extremadamente lento. Fue entonces cuando se determinó que los individuos mejoran muy poco al heredar características de sus padres, ya que estas estaban acotadas por sus genomas previos. Por el contrario, al darse un mutación favorable, el nivel rendimiento crecía considerablemente. Esto llevó a centrar el optimizador en un algoritmo evolutivo mucho más sencillo que se centrará en explotar los beneficios de la mutación para diversificar las soluciones.
