# Algoritmos de optimización - Seminario<br>
*Adrien Felipe*     
[Colab.research.google.com](https://colab.research.google.com/drive/1SuNFJWqr-g_XPSjd1C7yhKl6IRlVsWtC)     
[Github.com](https://github.com/AdrienFelipe/03MAIR---Algoritmos-de-Optimizacion---2019/tree/master/seminar)

## Problema
### 1. Sesiones de doblaje


Se precisa coordinar el doblaje de una película. Los actores del doblaje deben coincidir en las
tomas en las que sus personajes aparecen juntos en las diferentes tomas. Los actores de
doblaje cobran todos la misma cantidad por cada día que deben desplazarse hasta el estudio
de grabación independientemente del número de tomas que se graben.

No es posible grabar
más de 6 tomas por día. El objetivo es planificar las sesiones por día de manera que el gasto por los servicios de los actores de doblaje sea el menor posible



                                        

## Analisis previo
### Días de grabación
Hay 30 tomas en total y no se pueden superar 6 tomas por día,
por lo cual el caso óptimo no puede ser inferior a **5 días de grabación**.
### Precio por actor
Al cobrar todos los actores lo mismo por día independientemente de número de tomas, podemos **ignorar el precio por actor**.  
### Orden de las tomas
El **orden de las tomas es irrelevante** dentro de cada sesión, ya que no afecta el gasto final. 
### Orden de las sesiones
El **orden de las sesiones es irrelevante** ya que tampoco afecta al gasto final.

## Preguntas

### ¿Cuantas posibilidades hay sin tener en cuenta las restricciones?

Existe una **única restricción**; el máximo de tomas por día.   

El no tener en cuenta dicha restricción corresponde en poder grabar todas las tomas en un mismo día, y en tener una sola y única sesión.     

Disponemos de **30 tomas**, por lo cual tendríamos $n! = 30! \approx 2.7e32 $ combinaciones posibles de tomas dentro de una única sesión.    
Pero al ser irrelevante el orden de las tomas, tendríamos en realidad **1 única solución**, y un gasto correspondiente al total de actores (10). 





### ¿Cuantas posibilidades hay teniendo en cuenta todas las restricciones?

Definimos $n$ el total de tomas y $m$ las tomas por sesión, con $n,m \in \mathbb{N}^2 $ y $1\leq m \leq n$        
     
Para calcular el total de sesiones posibles, elegimos $m$ veces una de las $n$ tomas, teniendo una menos por elegir en cada iteración.    
Deducimos el **total de sesiones posibles**:
$$s_{t}(n) = \prod_{i=1}^{m} (n-i+1) = \frac{n!}{(n-m)!}$$    
       
Pero es necesario tener en cuenta que el orden de la tomas por sesión es irrelevante.     
En una sesión tenemos $m$ tomas, que se pueden combinar de $m!$ maneras, por lo cual si ignoramos el orden de las tomas, tenemos como **total de sesiones únicas**:

$$ s_{u}(n) = \frac{s_{t}(n)}{m!} = \frac{n!}{(n-m)! \cdot m!}$$    



       
Para calcular el total de soluciones, sabemos que la grabación necesitará realizar $\frac{n}{m}$ sesiones ($m \neq 0$).    
Sabemos también que el orden de las sesiones es irrelevante, y estas se pueden combinar de $\frac{n}{m}!$ maneras.        
Tenemos $s_{u}(n)$ sesiones por elegir para el primer día, pero las tomas no se han de repetir entre las diferentes sesiones, por lo cual tenemos $s_{u}(n-m)$ el segundo día, y de forma general tenemos, como **total de soluciones únicas posibles**:

<br />

$$
 S = \frac{\prod_{i=0}^{ \frac{n}{m}-1} s_{u}(n-i \cdot m)}{\frac{n}{m}!}
 = \frac{1}{\frac{n}{m}!} \cdot \prod_{i=0}^{ \frac{n}{m}-1} \frac{(n-i \cdot m)!}{(n-i \cdot m -m)! \cdot m!}
$$
      
<br /><br />

En el caso del enunciado, el número de **soluciones únicas posibles** es:     
    
$$
\frac{1}{ 5!} *
\frac{30!}{(30-6)! \cdot 6!} *
\frac{24!}{(24 -6)! \cdot 6!} *
\frac{18!}{(18 -6)! \cdot 6!} *
\frac{12!}{(12 -6)! \cdot 6!} *
\frac{6!}{(6 -6)! \cdot 6!}
\approx 1,14 \cdot10^{16}
$$
       
       
<br>
Deducimos también que:

$$ S = \frac{1}{\frac{n}{m}!} \cdot \prod_{i=1}^{\frac{n}{m}} \frac{ (i \cdot m)! }{ ((i-1) \cdot m)! \cdot  m! } = \frac{n!}{ \frac{n}{m}! \cdot m!^{\frac{n}{m}}} $$     
      
<br>
Lo cual tiene una lectura bastante intuitiva: disponemos de $n!$ combinaciones de tomas, las cuales contienen $\frac{n}{m}!$ combinaciones irrelevantes de sesiones, y $\frac{n}{m}$ veces $m!$ combinaciones de tomas irrelevantes.


### Modelo para el espacio de soluciones
#### ¿Cual es la estructura de datos que mejor se adapta al problema? 

La primera opción que viene a la cabeza para representar una solución, es una lista de sesiones, ellas mismas siendo listas de tomas, por ejemplo:    
- Sesión 1
  - toma a
  - toma b
  - toma c
  - ...
- Sesión 2
  - ...
- ...

La ventaja es su intuitividad, y su sencillez para delimitar el límite de tomas por sesión.     
Pero tiene una gran desventaja, y es que complica la programación necesaria para recorrer las soluciones requiriendo operaciones adicionales para buscar tomas ya usadas, calcular los gastos y encontrar soluciones duplicadas pero en orden de tomas diferentes.      

Conviene en realidad por cada solución crear una lista plana de tomas, y usar el número de tomas de la solución como indicador de cantidad total de sesiones o nivel de compleción de la última sesión.    

Por ejemplo el resto `tamaño_solución % número_de_tomas_por_sesión` nos indica el nivel de compleción de la última sesión. Si el resultado es cero, sabemos que la sesión anterior está completa y estamos empezando una nueva, o de lo contrario, cuantas tomas contiene la última sesión.

### Según el modelo para el espacio de soluciones<br>
#### ¿Cual es la función objetivo?
La función objetivo se resume en calcular el coste de los actores para la grabación, lo cual corresponde en **sumar el coste de cada sesión**, tras contabilizar **cuántos actores son necesarios** para cada una de ellas.    
Podemos modelizar la función de la siguiente manera:

$$ f(S) = \sum_{i=1}^{ \frac{n}{m} } \lVert OR_{ s_{i} \rightarrow j}( \vec{C}_{j}) \lVert $$

$OR_{ s_{i} \rightarrow j}$ siendo una operación lógica *OR* entre los vectores coste de las tomas $\vec{C}_{j} \in [0, 1]^a $ de cada sesión $s_{i}$, con $a$ el número de actores.    
Y $\lVert \vec{C} \lVert$ la norma 1 del vector coste resultante de la operación lógica.     

#### Código función objetivo

In [0]:
import numpy as np


def calculate_cost(solution: tuple, max_takes: int, costs: tuple) -> int:
    """
    Calculate the real cost of a single solution.

    :param solution: a flat list of takes, representing a complete or partial solution.
    :param max_takes: the max allowed number of takes per session.
    :param costs: a two dimensions list of all takes with their corresponding needed actors.

    :return: the cost of the solution.
    """
    # Solution total cost.
    solution_cost = 0
    # Takes per session counter.
    takes_count = 0
    session_cost = None
    session_is_full = False

    for take in solution:
        takes_count += 1
        # Whether a session reached its max allowed takes.
        session_is_full = takes_count == max_takes
        # Use a numpy array to ease bitwise operations.
        take_cost = np.array(costs[take])
        # Use bitwise 'or' operation to join the takes' costs per session,
        # as an actor gets paid the same amount regardless of his takes by session.
        session_cost = take_cost if session_cost is None else session_cost | take_cost

        if session_is_full:
            # Total cost is the cost sum of all sessions.
            solution_cost += session_cost.sum()
            # Reset session cost and counters.
            session_cost = None
            takes_count = 0

    # Sum last session if partial, as it would not have been previously added.
    if not session_is_full and session_cost is not None:
        solution_cost += session_cost.sum()

    return solution_cost

#### ¿Es un problema de maximización o minimización?

El objetivo es reducir el coste y por tanto minimizar la función $f(S)$. Es un problema de minimización.

## Algoritmo para resolver el problema por fuerza bruta

In [0]:
def brute_force(costs: tuple, max_takes: int) -> tuple:
    # Generate all solutions from all takes combinations.
    solutions = next_level(costs)

    best_solution = None
    best_solution_cost = None
    # Check all solutions to find the best one.
    for solution in solutions:
        solution_cost = calculate_cost(solution, max_takes, costs)
        if best_solution is None or solution_cost < best_solution_cost:
            best_solution = solution
            best_solution_cost = solution_cost

    return best_solution


def next_level(costs: tuple, solution: tuple = ()) -> list:
    """From a partial solution, generate all remaining combinations"""
    children = []
    for take_id in range(len(costs)):
        # Do not duplicate takes in a solution.
        if take_id in solution:
            continue

        local_solution = solution + (take_id,)
        if len(local_solution) < len(costs):
            # Recursively add levels until solution full length is reached.
            children += next_level(costs, local_solution)
        else:
            children.append(local_solution)

    return children

### Complejidad del algoritmo por fuerza bruta

El algoritmo por fuerza bruta genera todas las soluciones posibles, aunque estén duplicadas, es decir $n!$ soluciones y por tanto tiene una complejidad $O(n!)$

## Diseña un algoritmo que mejore la complejidad del algortimo por fuerza bruta

Propongo un algoritmo de ramificación y poda con 3 tipos de poda, con la idea de descartar una gran parte de las soluciones que estimemos tener un peor resultado.     
Para ello planteo un estimador de coste inferior, que calcule el coste mínimo posible entre las soluciones restantes, a partir de una solución parcial.    
Es decir que recorremos únicamente las tomas faltantes a una solución parcial, sumando el total de tomas faltantes por actor, y determinando así el total de sesiones restantes por actor, cuya suma representa el coste mínimo posible restante.       

     
Para formalizarlo, definimos $n'$ el número de tomas restantes y $\vec{C}_{i}$ los vectores restantes de coste de toma.     

$$ \text{vector coste inferior}: \vec{C} = \frac{1}{m} \sum_{i=1}^{n'}  \vec{C}_{i} $$

$$ \text{coste inferior} = \lVert \text{techo} (\vec{C}) \lVert $$

<br>

### Poda de hijos de un mismo nodo
Tras generar los hijos de un nodo, nos quedamos únicamente con los hijos de menor *estimación de coste inferior*, y podamos el resto.

### Poda de nodos con sesión completa
Tras completar una sesión -es decir que esta haya llegado al máximo de tomas permitidas-, y que todos los nodos activos sean completos, podemos podar los nodos cuya suma del *coste actual* y del *coste restante estimado* sea mayor. Esto porqué los costes de la sesión ya no se cruzarán con los coste restantes estimados al estar la sesión completa.

### Poda de límite de nodos
Para evitar generar una lista demasiada importante de nodos a pesar de las podas anteriores, conviene aplicar una poda "dura" cuando se supere un número definido de nodos. En cuyo caso se ordenan los nodos de menor a mayor suma de *coste* y *estimación* y nos quedamos con los $x$ primeros difinidos por el límite. Por defecto lo dejamos a 500.     
Esta poda implica no tener la garantía de encontrar la solución óptima ya que la seleción es semi-arbitraria.

### Algoritmo de ramificación y poda propuesto

In [0]:
def estimate_lowest_cost(solution: tuple, max_takes: int, costs: tuple) -> int:
    """Calculate an estimation of the lowest cost from the remaining takes"""
    estimated_cost = None
    for take_id, take in enumerate(costs):
        if take_id not in solution:
            take_cost = np.array(take)
            estimated_cost = take_cost if estimated_cost is None else take_cost + estimated_cost

    # Estimate best case scenario cost, by summing the minimal needed sessions per actor in the remaining takes.
    return np.ceil(estimated_cost / max_takes).sum() if estimated_cost is not None else 0


def create_child_solutions(solution: tuple, costs: tuple, max_takes: int, explored_nodes=None) -> list:
    """From a node solution, create its child solutions"""
    # Auto-initialization for tests simplicity.
    if explored_nodes is None:
        explored_nodes = []

    # Calculate takes number in the current session.
    session_takes_count = max_takes - (len(solution) + 1) % max_takes

    child_solutions = []
    for take_id in range(len(costs)):
        # Ignore already used takes.
        if take_id not in solution:
            local_solution = solution + (take_id,)
            # Sort takes in the current session to have unique solutions, regardless of its takes order.
            session_takes = tuple(sorted(local_solution[-session_takes_count:]))
            local_solution = local_solution[:-session_takes_count] + session_takes
            # Only add a child if it was not previously added.
            if local_solution not in explored_nodes:
                child_solutions.append(local_solution)
                # Keep track of generated solutions.
                explored_nodes.append(local_solution)

    return child_solutions


def branch_and_pound(costs: tuple, max_takes: int, nodes_limit: int = 500) -> tuple:
    """
    Iteratively branch and pound the node tree based on 3 types of pounding:
    - Node child pounding
    - Full session nodes pounding
    - Nodes limit pounding
    """
    best_solution = None
    best_solution_cost = None
    explored_nodes = []
    iteration = 0

    # Initialize the tree with an empty root node.
    nodes = [{
        's': (),
        'cost': 0,
        'depth': 0,
        'estimation': estimate_lowest_cost((), max_takes, costs),
    }]

    # Loop as long as there are nodes to loop over.
    while nodes:
        iteration += 1

        # Active nodes max and min depths.
        min_depth = min(nodes, key=lambda node: node['depth'])['depth']
        max_depth = max(nodes, key=lambda node: node['depth'])['depth']

        # Whether all nodes are at the same depth.
        if max_depth != 0 and min_depth == max_depth:
            # Whether it is a 'full session' depth.
            if min_depth % max_takes == 0:
                # As all nodes have full sessions, pound the ones with higher estimated cost.
                best_node = min(nodes, key=lambda node: node['cost'] + node['estimation'])
                best_cost = best_node['cost'] + best_node['estimation']
                nodes = [node for node in nodes if node['cost'] + node['estimation'] <= best_cost]

            # Hard pound if nodes list becomes too big. This might result in removing the best solution.
            elif len(nodes) > nodes_limit:
                # Sort nodes by current estimated cost.
                nodes = sorted(nodes, key=lambda node: node['cost'] + node['estimation'])
                nodes = nodes[:nodes_limit]

        # Extract first node of the list.
        # Node is expected to have the lowest depth as children are appended at the bottom of the list.
        selected_node = nodes.pop(0)

        # Branch selected node.
        child_nodes = [
            {
                's': solution,
                'depth': len(solution),
                'cost': calculate_cost(solution, max_takes, costs),
                'estimation': estimate_lowest_cost(solution, max_takes, costs),
            }
            for solution in create_child_solutions(selected_node['s'], costs, max_takes, explored_nodes)
        ]

        # Pound new branches with a higher estimated utopian cost.
        if child_nodes:
            best_cost = min(child_nodes, key=lambda node: node['estimation'])['estimation']
            child_nodes = [node for node in child_nodes if node['estimation'] == best_cost]
            nodes.extend(child_nodes)

        # Whether node is final and cannot have children.
        is_final_node = len(selected_node['s']) == len(costs)
        # Select node as best solution if its cost has improved.
        if is_final_node and (best_solution_cost is None or selected_node['cost'] < best_solution_cost):
            best_solution_cost = selected_node['cost']
            best_solution = selected_node['s']

    print('Best solution with cost %i in %i iterations:' % (best_cost, iteration))
    print(best_solution)

#### Preparamos los datos

In [0]:
import pandas as pd

filepath = 'https://raw.githubusercontent.com/AdrienFelipe/03MAIR---Algoritmos-de-Optimizacion---2019/master/seminar/res/data.csv'
dataFrame = pd.read_csv(filepath, index_col=0)

### Aplicamos el algoritmo

In [5]:
%%time

# Lista de costes por toma
costs = tuple(dataFrame.itertuples(index=False, name=None))
# Tomas por sesión
max_takes = 6

branch_and_pound(costs, max_takes)

Best solution with cost 29 in 8596 iterations:
(0, 1, 5, 6, 8, 12, 13, 16, 17, 18, 22, 23, 2, 3, 4, 14, 10, 19, 7, 15, 11, 20, 21, 24, 9, 25, 26, 27, 28, 29)
CPU times: user 3min 31s, sys: 120 ms, total: 3min 31s
Wall time: 3min 31s


### Complejidad del algoritmo 
Consideramos como iteración el haber expandido todos los nodos activos al siguiente nivel.     
De momento ignoramos la "poda dura", y permitimos un número libre de nodos.

#### Costes por iteración
**Definimos**     
Número de nodos: $N$      
Tamaño solución: $S$       
Hijos por nodo: $H$  
       
**Coste por función**     
Coste de generar hijos, por nodo: $n*S$     
Coste de calcular coste, por hijo: $S$     
Coste de estimar coste, por hijo: $n$

**Coste iteración**: $C = N*(n*S + H*(S + n))$       
         
           
#### Iteración 1
Número de nodos: $N_{1}=1$      
Tamaño solución: $S_{1}=0$       
Hijos por nodo: $H_{1}=n-S_{1}=n$         

#### Iteración 2
Factor de poda: $p$    
Número de nodos: $N_{2}=p \cdot H_{1} \cdot N_{1} = p \cdot n$      
Tamaño solución: $S_{2}=S_{1}+1=1$       
Hijos por nodo: $H_{2}=n-S_{2}=n-1$      


#### Iteración 3
Factor de poda: $p$    
Número de nodos: $N_{3}=p \cdot H_{2} \cdot N_{2}
= p^2 \cdot (n-1)  \cdot n$      
Tamaño solución: $S_{3}=S_{2}+1 = 2$       
Hijos por nodo: $H_{3}=n-S_{3}=n-2$      

#### Iteración i
Número de nodos: $N_{i}=p^{i-1} \cdot \frac{n!}{(n-i+1)!}$      
Tamaño solución: $S_{i}= i-1$       
Hijos por nodo: $H_{i}=n-i+1$    
          
<br>
Coste iteración $i$:       

$C_i = N_i \cdot (n \cdot S_i + H_i \cdot (S_i + n))$    
$C_i = p^{i-1}  \cdot  \frac{n!}{(n-i+1)!}  \cdot (n \cdot (i-1) + (n-i+1) \cdot (i-1 + n))$    
$C_i = p^{i-1} \cdot \frac{n!}{(n-i+1)!} \cdot (n^2 + n \cdot (i-1) + i \cdot(1-i)-1)$    

<br>
Coste total: $$ C = \sum_{i=1}^n C_i \approx C_n $$      
<br>

$C \approx p^{n-1} \cdot \frac{n!}{(n-n+1)!} \cdot (n^2 + n \cdot (n-1) + n \cdot(1-n)-1) =  p^{n-1} \cdot n! \cdot (n^2 - 1)$

<br>
$$C \approx n! \cdot n^2 \cdot p^{n-1} $$
         
**Peor caso**: la poda nunca encuentra mejores nodos teniendo entonces $p=1$, y la complejidad del peor caso resulta ser $O(n!)$        
**Mejor caso**: la poda es capaz de quedarse con un solo nodo en cada iteración por lo cual tenemos:     

$
N_{i}=p^{i-1} \cdot \frac{n!}{(n-i+1)!} = 1  
\Leftrightarrow  p^{i-1} = \frac{(n-i+1)!}{n!}
$      
y $C \approx n! \cdot n^2 \cdot \frac{(n-n+1)!}{n!} = n^2 $ y tenemos $O(n^2)$     
        
Tenemos una complejidad: $O(n^2) < O(f) < O(n!)$

#### Poda dura
            
Si aplicamos la "poda dura", y limitamos el número de nodos a máximo $L$ en cada iteración, entonces tenemos en el peor caso:        
$N_i=p^{i-1} \cdot L$, con $p=1$          
y $C_i = L \cdot (n^2 + n \cdot (i-1) + i \cdot (1-i)-1)$     
      
$ C = \sum_{i=1}^n C_i \approx n \cdot L \cdot n^2 = L \cdot n^3$      

Por tanto la poda dura nos permite acotar la complejidad a:      

$$ O(n^2) < O(f) < O(n^3)$$

## Juego de datos de entrada aleatorios

In [6]:
import random

# Máximo de tomas para el juego de datos.
total_takes = 24

# Número máximo de sesiones.
sessions = random.randint(3, int(total_takes / 2))

# Restricción de número de tomas por sesión.
session_takes = random.randint(2, int(total_takes / sessions))

# Número de tomas.
takes = session_takes * sessions

# Número de actores a tener en cuenta
actors = random.randint(4, 20)

# Probabilidad de actuar en una toma.
p = 0.2  # 20%

# Generamos los costes.
random_costs = ()
for take_id in range(takes):
    take = []
    for actor in range(actors):
        take.append(int(random.random() < p))
    # Nos aseguramos tener al menos 1 actor por toma.
    if not sum(take):
        actor = random.randint(0, actors - 1)
        take[actor] = 1

    random_costs += (take,)

print('Total de tomas:', takes)
print('Tomas por sesión:', sessions)
print('Total de actores:', actors)
print('Costes:')
display(random_costs)

Total de tomas: 14
Tomas por sesión: 7
Total de actores: 13
Costes:


([1, 0, 1, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0],
 [1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0],
 [0, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 1],
 [1, 0, 0, 1, 0, 0, 0, 1, 0, 1, 0, 0, 1],
 [0, 1, 1, 0, 0, 1, 0, 0, 0, 0, 0, 0, 1],
 [0, 0, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0],
 [0, 0, 1, 0, 0, 1, 0, 0, 0, 0, 0, 0, 1],
 [0, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 1],
 [0, 0, 1, 0, 0, 0, 0, 1, 0, 0, 1, 0, 0],
 [0, 1, 0, 0, 0, 0, 0, 1, 0, 1, 0, 0, 0],
 [1, 1, 1, 1, 0, 1, 1, 0, 1, 0, 1, 0, 0],
 [0, 1, 0, 0, 0, 0, 0, 0, 0, 1, 0, 0, 1],
 [0, 1, 1, 1, 0, 0, 1, 0, 1, 0, 1, 0, 0],
 [1, 0, 0, 1, 0, 1, 0, 0, 1, 1, 0, 0, 0])

### Aplica el algoritmo al juego de datos generado

In [7]:
branch_and_pound(random_costs, session_takes)

Best solution with cost 33 in 36 iterations:
(10, 12, 4, 6, 0, 8, 3, 13, 1, 2, 5, 7, 9, 11)


## Como crees que es posible avanzar en el estudio del problema

Lo primero para mi sería hacer benchmark del algoritmo actual comparando el impacto sobre el tiempo total de cálculo aplicando variantes en el código, como limitando bucles, apoyandose más en librerias y apreciando el impacto de usar clases.     
Lo segundo sería probar una alternativa a la poda dura con otro tipo de estimación de coste.