<a href="https://colab.research.google.com/github/LukzAndriy/03MAIR-Algoritmos-de-Optimizacion-LOL-2020/blob/main/Seminario/Lafranconi_Lucas_Seminario_Algoritmos.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Algoritmos de optimización - Seminario<br>
Nombre y Apellidos:  Lucas Lafranconi <br>
Url: https://colab.research.google.com/drive/1AR_IEEpgXbWW2Jy8O35bSv1kEt4PF9nD?usp=sharing <br>
Github: ... <br>

##Problema:
> 1. Sesiones de doblaje <br>

**Descripción del problema:**

Se precisa coordinar el doblaje de una película. Los actores del doblaje deben coincidir en las tomas en las que sus personajes aparecen juntos en las diferentes tomas. Los actores de doblaje cobran todos la misma cantidad por cada día que deben desplazarse hasta el estudio de grabación independientemente del número de tomas que se graben. 

No es posible grabar más de 6 tomas por día. El objetivo es planificar las sesiones por día de manera que se gasto por los servicios de los actores de doblaje sea el menor posible.







                                        

### Consideraciones del problema

En el mundo real, la secuencia de filmación de las escenas de la película no es la secuencia final. Por lo tanto, la idea detrás de este problema es encontrar la secuencia óptima. Si tenemos un conjunto de escenas y un conjunto de actores. 

El problema consiste en cómo reducir el costo de transferencia en función de los actores para minimizar el costo total, por lo que se trata de un problema de optimización de uno o más factores, y es considerado un problema NP-difícil.

Planteado inicialmente por [Cheng et al](https://https://link.springer.com/article/10.1007/BF00940554) (1993), es un problema de permanente interés, abordado por diversas técnicas algorítmicas, encontrándose en las metaheurísticas los enfoques más novedosas para optimización multifactorial para un número grande de tomas, como el Método Basado en Búsqueda Tabú (TSBM), la optimización de enjambre (PSOBM) [(Liu et al, 2019)](https://https://www.hindawi.com/journals/ddns/2019/3737105/) o de colonia de hormigas [(Long & Zhao, 2020)](https://ieeexplore.ieee.org/stamp/stamp.jsp?arnumber=9044871).

#### Días de grabación
Son 30 tomas a filmar en total y no se pueden superar las 6 tomas por día. Por lo tanto, en el mejor de los casos el número mínimo de días sería de 5 días de grabación.

#### Precio por actor
Como todos los actores cobran lo mismo por día, y esto es independiente del número de tomas, se puede ignorar el precio por actor para este problema en particular.

#### Duración de escenas
Se dejará de lado la duración de las escenas, suponiendo que todas duran lo mismo y no afectan al pago del actor o la cantidad que pueden filmarse en un día. 

#### Orden de las tomas y las sesiones
No hay ninguna restricción aparente del orden de las tomas, ya que es irrelevante dentro de cada sesión, y no afecta el gasto final. Lo mismo sucede con el orden de las sesiones.

In [None]:
#Análisis de datos de esta película

import numpy as np
import pandas as pd

ruta = 'https://raw.githubusercontent.com/LukzAndriy/03MAIR-Algoritmos-de-Optimizacion-LOL-2020/main/Seminario/data_sp.csv'
data = pd.read_csv(ruta, index_col=0)

display(data)

Unnamed: 0_level_0,1,2,3,4,5,6,7,8,9,10
Toma,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1
1,1,1,1,1,1,0,0,0,0,0
2,0,0,1,1,1,0,0,0,0,0
3,0,1,0,0,1,0,1,0,0,0
4,1,1,0,0,0,0,1,1,0,0
5,0,1,0,1,0,0,0,1,0,0
6,1,1,0,1,1,0,0,0,0,0
7,1,1,0,1,1,0,0,0,0,0
8,1,1,0,0,0,1,0,0,0,0
9,1,1,0,1,0,0,0,0,0,0
10,1,1,0,0,0,1,0,0,1,0


In [None]:
tomas=data.shape[0]
actores=data.shape[1]
tomas,actores

(30, 10)

In [None]:
# Lista de costes por toma
costos = tuple(data.itertuples(index=False, name=None))
# Tomas por sesión
max_tomas = 6

* **¿Cuántas posibilidades hay sin tener en cuenta las restricciones?**<br>

La única restricción es el **máximo de tomas por día**.

De no tener en cuenta dicha restricción, se podría grabar todas las tomas en un mismo día, en una única gran sesión.

Al tener que filmar 30 tomas, tendríamos que el número de posibilidades se calcularía con una permutación lineal simple: 

$n! = 30! $

Se calcula a continuación:


Respuesta

In [None]:
def factorial(n, memo = {}):   
  if n == 0 or n == 1:
    return 1

  try:       
    return memo[n]   
  except KeyError:       
    resultado = n*factorial(n - 1, memo)       
    memo[n] = resultado               
    return resultado

posibilidades = factorial(tomas)
print('Existen %s posibilidades si no existen restricciones de tomas por día' % ("{:e}".format(posibilidades)))


Existen 2.652529e+32 posibilidades si no existen restricciones de tomas por día


Como se calculó arriba, existen $\approx 2.65e32 $ combinaciones posibles de tomas dentro de una única sesión.

En este caso en particular, sería irrelevante el orden de las tomas porque todos los actores estarían allí ya, cualquier solución sería válida e idéntica en gasto, correspondiente al total de actores (10).

---

* **¿Cuantas posibilidades hay teniendo en cuenta todas las restricciones?**

Definimos $n$ el total de tomas y $b$ las tomas por sesión, con $n,b \in \mathbb{N}^2 $ y $1\leq b \leq n$.

Para calcular el total de sesiones posibles, elegimos $b$ veces una de las $n$ tomas, teniendo una menos por elegir en cada iteración.

Agrupando a elementos de $b$ en $b$, se pueden formar $k=b/n$ grupos (suponiendo siempre que b es múltiplo de n, como lo es en el caso del problema)

El primer grupo estará formado por cualquier combinación de $b$ elementos a tomar entre todos los que hay. El número de tales combinaciones es $C(n,b)$

El segundo grupo estará formado otra vez por cualquier combinación de $b$ elementos, pero esta vez no tenemos para elegir todos los $n$ iniciales, pues ya se han usado $b$ elementos en el primer grupo. 

Por tanto serían $b$ elementos a elegir de un conjunto de $(n-b)$, y por tanto sería el número binomial $C(n-b, b)$
Para el grupo k-ésimo, estará formado por los b elementos a elegir entre $(n-(k-1)b)$, y por tanto sería $C(n-(k-1)b, b)$.

Sabiendo que $$ C(n,b) = \frac{n!}{(n-b)! \cdot b!}$$

Deducimos el total de sesiones posibles:
$$s_{t}(n) = C(n-(k-1)b,b) = \prod_{i=1}^{k} \frac{(n-(k-1)b)!}{(n-kb)! \cdot b!}$$

$$s_{t}(n) = \frac{n!}{(n-b)! \cdot b!}.\frac{(n-b)!}{(n-2b)! \cdot b!}. . .\frac{(n-(k-1)b)!}{(n-kb)! \cdot b!}$$

Para simplificar, se puede ver que en el denominador de la primera fracción aparece $(n-b)!$, que se simplifica con el numerador de la siguiente, y lo mismo pasa en cada iteración, quedando lo siguiente:

$$s_{t}(n) = \frac{n!}{b!}.\frac{1}{b!}.\frac{1}{b!} . .\frac{1}{(n-kb)! \cdot b!}$$

Como $n=k.b$, el último factorial es el factorial de 0, quedando simplemente:

$$s_{t}(n) = \frac{n!}{(b!)^k} $$

En este punto, es necesario tener en cuenta que el orden de la agrupación de tomas por sesión es irrelevante (una vez definidas los k grupos, es indistinto cuál va en cada "posición"). 

Para eliminar todas esas posibilidades tenemos que eliminar esas permutaciones de múltiples maneras de seleccionar los grupos de tomas: Como debe realizarse $k$ agrupaciones, que se pueden combinar de $k!$ maneras, se debe dividir por dicho factor para obtener las posibles combinaciones de agrupaciones totales, las soluciones únicas posibles:

$$S_{u}(n) = \frac{n!}{k!(b!)^k} $$

In [None]:
def cant_soluciones(n,b):   
  if n == 0 or n == 1:
    return 1

  # try:       
  #   return memo[n]   
  # except KeyError:       
  resultado = factorial(n) / (factorial(n/b)*pow(factorial(b),n/b) )     
    # memo[n] = resultado               
  return resultado

num_soluciones=cant_soluciones(30,6)
print('Existen %s soluciones' % ("{:e}".format(num_soluciones)))

Existen 1.142395e+16 soluciones


Si bien se tienen un espacio de soluciones mucho menor, las mismas difererirán en costo, puesto que el número de actores en cada sesión puede no ser el óptimo.

---

###Modelo para el espacio de soluciones<br>
* **¿Cual es la estructura de datos que mejor se adapta al problema? Argumentalo (Es posible que hayas elegido una al principio y veas la necesidad de cambiar)**

Teniendo en cuenta que existen sesiones y tomas, y que estas variables tienen una relación de pertenencia entre sí, uno podría pensar múltiples maneras de agrupar los datos para trabajarlos de la manera más amigable posible.

Se podrían armar listas de tomas de cada una de las sesiones que, a su vez, se agrupen, en otra lista de sesiones totales, de tal manera de siempre recorrer las tomas de cada sesión y luego en un nivel superior las sesiones. El problema de esta forma de agrupar los datos, es que en cada algoritmo que implemente tendré que necesariamente recorrer en dos niveles de bucles, forzando una complejidad mayor.

Otra forma sería tener una lista con todas las tomas, y usar el número de tomas en cada iteración como el indicador indirecto de la cantidad total de sesiones, indicando incluso si está completa o no la última sesión (simplemente haciendo un resto `tamaño_solución % tomas_por_sesión` al operar).

Según el modelo para el espacio de soluciones<br>
* **¿Cual es la función objetivo?**

Respuesta:

La función objetivo debe calcular el coste de los actores para terminar la grabación, es decir, para finalizar las 30 tomas. Esto corresponde a sumar el coste de cada sesión, tras contabilizar cuántos actores son necesarios para cada una de ellas.

Se podría modelizar la función de la siguiente manera:

$$ f(S) = \sum_{i=1}^{n} \sum_{j=1}^{m} \sum_{k=1}^{p}  {c}_{ijk} $$

Donde $ f(S)  $ es la función a modelizar, $n$ es el número de sesiones, $m$ el número de tomas por sesión, $p$ el número de actores y $c_{ijk}$ los costos del actor $k$ de la toma $m$ de la sesión $n$.

* **¿Es un problema de maximización o minimización?**

Es un **problema de minimización**, siendo el coste de los actores la variable a minimizar, lo cual está expresado en la función objetivo. 

Respuesta (código)

In [None]:
def calcular_costo(solucion: tuple, max_tomas: int, costos: tuple) -> int:
    """
    Calcula el costo de una única solución.

    :solucion: una lista de tomas, representando una solución completa o parcial.
    :max_tomas: el número máximo de tomas por sesión.
    :costos: una lista bidimensional de todas las tomas con sus correspondientes actores (equivalen a los costos de las tomas).

    :return: el costo de la solución.
    """
    # Costo total de la solución.
    costo_solucion = 0
    # Contador de tomas por sesión.
    cuenta_tomas = 0
    costo_sesion = None
    sesion_completa = False

    for toma in solucion:
        cuenta_tomas += 1
        # Evalúa si cada sesión se ha completado.
        sesion_completa = cuenta_tomas == max_tomas
        costo_toma = np.array(costos[toma])   #Revisa el costo de los actores en cada toma
        # Usamos el operador bitwise 'or' para unir los costos por cada sesión
        # A cada actor se le paga lo mismo haga 1 o varias tomas en cada sesión
        costo_sesion = costo_toma if costo_sesion is None else costo_sesion | costo_toma

        ### Si para la toma 27, por ejemplo, se tiene 27,0,0,0,1,1,0,0,0,0,0
        ### Y en la sesión ya estaba la toma 28       28,1,0,0,1,0,0,0,0,0,0 
        ### En costo_sesion, tendríamos lo siguiente:    1,0,0,1,1,0,0,0,0,0

        if sesion_completa:
            # El costo total es la suma de los costos de las distintas sesiones.
            costo_solucion += costo_sesion.sum() 
            #Como el costo de la sesión tiene todos los actores involucrados, 
            # es necesario sumarlos antes de agregarlos al costo total de la solución.
            
            #Reinicio de contadores para próxima sesión (sesión ya completa)
            costo_sesion = None
            cuenta_tomas = 0

    # Si la solución no está completa aún, suma la última sesión
    if not sesion_completa and costo_sesion is not None:
        costo_solucion += costo_sesion.sum()

    return costo_solucion


### Diseña un algoritmo para resolver el problema por fuerza bruta

Respuesta

In [None]:

def fuerza_bruta(costos: tuple, max_tomas: int):
    # Genera todas las soluciones para todas las combinaciones de tomas.
    soluciones = siguiente_nivel(costos)

    mejor_solucion = None
    costo_mejor_solucion = None
    # Verifica todas las soluciones para encontrar la mejor.
    for solucion in soluciones:
        costo_solucion = calcular_costo(solucion, max_tomas, costos)
        if mejor_solucion is None or costo_solucion < costo_mejor_solucion:
            mejor_solucion = solucion
            costo_mejor_solucion = costo_solucion

    return mejor_solucion


def siguiente_nivel(costos: tuple, solucion: tuple = ()):
    """
    A partir de una solución parcial, generar todas las combinaciones restantes
    """
    hijos = []
    for id in range(len(costos)):
        # No duplicar tomas en cada solución.
        if id in solucion:
            continue

        solucion_local = solucion + (id,)
        if len(solucion_local) < len(costos):
            # Agrega niveles hasta que hasta alcanzar la longitud de la solución.
            hijos += siguiente_nivel(costos, solucion_local)
        else:
            hijos.append(solucion_local)

    return hijos

* **Calcula la complejidad del algoritmo por fuerza bruta**

Respuesta

El algoritmo por fuerza bruta genera y explora el espacio de todas las soluciones posibles, revisando una a una su coste, aunque estén duplicadas (es decir, aunque haya una solución que ya haya sido explorada en otro orden de generación), lo que representa $n!$ soluciones y, por tanto, tiene una complejidad $O(n!)$.

### Diseña un algoritmo que mejore la complejidad del algoritmo por fuerza bruta. 
**Argumenta porque crees que mejora el algoritmo por fuerza bruta**

Respuesta

Si bien se podría pensar en un algoritmo de ramificación y poda, con la idea de descartar una gran parte de las soluciones que estimemos tener un peor resultado, **se optará por una técnica metaheurística**, por varios motivos que la posicionan muy bien frente al método voraz:

1. El problema lo permite, puesto que **tenemos una función de coste que puede evaluar cualquier solución inmediatamente**, sin que necesitamos acercarnos secuencialmente a la solución o con alguna restricción que imposibilite esto.

2. El método voraz revisa un número inadmisible de soluciones sin necesidad de que ellas estén cerca de la solución óptima. Si bien es posible que con este método heurístico no se obtenga la solución más óptima, por no ser determinista, lo mismo incluso puede suceder con métodos deterministas como ramificación y poda si se quiere obtener una solución en un tiempo computacional realizable. Esto es, **con seguridad se obtendrá una solución eficiente y aceptable**. 

3. Tiene una **relativa facilidad de implementación**, a lo que se suma un componente lúdico de la mejora continua del proceso metaheurística.

4. El interés académico en indagar en estas técnicas, presentada en las últimas sesiones de la asignatura, está muy vigente en la bibliografía consultada. El refrán "mejor pájaro en mano que cien volando", resume la filosofía detrás de estás técnicas, que bien implementadas pueden incluso llegar a la solución óptima.

Se utilizará una técnica mixta, basada en los siguientes métodos:

1. **Búsqueda aleatoria**, para recorrer una buena variedad de soluciones y diversificar la búsqueda, 
2. **Recocido simulado (Simulated Annealing)**, para intensificar al final, haciendo soluciones vecinas aleatorias que mejoren el costo.



#### Desarrollo de Algoritmo propuesto: Búsqueda Aleatoria con Recocido Simulado

In [None]:
import random

def generar_solucion(costos):
  """
  Genera una solución aleatoria a partir de los datos de los costos de actores
  """
  tomas_costos = [(i,elem) for i,elem in enumerate(costos)]
  sol_temp = list(tomas_costos)
  random.shuffle(sol_temp)
  sol_prueba = tuple(i for i,costo in sol_temp)
  return sol_prueba


In [None]:
def busqueda_aleatoria(costos, max_tomas, N):
  """
  Busca una solución aleatoria minimizando el costo de la función objetivo
  """
  mejor_solucion = []
  mejor_costo = 35                         #Inicializamos con un valor alto
  
  for i in range(N):                                #Criterio de parada: repetir N veces pero podemos incluir otros
    solucion = generar_solucion(costos)                #Genera una solucion aleatoria
    costo = calcular_costo(solucion, max_tomas, costos)  #Calcula el valor objetivo(distancia total)
    
    if costo < mejor_costo:                 #Compara con la mejor obtenida hasta ahora
      mejor_solucion = solucion
      mejor_costo = costo
      
      
  print("Mejor solución aleatoria:" , mejor_solucion) 
  print("         Costo:" , mejor_costo) 
  return mejor_solucion

solucion = busqueda_aleatoria(costos, max_tomas, 20000)

Mejor solución aleatoria: (11, 8, 18, 4, 20, 21, 2, 26, 10, 14, 6, 3, 22, 28, 19, 7, 17, 12, 23, 5, 13, 0, 9, 25, 16, 24, 29, 1, 27, 15)
         Costo: 32


In [None]:

def genera_vecina_aleatorio(solucion):
  #Generador de soluciones vecinas: 2-opt (intercambiar 2 nodos) Si hay N nodos se generan (N-1)x(N-2)/2 soluciones

  i,j = sorted(random.sample( range(1,len(solucion)) , 2))
     
  #Se genera una nueva solución intercambiando los dos nodos i,j:
  #  (usamos el operador + que para listas en python las concatena) : ej.: [1,2] + [3] = [1,2,3]
  sol_list = list(solucion)
  type(sol_list)
  vecina = tuple(sol_list[:i] + [sol_list[j]] + sol_list[i+1:j] + [sol_list[i]] + sol_list[j+1:])
  
  return vecina

print("Costo Solucion Inicial:" , calcular_costo(solucion, max_tomas,costos))
 
nueva_solucion = genera_vecina_aleatorio(solucion)
print(nueva_solucion)
print("Costo Solucion Local:", calcular_costo(nueva_solucion, max_tomas,costos))


Costo Solucion Inicial: 32
(11, 8, 18, 29, 20, 21, 2, 26, 10, 14, 6, 3, 22, 28, 19, 7, 17, 12, 23, 5, 13, 0, 9, 25, 16, 24, 4, 1, 27, 15)
Costo Solucion Local: 33


In [None]:
import math
#Funcion de probabilidad para aceptar peores soluciones
#Necesaria para el método del Recocido Simulado
def probabilidad(T,d):
  if random.random() <  math.exp( -1*d / T)  :
    return True
  else:
    return False

#Funcion de descenso de temperatura
def bajar_temperatura(T):
  return T*0.99

In [None]:
import copy
def recocido_simulado(solucion, max_tomas, costos, TEMPERATURA):
  """
  Tiene por objetivo mejorar la solución aleatoria que se le ingrese, aceptando
  peores soluciones para permitir diversificar mientras que no encontremos 
  una solución óptima
  Depende la TEMPERATURA(T) y de de la diferencia de costos de las soluciones
  A mayor temperatura => mayor probabilidad de aceptar peores soluciones
  A menor diferencia de costes => mayor probabilidad de aceptar peores soluciones
  """
  solucion_referencia = solucion
  costo_referencia = calcular_costo(solucion_referencia, max_tomas,costos)
  
  mejor_solucion = []
  mejor_costo = 100
    
  K=0
  while TEMPERATURA > .0001:
    K+=1
    #Genera una solución vecina
    vecina = genera_vecina_aleatorio(solucion_referencia)
    
    #Calcula su valor(costo)
    costo_vecina = calcular_costo(vecina, max_tomas,costos)
          
    #Si es la mejor solución de todas se guarda
    if costo_vecina < costo_referencia:
        mejor_solucion = vecina
        mejor_costo = costo_vecina
    
    #Si la nueva vecina es mejor se cambia  
    #Si es peor se cambia según una probabilidad que depende de T y delta(distancia_referencia - distancia_vecina)
    if costo_vecina < costo_referencia or probabilidad(TEMPERATURA, abs(costo_referencia - costo_vecina) ) :
      solucion_referencia = copy.deepcopy(vecina)
      costo_referencia = costo_vecina

    #Bajamos la temperatura
    TEMPERATURA = bajar_temperatura(TEMPERATURA)
 
  print("La mejor solución encontrada del recocido simulado es " , end="")
  print(mejor_solucion)
  print("con un costo total de " , end="")
  print(mejor_costo)
  print("en " + str(K) + " iteraciones")
  return mejor_solucion

sol  = recocido_simulado(nueva_solucion,max_tomas,costos, 10000000)

La mejor solución encontrada del recocido simulado es (11, 5, 9, 6, 25, 1, 12, 19, 24, 15, 18, 0, 21, 14, 2, 26, 10, 3, 29, 20, 7, 4, 8, 27, 17, 23, 16, 13, 22, 28)
con un costo total de 29
en 2521 iteraciones


In [None]:
def busqueda_con_recocido(costos, max_tomas,TEMPERATURA,N,repeticiones: int=3):
  """
  Función que integra los pasos del método diseñado.
  """
  mejor_solucion = []
  mejor_costo = 100
  for repeticion in range(repeticiones):
    solucion = busqueda_aleatoria(costos, max_tomas, N)
    sol_recocida = recocido_simulado(solucion, max_tomas,costos,TEMPERATURA)

    costo_recocida = calcular_costo(sol_recocida, max_tomas,costos)
          
    #Si es la mejor solución de todas se guarda
    if costo_recocida < mejor_costo:
      mejor_solucion = sol_recocida
      mejor_costo = costo_recocida
  
  print("La mejor solución encontrada de la búsqueda aleatoria con recocido, en " + str(repeticiones) + "repeticiones, es " , end="")
  print(mejor_solucion)
  print("con un costo total de " , end="")
  print(mejor_costo)
  return mejor_solucion



**Se aplica el algoritmo de Búsqueda Aleatoria con Recocido Simulado** 

*Datos cargados previamente. Se preparan los parámetros del algoritmo.*

In [20]:
%%time

mejor_solucion_heuristica = busqueda_con_recocido(costos,max_tomas,10000000,20000,20)

Mejor solución aleatoria: (18, 13, 26, 9, 6, 8, 10, 4, 16, 25, 19, 12, 15, 28, 24, 11, 1, 17, 2, 0, 29, 21, 5, 27, 22, 7, 3, 14, 23, 20)
         Costo: 33
La mejor solución encontrada del recocido simulado es (18, 19, 1, 26, 13, 28, 12, 6, 8, 21, 22, 29, 14, 16, 3, 23, 10, 2, 7, 15, 24, 27, 20, 4, 17, 5, 11, 9, 25, 0)
con un costo total de 30
en 2521 iteraciones
Mejor solución aleatoria: (10, 25, 1, 3, 21, 12, 14, 29, 7, 2, 6, 5, 24, 9, 0, 19, 15, 26, 28, 23, 22, 13, 16, 17, 11, 4, 8, 18, 27, 20)
         Costo: 32
La mejor solución encontrada del recocido simulado es (10, 15, 19, 1, 5, 24, 26, 12, 2, 14, 3, 4, 6, 9, 25, 0, 11, 28, 21, 7, 8, 29, 23, 27, 17, 22, 20, 18, 16, 13)
con un costo total de 29
en 2521 iteraciones
Mejor solución aleatoria: (19, 18, 1, 22, 26, 12, 10, 2, 20, 4, 29, 3, 0, 16, 14, 27, 28, 17, 11, 23, 9, 7, 21, 13, 25, 5, 15, 6, 8, 24)
         Costo: 32
La mejor solución encontrada del recocido simulado es (19, 12, 26, 16, 18, 22, 1, 0, 28, 20, 10, 4, 27, 2, 3, 5,

* **Calcula la complejidad del algoritmo** 

Para calcular la complejidad del algoritmo, debo calcular la complejidad de sus etapas:
1. Búsqueda aleatoria:

[Random.shuffle](https://hg.python.org/cpython/file/8962d1c442a6/Lib/random.py#l256) de Python usa el shuffle de [Fisher-Yates](https://en.wikipedia.org/wiki/Fisher%E2%80%93Yates_shuffle), que se ejecuta en tiempo $O (n)$ y se ha demostrado que es un shuffle perfecto (asumiendo un buen generador de números aleatorios). Itera sobre el array desde la última a la primera posición, cambiando cada valor con uno correspondiente a un índice aleatorio en una posición debajo de éste.

 1.1. Genera una solución aleatoria, usando random.shuffle ($O (n)$). 
 
 1.2. Calcula el costo de la solución ($O (n . m)$) 
 
 1.3. Se repite $N$ veces para generar $N$ soluciones aleatorias, calculando el costo de cada una. 

 1.4. Guarda la mejor solución para iniciar el algoritmo de recocido simulado. 

Como el procedimiento se repite N veces, y para cada una de las veces se calcula el costo (recorre las $n$ tomas y suma los $m$ actores), tenemos que:

$$Operaciones_{ba}=N.n.n.m => Complejidad=O(N.n^2),$$

siendo $N$ el número de búsquedas o repeticiones de la búsqueda, $m$ la cantidad de actores y $n$ el tamaño de la solución. Ciertamente es un caso de complejidad multivariable, pues como es posible alterar el valor de N, esto incidirá en la complejidad del algoritmo final. 

Si se quisiera expresar sólo en función de $n$, para hacer una comparativa con el algoritmo voraz, la misma variaría según el rango de $n$, y el valor de $N$ y $m$. Como $m < n$, podría elegir despreciarla en el mejor de los casos o potenciarla en el peor. 

Para valores de $n$ cercanos a $30$, se tendría que

$$ O(n^4) \geq O(f) \geq O(n^5)$$

De nuevo, no sería correcto extrapolar este resultado a valores muy distintos de n, y la forma correcta de expresar la Complejidad sería en función de ambas variables, ya que no se trata de constantes multiplicativas sino de hacer las $n$ operaciones $N$ veces.

2. Recocido Simulado:

 2.0. Calculo costo solucion de entrada: $O(n.m)$
 
 2.1. Generación de solución vecina: 

 2.1.1. Selecciona 2 elementos al azar entre n elementos: $O(2n)$

 2.1.2. Los ordena: 2 operaciones

 2.1.3. Reordena la tupla con los índices intercambiados: $O(log (n))$

 2.2. Calcula el costo de la solución vecina. -> $O(n.m)$

 2.3. Mientras la temperatura del circuito está por encima de un umbral ... (he contado I: 2292 iteraciones) -> $O(log (I))$

3. Repite el proceso R veces. -> $O(R)$


Entonces, para el paso 2, sería $O (n.m.n.m.(2.n). log(n).(log (I))) \approx O(n^3.log(n).log (I))$, para

Si se concatenan los 3 pasos, sería igual a $O(R) . O(N.n^2).O(n^3.log (I).log(n))$

Reorganizando,

$O(R.N.n^5.log (I).log(n))$

Sean $R.N = N_R$,  

Se tiene que: $O(N_R.n^5.log (I).log(n))$

Finalmente, la complejidad oscilaría entre:

$$ O(n^5.log(n)) \geq O(f) \geq O(n^6.log(n))$$

Si bien el algoritmo puede mejorarse y el cálculo de la complejidad es aproximado, se aprecia la mejora con respecto al algoritmo voraz, de complejidad $n!$

---

**Diseña un juego de datos de entrada aleatorios**

Respuesta

In [None]:
import random

# Se plantea un máximo de tomas inferior al problema, para mejorar tiempo de ejecución.
tomastotales = 20

# Número máximo de sesiones.
sesiones = random.randint(2, int(tomastotales / 2))

# Restricción de número de tomas por sesión.
tomas_por_sesion = random.randint(2, int(tomastotales / sesiones))

# Número de tomas.
tomas_random = tomas_por_sesion * sesiones

# Número de actores a tener en cuenta
actores = random.randint(4, 10)

# Probabilidad de actuar en una toma.
p = 0.2  # 20%

# Generamos los costos.
costos_random = ()
for id in range(tomas_random):
    toma = []
    for actor in range(actores):
        toma.append(int(random.random() < p))
    # Nos aseguramos tener al menos 1 actor por toma.
    if not sum(toma):
        actor = random.randint(0, actores - 1)
        toma[actor] = 1

    costos_random += (toma,)

print('Total de tomas:', tomas_random)
print('Tomas por sesión:', tomas_por_sesion)
print('Total de actores:', actores)
print('Costes:')
display(costos_random)

Total de tomas: 16
Tomas por sesión: 2
Total de actores: 10
Costes:


([0, 0, 0, 1, 1, 0, 0, 1, 0, 0],
 [0, 1, 0, 0, 0, 0, 0, 0, 1, 1],
 [0, 0, 0, 0, 0, 0, 1, 1, 0, 0],
 [1, 0, 1, 0, 0, 0, 0, 0, 0, 0],
 [0, 0, 0, 0, 0, 0, 0, 1, 0, 0],
 [0, 0, 0, 0, 0, 1, 0, 0, 0, 0],
 [0, 0, 0, 0, 0, 1, 1, 0, 0, 0],
 [0, 0, 0, 0, 0, 0, 1, 1, 0, 0],
 [0, 0, 0, 0, 0, 1, 0, 0, 0, 0],
 [0, 0, 0, 1, 0, 0, 0, 1, 0, 0],
 [0, 0, 1, 0, 1, 0, 0, 0, 1, 0],
 [1, 0, 0, 0, 0, 0, 1, 0, 0, 0],
 [0, 0, 0, 1, 0, 0, 0, 0, 0, 0],
 [0, 0, 0, 1, 0, 1, 1, 0, 0, 0],
 [1, 1, 0, 0, 0, 0, 0, 0, 0, 0],
 [0, 1, 0, 0, 0, 1, 0, 0, 0, 0])

* **Aplica el algoritmo al juego de datos generado**

Respuesta

In [None]:
mejor_solucion_random = busqueda_con_recocido(costos_random,tomas_por_sesion,1000000,20000,10)

Mejor solución aleatoria: (9, 0, 13, 6, 7, 11, 10, 3, 2, 4, 5, 8, 15, 12, 1, 14)
         Costo: 23
La mejor solución encontrada del recocido simulado es (9, 12, 13, 6, 0, 4, 11, 14, 15, 1, 8, 5, 3, 10, 2, 7)
con un costo total de 22
en 2292 iteraciones
Mejor solución aleatoria: (1, 10, 0, 9, 14, 15, 4, 5, 11, 3, 8, 12, 7, 2, 6, 13)
         Costo: 23
La mejor solución encontrada del recocido simulado es (1, 10, 2, 7, 9, 4, 13, 6, 15, 14, 12, 0, 11, 3, 8, 5)
con un costo total de 22
en 2292 iteraciones
Mejor solución aleatoria: (2, 11, 0, 10, 8, 5, 3, 14, 7, 4, 13, 6, 9, 12, 15, 1)
         Costo: 23
La mejor solución encontrada del recocido simulado es (2, 7, 5, 8, 12, 4, 9, 0, 10, 1, 13, 6, 3, 11, 15, 14)
con un costo total de 22
en 2292 iteraciones
Mejor solución aleatoria: (14, 3, 0, 4, 10, 1, 8, 13, 15, 5, 9, 12, 7, 2, 6, 11)
         Costo: 23
La mejor solución encontrada del recocido simulado es (14, 15, 8, 5, 12, 9, 3, 11, 6, 13, 10, 1, 0, 4, 2, 7)
con un costo total de 22
en 2

**Describe brevemente las lineas de como crees que es posible avanzar en el estudio del problema.**

Ten en cuenta incluso posibles variaciones del problema y/o variaciones al alza del tamaño

*Respuesta*

Como se describió al principio, este problema es un problema de estudio permanente, considerado NP-difícil.  No sólo se han estudiado diversos tipos de ramificación y poda, mejorando las funciones de estimación de costo, sino también alternativas metaheurísticas para abordar formas más óptimas de llegar a la solución con mejor costo.

* El algoritmo propuesto ha podido encontrar **soluciones con costo igual a 27**, en el 70% de las ejecuciones (comprobado de forma empírica, para 30 ejecuciones).

* Para el presente problema, podría contemplarse la optimización del código en Python para poder hacer una búsqueda más completa. También se contemplaría hacer una librería de mejores soluciones, para que no las vuelva a encontrar (búsqueda Tabú), y volver a realizar el procedimiento N veces más, para al final ver si mejoró. Además, podría anclarse el primer valor cada solución y generar soluciones aleatorias para el resto de los valores, forzando a diversificar al inicio.

* Al problema se le puede **sumar complejidad**, teniendo en cuenta diferentes salarios diarios de los actores, o la duración del rodaje de cada escena con distinto valor. La mayoría de los estudios consideran el costo del actor, sin embargo, una pequeña cantidad de estudios no solo consideran este costo, sino también los costos operativos de todo el staff. Los nuevos enfoques incluso contemplan cambios de set, y apelan a búsquedas Tabú, algoritmos de enjambre de particulas o algoritmos genéticos para llegar a una solución en tiempo computacional.

* Para pocas escenas, menos de 10, se puede pensar en métodos voraces. A mayor tamaño del problema, incluso para el problema de este ejemplo, soluciones optimizadas de ramificación y poda pueden ser interesantes. Ahora bien, a medida que aumenta la complejidad del problema, incluyendo más restricciones o variables, la posibilidad de utilizar algoritmos de técnicas metaheurísticas se torna mucho más atractica frente a algoritmos de ramificación y poda optimizados, por su rapidez en encontrar soluciones lo suficientemente óptimas como para ser utilizadas en la práctica.

Enumera las referencias que has utilizado(si ha sido necesario) para llevar a cabo el trabajo

*Referencias*

1. "Yulian Liu, Qiuji Sun, Xiaotian Zhang, Yiwei Wu, "Research on the Scheduling Problem of Movie Scenes", Discrete Dynamics in Nature and Society, vol. 2019, Article ID 3737105, 8 pages, 2019. https://doi.org/10.1155/2019/3737105". [Link](https://www.hindawi.com/journals/ddns/2019/3737105/)
2. "Long, Xiaoqing & Jinxing, Zhao. (2020). Scheduling Problem of Movie Scenes Based on Three Meta-Heuristic Algorithms. IEEE Access. PP. 1-1. 10.1109/ACCESS.2020.2982664." [Link](https://www.researchgate.net/publication/340109703_Scheduling_Problem_of_Movie_Scenes_Based_on_Three_Meta-Heuristic_Algorithms)
3. Manual de la asignatura "Algoritmos de Optimización".

In [18]:
#ANEXO - Tests (solo muestran el funcionamiento de los algoritmos internos)
sol_prueba=generar_solucion(costos)
sol_test=(0, 1, 5, 6, 8, 12, 13, 16, 17, 18, 22, 23, 2, 3, 4, 14, 10, 19, 7, 15, 11, 20, 21, 24, 9, 25, 26, 27, 28, 29)
print(calcular_costo(sol_prueba,max_tomas,costos))
calcular_costo(sol_test,max_tomas,costos)

40


29

In [19]:
#ANEXO - DESCRIPCIÓN DE LOS DATOS DEL PROBLEMA
actoresxtoma = [sum(i) for i in costos]
print(actoresxtoma)

tomasactores=[]
for n in range(10):
  tomasactores.append(i[n] for i in costos)

tomasxactor=[]
for n in range(10):
  tomasxactor.append(sum(tomasactores[n]))

print(tomasxactor)

#Se ve que hay tomas con más actores que otras, pero ninguna tiene un solo actor
#Los primeros actores están en muchas más tomas.


[5, 3, 3, 4, 3, 4, 4, 3, 3, 4, 5, 5, 3, 3, 3, 2, 2, 2, 2, 4, 2, 4, 2, 2, 4, 4, 2, 2, 3, 2]
[22, 14, 13, 15, 11, 8, 3, 4, 2, 2]
