# Algoritmos de optimización - Problema del doblaje

# Santiago Félix García Marín, 2a Convocatoria 2021

Url: https://github.com/

Dirección de este notebook: https://github.com/SantiagoFelix/ALG-OPT/blob/main/AO_SFGM_2Aconv.ipynb

Direccion del fichero de datos: https://docs.google.com/spreadsheets/d/1Ipn6IrbQP4ax8zOnivdBIw2lN0JISkJG4fXndYd27U0/edit#gid=0

## Definición del problema

Problema 1. Organizar sesiones de doblaje • Se precisa coordinar el doblaje de una película. Los actores del doblaje deben coincidir en las tomas en las que sus personajes aparecen juntos en las diferentes tomas. Los actores de doblaje cobran todos la misma cantidad por cada día que deben desplazarse hasta el estudio de grabación independientemente del número de tomas que se graben. No es posible grabar más de 6 tomas por día. El objetivo es planificar las sesiones por día de manera que el gasto por los servicios de los actores de doblaje sea el menor posible. Número de actores:10 Número de tomas:30 Actores/Tomas:1 indica que el actor participa en la toma, 0 en caso contrario.

## (*)¿Cuantas posibilidades hay sin tener en cuenta las restricciones?

Sin ninguna restricción, para doblar 30 escenas, se podría hacer:

Desde que vayan un solo día los 10 actores y hagan las 30 tomas (coste=10)
    
hasta que hagan una toma por dia con solo los indispensables para cada toma; 
    (en este caso, coste = sumatorio de 1 a 30 dias del numero de dobladores de ese dia (coste = 94)

En todo caso, hay que ordenar las 30 escenas, lo que supone: 
30! = 2,652528598121911e+32 posibilidades.

## ¿Cuantas posibilidades hay teniendo en cuenta todas las restricciones.

Teniendo en cuenta la restricción de máximo 6 tomas al dia:
    
El máximo de ocupación de estudios posible seguiría siendo de 30 dias y coste 94, 

y el mínimo de ocupación de estudios sería de 30/6 = 5 días, con costes a analizar:

Por ejemplo: Si los 10 actores fueran los 5 días, se podía doblar a coste = 50 pero ésta sería la cota superior del coste, porque para cada día, habría actores convocados innecesariamente

Esto obliga a calcular los costes para las diferentes combinaciones de escenas en cada día.
    
Si restringimos además, que el numero de escenas dobladas en un dia sea exactamente el máximo (6):
       
Las posibles combinaciones de 30 escenas, sin repetición, tomadas de seis en seis, (dia 1), son: 593775

Las posibles combinaciones de 24 escenas, sin repetición, tomadas de seis en seis, (dia 2), son: 134596

Las posibles combinaciones de 18 escenas, sin repetición, tomadas de seis en seis, (dia 3), son: 18564

Las posibles combinaciones de 12 escenas, sin repetición, tomadas de seis en seis, (dia 4), son: 924

Las posibles combinaciones de 6 escenas, sin repetición, tomadas de seis en seis, son: 1
    
Nótese que, en cualquier caso, para cada día, el orden de las escenas en ese dia no afecta al coste (los dobladores serán los mismos), y el número de posibilidades analizadas será la suma de de las de todas las etapas.

Para 6 escenas/dia totaliza: 593775 + 134596 + 18564 + 924 + 1 = 747860 combinaciones de escenas, cada una con su coste. Es decir, extraordinariamente ventajoso frente a 30!

## Modelo para el espacio de soluciones
## (*) ¿Cual es la estructura de datos que mejor se adapta al problema? Argumentalo.(Es posible que hayas elegido una al principio y veas la necesidad de cambiar, argumentalo)


Se trata de obtener finalmente una secuancia de tomas (lo que corresponde a un array, o varios, y un entero que será el coste_total).

Partimos de un fichero csv que convertiremos en una estructura pandas DataFrame, a partir de la cual operaré también a nivel array con numpy o/y pandas.

A primera vista, parecía adecuado un abordaje matricial, pero al ir analizando el problema se vió más abordable con np.arrays.


## Según el modelo para el espacio de soluciones

### (*)¿Cual es la función objetivo?
### (*)¿Es un problema de maximización o minimización?

Función objetivo:

Este problema trata de minimizar un coste que es el sumatorio para cada dia empleado, del numero de dobladores empleados en ese día, lo que se relaciona con minimizar las veces que un doblador acude al estudio, existiendo la restricción de que el estudio solo puede hacer 6 tomas al día como máximo, y que graban por grupos segun lo pide la escena.

Así, si todos (10) estuvieran presentes en las 30 tomas, se optimizaría el tiempo de uso del estudio, y conllevaría 30/6=5 días seguidos, con un coste de 10x5=50 u.m. que, seguramente, no es óptimo. Por otra parte, no se trata de optimizar el uso del estudio (tiene coste cero independientemente de los dias que se use) sino del coste en dobladores.

Cada escena se graba en grupo de (por inspección del caso) entre 2 a 5 dobladores, de modo que cada día (grupo de escenas) se requerirán entre 2 y quizá hasta 10 dobladores potenciales, dependiendo de la agrupacion de las escenas de ese día.

Así que convendría combinar los dobladores de modo que se optimicen sus solapamientos, respetando las 6 tomas diarias como máximo, para que el coste total sea mínimo. 



## Diseña un algoritmo para resolver el problema por fuerza bruta. 

In [1]:
# Fuerza bruta supone recorrer todas las posibles combinaciones 
# y de todas ellas quedarnos con la de mínimo coste global

# minimo=99999999
# mejores_combinaciones = []  #porque puede haber mas de una que consiga el mismo resultado optimo
# Para cada una de las combinaciones de 30 elementos sin repetición
#    coste_combinacion = 0
#    Dividimos la combinación en n bloques   #n=6
#    Para cada bloque, calculamos la suma de costes de los dobladores
#             coste_combinación += coste_bloque
#    if coste_combinacion < minimo
#            minimo = coste_combinación
#            mejor combinación = combinacion
#            añadir (mejor_combinacion, minimo) a mejores_combinaciones
# print (item con minimo campo mínimo de entre mejores_combinaciones)


## Calcula la complejidad del algoritmo por fuerza bruta

Calcular una a una todas las 30! combinaciones supondría 2,652528598121911e+32 cálculos (30!)
Su complejidad será del orden O(30!)

Pero si restringimos a n (n=6) escenas por dia supone igualmente recorrer todas las posibles escenas (30!) con cómputo del coste cada n (n=6).

## (*)Diseña un algoritmo que mejore la complejidad del algortimo por fuerza bruta. 


La mejor solución siempre se obtendrá por fuerza bruta, pero con un coste computacional tan elevadísimo como 30!, es inviable. 

Como alternativa, yo usaré un algoritmo voraz, aplicado por etapas; es decir: una heurística consistente en elegir la opción óptima en cada paso local con la esperanza de llegar a una solución general óptima. 

Vendría a ser un equivalente por trozos del algoritmo de Prim, o de "Minimum Spanning Tree", donde: escena = nodo, coste de ir de una escena a otra = arista. Grafo dirigido, con n=6 vértices y n-1=5 aristas. Porque evaluamos de seis en seis.

Cada escena supone un estado o un número de dobladores (que llamaré coste de esa escena). 
El coste del dia, será igual al número de dobladores diferentes que se han empleado para esa secuencia de tomas (ese dia).

Aquí hago la simplificación de que todos los dobladores cobran lo mismo por escena doblada. De modo que el coste monetario será el coste (número) de dobladores multiplicado por su salario por convocatoria. Para simplificar, pongamos que 1 unidad monetaria.

El coste total, será la suma de los costes de cada dia.

La diferencia de costes entre escenas será el número de dobladores diferentes que se han tenido que añadir entre una escena y otra para completar ambas.

Como, en cuanto ha hecho sus escenas de ese dia, el doblador ya puede irse, ya ha generado su coste, lo más conveniente parece ser no reducir, sino ir incrementando el número de dobladores según se vayan necesitando para nuevas escenas.

Lo que haré será calcular, desde el estado cero dobladores, el coste por dia de todas los posibles combinaciones del día, tomando para el primer dia la combinación de menor coste (minimización de los dobladores añadidos), e ir borrando las escenas dobladas del conjunto de escenas a doblar. En cada nueva etapa (dia de doblaje) se recalcula desde cero para la nueva situación, una vez eliminadas las escenas ya dobladas de las escenas a doblar, hasta que para el ultimo dia ya solo queda una combinación posible (que seguramente será la que requerirá el máximo número de dobladores). 

Nótese que en una sesion, no importa el orden de las escenas a efectos de su coste. Comienza con la escena pendiente de menor coste, y va escalando, lo cual es óptimo a nivel de etapa. 

El coste total del doblaje será la suma de los costes de cada dia.

Es posible que no sea la mejor solución posible, o que, aun siéndolo, no se pueda demostrar. Pero es abordable y seguro rebaja el coste total por debajo de las 50 um que costarían los diez dobladores durante los cinco dias. (En este caso, lo rebaja a 29 para sesiones de seis escenas).


In [2]:
#IMPORTACIONES
import os
import pandas as pd
import numpy as np
import itertools
from os import path
import csv
import random

In [3]:
# ASIGNACION DE PARÁMETROS
verbose_all=False   # True si queremos visualizar información para ir viendo TODOS los procesos
                    # Ésto es muy útil en fase de debug. En producción es recomendable no usarlo.

In [4]:
# ESTABLECIMIENTO DEL PATH DEL FICHERO A TRATAR
verbose = False
dob_path = path.join('','Datos.csv')
#Comprobación: 
if (verbose_all or verbose): print(dob_path) #da como resultado: Datos.csv

In [5]:
#CARGA Y PROSPECCIÓN OPCIONAL DEL FICHERO
verbose = False
dob_raw = pd.read_csv(dob_path,sep=',')
if (verbose_all or verbose):
    display(dob_raw.shape)
    #son 33 filas y 13 columnas
    display(dob_raw.info())
    #DESCRIPCION ESTADISTICA
    #display(dob_raw.describe(include='all'))
    print(dob_raw.head())

In [6]:
# Apertura del csv, preprocesado y paso de los datos útiles a una matriz    
#Nótese que el csv está mal formateado, así que elimino la primera fila para que no de problemas:
verbose = False
df = pd.read_csv("Datos.csv",  sep=',').values
df = pd.DataFrame(df)
if (verbose_all or verbose): print(df)
print(df.columns)
#eliminamos la columna de NaNs, que, por inspección es la 11
del(df[11])
if (verbose_all or verbose):
    print("Sin NaN:")
    print(df)
#eliminamos las filas del final
df = df.drop([31,32], axis=0)
if (verbose_all or verbose):
    print("Sin las filas del final:")
    print(df)
# Pasamos a numpy
dfn=df.to_numpy()


RangeIndex(start=0, stop=13, step=1)


In [7]:
# INTRO DATOS
# Aqui cargamos la matriz, bien sea la inmediatamente obtenida desde el fichero del enunciado
# o bien la generada aleatoriamente en un apartado posterior de esta actividad:
verbose=True

if int(input("Introduzca 1 para fichero csv, 2 para datos aleatorios"))>1:
    # Genero una matriz de numero de filas y de columnas aleatorio con participación aleatoria de los dobladores, 
    # a semejanza de la matriz que provenía del fichero csv
    MAXF=40
    MAXC=15
    max_filas=random.randint(2,MAXF)
    max_columnas=random.randint(3,MAXC)
    #genero una matriz a semejanza de la proporcionada en el enunciado, pero con datos aleatorios
    aleatoria = np.zeros((max_filas+1,max_columnas+2))
    for fila in range(1,max_filas+1):
        aleatoria[fila,0]=str(fila)
        for columna in range(1,max_columnas+1):
            aleatoria[fila,columna]=random.randint(0,1)
        aleatoria[fila,max_columnas+1]=str(np.sum(aleatoria[fila,1:max_columnas]))
    dfn=aleatoria
    
if (verbose_all or verbose):
    print(dfn)
    display(dfn.shape)
# Nótese que en dfn podemos extraer cualquier item llamándolo por escena,actor, de 1 a 30 y de 1 a 10 respectivamente
# siendo la columna cero el string "numero de escena" y la columna 11 el string coste de esa escena
# p.ej, si queremos el coste de la escena 29, coste = 3
# print(int(dfn[29][11]))
# El número de escenas a doblar será 
num_esc = dfn.shape[0] -1
num_act = dfn.shape[1] -2
todas_las_escenas=np.arange(1,num_esc +1)
escenas_por_doblar=todas_las_escenas
if (verbose_all or verbose):
    print("Número de escenas a doblar:", num_esc)
    print("Número de actores:", num_act)
    print("Escenas a doblar:", escenas_por_doblar)

Introduzca 1 para fichero csv, 2 para datos aleatorios1
[['Toma' 1.0 2.0 3.0 4.0 5.0 6.0 7.0 8.0 9.0 10.0 'Total']
 ['1' 1.0 1.0 1.0 1.0 1.0 0.0 0.0 0.0 0.0 0.0 '5']
 ['2' 0.0 0.0 1.0 1.0 1.0 0.0 0.0 0.0 0.0 0.0 '3']
 ['3' 0.0 1.0 0.0 0.0 1.0 0.0 1.0 0.0 0.0 0.0 '3']
 ['4' 1.0 1.0 0.0 0.0 0.0 0.0 1.0 1.0 0.0 0.0 '4']
 ['5' 0.0 1.0 0.0 1.0 0.0 0.0 0.0 1.0 0.0 0.0 '3']
 ['6' 1.0 1.0 0.0 1.0 1.0 0.0 0.0 0.0 0.0 0.0 '4']
 ['7' 1.0 1.0 0.0 1.0 1.0 0.0 0.0 0.0 0.0 0.0 '4']
 ['8' 1.0 1.0 0.0 0.0 0.0 1.0 0.0 0.0 0.0 0.0 '3']
 ['9' 1.0 1.0 0.0 1.0 0.0 0.0 0.0 0.0 0.0 0.0 '3']
 ['10' 1.0 1.0 0.0 0.0 0.0 1.0 0.0 0.0 1.0 0.0 '4']
 ['11' 1.0 1.0 1.0 0.0 1.0 0.0 0.0 1.0 0.0 0.0 '5']
 ['12' 1.0 1.0 1.0 1.0 0.0 1.0 0.0 0.0 0.0 0.0 '5']
 ['13' 1.0 0.0 0.0 1.0 1.0 0.0 0.0 0.0 0.0 0.0 '3']
 ['14' 1.0 0.0 1.0 0.0 0.0 1.0 0.0 0.0 0.0 0.0 '3']
 ['15' 1.0 1.0 0.0 0.0 0.0 0.0 1.0 0.0 0.0 0.0 '3']
 ['16' 0.0 0.0 0.0 1.0 0.0 0.0 0.0 0.0 0.0 1.0 '2']
 ['17' 1.0 0.0 1.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 '2']
 ['18' 0.0

(31, 12)

Número de escenas a doblar: 30
Número de actores: 10
Escenas a doblar: [ 1  2  3  4  5  6  7  8  9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24
 25 26 27 28 29 30]


In [8]:
def coste_camino(camino):
    """ 
    INPUT: un np.array camino, que contiene las escenas a rodar (no hace falta que esten en orden o que no se repitan)
    OUTPUT: int que da el numero total de actores diferentes involucrados en ese camino (p.ej.: en esa sesion)
    PREREQUISITO: camino debe contener al menos una escena. Requisito controlado en código.
    EJEMPLO: coste_camino([1,7,31,22,2]) da como resultado 5. Son necesarios 5 dobladores diferentes para esa secuencia.
    OBSERVACIONES:
    La idea es, para un cierto camino, ver cual es el coste_total
    Este camino puede ser una sola escena (=coste de la escena), entre dos escenas, o el formado por todas las que se quiera,
    Ojo: No es lo mismo que la suma acumulada de coste_escena, sino el total de actores diferentes empleados en ese camino
    IMPLEMENTACION:
    """
    
    verbose = False
    if(len(camino) >= 1):
        array_temp=np.zeros(num_act) # hacemos un array de, en este caso, diez ceros
        #if (verbose_all or verbose):
            #print("Actores:",array_temp)
            #print("Empezamos a sumar")
        for salto in range(0,len(camino)):
            if (verbose_all or verbose): print("Escena: ", camino[salto])
            for i in range(1,num_act+1): #para todos los actores posibles
                if (verbose_all or verbose):
                    print("Actor: ",i, "  ", int(array_temp[i-1]), "  ", int(dfn[camino[salto]][i]))
                if (int(array_temp[i-1]) <= int(dfn[camino[salto]][i])):
                    array_temp[i-1] = int(dfn[camino[salto]][i])
        if (verbose_all or verbose):
            print(array_temp)
        return(int(sum(array_temp[:num_act+1])))
    else:
        print("ERROR FATAL en funcion coste_camino: El camino debe tener al menos una escena")
# FIN IMPLEMENTACION funcion coste_camino

In [9]:
def elimina_escenas(array_1,array_2):
    """ 
    FUNCION: Elimina de un array los contenidos que se encuentran en otro array    
    INPUT: dos np.arrays que contienen las escenas a doblar pre-doblaje y las que se han doblado en el dia
    OUTPUT: np.array que contiene las escenas post-doblaje (las que quedan para el siguiente dia)
    PREREQUISITOS: Importaciones,  
    EJEMPLO: print(elimina_escenas([1,2,3,4,5,6,7,8,9,10,11,12],[1,3,5,7])) = [ 2  4  6  8  9 10 11 12]
    OBSERVACIONES: Comparación de contenidos por recorrido de índices
    IMPLEMENTACION:
    """

    verbose = False
    for index_2 in range(0,len(array_2)):
        for index_1 in range (0,len(array_1)):
            if array_1[index_1] == array_2[index_2]:
                array_1=np.delete(array_1,index_1)
                break
    if (verbose_all or verbose): print(array_1)
    return(array_1)
# FIN IMPLEMENTACION funcion elimina_escenas

In [10]:
""" 
MAIN: Cuerpo principal del programa
OBJETIVO: Calcular mínimo coste de doblaje
INPUT: array escenas a doblar, Número de escenas por dia
OUTPUT: Para cada dia de doblaje, secuencia a doblar, coste de ese dia, secuencia pendiente de doblar.
        Coste total
PREREQUISITO: 
EJEMPLO: 
Plan optimizado de doblaje para las escenas: 
 [ 1  2  3  4  5  6  7  8  9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24
 25 26 27 28 29 30]
Dia 1 :
Escenas: (14, 17, 18, 19, 23, 24)  Coste dia: 3  Coste total: 3
Quedan por hacer [ 1  2  3  4  5  6  7  8  9 10 11 12 13 15 16 20 21 22 25 26 27 28 29 30] 

Dia 2 :
Escenas: (2, 13, 20, 27, 28, 30)  Coste dia: 4  Coste total: 7
Quedan por hacer [ 1  3  4  5  6  7  8  9 10 11 12 15 16 21 22 25 26 29] 

Dia 3 :
Escenas: (1, 3, 6, 7, 9, 15)  Coste dia: 6  Coste total: 13
Quedan por hacer [ 4  5  8 10 11 12 16 21 22 25 26 29] 

Dia 4 :
Escenas: (4, 5, 8, 12, 21, 22)  Coste dia: 7  Coste total: 20
Quedan por hacer [10 11 16 25 26 29] 

Dia 5 :
Escenas: (10, 11, 16, 25, 26, 29)  Coste dia: 9  Coste total: 29
Quedan por hacer [] 

Coste total del doblaje:  29
Proceso completado
OBSERVACIONES: 
IMPLEMENTACION:
"""

verbose = False
coste_total=0
max_esc_dia=6
print("Kernel trabajando. Por favor, espere hasta mensaje expreso de finalización. \n")
#print("Plan optimizado de doblaje para las escenas: \n", escenas_por_doblar, "\n")
print("Plan optimizado de doblaje. Número de escenas:", str(num_esc), "Número de dobladores:", str(num_act),"Escenas/dia:",str(max_esc_dia),"\n")
for dia in range(1,int(num_esc/max_esc_dia)+1): # range 1 a 6 (5 dias)
    print("Dia", dia,":")
    posibles_sesiones=list(itertools.combinations(escenas_por_doblar, max_esc_dia))
    if (verbose_all or verbose): print("Posibles sesiones:"+posibles_sesiones)
    min_coste_dia=99999999
    for sesion in posibles_sesiones:
        coste_sesion=coste_camino(sesion)
        if coste_sesion < min_coste_dia:
            min_coste_dia = coste_sesion
            ganadora = sesion
        if (verbose_all or verbose): print(str(sesion) + "   " + str(coste_camino(sesion)))
    coste_total = coste_total + min_coste_dia
    print("Escenas:", ganadora, " Coste dia:", min_coste_dia, " Coste total:", coste_total)  
    #print("Actores:", convocados(ganadora, cuadrante))
    # Dia 1:
    # Escenas: (14, 17, 18, 19, 23, 24) Coste dia: 3 Costre total: 3
    # ahora modificamos la lista de escenas_por_doblar, eliminando las ya dobladas, que son las de la sesion ganadora
    escenas_por_doblar=elimina_escenas(escenas_por_doblar,ganadora)
    print ("Quedan por hacer", escenas_por_doblar, "\n") 
if len(escenas_por_doblar)>=1:
    print("Dia", dia+1," Escenas:", escenas_por_doblar, " Coste dia:", coste_camino(escenas_por_doblar),"\n")
    coste_total += coste_camino(escenas_por_doblar)
print("Coste total del doblaje: ",coste_total,"\n")
print("Proceso completado")


Kernel trabajando. Por favor, espere hasta mensaje expreso de finalización. 

Plan optimizado de doblaje. Número de escenas: 30 Número de dobladores: 10 Escenas/dia: 6 

Dia 1 :
Escenas: (14, 17, 18, 19, 23, 24)  Coste dia: 3  Coste total: 3
Quedan por hacer [ 1  2  3  4  5  6  7  8  9 10 11 12 13 15 16 20 21 22 25 26 27 28 29 30] 

Dia 2 :
Escenas: (2, 13, 20, 27, 28, 30)  Coste dia: 4  Coste total: 7
Quedan por hacer [ 1  3  4  5  6  7  8  9 10 11 12 15 16 21 22 25 26 29] 

Dia 3 :
Escenas: (1, 3, 6, 7, 9, 15)  Coste dia: 6  Coste total: 13
Quedan por hacer [ 4  5  8 10 11 12 16 21 22 25 26 29] 

Dia 4 :
Escenas: (4, 5, 8, 12, 21, 22)  Coste dia: 7  Coste total: 20
Quedan por hacer [10 11 16 25 26 29] 

Dia 5 :
Escenas: (10, 11, 16, 25, 26, 29)  Coste dia: 9  Coste total: 29
Quedan por hacer [] 

Coste total del doblaje:  29 

Proceso completado


## Argumenta por que crees que mejora el algoritmo por fuerza bruta

Indudablemente lo mejora en tiempo, porque se basa en etapas con número de combinaciones mucho más pequeñas, pero no lo mejora en cuanto a la certidumbre de encontrar la mejor solución. Es un algoritmo voraz y aunque se base en optimizar cada etapa, no es descartable que pueda existir una solución mejor. 

## (*)Calcula la complejidad del algoritmo 

Estimo que vendría a ser equivalente a la del método de Prim (Prim añade nodos sabiendo que llegamos a ellos con menor coste).
Como tomamos escenas de 6 en 6, para cada etapa serán 6 nodos (escenas) y 6*(6-1)=30 posibles aristas
Es decir, para cada etapa es = O(escenas_etapa^2) = O(6^2) 

## Según el problema (y tenga sentido), diseña un juego de datos de entrada aleatorios
## Aplica el algoritmo al juego de datos generado

Esto es volver a ejecutar el programa con un nuevo conjunto de datos, aleatorios.

Nótese que, en código ya mostrado, se ha implementado poder seleccionar entre los datos del fichero csv o datos generados aleatoriamente.

Para volver a ejecutar el programa, reiniciar el Kernel y ejecutar.


A continuación, resultado de ejecutar de nuevo el programa, en este caso para datos aleatorios. 

Kernel trabajando. Por favor, espere hasta mensaje expreso de finalización. 

Plan optimizado de doblaje. Número de escenas: 31 Número de dobladores: 15 Escenas/dia: 6

Dia 1 :
Escenas: (1, 2, 12, 13, 19, 28)  Coste dia: 11  Coste total: 11
Quedan por hacer [ 3  4  5  6  7  8  9 10 11 14 15 16 17 18 20 21 22 23 24 25 26 27 29 30
 31] 

Dia 2 :
Escenas: (3, 11, 20, 22, 23, 31)  Coste dia: 11  Coste total: 22
Quedan por hacer [ 4  5  6  7  8  9 10 14 15 16 17 18 21 24 25 26 27 29 30] 

Dia 3 :
Escenas: (4, 5, 7, 14, 17, 26)  Coste dia: 12  Coste total: 34
Quedan por hacer [ 6  8  9 10 15 16 18 21 24 25 27 29 30] 

Dia 4 :
Escenas: (6, 8, 9, 15, 27, 30)  Coste dia: 13  Coste total: 47
Quedan por hacer [10 16 18 21 24 25 29] 

Dia 5 :
Escenas: (10, 16, 18, 21, 24, 25)  Coste dia: 15  Coste total: 62
Quedan por hacer [29] 

Dia 6 :
Escenas: [29]  Coste dia: 8 

Coste total del doblaje:  70 

Proceso completado

## Enumera las referencias que has utilizado(si ha sido necesario) para llevar a cabo el trabajo

He realizado este trabajo "from scratch" (desde cero), tan solo con los conocimientos adquiridos en la asignatura (y, por cierto, siendo además, principiante en Python), buscando intuitivamente la forma de crear un algoritmo apropiado.

Sin embargo, sí que he intentado recabar más información sobre el tema, habiendo encontrado, ya diseñado mi algoritmo, dos referencias interesantes. Lamentablemente, no directamente aplicables. Son:

Optimization in dubbing scheduling.
N. R. Brisaboa (1), A. Cerdeira-Pena (1), L. Carpente (2), S. Lorenzo-Freire (2)
(1) Database Laboratory, Department of Computer Science, Faculty of Computer Science, University of A Coruña, A Coruña, Spain
(2) MODES Research Group, Department of Mathematics, Faculty of Computer Science, University of A Coruña, 15071 A Coruña, Spain 
DOI 10.1007/s11750-015-0361-4, 
Published online: 14 February 2015 © Sociedad de Estadística e Investigación Operativa 2015

y:

Aplicación de algoritmos heurísticos para optimizar el coste de doblaje de películas
Proyecto de Investigación, Proyecto fin de máster, Máster en técnicas estadísticas.
Universidade da Coruña, Universidade de Santiago de Compostela, UniversidadeVigo.
Autor: Alberto Caldas Lima
Directores: Silvia María Lorenzo Freire, María Luisa Carpente Rodríguez
A Coruña, a 4 de septiembre de 2014
En este Trabajo Final de Master, a partir del estudio anterior, se aborda una solución óptima, realizada en C#, al problema del doblaje para las necesidades de optimización de un estudio de doblaje real, cuya propiedad está relacionada con su autor. La solución contempla todos los factores posibles (incluyendo p.ej.: multi-doblaje simultáneo de varias películas, subdivisión de un take, etc). Es una solución "definitiva" para cualquier casuística que se pueda dar en unos estudios de doblaje, ya que se aborda desde una variante determinista y si esta falla, otra heurística, utilizando una combinación de Algoritmos Genéticos, Recocido Simulado y Búsqueda Tabú, analizando y comparando su aplicabilidad y resultados. 

Pese a que no ha tenido aplicabilidad directa en mi solución, lo comento porque creo que serían un buen referente teórico y de ejemplificación para la asignatura.


## Describe brevemente las lineas de como crees que es posible avanzar en el estudio del problema. Ten en cuenta incluso posibles variaciones del problema y/o variaciones al alza del tamaño

Con mi solución, se obtienen resultados optimizados por tramos iguales al máximo de escenas por dia. Pero:

a) Aun con un numero fijo maximo de escenas, se podría jugar con el número. Así, para el fichero csv: 

Para max 2 al dia, sale por 59 en 15 dias 
(17, 19)(18, 24)(28, 30)(2, 27)(14, 23)(3, 15)(5, 9)(6, 7)(8, 10)(13, 16)(21, 29)(1, 20)(12, 22)(4, 11)(25, 26)

Para max 3 al dia, sale por 44 en 10 dias
(17, 19, 23)(9, 28, 30)(14, 18, 24)(2, 13, 20)(6, 7, 27)(3, 4, 15)(5, 8, 21)(16, 22, 25)(1, 12, 29)(10, 11, 26)

Para max 4 al dia, sale por 40 en 8 dias:
(13, 27, 28, 30)(14, 17, 18, 19)(1, 2, 6, 7)(3, 8, 15, 29)(5, 9, 16, 25)(12, 22, 23, 24)(10, 11, 21, 26)(4, 20)

Para max 5 al dia, sale por 32 en 6 dias:
(14, 17, 18, 19, 23)(2, 13, 20, 27, 28)(1, 6, 7, 9, 22)(3, 4, 5, 15, 30)(8, 10, 24, 26, 29)(11, 12, 16, 21, 25)

Para max 6 al dia, sale por 29 en 5 dias:
(14, 17, 18, 19, 23, 24)(2, 13, 20, 27, 28, 30)(1, 3, 6, 7, 9, 15)(4, 5, 8, 12, 21, 22)(10, 11, 16, 25, 26, 29)

Para max 7 al dia, sale por 24 en 4 dias:
(2, 13, 17, 19, 20, 23, 27)(1, 6, 7, 9, 22, 28, 30)(3, 8, 14, 15, 18, 24, 29)(4, 5, 10, 11, 12, 21, 26)(16, 25)

Para max 8 al dia, sale por 16 en 4 dias:
(2, 13, 17, 19, 20, 23, 27, 28)(8, 9, 12, 14, 18, 22, 24, 30)(1, 3, 4, 5, 6, 7, 11, 15)(10, 16, 21, 25, 26, 29) 


Vemos que el algoritmo:
a) Funciona por etapas del número maximo de takes por dia
b) que evalúa y consigue minimo coste en cada etapa, 
c) que cada etapa depende de la anterior,

Así, resulta más ventajoso hacer 8 que 7, o que 6 escenas por dia, tanto en coste como en ocupacion de estudio, para el caso propuesto en la actividad.

b) Sin embargo, quizá sea posible encontrar una solución aun menos costosa haciendo para cada dia un número de escenas no fijo sino variable. Por ejemplo, si para un mismo dia, el conjunto de dobladores necesarios en las escenas a,b, y c,d,e,f de ese dia fueran disjuntos, y en cambio los de c,d,e,f tuvieran algun/os dobladores en común con las siguientes escenas en coste diferencial, parece razonable subdividir el primer dia en dos, quedando a,b como primer dia, y el siguiente recalcular de la misma forma, etc. Es una linea que quería desarrollar, pero no ha sido posible por falta de tiempo.
