# Algoritmos de optimizaci√≥n - Seminario<br>
Nombre y Apellidos: Alejandro Casado Figueredo  <br>
Url: https://github.com/alexcefe02/VIU/blob/99a84a1c51ed18ca33359d5ac5081470d91e49ae/AO/SeminarioAlejandro.ipynb<br>
Problema:
> 1. Sesiones de doblaje <br>

Descripci√≥n del problema:

Se precisa coordinar el doblaje de una pel√≠cula. Los actores del doblaje deben coincidir en las
tomas en las que sus personajes aparecen juntos en las diferentes tomas. Los actores de
doblaje cobran todos la misma cantidad por cada d√≠a que deben desplazarse hasta el estudio de
grabaci√≥n independientemente del n√∫mero de tomas que se graben. No es posible grabar m√°s
de 6 tomas por d√≠a. El objetivo es planificar las sesiones por d√≠a de manera que el gasto por los
servicios de los actores de doblaje sea el menor posible. Los datos son:

    N√∫mero de actores: 10
    N√∫mero de tomas : 30

![image.png](attachment:image.png)

        - 1 indica que el actor participa en la toma
        - 0 en caso contrario




                                        

Nuestra estrategia se fundamentar√° en un Greedy con minimizaci√≥n de costes, la cual est√° caracterizada por:

- Tomamos la lista de 30 tomas junto a su matriz de participaci√≥n 30x10.
- En cada paso / iteraci√≥n creamos un nuevo d√≠a, agregamos tomas al d√≠a mientras no pasemos el m√°ximo (6) y nos centremos en minimizar los actores requeridos
- Repetimos la jugada hasta acabar con la asignaci√≥n de tomas

In [419]:
# Importamos toda la documentaci√≥n necesaria
import numpy as np
import pandas as pd
import random
from os import path as osp

# Cargamos nuestro dataset (matriz tomas x actores)
ruta_archivo = osp.join("Matriz.csv")
df = pd.read_csv(ruta_archivo, sep=',', header=1, index_col=0, engine='python')

# Esta matriz la trataremos como un array(numpy) y eliminaremos las columnas innecesarias
df = df.iloc[:-2, :-2]
sesiones = np.array(df)

def organizar_sesiones(sesiones):
    """
    Organiza las tomas en d√≠as. Cada d√≠a incluye hasta 6 tomas, intentando 
    minimizar el n√∫mero total de actores requeridos.
    
    Par√°metro:
    - sesiones: matriz binaria donde [i,j] = 1 si el actor j participa en la toma i.
    
    Devuelve:
    - Lista de listas, donde cada sublista representa las tomas de un d√≠a.
    """
    dias = []
    num_tomas = sesiones.shape[0]
    sin_asignar = set(range(num_tomas))
    

    while sin_asignar:
        # Elegimos la toma con menor n√∫mero de actores como semilla del d√≠a
        cuenta_actores_por_toma = {toma: np.sum(sesiones[toma]) for toma in sin_asignar}
        minimo_actores = min(cuenta_actores_por_toma.values())
        candidatas = [toma for toma, cuenta in cuenta_actores_por_toma.items() if cuenta == minimo_actores]
        toma_semilla = np.random.choice(candidatas)

        tomas_del_dia = [toma_semilla]
        sin_asignar.remove(toma_semilla)

        # Inicializamos el conjunto de actores del d√≠a
        actores_del_dia = set(np.where(sesiones[toma_semilla] == 1)[0])

        # A√±adimos hasta 5 tomas adicionales al d√≠a (m√°ximo 6 tomas por d√≠a)
        for _ in range(5):
            mejor_toma = None
            menor_incremento = None

            for toma in sin_asignar:
                actores_en_toma = set(np.where(sesiones[toma] == 1)[0])
                # Calculamos cu√°ntos actores nuevos se incorporar√≠an con esta toma
                incremento = len(actores_del_dia | actores_en_toma) - len(actores_del_dia)

                if mejor_toma is None or incremento < menor_incremento:
                    mejor_toma = toma
                    menor_incremento = incremento

            # Elegimos la toma que menor n√∫mero de actores nuevos aporta
            if mejor_toma is not None:
                tomas_del_dia.append(mejor_toma)
                actores_del_dia |= set(np.where(sesiones[mejor_toma] == 1)[0])
                sin_asignar.remove(mejor_toma)
            
            # En caso de no poder agregar m√°s tomas, abandonamos el bucle
            else:
                break

        dias.append(tomas_del_dia)
    return dias

def calcular_coste(dias, sesiones):
    """
    Calcula el n√∫mero total de d√≠as-actor requeridos.
    Es decir, suma cu√°ntos actores trabajan cada d√≠a.
    Esto equivaldria a ser el coste final.

    Par√°metros:
    - dias: lista de listas de tomas agrupadas por d√≠a
    - sesiones: matriz binaria de tomas x actores

    Retorna:
    - Entero con el total de d√≠as-actor (coste)
    """
    total_actor_dias = 0
    dia = 0
    for tomas_del_dia in dias:
        actores = set()
        for toma in tomas_del_dia:
            actores |= set(np.where(sesiones[toma] == 1)[0]) # Uni√≥n de actores del d√≠a
        total_actor_dias += len(actores)
        dia += 1
    return total_actor_dias


# Inicializamos el mejor coste muy alto, para poder comparar
total_actor_dias = 99999
mejor_distribucion = []

print('Distribuci√≥n de las tomas por d√≠a, siendo 6 las tomas que se realizan cada d√≠a:')
print()

# Ejecutamos el algoritmo 1000 veces con distintas semillas aleatorias
for intento in range(1000):
    dias_temp = organizar_sesiones(sesiones)
    coste_temp = calcular_coste(dias_temp, sesiones)

    # Nos quedamos con la mejor distribuci√≥n encontrada
    if coste_temp < total_actor_dias:
        total_actor_dias = coste_temp
        mejor_distribucion = dias_temp

# Bloque de impresi√≥n. Mostramos la mejor forma de distribuir las tomas
dia = 1
for tomas_del_dia in mejor_distribucion:
    descripciones = []
    for toma in tomas_del_dia:
        num_actores = int(np.sum(sesiones[toma])) # Numero de actores que hay en la toma
        descripciones.append(f"{toma} ({num_actores} actores)") # Damos formato a la futura impresi√≥n -> toma (X actores)
    print(f"Tomas del d√≠a {dia}: [{', '.join(descripciones)}]") # Imprimimos las tomas de un d√≠a dentro del bucle for, as√≠ se imprimir√° iterativamente cada uno de los d√≠as
    dia += 1
print()
print("Total d√≠as-actor, es decir, el coste total de la distribucion:", total_actor_dias) # Total del coste

Distribuci√≥n de las tomas por d√≠a, siendo 6 las tomas que se realizan cada d√≠a:

Tomas del d√≠a 1: [18 (2 actores), 16 (2 actores), 22 (2 actores), 13 (3 actores), 17 (2 actores), 23 (2 actores)]
Tomas del d√≠a 2: [26 (2 actores), 1 (3 actores), 12 (3 actores), 19 (4 actores), 27 (2 actores), 29 (2 actores)]
Tomas del d√≠a 3: [20 (2 actores), 4 (3 actores), 7 (3 actores), 8 (3 actores), 3 (4 actores), 14 (3 actores)]
Tomas del d√≠a 4: [15 (2 actores), 24 (4 actores), 5 (4 actores), 6 (4 actores), 0 (5 actores), 21 (4 actores)]
Tomas del d√≠a 5: [28 (3 actores), 2 (3 actores), 9 (4 actores), 25 (4 actores), 10 (5 actores), 11 (5 actores)]

Total d√≠as-actor, es decir, el coste total de la distribucion: 28


#### (*)¬øCuantas posibilidades hay sin tener en cuenta las restricciones?<br>




Estamos dividiendo 30 tomas en 5 grupos de 6 tomas cada uno, donde:

- No importa el orden de los grupos

- No importa el orden de las tomas dentro de cada grupo

Este es un cl√°sico problema de partici√≥n de un conjunto en subconjuntos del mismo tama√±o, y el n√∫mero total de combinaciones posibles es:

Total¬†de¬†particiones = 30!/((6!^5)*5!) ‚âà **7.9 * 10^15**

Es un n√∫mero extremadamente alto, y eso es por que sin restricciones se comprueban todas las posibilidades, incluso las que se sabe que no son √≥ptimas, y es gracias a las restricciones que se acotan las posibilidades.
La soluci√≥n m√°s √≥ptima posible se encuentra en esta casu√≠stica, la cual es **llevar a todos los actores a hacer todas las tomas en un mismo d√≠a** por lo que solo tendr√≠a un coste 10 (pagar √∫nicamente a cada actor por presentarse all√≠)

‚Äã


#### ¬øCuantas posibilidades hay teniendo en cuenta todas las restricciones?


Esto implica contar solo las combinaciones de agrupaciones de tomas en d√≠as que:

- No asignen m√°s de 6 tomas a un mismo d√≠a

- Sean completas: todas las 30 tomas deben ser asignadas a alg√∫n d√≠a

- Pueden tener menos de 6 tomas si no forzamos el m√°ximo

- Cumplen con las restricciones impl√≠citas de coste: minimizar d√≠as-actor

- No hay tomas simult√°neas: cada toma ocurre en un √∫nico d√≠a

- No se permiten repeticiones ni omisiones

A diferencia del caso anterior, tenemos un **espacio de posibilidades m√°s acotado**, lo cu√°l nos ayudar√° a encontrar alguna soluci√≥n m√°s r√°pido.

En nuestro caso con el algoritmo heur√≠stico (greedy) encontramos una buena soluci√≥n (aunque no sabemos si la m√°s √≥ptima, pues recorrer todo el espacio de soluciones es inviable computacionalmente hablando)
la cual asume un coste aproximado entre 26 y 34. Como ya hemos dicho, la m√°s √≥ptima se encuentra en la casu√≠stica anterior, pero aqu√≠ si que se encontraran la gran mayor√≠a de soluciones viables para el problema.

Modelo para el espacio de soluciones<br>

#### (*) ¬øCual es la estructura de datos que mejor se adapta al problema? Argumentalo.(Es posible que hayas elegido una al principio y veas la necesidad de cambiar, argumentalo)


Debido a la complejidad del problema, hemos utilizado m√°s de un tipo de estructura para el mismo:

- Para los datos de entrada hemos empleado un **numpy.array**, el cual nos ayudaba pues debido a su formato, cada columna es un actor y cada fila una toma. Adem√°s, podemos marcar como 1 si el actor participa y como 0 si no participa, lo cual son valores binarios muy √∫tiles para matrices de este tipo. Adem√°s de esto, la librer√≠a numpy y sus matrices nos permiten realizar una gran cantidad de operaciones para solucionar el problema como:

    - np.sum
    - np.where

- En cuanto a la representaci√≥n de la soluci√≥n hemos optado por una **lista de listas**, b√°sicamente una lista. Esta nos ayuda bastante pues agrupa las tomas en d√≠as seg√∫n la soluci√≥n candidata, y al igual que la matriz tenemos varias opciones dentro de la estructura. Cada sublista representa un d√≠a, y cada uno de los elementos de una sublista es el √≠ndice de una toma. Adem√°s, son estructuras muy naturales de tratar e imprimir, y nos facilita mucho el c√°lculo del coste final del problema

Seg√∫n el modelo para el espacio de soluciones<br>

#### (*)¬øCual es la funci√≥n objetivo?

La funci√≥n objetivo en este problema es: **Minimizar el n√∫mero total de d√≠as-actor (el coste)**

Cada vez que un actor tiene que ir al estudio a grabar al menos una toma en un d√≠a, cuenta como 1 d√≠a-actor, sin importar cu√°ntas tomas grabe ese d√≠a. Por tanto, cuantos m√°s actores haya que mover cada d√≠a, mayor ser√° el coste total.

Esto se representa en nuestro c√≥digo con la funci√≥n **calcular_coste**, la cual:
- Suma, para cada d√≠a, el n√∫mero de actores distintos que participan.
- Devuelve el total, que es el coste en d√≠as-actor.

Adem√°s, por ello se ha afirmado que el mejor caso (ut√≥pico pues sin retricciones obligatorias) ser√≠a que todos los actores grabaran en un solo d√≠a todas las tomas, por lo que el coste ser√≠a 10 (1 por cada desplazamiento de actor), y no 27, como nos resulta en el mejor caso con nuestro greedy.

#### (*)¬øEs un problema de maximizaci√≥n o minimizaci√≥n?

Se trata de un problema de **minimizaci√≥n**, pues nuestro objetivo detr√°s del mismo es minimizar el coste (desplazamientos de actores por d√≠a) en base a unas restricciones impuestas.

Si fuera de maximizacion estar√≠amos hablando, por ejemplo, de intentar expandir esas toma en cada d√≠a (+6 tomas) o expandir esos d√≠as de grabaci√≥n (1 toma por dia, para que sean 30 d√≠as).

Dise√±a un algoritmo para resolver el problema por fuerza bruta

In [None]:
"""""
from itertools import combinations

ruta_archivo = osp.join("Matriz.csv")
df = pd.read_csv(ruta_archivo, sep=',', header=1, index_col=0, engine='python')


df = df.iloc[:-2, :-2]
sesiones = np.array(df)

def calcular_coste(dias, sesiones):

    total_actor_dias = 0
    for tomas_del_dia in dias:
        actores = set()
        for toma in tomas_del_dia:
            actores |= set(np.where(sesiones[toma] == 1)[0])
        total_actor_dias += len(actores)
    return total_actor_dias

def fuerza_bruta(sesiones):

    from itertools import combinations

    num_tomas = sesiones.shape[0]
    indices = list(range(num_tomas))

    mejor_coste = float('inf')
    mejor_distribucion = None

    def generar_particiones(tomas_restantes, actual=[]):
        if not tomas_restantes:
            yield actual
        else:
            for r in range(1, min(6, len(tomas_restantes)) + 1):
                for grupo in combinations(tomas_restantes, r):
                    resto = [t for t in tomas_restantes if t not in grupo]
                    yield from generar_particiones(resto, actual + [list(grupo)])

    for distribucion in generar_particiones(indices):
        coste = calcular_coste(distribucion, sesiones)
        if coste < mejor_coste:
            mejor_coste = coste
            mejor_distribucion = distribucion

    return mejor_distribucion, mejor_coste

mejor_distribucion, mejor_coste = fuerza_bruta(sesiones)

print("Mejor distribuci√≥n (por fuerza bruta):")
dia = 1
for tomas in mejor_distribucion:
    actores_dia = set()
    for toma in tomas:
        actores_dia |= set(np.where(sesiones[toma] == 1)[0])
    print(f"D√≠a {dia}: Tomas {tomas} ‚Üí Actores: {sorted(actores_dia)}")
    dia += 1
print("\nCoste total (d√≠as-actor):", mejor_coste)
"""""

KeyboardInterrupt: 

**COMO SE PUEDE COMPROBAR, NUESTRO PROBLEMA NO ES VIABLE REALIZARLO MEDIANTE FUERZA BRUTA, PUES EL PODER C√ìMPUTO PARA EXPLORAR CADA POSIBLE INSTANCIA DE SOLUCI√ìN DE NUESTRO ORDENADOR NO ES SUFICIENTE PARA LO QUE NOS SOLICITA. PROCEDEREMOS A PROBAR A REALIZAR ESTA MISMA T√ÅCTICA, PERO EN VEZ DE LEER NUESTRA MATRIZ DIA-ACTOR (30*10) LO HAREMOS CON UN EJEMPLO DE 7 TOMAS, QUE SI QUE ES VIABLE COMPUTACIONALMENTE.**

In [38]:
from itertools import combinations

"""""

Como es computacionalmente inviable lo que se pide de realizar por fuerza bruta una soluci√≥n para nuestro problema,
se ha pensado en realizar esa misma t√°ctica pero para una ejemplificaci√≥n del problema en base a 7 tomas, lo cual nos
sirve perfectamente para ver como ser√≠a el funcionamiento y los resultados.

"""""

# Cada fila representa una toma, cada columna si un actor participa (1) o no (0)
sesiones = np.array([
    [1, 0, 1, 0, 1],  # Toma 0 -> Trabajan actor 1,3 y 5
    [1, 1, 0, 0, 0],  # Toma 1 -> Trabajan actor 1 y 2
    [0, 1, 1, 0, 0],  # Toma 2 -> Trabajan actor 2 y 3
    [0, 0, 1, 1, 0],  # Toma 3 -> Trabajan actor 3 y 4
    [1, 0, 0, 1, 1],  # Toma 4 -> Trabajan actor 1, 4 y 5
    [0, 1, 0, 1, 1],  # Toma 5 -> Trabajan actor 2, 4 y 5
    [0, 0, 0, 1, 0],  # Toma 6 -> Trabaja actor 4
])

def calcular_coste(dias, sesiones):
    """
    Calcula el coste total en d√≠as-actor para una distribuci√≥n dada de tomas.
    'dias' es una lista de listas, cada sublista contiene √≠ndices de tomas en un d√≠a.
    'sesiones' es una matriz numpy donde filas=tomas, columnas=actores (1 si actor participa).
    """
    total_actor_dias = 0
    for tomas_del_dia in dias:
        actores = set()
        for toma in tomas_del_dia:
            actores |= set(np.where(sesiones[toma] == 1)[0])
        total_actor_dias += len(actores)
    return total_actor_dias

def fuerza_bruta(sesiones):
    """
    Busca la mejor distribuci√≥n de tomas en d√≠as para minimizar el coste total usando fuerza bruta.
    'sesiones' es la matriz numpy con tomas vs actores.
    """
    from itertools import combinations

    num_tomas = sesiones.shape[0]
    indices = list(range(num_tomas))

    mejor_coste = float('inf')
    mejor_distribucion = None

    # Generar todas las particiones posibles de 6 tomas en grupos de hasta 6
    def generar_particiones(tomas_restantes, actual=[]):
        if not tomas_restantes:
            yield actual
        else:
            for r in range(1, min(6, len(tomas_restantes)) + 1):
                for grupo in combinations(tomas_restantes, r):
                    resto = [t for t in tomas_restantes if t not in grupo]
                    yield from generar_particiones(resto, actual + [list(grupo)])

    for distribucion in generar_particiones(indices):
        coste = calcular_coste(distribucion, sesiones)
        if coste < mejor_coste:
            mejor_coste = coste
            mejor_distribucion = distribucion

    return mejor_distribucion, mejor_coste

# Ejecuci√≥n
mejor_distribucion, mejor_coste = fuerza_bruta(sesiones)

# Mostrar resultados
print("Mejor distribuci√≥n (por fuerza bruta):")
dia = 1
for tomas in mejor_distribucion:
    actores_dia = set()
    for toma in tomas:
        actores_dia |= set(np.where(sesiones[toma] == 1)[0])
    print(f"D√≠a {dia}: Tomas {tomas} ‚Üí Actores: {sorted(actores_dia)}")
    dia += 1
print("\nCoste total (d√≠as-actor):", mejor_coste)

Mejor distribuci√≥n (por fuerza bruta):
D√≠a 1: Tomas [6] ‚Üí Actores: [3]
D√≠a 2: Tomas [0, 1, 2, 3, 4, 5] ‚Üí Actores: [0, 1, 2, 3, 4]

Coste total (d√≠as-actor): 6


Este enfoque es **√∫til para problemas muy peque√±os o para validar soluciones de otros m√©todos.**
Para casos reales (30 tomas, 10 actores), es necesario usar m√©todos heur√≠sticos, metaheur√≠sticas o algoritmos aproximados que reduzcan el espacio de b√∫squeda y ofrezcan soluciones cercanas al √≥ptimo en tiempo razonable.



#### Calcula la complejidad del algoritmo por fuerza bruta

El algoritmo genera todas las particiones posibles con grupos de tama√±o entre 1 y 6 y para cada partici√≥n calcula el coste (sumando actores), y selecciona la mejor.

- El n√∫mero de particiones posibles de un conjunto se mide por el n√∫mero de Bell, que crece muy r√°pido (superexponencial). Para un conjunto de tama√±o n, el n√∫mero de particiones es: **B(n).**
- Aqu√≠ no es cualquier partici√≥n, sino particiones con grupos de tama√±o m√°ximo 6. Este es un subconjunto de todas las particiones, pero sigue siendo muy grande y crece muy r√°pido con n.
- Generar todas estas particiones con el c√≥digo recursivo que hace combinaciones de tama√±os 1 a 6, es equivalente a enumerar todas las particiones restringidas, que sigue siendo exponencial en n.

Ya que el crecimiento es superexponencial y adem√°s, en cada partici√≥n adem√°s se calcula el coste, la complejidad temporal resulta en: **O(B(n) x n)**, y como hemos podido comprobar, esta complejidad para valores medianamente altos como el de nuestro problema es INVIABLE.

#### (*)Dise√±a un algoritmo que mejore la complejidad del algortimo por fuerza bruta. Argumenta porque crees que mejora el algoritmo por fuerza bruta

El algoritmo voraz (greedy) propuesto inicialmente mejora a este algoritmo por fueza bruta por los siguientes motivos expuestos en la comparaci√≥n entre ambos:

**Fuerza bruta:**
- El algoritmo por fuerza bruta explora todas las particiones posibles de 30 tomas en d√≠as, donde cada d√≠a tiene un m√≠nimo de 1 y un m√°ximo de 6 tomas.
- El n√∫mero de particiones (particiones de conjunto con restricciones) es astron√≥mico. En t√©rminos simples, el n√∫mero de maneras de agrupar ùëõ elementos en grupos de tama√±o 6 es enorme, crece factorialmente o combinatoriamente de forma explosiva.
- Esto implica que el tiempo de ejecuci√≥n es impracticable para n=30.

**Algoritmo propuesto:**
- En cada iteraci√≥n solo eval√∫a un subconjunto peque√±o de posibilidades (por ejemplo, para elegir la siguiente toma, eval√∫a todas las tomas no asignadas, pero solo una toma se a√±ade al d√≠a).
- Por tanto, la complejidad est√° en el orden de iterar todas las tomas y para cada toma hacer un an√°lisis de actores (algo en torno a O(n√óm) donde n es n√∫mero de tomas y m el n√∫mero de actores).
- No explora exhaustivamente todas las combinaciones, sino que construye una soluci√≥n v√°lida con heur√≠stica.

Adem√°s, tras la ejecuci√≥n en repetidas ocasiones de mi algoritmo probando la versi√≥n original de m√≠nimo 1 toma y m√°ximo 6, he llegado a la conclusi√≥n de que siempre me arrojaba los costes menores cuando el valor de tomas por d√≠a era **exactamente 6**. Por ello, ahorr√© a√∫n m√°s en c√°culo computacional establendiendo que cada d√≠a ten√≠a que tener 6 tomas exactamente (esto en parte es posible gracias a que 30 tomas son divisibles entre 5 d√≠as)


En conclusi√≥n, se puede determinar que **en base a nuestro problema**, el cual encaja mayormenete con las caracter√≠sticas de un algoritmo voraz, es mucho mejor este pues el algoritmo por fuerza bruta es impoisble de realizar. Si en nuestro caso contaramos con una cantidad de tomas muy inferior, es probable que el algoritmo por fuerza bruta fuera el mejor, pues explora cada posibilidad, llegando al resultado **m√°s optimo posible**

#### (*)Calcula la complejidad del algoritmo

Para tratar la complejidad de mi algoritmo asumiremos que:

    n = n√∫mero de tomas (en tu caso 30)
    m = n√∫mero de actores (en tu caso 10)

Teniendo en cuenta esto, trazaremos lo que necesita realizar mi algoritmo ara determinar su complejidad.

Inicialmente, el conjunto sin_asignar contiene n tomas y el algoritmo itera creando "d√≠as" con hasta 6 tomas cada uno, por lo que el bucle principal se ejecuta aproximadamente n/6 veces.
En cada iteraci√≥n del bucle principal:
1) Se calcula el n√∫mero de actores por cada toma sin asignar:
Esto implica sumar un vector de longitud m para cada una de las hasta n tomas.
- Complejidad: O(n √ó m).

2) Se selecciona la toma con el m√≠nimo n√∫mero de actores:
- Complejidad: O(n).

3) Se forma el conjunto de actores del d√≠a a partir de la toma semilla:
- Complejidad: O(m).

4) Se a√±aden hasta 5 tomas m√°s al d√≠a, lo cual acaba siendo una suma constante (no altera la complejidad)

Sumando los costos dentro del bucle O(n √ó m) + O(n √ó m) = O(n √ó m). (Complejidad si nuestra problema tuviera una iteraci√≥n)

Como el bucle principal se ejecuta aproximadamente n/6 veces, la complejidad total es:
##### (n / 6) √ó O(n √ó m) = O(n¬≤ √ó m).

Cumplimentando esta complejidad con nuestros datos (n = 30, m = 10): 30 * 30 √ó10 = 900 √ó 10 = **9000 operaciones, muy inferior a la cifra superexponencial de la fuerza bruta**


#### Seg√∫n el problema (y tenga sentido), dise√±a un juego de datos de entrada aleatorios

In [48]:
import numpy as np

def generar_sesiones_aleatorias(num_tomas, num_actores, prob_actor):
    """
    Genera una matriz binaria de tomas x actores donde 1 indica
    que el actor participa en la toma y 0 que no participa.

    Par√°metros:
    - num_tomas: n√∫mero total de tomas.
    - num_actores: n√∫mero total de actores.
    - prob_actor: probabilidad de que un actor participe en una toma.

    Devuelve:
    - sesiones: numpy array de tama√±o (num_tomas, num_actores)
    """
    sesiones = np.random.rand(num_tomas, num_actores) < prob_actor
    return sesiones.astype(int)

# Ejemplo de uso
sesiones_aleatorias = generar_sesiones_aleatorias(num_tomas=30, num_actores=10, prob_actor=0.4)

print("Matriz tomas x actores (1 indica participaci√≥n del actor en la toma):")
print(sesiones_aleatorias)

Matriz tomas x actores (1 indica participaci√≥n del actor en la toma):
[[0 1 1 0 0 1 0 0 1 0]
 [1 0 0 1 0 1 0 1 0 0]
 [1 0 0 0 0 1 0 0 0 0]
 [1 1 0 0 0 0 1 0 0 1]
 [1 0 1 0 1 0 1 1 0 0]
 [1 0 0 0 0 0 0 0 0 0]
 [0 0 0 0 0 1 0 0 0 0]
 [0 1 0 0 1 0 1 0 0 0]
 [0 0 0 1 0 0 0 0 1 1]
 [0 0 1 1 0 1 0 1 1 0]
 [0 0 1 1 0 1 0 0 0 0]
 [0 1 1 0 0 0 0 0 1 1]
 [1 0 0 0 1 0 0 1 0 0]
 [1 0 1 0 0 1 0 1 0 1]
 [0 1 0 0 1 1 0 0 1 0]
 [0 0 1 0 0 1 0 0 1 1]
 [1 1 0 0 0 0 0 0 0 1]
 [1 1 0 0 0 0 1 0 0 1]
 [0 0 0 1 0 0 0 0 1 1]
 [0 0 1 0 1 1 1 1 0 0]
 [0 1 0 1 0 0 0 1 0 0]
 [1 0 0 0 1 0 0 0 1 1]
 [0 1 1 0 0 1 0 0 1 0]
 [0 1 0 1 0 0 0 1 0 1]
 [0 0 0 0 1 0 0 1 1 0]
 [0 0 0 0 1 0 1 0 1 0]
 [1 0 0 1 0 0 1 0 0 0]
 [0 1 1 0 0 1 0 1 0 0]
 [1 1 0 0 0 0 0 0 1 0]
 [0 0 1 1 0 0 0 1 0 1]]


#### Aplica el algoritmo al juego de datos generado

In [416]:
print('Realizando siempre 6 tomas al d√≠a:')

sesiones = generar_sesiones_aleatorias(30, 10, 0.3133) # Ajustamos la probabilidad a 0.3133 pues es el valor m√°s similar a la matriz de nuestro problema
dias = organizar_sesiones(sesiones)
coste = calcular_coste(dias,sesiones)


# Reutilizamos nuestro c√≥digo del algoritmo cambiando que las variables ahora se generan autom√±√°ticamente
dia = 1
for tomas_del_dia in dias:
    descripciones = []
    for toma in tomas_del_dia:
        num_actores = int(np.sum(sesiones[toma])) # Numero de actores que hay en la toma
        descripciones.append(f"{toma} ({num_actores} actores)") # Damos formato a la futura impresi√≥n -> toma (X actores)
    print(f"Tomas del d√≠a {dia}: [{', '.join(descripciones)}]") # Imprimimos las tomas de un d√≠a dentro del bucle for, as√≠ se imprimir√° iterativamente cada uno de los d√≠as
    dia += 1

print()
print("Total d√≠as-actor, es decir, el coste total de la distribucion:", coste) # Total del coste

Realizando siempre 6 tomas al d√≠a:
Tomas del d√≠a 1: [23 (1 actores), 4 (1 actores), 8 (1 actores), 5 (3 actores), 0 (2 actores), 9 (4 actores)]
Tomas del d√≠a 2: [13 (1 actores), 24 (2 actores), 1 (3 actores), 12 (3 actores), 14 (4 actores), 17 (3 actores)]
Tomas del d√≠a 3: [18 (2 actores), 10 (2 actores), 7 (4 actores), 21 (4 actores), 11 (4 actores), 2 (5 actores)]
Tomas del d√≠a 4: [26 (2 actores), 19 (3 actores), 28 (3 actores), 3 (5 actores), 6 (5 actores), 20 (4 actores)]
Tomas del d√≠a 5: [29 (3 actores), 15 (4 actores), 22 (4 actores), 25 (4 actores), 16 (7 actores), 27 (5 actores)]

Total d√≠as-actor, es decir, el coste total de la distribucion: 36


#### Enumera las referencias que has utilizado(si ha sido necesario) para llevar a cabo el trabajo

[1] Wikipedia, ‚ÄúAlgoritmo Voraz‚Äù Wikipedia, La enciclopedia libre. [Online]. Available: https://es.wikipedia.org/wiki/Algoritmo_voraz

[2] Wikipedia, "B√∫squeda de fuerza bruta" Wikipedia, La enciclopedia libre. [Online] Available: https://es.wikipedia.org/wiki/B%C3%BAsqueda_de_fuerza_bruta

#### Describe brevemente las lineas de como crees que es posible avanzar en el estudio del problema. Ten en cuenta incluso posibles variaciones del problema y/o variaciones al alza del tama√±o

Algunas posibilidades en cuanto avance en el estudio de este problema, nos llevan a otros planteamientos distintos al que hemos tenido. Posiblemente estos deriven en b√∫squeda de infromaci√≥n o prueba y error con otras soluciones propuestas que igual brindan algun aporte pero complican en algun aspecto el problema. Algunos planteamientos son:

**Optimizaci√≥n mediante metaheur√≠sticas o algoritmos aproximados**
- Dado que la fuerza bruta es inviable para tama√±os grandes, se puede explorar el uso de algoritmos heur√≠sticos como Algoritmos Gen√©ticos o Enfriamiento Simulado para encontrar soluciones buenas en tiempo razonable, especialmente con m√°s tomas o actores.

**Paralelizaci√≥n y procesamiento distribuido**
- Para casos muy grandes, dividir la planificaci√≥n en subproblemas que se resuelvan en paralelo o en cl√∫ster, reduciendo tiempos de c√°lculo.

Por otro lado, tambi√©n se puede analizar el problema como que creciera y se necesitaran algunas nuevas propiedades o estudios para poder determinar el crecimiento o an√°lisis del mismo. Es probable que creiera hacia **mayores cantidades de datos, y por tanto de c√°lculo, restricciones din√°micas en funci√≥n de la situaci√≥n actual del problema o hacia la utilizaci√≥n de una potencia de c√≥mputo mucho mayor que permitiera mas que lo empleado, como el uso de un ordenador cu√°ntico para la resoluci√≥n de este problema mediante fuerza bruta**


