
# Algoritmos de Optimización - Trabajo Practico

**Nombre:**     Antonio Jose. Bonafede Salas<br>
**Problema 1:** Se precisa coordinar el doblaje de una película, con las siguientes condiciones:
- Los actores del doblaje deben coincidir en las tomas en las que sus personajes aparecen juntos en las diferentes tomas.
- Los actores de doblaje cobran todos la misma cantidad por cada día que deben desplazarse hasta el estudio de grabación independientemente del número de tomas que se graben.
- No es posible grabar más de 6 tomas por día.<br>

El objetivo es planificar las sesiones por día de manera que el gasto por los servicios de los actores de doblaje sea el menor posible. 
Los datos son:
- Archivo Entrada   : Datos problema doblaje.csv 
- Numero de actores : 10,
- Numero de tomas   : 30, los datos adjuntos indican lo siguiente: 1 que el actor participa en la toma, 0 en caso contrario.

Indicar 3 algoritmos uno por fuerza bruta, uno determinista y otro algoritmo de optimización heurística para resolver el problema. y contestar las siguientes preguntas:

<u>Generales:</u><br>
1.	¿Cuantas posibilidades hay sin tener en cuenta las restricciones?<br>
2.  ¿Cuantas posibilidades hay teniendo en cuenta todas las restricciones.<br>
3.	Según el modelo para el espacio de soluciones<br>
    •	¿Cual es la función objetivo?<br>
    •	¿Es un problema de maximización o minimización?<br>

<u>Para CADA algoritmo</u>:<br>
1.	¿Cual es la estructura de datos que mejor se adapta al problema? Argumentarlo<br>
2.	Calcula la complejidad del algoritmo<br>

<u>Adicionalmente</u>:<br>
1.	Argumenta porque crees que mejora el algoritmo Greedy al por fuerza bruta.<br>
2.	Diseña un juego de datos de entrada aleatorios (guardarlo en un csv aparte)<br>
3.	Aplica el algoritmo al juego de datos generado<br>
4.	Describe brevemente las lineas de como crees que es posible avanzar en el estudio del problema. Ten en cuenta incluso posibles variaciones del problema y/o variaciones al alza del tamaño<br>

**Solución:**   https://github.com/bonafedeaviu/Seminario


## Generales

**¿Cuantas posibilidades hay sin tener en cuenta las restricciones?**

Sin considerar restricciones, el problema equivale a **particionar** \( n \) tomas en \( k \) días, donde \( k \) puede variar desde 1 hasta \( n \). Esto corresponde al **número de Bell** \( B(n) \), que cuenta todas las particiones posibles de un conjunto de \( n \) elementos. *NOTA: El número de actores (10) solo afecta cómo se evalúa cada agrupación (función objetivo) y no las posibilidades*

<hr>

#### Fórmula básica:

$$
B(n) = \sum_{k=0}^{n} S(n, k)
$$

donde \( S(n, k) \) son los **números de Stirling de segunda especie**, que indican cuántas formas hay de dividir \( n \) elementos en \( k \) subconjuntos no vacíos.

<hr>

#### Fórmula alternativa (Dobiński):

$$
B(n) = \sum_{k=0}^{\infty} \frac{(\lambda)^k \cdot k^n}{k!} \cdot e^{-\lambda} \quad \text{con } \lambda = 1
$$

Por lo tanto, queda:

$$
B(n) = \frac{1}{e} \sum_{k=0}^{\infty} \frac{k^n}{k!}
$$

<hr>

Para el problema específico con 30 tomas, sin considerar restricciones, el número total de posibilidades corresponde al número de Bell B(30), que cuenta todas las particiones posibles de un conjunto de 30 elementos.<br>
Para n = 30 tomas:<br> 
$$
B(30) = \frac{1}{e} \sum_{k=0}^{\infty} \frac{k^{30}}{k!}     =     5,998,144,949,446,136,241,083,601,909,575
$$
                                       
<hr>

#### Referencia:

Bell, E.T. (1934). *Exponential polynomials*. *Annals of Mathematics*, **35**(2), 258–277. <br>
URL: https://mathworld.wolfram.com/DobinskisFormula.html 


**¿Cuantas posibilidades hay teniendo en cuenta todas las restricciones?**

Con **30 tomas** y la restricción de **máximo 6 tomas por día**, el problema se reduce significativamente:

**Número mínimo de días necesarios:**

$$
\left\lceil \frac{30}{6} \right\rceil = 5 \text{ días}
$$

**Rango de días posibles:**

Entre \( 5 \) y \( 30 \) días (el caso extremo sería una toma por día).

<hr>

### Estimación de posibilidades válidas

Para el cálculo exacto se requiere:

$$
\sum_{k=5}^{30} S_r(30, k, 6)
$$

donde \( S_r(30, k, 6) \) representa particiones de 30 tomas en \( k \) días, con máximo 6 tomas por día.

<hr>

### Estimación computacional

- Para \( k = 5 \):  
  $$\sim 10^{15} \text{ posibilidades}$$

- Para \( k = 6 \):  
  $$\sim 10^{16} \text{ posibilidades}$$

- **Total estimado:**  
  $$\sim 10^{16} \text{ a } 10^{17} \text{ particiones válidas}$$


<hr>

#### Referencia:

Comtet, L. (1974). "Advanced Combinatorics". D. Reidel Publishing Company.

**Según el modelo para el espacio de soluciones**

<hr>

¿Cual es la estructura de datos que mejor se adapta al problema? Argumentalo.

<hr>

La lista de listas es óptima para este problema por:<br>

Ventajas técnicas:<br>

- Acceso directo        : O(1) para acceder a cualquier día<br>
- Flexibilidad          : Permite días con diferente número de tomas<br>
- Operaciones eficientes: Inserción y eliminación en O(1) amortizado<br>
- Memoria eficiente: Solo almacena las asignaciones necesarias<br>

Justificación algorítmica:<br>

- Permite operaciones de vecindario eficientes para metaheurísticas<br>
- Facilita la validación de restricciones<br>
- Compatible con operaciones de particionado<br>


<hr>

¿Cual es la función objetivo?

<hr>

**Objetivo:** Minimizar el número total de actores-día.

**Minimizar:**

$$
\sum_{d=1}^{D} |A_d|
$$

donde:

𝐷     es el número total de días  
Ad    es el conjunto de actores únicos que trabajan en el día \( d \)  
|Ad|  representa la cardinalidad del conjunto \( A_d \), es decir, el número de actores distintos que graban ese día



**Justificación:**

Cada **actor-día** representa un **costo fijo de contratación**, por lo tanto:

> Minimizar la suma total de actores-día implica **reducir directamente los costos de producción**.

<hr>

¿Es un problema de maximización o minimización?

<hr>

Es un problema de minimización porque:

1, Objetivo: Reducir costos de producción <br>
2. Variable a optimizar: Número de actores-día (a menor valor, menor costo) <br>
3. Contexto económico: Los costos de contratación se minimizan cuando se reduce la presencia total de actores <br>

Clasificación: Problema de optimización combinatoria NP-Hard 

<hr>

#### Referencia:

Pinedo, Scheduling: Theory, Algorithms, and Systems, Springer


## Implementación de Algoritmos 

In [2]:
import pandas as pd
import numpy as np
import itertools
import random
import time
from typing import List, Tuple, Set
import csv
import math
import warnings

class DoblajeOptimizer:
    def __init__(self, csv_file=None, matrix=None):
        """
        Inicializa el optimizador con datos desde CSV o matriz directa
        """
        if csv_file:
            self.load_data_from_csv(csv_file)
        elif matrix is not None:
            self.matrix = matrix
            self.n_tomas = len(matrix)
            self.n_actores = len(matrix[0]) if matrix else 0
        else:
            raise ValueError("Debe proporcionar csv_file o matrix")
        
        self.max_tomas_por_dia = 6
        
    def load_data_from_csv(self, csv_file):
        """
        Carga y limpia los datos del CSV
        """
        # Leer el CSV
        df = pd.read_csv(csv_file, skiprows=2)
        
        # Limpiar datos - eliminar filas y columnas innecesarias
        # Eliminar la primera columna (índice de tomas) y la columna 'Total'
        df_clean = df.iloc[:-1, 1:11]  # Excluir última fila (TOTAL) y columnas innecesarias
               
        # Convertir a matriz numpy
        self.matrix = df_clean.values.astype(int)
        self.n_tomas = self.matrix.shape[0]
        self.n_actores = self.matrix.shape[1]
        
        print(f"        Datos cargados: {self.n_tomas} tomas, {self.n_actores} actores \n")
        
    def calcular_actores_por_dia(self, solucion):
        """
        Calcula el número total de actores-día para una solución dada
        """
        total_actores_dia = 0
        
        for dia in solucion:
            actores_en_dia = set()
            for toma in dia:
                for actor in range(self.n_actores):
                    if self.matrix[toma][actor] == 1:
                        actores_en_dia.add(actor)
            total_actores_dia += len(actores_en_dia)
            
        return total_actores_dia
    
    def is_valid_solution(self, solucion):
        """
        Verifica si una solución es válida
        """
        # Verificar que cada día tenga máximo 6 tomas
        for dia in solucion:
            if len(dia) > self.max_tomas_por_dia:
                return False
        
        # Verificar que todas las tomas estén incluidas exactamente una vez
        tomas_incluidas = set()
        for dia in solucion:
            for toma in dia:
                if toma in tomas_incluidas:
                    return False
                tomas_incluidas.add(toma)
        
        return len(tomas_incluidas) == self.n_tomas

    def generar_solucion_aleatoria(self):
        """
        Genera una solución inicial completamente aleatoria válida
        Estructura de datos: Lista de listas (días con tomas)
        """
        print("--- Generando solución inicial aleatoria.---")
        start_time = time.time()
    
        # Lista de todas las tomas disponibles
        tomas_disponibles = list(range(self.n_tomas))
        random.shuffle(tomas_disponibles)  # Mezclar aleatoriamente
    
        solucion = []
        dia_actual = []
    
        for toma in tomas_disponibles:
            # Si el día actual está lleno, crear un nuevo día
            if len(dia_actual) >= self.max_tomas_por_dia:
                solucion.append(dia_actual)
                dia_actual = []
        
            # Agregar la toma al día actual
            dia_actual.append(toma)
    
        # Agregar el último día si tiene tomas
        if dia_actual:
            solucion.append(dia_actual)
    
        costo = self.calcular_actores_por_dia(solucion)
        end_time = time.time()
        print(f"Solución aleatoria generada en {end_time - start_time:.4f} segundos")
    
        return solucion, costo

    def generar_solucion_aleatoria_inteligente(self):
        """
        Genera una solución inicial aleatoria con cierta inteligencia
        Considera probabilidades basadas en el número de actores por toma
        """
        print("Generando solución inicial aleatoria inteligente...")
        start_time = time.time()
    
        tomas_disponibles = list(range(self.n_tomas))
        solucion = []
    
        while tomas_disponibles:
            dia_actual = []
            actores_dia = set()
        
            # Crear una lista de tomas disponibles con sus pesos
            # Pesos más altos para tomas con más actores (para balancear)
            pesos = []
            for toma in tomas_disponibles:
                num_actores = sum(self.matrix[toma])
                # Peso inversamente proporcional al número de actores
                # para evitar concentrar todas las tomas complejas en un día
                peso = 1.0 / (num_actores + 1)
                pesos.append(peso)
        
            # Llenar el día actual
            for _ in range(self.max_tomas_por_dia):
                if not tomas_disponibles:
                    break
            
                # Selección aleatoria ponderada
                toma_seleccionada = random.choices(tomas_disponibles, weights=pesos, k=1)[0]
            
                # Agregar la toma al día
                dia_actual.append(toma_seleccionada)
            
                # Actualizar actores del día
                for actor in range(self.n_actores):
                    if self.matrix[toma_seleccionada][actor] == 1:
                        actores_dia.add(actor)
            
                # Remover la toma seleccionada
                idx = tomas_disponibles.index(toma_seleccionada)
                tomas_disponibles.pop(idx)
                pesos.pop(idx)
        
            solucion.append(dia_actual)
    
        costo = self.calcular_actores_por_dia(solucion)
        end_time = time.time()
        print(f"Solución aleatoria inteligente generada en {end_time - start_time:.4f} segundos")
    
        return solucion, costo

    def generar_multiples_soluciones_aleatorias(self, num_soluciones=10):
        """
        Genera múltiples soluciones aleatorias y devuelve la mejor
        """
        print(f"Generando {num_soluciones} soluciones aleatorias...")
    
        mejor_solucion = None
        mejor_costo = float('inf')
    
        for i in range(num_soluciones):
            solucion, costo = self.generar_solucion_aleatoria()
            if costo < mejor_costo:
                mejor_costo = costo
                mejor_solucion = solucion
            
            if i % 5 == 0:
                print(f"Solución {i+1}: Costo = {costo}")
    
        print(f"Mejor solución aleatoria: Costo = {mejor_costo}")
        return mejor_solucion, mejor_costo


    def brute_force_pura_iterativa(self):
        """
        Versión iterativa de fuerza bruta pura usando itertools
        Evalúa TODAS las posibles asignaciones de tomas a días sin modificaciones
        """
        print("=== FUERZA BRUTA PURA ITERATIVA ===:\n")
        start_time = time.time()
    
        mejor_solucion = None
        mejor_costo = float('inf')
        evaluaciones = 0
    
        # Calcular número máximo de días posibles
        max_dias = self.n_tomas  # En el peor caso, una toma por día
    
        # Generar todas las posibles asignaciones usando itertools
        # Cada toma puede ir a cualquier día (0 a max_dias-1)
        for asignacion in itertools.product(range(max_dias), repeat=self.n_tomas):
            # Convertir asignación a formato de solución
            solucion = self.convertir_asignacion_a_solucion(list(asignacion))
        
            # Verificar si la solución es válida (máximo 6 tomas por día)
            if self.es_solucion_valida_fuerza_bruta(solucion):
                evaluaciones += 1
                costo = self.calcular_actores_por_dia(solucion)
            
                if costo < mejor_costo:
                    mejor_costo = costo
                    mejor_solucion = solucion.copy()
            
                # Mostrar progreso cada 10000 evaluaciones
                if evaluaciones % 10000 == 0:
                    print(f"Evaluaciones: {evaluaciones}, Mejor costo: {mejor_costo}")
    
        end_time = time.time()
        print(f"\nFuerza bruta iterativa completada en {end_time - start_time:.2f} segundos")
        print(f"Total de soluciones válidas evaluadas: {evaluaciones}")
    
        return mejor_solucion, mejor_costo

    def convertir_asignacion_a_solucion(self, asignacion):
        """
        Convierte una asignación [dia_toma0, dia_toma1, ...] a formato de solución     [[tomas_dia0], [tomas_dia1], ...]
        """
        # Crear diccionario de días con sus tomas
        dias_dict = {}
        for toma, dia in enumerate(asignacion):
            if dia not in dias_dict:
                dias_dict[dia] = []
            dias_dict[dia].append(toma)
    
        # Convertir a lista de listas, ordenada por día
        solucion = []
        for dia in sorted(dias_dict.keys()):
            solucion.append(dias_dict[dia])
    
        return solucion

    def es_solucion_valida_fuerza_bruta(self, solucion):
        """
        Verifica si una solución es válida para fuerza bruta pura
        """
        # Verificar que cada día tenga máximo 6 tomas
        for dia in solucion:
            if len(dia) > self.max_tomas_por_dia:
                return False
    
        # Verificar que todas las tomas estén incluidas exactamente una vez
        tomas_incluidas = set()
        for dia in solucion:
            for toma in dia:
                if toma in tomas_incluidas:
                    return False
                tomas_incluidas.add(toma)
    
        return len(tomas_incluidas) == self.n_tomas  
    
    def brute_force(self):
        """
        Algoritmo de fuerza bruta
        Estructura de datos: Lista de listas (días con tomas)
        """
        print("=== FUERZA BRUTA MODIFICADA ===:\n")
        start_time = time.time()
        
        mejor_solucion = None
        mejor_costo = float('inf')
        
        # Generar todas las particiones posibles de tomas en días
        tomas = list(range(self.n_tomas))
        
        # Número mínimo de días necesarios
        min_dias = math.ceil(self.n_tomas / self.max_tomas_por_dia)
        max_dias = self.n_tomas  # En el peor caso, una toma por día
        
        for n_dias in range(min_dias, min(max_dias + 1, 8)):  # Limitamos para evitar explosión combinatoria
            for particion in self.generar_particiones(tomas, n_dias):
                if all(len(dia) <= self.max_tomas_por_dia for dia in particion):
                    costo = self.calcular_actores_por_dia(particion)
                    if costo < mejor_costo:
                        mejor_costo = costo
                        mejor_solucion = particion
        
        end_time = time.time()
        print(f"Fuerza bruta completada en {end_time - start_time:.2f} segundos")
        return mejor_solucion, mejor_costo
    
    def generar_particiones(self, elementos, k):
        """
        Genera todas las particiones de elementos en k grupos no vacíos
        """
        if k == 1:
            yield [elementos]
        elif k == len(elementos):
            yield [[elem] for elem in elementos]
        else:
            for i in range(1, len(elementos) - k + 2):
                for resto in self.generar_particiones(elementos[i:], k - 1):
                    yield [elementos[:i]] + resto
    
    def greedy_determinista(self):
        """
        Algoritmo greedy determinista
        Estructura de datos: Lista de listas y conjunto para actores únicos
        """
        print("\n")
        print("=== GREEDY DETERMINISTA ===:\n")
        start_time = time.time()
        
        tomas_restantes = set(range(self.n_tomas))
        solucion = []
        
        while tomas_restantes:
            dia_actual = []
            actores_dia = set()
            
            # Ordenar tomas por número de actores (descendente) para priorizar tomas complejas
            tomas_ordenadas = sorted(tomas_restantes, 
                                   key=lambda t: sum(self.matrix[t]), 
                                   reverse=True)
            
            for toma in tomas_ordenadas:
                if len(dia_actual) >= self.max_tomas_por_dia:
                    break
                    
                # Actores que participan en esta toma
                actores_toma = set(i for i in range(self.n_actores) if self.matrix[toma][i] == 1)
                
                # Calculamos el costo marginal de agregar esta toma
                nuevos_actores = actores_toma - actores_dia
                
                # Agregamos la toma (estrategia greedy simple)
                dia_actual.append(toma)
                actores_dia.update(actores_toma)
                tomas_restantes.remove(toma)
            
            solucion.append(dia_actual)
        
        costo = self.calcular_actores_por_dia(solucion)
        end_time = time.time()
        print(f"Greedy determinista completado en {end_time - start_time:.2f} segundos")
        return solucion, costo
    
    def simulated_annealing(self, max_iterations=10000, temp_inicial=1000, 
                                           factor_enfriamiento=0.95, tipo_inicio='aleatorio'):
        """
        Algoritmo de recocido simulado con diferentes tipos de solución inicial
        
        Parámetros:
            - tipo_inicio: 'aleatorio', 'aleatorio_inteligente', 'multiples_aleatorios'
        """
        
        print("\n")
        print(f"=== SIMULATED ANNEALING (Inicio: {tipo_inicio}) ===:\n")
        start_time = time.time()
    
        # Se selecciona la distribución inicial
        
        if tipo_inicio == 'aleatorio_inteligente':
            # Solución inicial aleatoria con pesos
            solucion_actual, costo_actual = self.generar_solucion_aleatoria_inteligente()
            mejor_solucion = [dia.copy() for dia in solucion_actual]
            mejor_costo = costo_actual
        
        elif tipo_inicio == 'multiples_aleatorios':
            # Mejor de múltiples soluciones aleatorias
            solucion_actual, costo_actual = self.generar_multiples_soluciones_aleatorias(10)
            mejor_solucion = [dia.copy() for dia in solucion_actual]
            mejor_costo = costo_actual
        
        else:  # 'aleatorio' 
            # Solución inicial completamente aleatoria
            solucion_actual, costo_actual = self.generar_solucion_aleatoria()
            mejor_solucion = [dia.copy() for dia in solucion_actual]
            mejor_costo = costo_actual
    
        print(f"Solución inicial: Costo = {costo_actual} Usando {tipo_inicio}")
        
        temperatura = temp_inicial
        
        for iteracion in range(max_iterations):
            # Generar vecino moviendo una toma aleatoria
            nueva_solucion = [dia.copy() for dia in solucion_actual]
            
            # Seleccionar día origen y destino
            dia_origen = random.randint(0, len(nueva_solucion) - 1)
            if not nueva_solucion[dia_origen]:
                continue
                
            # Seleccionar toma a mover
            toma_idx = random.randint(0, len(nueva_solucion[dia_origen]) - 1)
            toma = nueva_solucion[dia_origen].pop(toma_idx)
            
            # Encontrar día destino válido o crear nuevo día
            dia_destino = None
            for i, dia in enumerate(nueva_solucion):
                if len(dia) < self.max_tomas_por_dia:
                    dia_destino = i
                    break
            
            if dia_destino is None:
                nueva_solucion.append([])
                dia_destino = len(nueva_solucion) - 1
            
            nueva_solucion[dia_destino].append(toma)
            
            # Limpiar días vacíos
            nueva_solucion = [dia for dia in nueva_solucion if dia]
            
            # Calcular nuevo costo
            nuevo_costo = self.calcular_actores_por_dia(nueva_solucion)
            
            # Decidir si aceptar la nueva solución
            if nuevo_costo < costo_actual or random.random() < math.exp(-(nuevo_costo - costo_actual) / temperatura):
                solucion_actual = nueva_solucion
                costo_actual = nuevo_costo
                
                if nuevo_costo < mejor_costo:
                    mejor_solucion = [dia.copy() for dia in nueva_solucion]
                    mejor_costo = nuevo_costo
            
            # Enfriar temperatura
            temperatura *= factor_enfriamiento
            
            if iteracion % 1000 == 0:
                print(f"Iteración {iteracion}: Mejor costo = {mejor_costo}, Costo actual = {costo_actual}")
        
        end_time = time.time()
        print("\n")
        print(f"Recocido simulado completado en {end_time - start_time:.2f} segundos")
        return mejor_solucion, mejor_costo
    
    def print_solution(self, solucion, costo, nombre_algoritmo):
        """
        Imprime una solución de forma legible
        """
        print(f"\n=== SOLUCIÓN {nombre_algoritmo.upper()} ===")
        print(f"Costo total (actores-día): {costo}")
        print(f"Número de días: {len(solucion)}")
        
        for i, dia in enumerate(solucion):
            actores_dia = set()
            for toma in dia:
                for actor in range(self.n_actores):
                    if self.matrix[toma][actor] == 1:
                        actores_dia.add(actor + 1)  # +1 para numeración desde 1
            
            print(f"Día {i+1}: Tomas {[t+1 for t in dia]} -> Actores {sorted(actores_dia)} ({len(actores_dia)} actores)")
    
    def calcular_posibilidades_totales(self):
        """
        Calcula el número total de posibilidades considerando restricciones
        """
        # Número mínimo de días
        min_dias = math.ceil(self.n_tomas / self.max_tomas_por_dia)
        
        # Para una estimación, usamos el número de Stirling de segunda especie
        # modificado por las restricciones de capacidad
        print(f"        Número mínimo de días: {min_dias}")
        print(f"        Número máximo de tomas por día: {self.max_tomas_por_dia}")
        
        # Estimación simplificada: particiones de n elementos en k grupos
        # con restricción de tamaño máximo por grupo
        if self.n_tomas <= 31:  # Solo calculamos exacto para problemas pequeños
            count = 0
            for n_dias in range(min_dias, self.n_tomas + 1):
                # Número de formas de particionar n tomas en n_dias días
                # con máximo 6 tomas por día (aproximación)
                count += self.stirling_second_kind_restricted(self.n_tomas, n_dias, self.max_tomas_por_dia)
            print(f"        Número aproximado de posibilidades: {count}")
        else:
            print("        Problema demasiado grande para cálculo exacto")
        
        return min_dias
    
    def stirling_second_kind_restricted(self, n, k, max_size):
        """
        Aproximación del número de Stirling de segunda especie con restricción de tamaño
        """
        if k == 1:
            return 1 if n <= max_size else 0
        if k == n:
            return 1
        if k > n:
            return 0
        
        # Aproximación simple - en la práctica sería más complejo
        return min(1000000, math.factorial(n) // (math.factorial(k) * (k ** (n-k))))

def generar_datos_aleatorios(n_tomas, n_actores, densidad=0.3, filename="datos_aleatorios.csv"):
    """
    Genera un conjunto de datos aleatorio para testing
    """
    import random
    import csv
    
    print(f"Generando datos aleatorios: {n_tomas} tomas, {n_actores} actores, densidad {densidad}")
    
    matrix = []
    for toma in range(n_tomas):
        fila = []
        for actor in range(n_actores):
            # Probabilidad de que un actor participe en una toma
            participa = 1 if random.random() < densidad else 0
            fila.append(participa)
        
        # Asegurar que cada toma tenga al menos un actor
        if sum(fila) == 0:
            fila[random.randint(0, n_actores - 1)] = 1
        
        matrix.append(fila)
    
    # Guardar en CSV
    with open(filename, 'w', newline='') as f:
        writer = csv.writer(f)
        
        # Fila vacía inicial con "Actor" en la segunda columna
        header1 = [''] + ['Actor'] + [''] * (n_actores - 1) + [''] * 2
        writer.writerow(header1)

        # Fila vacía inicial con "Toma" en la segunda columna
        header2 = ['Toma'] + list(range(1, n_actores + 1)) + [''] + ['Total']
        writer.writerow(header2)
        
        # Datos de las tomas
        for i, fila in enumerate(matrix):
            total = sum(fila)
            # CAMBIO 3: Agregar columna vacía antes del total
            writer.writerow([i+1] + fila + [''] + [total])
        
        writer.writerow([''] * (n_actores + 3))
        
        # Fila total
        totales = ['TOTAL'] + [sum(matrix[i][j] for i in range(n_tomas)) for j in range(n_actores)] + [''] + ['']
        writer.writerow(totales)
    
    print(f"Datos guardados en {filename}")
    return matrix

def main():
    
    warnings.filterwarnings("ignore") # Suprimir todos los warnings
    print("\n" + "="*50)
    print("    ANÁLISIS DEL PROBLEMA DE DOBLAJE    ")
    print("="*50)
    
    # Cargar datos originales
    print("=== CARGA DE DATOS ===\n")
    optimizer = DoblajeOptimizer(csv_file="Datos problema doblaje.csv")
    
    # Análisis del problema
    print("=== ANÁLISIS GENERAL ===:\n")
    print(f"        Función objetivo: Minimizar el número total de actores-día")
    print(f"        Tipo de problema: Minimización")
    print(f"        Restricciones: Máximo {optimizer.max_tomas_por_dia} tomas por día\n")
    
    # Calcular posibilidades
    print(f"=== CALCULO DE POSIBILIDADES ===:\n")
    optimizer.calcular_posibilidades_totales()
    
    # Ejecutar algoritmos
    print("\n" + "="*50)
    print("    EJECUTANDO ALGORITMOS    ")
    print("="*50)
    
    # 1. Fuerza bruta (solo para problemas pequeños)
    if optimizer.n_tomas <= 6:  # Muy restrictivo
        sol_bf_pura, costo_bf_pura = optimizer.brute_force_pura_iterativa()
        optimizer.print_solution(sol_bf_pura, costo_bf_pura, "FUERZA BRUTA PURA ITERATIVA")
    else:
        print("Fuerza bruta pura omitida - problema demasiado grande")

    # 2. Fuerza bruta mejorada 
    if optimizer.n_tomas <= 31:
        sol_bf, costo_bf = optimizer.brute_force()
        optimizer.print_solution(sol_bf, costo_bf, "FUERZA BRUTA")
    else:
        print("\nFuerza bruta omitida - problema demasiado grande")
        
    # 3. Algoritmo Greedy Determinista
    sol_greedy, costo_greedy = optimizer.greedy_determinista()
    optimizer.print_solution(sol_greedy, costo_greedy, "GREEDY DETERMINISTA")
    
    # 4. Algoritmo de Recocido Simulado
    #sol_sa, costo_sa = optimizer.simulated_annealing(max_iterations=10000, tipo_inicio='aleatorio')
    #sol_sa, costo_sa = optimizer.simulated_annealing(max_iterations=10000, tipo_inicio='aleatorio_inteligente')
    sol_sa, costo_sa = optimizer.simulated_annealing(max_iterations=10000, tipo_inicio='multiples_aleatorios')
    optimizer.print_solution(sol_sa, costo_sa, "RECOCIDO SIMULADO")
    
    # Comparación de algoritmos
    print("\n" + "="*50)
    print("COMPARACIÓN DE RESULTADOS")
    print("="*50)
    
    print(f"Greedy Determinista: {costo_greedy} actores-día")
    print(f"Recocido Simulado: {costo_sa} actores-día")
    
    mejor_algoritmo = "Recocido Simulado" if costo_sa < costo_greedy else "Greedy Determinista"
    print(f"Mejor resultado: {mejor_algoritmo}")
    
    # Generar datos aleatorios
    print("\n" + "="*50)
    print("GENERANDO DATOS ALEATORIOS")
    print("="*50)
    
    datos_aleatorios = generar_datos_aleatorios(20, 8, 0.35, "datos_aleatorios.csv")
    
    # Probar con datos aleatorios
    print("\nProbando algoritmos con datos aleatorios...")
    optimizer_random = DoblajeOptimizer(matrix=datos_aleatorios)

    
    # 1. Fuerza bruta (solo para problemas pequeños)
    if optimizer.n_tomas <= 6:  # Muy restrictivo
        sol_bf_pura, costo_bf_pura = optimizer.brute_force_pura_iterativa()
        optimizer.print_solution(sol_bf_pura, costo_bf_pura, "FUERZA BRUTA PURA ITERATIVA")
    else:
        print("Fuerza bruta pura omitida - problema demasiado grande")

    # 2. Fuerza bruta (solo para problemas pequeños)
    if optimizer.n_tomas <= 31:
        sol_bf, costo_bf = optimizer.brute_force()
        optimizer.print_solution(sol_bf, costo_bf, "FUERZA BRUTA")
    else:
        print("\nFuerza bruta omitida - problema demasiado grande")
        
    # 3. Algoritmo Greedy Determinista
    sol_greedy, costo_greedy = optimizer.greedy_determinista()
    optimizer.print_solution(sol_greedy, costo_greedy, "GREEDY DETERMINISTA")
    
    # 4. Algoritmo de Recocido Simulado
    #sol_sa, costo_sa = optimizer.simulated_annealing(max_iterations=10000, tipo_inicio='aleatorio')
    #sol_sa, costo_sa = optimizer.simulated_annealing(max_iterations=10000, tipo_inicio='aleatorio_inteligente')
    sol_sa, costo_sa = optimizer.simulated_annealing(max_iterations=10000, tipo_inicio='multiples_aleatorios')
    optimizer.print_solution(sol_sa, costo_sa, "RECOCIDO SIMULADO")

    # Comparación de algoritmos
    print("\n" + "="*50)
    print("COMPARACIÓN DE RESULTADOS")
    print("="*50)
    
    print(f"Greedy Determinista: {costo_greedy} actores-día")
    print(f"Recocido Simulado: {costo_sa} actores-día")
    
    mejor_algoritmo = "Recocido Simulado" if costo_sa < costo_greedy else "Greedy Determinista"
    print(f"Mejor resultado: {mejor_algoritmo}")

if __name__ == "__main__":
    main()


    ANÁLISIS DEL PROBLEMA DE DOBLAJE    
=== CARGA DE DATOS ===

        Datos cargados: 30 tomas, 10 actores 

=== ANÁLISIS GENERAL ===:

        Función objetivo: Minimizar el número total de actores-día
        Tipo de problema: Minimización
        Restricciones: Máximo 6 tomas por día

=== CALCULO DE POSIBILIDADES ===:

        Número mínimo de días: 5
        Número máximo de tomas por día: 6
        Número aproximado de posibilidades: 5867535

    EJECUTANDO ALGORITMOS    
Fuerza bruta pura omitida - problema demasiado grande
=== FUERZA BRUTA MODIFICADA ===:

Fuerza bruta completada en 2.87 segundos

=== SOLUCIÓN FUERZA BRUTA ===
Costo total (actores-día): 36
Número de días: 5
Día 1: Tomas [1, 2, 3, 4, 5, 6] -> Actores [1, 2, 3, 4, 5, 7, 8] (7 actores)
Día 2: Tomas [7, 8, 9, 10, 11, 12] -> Actores [1, 2, 3, 4, 5, 6, 8, 9] (8 actores)
Día 3: Tomas [13, 14, 15, 16, 17, 18] -> Actores [1, 2, 3, 4, 6, 7, 10] (7 actores)
Día 4: Tomas [19, 20, 21, 22, 23, 24] -> Actores [1, 2, 3, 4, 

**Comentarios sobre el Algoritmo de Fuerza Bruta**

A fin de poder ejecutar el algoritmo de fuerza bruta (Ya que esta función tiene complejidad muy alta, por lo que solo es viable para problemas muy pequeños -≤6 tomas- ), se agrego una implementación que se baso en lo que llamaria una fuerza bruta restringida con las siguientes caracteristicas:

- Solo evalúa soluciones con 5-8 días (no hasta 30 días)
- Aproximadamente 437 millones de particiones vs $10^{44}$ teóricas
- Descarta rápidamente configuraciones inválidas

## Preguntas sobre los Algoritmos

**Calcula la complejidad del algoritmo**

Para el problema específico con 30 tomas y 10 actores:<br>

<hr>
**Fuerza Bruta**

<u>Teorica:</u>

- Complejidad asintótica general:

$$
O(k^n \cdot n \cdot m)
$$

donde:

- k : número de días posibles (hasta n en el peor caso)
- n : número de tomas
- m : número de actores

Desglose

- k^n: Número total de posibles particiones (distribuciones de tomas en días)
- n^m: Evaluación del costo de cada solución (actores involucrados por día)
- En el **peor caso**, k = n (una toma por día)

Cálculo para n = 30

- Evaluamos las particiones restringidas: \( S(30, k) \) para entre [5, 30] 
- Ejemplo:  
  \[
  S(30, 5) aprox 10^15 particiones
  \]

- Estimación del orden general (sin restricciones):

  \[
  O(30^30) aprox O(10^44)
  \]

Estructura de datos: Lista de listas Espacio: O(n) para almacenar la mejor solución

En el **peor escenario teórico**, el número de particiones crece exponencialmente, haciendo que la complejidad temporal alcance órdenes del tipo \( O(10^{44}) \), lo cual confirma que el problema es **inabordable por fuerza bruta** sin restricciones o podas drásticas del espacio de búsqueda.


<u>Practica:</u>

- Evaluamos solo particiones con k entre [5, 8] :

•	S(30,5): ~142,506 particiones<br>
•	S(30,6): ~9,694,845 particiones<br>
•	S(30,7): ~85,973,670 particiones<br>
•	S(30,8): ~341,149,446 particiones<br>
•	Total aproximado: ~437 millones de particiones 

Aunque el espacio de soluciones teóricas sin restricciones es del orden de 10^44, al **restringir a 8 días como máximo**, el espacio se **reduce drásticamente** a ~437 millones de particiones, lo que hace viable el análisis mediante fuerza bruta solo en este rango limitado.

<hr>

**Greedy** 


- Complejidad asintótica general:

$$
O(n^2 \log n \cdot m)
$$

donde:

- n: número de tomas  
- m: número de actores

Desglose paso a paso:

- Bucle principal: O(n) - procesa cada toma una vez
- Ordenamiento por iteración: O(n log n) - ordena tomas restantes
- Evaluación por toma: O(m) - cuenta actores por toma
- Total: O(n × n log n × m) = O(n² log n × m)

Cálculo para n=30, m=10:<br>

- Operaciones: 30² × log(30) × 10 ≈ 900 × 5 × 10 = 45,000
- Orden: O(n² log n) 

Estructura de datos: Lista de listas + conjunto Espacio: O(n + m) para estructuras auxiliares

<hr> 

**Annealing**

- Complejidad asintótica general:

$$
O(I \cdot n \cdot m)
$$

donde:

- I: número total de iteraciones del algoritmo  
- n: número de tomas  
- m: número de actores

Desglose:

1. generar_solucion_aleatoria()
    - Mezcla aleatoria: O(n)
    - Bucle principal: O(n) 
    - Cálculo de costo: O(n × m)<br>

      **Complejidad Total: O(n × m)**

2. generar_solucion_aleatoria_inteligente()
    - Días necesarios: D ≈ n/max_tomas_por_dia
    - Por cada día: calcular pesos O(n) + seleccionar O(n) + actualizar O(m)
    - Bucle externo: O(D) = O(n)
    - Bucle interno: O(n) por día
    - Cálculo final: O(n × m)<br>

      **Complejidad Total: O(n² + n × m)**

3. generar_multiples_soluciones_aleatorias(N)
    - N llamadas a generar_solucion_aleatoria()
    - Cada llamada: O(n × m)<br>

     **Complejidad Total: O(N × n × m)**

4. Bucle Principal del Simulated Annealing
    Por cada iteración (I total):
        - Generar vecino: O(n)
        - Calcular costo: O(n × m)
        - Evaluación: O(1)<br>

   **Complejidad Total: O(I × n × m)**


Pará este caso:

I = 10,000 iteraciones
n = 30 tomas
m = 10 actores

    - Operaciones por componente:
        Inicialización simple:     30 × 10 = 300
        Inicialización inteligente: 30² + 30 × 10 = 1,200
        Bucle principal SA:        10,000 × 30 × 10 = 3,000,000
        
<hr> 

#### Referencia:

Knuth, D.E. (2005). "The Art of Computer Programming, Volume 4A: Combinatorial Algorithms". Addison-Wesley.<br>
Lundy M., Mees A., "CONVERGENCE OF AN ANNEALING ALGORITHM", Mathematical Programming 34 (1986) 111-124 


## Lineas de Investigacion Futuras

A. Algoritmos Avanzados

1. Metaheurísticas Poblacionales

- Algoritmos Genéticos: Cruzamiento especializado para particiones
- Optimización por Enjambre de Partículas: Adaptado para espacios discretos
- Algoritmos Evolutivos Multi-objetivo: Para optimizar múltiples criterios

2. Técnicas de Búsqueda Local

- Búsqueda Tabú: Con memoria adaptativa
- Variable Neighborhood Search: Múltiples estructuras de vecindario
- Búsqueda Scatter: Para diversificación e intensificación


B. Variaciones del Problema

1. Extensiones Multi-criterio

- Costos diferenciados por actor: Actores principales vs secundarios
- Restricciones temporales: Disponibilidad limitada de actores
- Optimización multi-objetivo: Costo vs. tiempo vs. calidad

2. Problemas Estocásticos

- Tiempos de grabación inciertos: Distribuciones probabilísticas
- Disponibilidad variable: Modelado de ausencias imprevistas
- Planificación robusta: Soluciones resistentes a perturbaciones


C. Escalabilidad y Aplicaciones

1. Técnicas de Descomposición

- Programación Dinámica: Para subproblemas estructurados
- Divide y Vencerás: Particionado jerárquico
- Relajación Lagrangiana: Para obtener cotas inferiores

2. Aplicaciones Relacionadas

- Planificación de personal hospitalario: Turnos y especialidades
- Asignación de recursos en proyectos: Task scheduling con recursos compartidos
- Horarios académicos: Profesores, aulas y materias
- Manufactura flexible: Máquinas y productos

D. Modelado Matemático Avanzado

1. Formulaciones Exactas

- Programación Lineal Entera: Modelos de particionado
- Programación por Restricciones: CSP con propagación
- Optimización Convexa: Relajaciones semidefinidas

2. Análisis Teórico

- Aproximabilidad: Ratios de aproximación garantizados
- Complejidad parametrizada: FPT algorithms
- Análisis probabilístico: Performance en instancias aleatorias



<hr> 

#### Referencia:

Goldberg, D.E. (1989). "Genetic Algorithms in Search, Optimization, and Machine Learning". Addison-Wesley.<br>
Glover, F. & Laguna, M. (1997). "Tabu Search". Kluwer Academic Publishers.<br>
Birge, J.R. & Louveaux, F. (2011). "Introduction to Stochastic Programming". Springer.<br>
Pinedo, M.L. (2016). "Scheduling: Theory, Algorithms, and Systems". Springer.<br>
Vazirani, V.V. (2001). "Approximation Algorithms". Springer.<br>

