# Algoritmos de optimización - Trabajo Práctico<br>
Nombre y Apellidos: Eros Piera Moreno  <br>
Url: <br>
Google Colab:  <br>

## Problema:
>2. Organizar los horarios de partidos de La Liga<br>

## Descripción del problema:

Desde la La Liga de fútbol profesional se pretende organizar los horarios de los partidos de 
liga de cada jornada. Se conocen algunos datos que nos deben llevar a diseñar un 
algoritmo que realice la asignación de los partidos a los horarios de forma que maximice la 
audiencia. 

Los horarios disponibles se conocen a priori y son los siguientes:

![horarios](horarios.png)

En primer lugar se clasifican los equipos en tres categorías según el número de 
seguidores (que tiene relación directa con la audiencia). Hay 3 equipos en la 
categoría A, 11 equipos de categoría B y 6 equipos de categoría C.

Se conoce estadísticamente la audiencia que genera cada partido según los equipos 
que se enfrentan y en horario de sábado a las 20h (el mejor en todos los casos):


![audiencia](audiencia.png)

Si el horario del partido no se realiza a las 20 horas del sábado se sabe que se reduce 
según los coeficientes de la siguiente tabla:

![coeficientes](coeficientes.png)


Es posible la coincidencia de horarios pero en este caso la audiencia de cada partido se verá afectada y 
se estima que se reduce en porcentaje según la siguiente tabla dependiendo del número de coincidencias:

Además, cabe destacar que debemos asignar obligatoriamente siempre un partido el viernes y un partido el lunes.

![coincidencias](coincidencias.png)







                                        

# Modelo

- ¿Como represento el espacio de soluciones?

Para representar el espacio de soluciones primero debemos escoger el tipo de dato que más se ajuste a las necesidades del problema. En este caso lo más eficiente sería emplear los diccionarios de python ya que que permiten almacenar pares de datos compuestos por una clave y un valor asociado a esa clave.

Las claves en un diccionario deben ser únicas, pero los valores pueden ser de cualquier tipo de datos (números, cadenas, listas, otros diccionarios, etc.). Los diccionarios son estructuras de datos muy versátiles y eficientes para recuperar y manipular datos mediante el acceso rápido a través de las claves.

Además, para los valores de los diccionarios que sean inmutables (por la definición del problema a solucionar) se emplearán tuplas ya que son eficientes porque ofrecen acceso directo por índice, son eficientes en la iteración, ocupan un espacio de memoria contiguo y tienen una implementación interna simplificada debido a su inmutabilidad.

Teniendo en cuenta estas características en los diccionarios y en las tuplas, el espacio de soluciones se podría representar de esta manera:

1. Horarios <br>
La clave en este caso es un tipo "String" que representa el día y la hora del partido y el valor es un float que representa el coeficiente de audiencia a aplicar para esa franja horaria.<br>
**{Clave(Día y hora): "V20", Valor(Coeficiente a aplicar para esa franja horaria): 0.4}** <br>
Ejemplo: "V20": 0.4
<br>

2. Partidos <br>
La clave en este caso es un tipo "String" que representa el ID del partido y el valor una tupla que contiene la pareja de equipos que se van a enfrentar.<br>
**{Clave(ID del partido): "0", Valor(Equipos que se enfrentan): ("Equipo1", "Equipo2")}**<br>
Ejemplo: "0" : ("Barsa","Madrid")
<br>
3. Categorías <br>
La clave en este caso es un tipo "String" que representa la categoría y el valor una tupla que contiene el conjunto de equipos en esa categoría.<br>
**{Clave(Categoría A,B,C): "Categoría A", Valor(Equipos con mayor audiencia): ("RMadrid","RSociedad"," Barcelona")}**<br>
Ejemplo: "Categoria A": ("RMadrid","RSociedad","Barcelona")<br>
<br>

4. Emparejamientos con audiencia <br>
**{Clave(Equipo1-Equipo2): "Barcelona-Madrid", Valor(Estadística de la audiencia): (2)}**<br>
Ejemplo: "Barcelona-Madrid": 2



- ¿Cual es la función objetivo?

En el contexto de un algoritmo de optimización, la función objetivo juega un papel crucial al evaluar la calidad de una solución. Esta función, típicamente una expresión matemática, cuantifica qué tan efectiva es una solución particular para abordar un problema específico. La meta fundamental de un algoritmo de optimización radica en encontrar la solución más óptima posible. La función objetivo sirve como un criterio para este propósito, permitiendo la comparación y selección entre diferentes soluciones propuestas.

Al recibir una o más variables de decisión que caracterizan la solución propuesta, la función objetivo calcula un valor que refleja la calidad de dicha solución. En la mayoría de los casos, el objetivo es maximizar o minimizar este valor, según la naturaleza del problema que se está abordando.

En el caso particular que estamos considerando, el objetivo es obtener el máximo número de visualizaciones durante una jornada específica. Para lograr esto, la función objetivo evaluará la efectividad de cada posible solución en términos de generar el mayor número de visualizaciones dentro del contexto dado.

Por lo que se trata de un problema de maxificación. En el cual tenemos dos restricciones principales:

1. Se debe jugar obligatoriamente un partido el viernes y otro el lunes.
2. Si se juega un partido a la misma hora el mismo día se penaliza el nivel de audiencia dada la tabla de la figura X.

- ¿Como implemento las restricciones?

He creado una función llamada "aplicarRestricciones" a la cual aplico las restricciones de audiencia y de coincidencia en horarios de la jornada una vez que ya he generado el espacio de soluciones.

# Análisis

- Contabilizar el espacio de soluciones y ¿Orden de complejidad?

Para contabilizar el espacio de soluciones, aplicamos combinatoria teniendo en cuenta que se trata de un problema de variación con repetición donde hay que tener en cuenta las restricciones del lunes y el viernes:

VR = 10<sup>10</sup> - 2*9<sup>10</sup> + 8<sup>10</sup> = 4.100.173.022

Existen 4.100.173.022 de posibles soluciones.


Este tipo de problemas se categorizan como problemas NP-completos, lo que significa que no existe un algoritmo conocido que pueda encontrar la solución óptima en tiempo polinomial para todas las instancias del problema. En este caso, se requeriría un enfoque heurístico o algoritmos aproximados, que podrían tener una complejidad exponencial en el peor de los casos.

Aplicando un algoritmo de fuerza bruta observaríamos todas las posibles soluciones por lo que la complejidad del problema sería exponencial O(2<sup>n</sup>). Por otro lado, buscando una solución razonable (no necesariamente óptima), la complejidad podría ser lineal o incluso cuadrática, dependiendo del enfoque del algoritmo utilizado.

# Diseño
- ¿Que técnica utilizo? ¿Por qué?

Recocido simulado con la finalidad de obtener una solución óptima con un coste temporal bajo.

In [106]:
import random
import math
import numpy as np
import time

In [77]:
#Horarios: Clave: Día/Hora || Valor: Coeficiente audiencia
dicSchedule = {'V20': 0.4, 'S12': 0.55, 'S16': 0.7, 'S18': 0.8, 'S20': 1, 'D12':0.45, 'D16':0.75, 'D18':0.85, 'D20':1, 'L20':0.4}

#Partidos de la jornada
dicGames = {
    0: ("Celta", "RealMadrid"),
    1: ("Valencia", "RealSociedad"),
    2: ("Mallorca", "Eibar"),
    3: ("Athletic", "Barcelona"),
    4: ("Leganés", "Osasuna"),
    5: ("Villareal", "Granada"),
    6: ("Alavés", "Levante"),
    7: ("Espanyol", "Sevilla"),
    8: ("Betis", "Valladolid"),
    9: ("Atlético", "Getafe")
}

#Categoría de cada equipo por nivel de audiencia
dicCategory = {
    "A": ("RealMadrid", "RealSociedad", "Barcelona"),
    "B": ("Celta", "Valencia", "Athletic", "Villareal", "Alavés","Levante", "Espanyol", "Sevilla", "Betis", "Atlético", "Getafe"),
    "C": ("Mallorca", "Eibar", "Leganés", "Osasuna", "Granada", "Valladolid")
}

In [78]:
## Primero hacer una función que genere un diccionario de los equipos que tenemos y les asigne un
## peso que correspomnda a su categoría.

def asignarCategoria(equipo1,equipo2,categoria):
    peso = 0
    if ((equipo1 in categoria["A"]) and (equipo2 in categoria["A"])):
        peso = 2.0
    if ((equipo1 in categoria["B"]) and (equipo2 in categoria["B"])):
        peso = 0.9 
    if ((equipo1 in categoria["C"]) and (equipo2 in categoria["C"])):
        peso = 0.47
    if((equipo1 in categoria["A"]) and (equipo2 in categoria["B"])) or ((equipo2 in categoria["A"]) and (equipo1 in categoria["B"])):
        peso = 1.3
    if((equipo1 in categoria["A"]) and (equipo2 in categoria["C"])) or ((equipo2 in categoria["A"]) and (equipo1 in categoria["C"])):
        peso = 1.0
    if((equipo1 in categoria["B"]) and (equipo2 in categoria["C"])) or ((equipo2 in categoria["B"]) and (equipo1 in categoria["C"])):
        peso = 0.75
    return peso

def generarJornada(diccionario_original, dicCategory):
    diccionario_nuevo = {}
    for clave, equipos in diccionario_original.items():
        equipo1, equipo2 = equipos
        clave_nueva = f"{equipo1}-{equipo2}"
        peso = asignarCategoria(equipo1,equipo2,dicCategory)  # Darles el valor dependiendo de las categorías
        diccionario_nuevo[clave_nueva] = peso
    return diccionario_nuevo

dicEmparejamientos = generarJornada(dicGames,dicCategory)
        

In [80]:
#Una vez tenemos el diccionario con los emparejamientos y sus niveles de audiencia asociados, tenemos que asignarles de manera
#aleatoria un horario teniendo en cuenta que el lunes y el viernes solo puede haber un partido

def horarioAleatorio(dicEmparejamientos):
    # Separar los horarios en dos grupos: uno que permite múltiples partidos y otro que solo permite un partido
    horarios_multiples = {'S12', 'S16', 'S18', 'S20', 'D12', 'D16', 'D18', 'D20'}
    horarios_unico_partido = {'V20', 'L20'}

    # Inicializar un diccionario para almacenar los emparejamientos asignados a los horarios
    asignaciones = {horario: [] for horario in dicSchedule}

    # Inicializar un diccionario para contar la cantidad de partidos asignados a cada horario
    partidos_por_horario = {horario: 0 for horario in dicSchedule}

    # Asignar aleatoriamente los emparejamientos a los horarios
    for emparejamiento, audiencia in dicEmparejamientos.items():
        if len(horarios_unico_partido) > 0:
            horario_seleccionado = random.choice(list(horarios_unico_partido))
            horarios_unico_partido.remove(horario_seleccionado)
        else:
            horario_seleccionado = random.choice(list(horarios_multiples))
        asignaciones[horario_seleccionado].append((emparejamiento, audiencia))
    return asignaciones
    
    
def aplicarRestricciones(asignaciones,dicSchedule):
    # Calcular los coeficientes de penalización por coincidencia de partidos
    coeficientes_penalizacion = {0: 0, 1: 0, 2: 0.25, 3: 0.45, 4: 0.6, 5: 0.7, 6: 0.75, 7: 0.78, 8: 0.8}
    suma_audiencias = 0
    
    # Aplicar los coeficientes de penalización y mostrar las asignaciones
    for horario, emparejamientos in asignaciones.items():
        # Contar la cantidad de partidos asignados a este horario
        cantidad_partidos = len(emparejamientos)
        # Obtener el coeficiente de penalización correspondiente
        coeficiente_penalizacion = coeficientes_penalizacion.get(cantidad_partidos, 0)
        for idx, (emparejamiento, audiencia) in enumerate(emparejamientos):
            audiencia_total = audiencia * dicSchedule[horario] * (1 - coeficiente_penalizacion)
            asignaciones[horario][idx] = (emparejamiento, audiencia_total)
            suma_audiencias += audiencia_total
    return asignaciones,suma_audiencias

horario = horarioAleatorio(dicEmparejamientos)
horario_restricciones, audiencia_total = aplicarRestricciones(horario,dicSchedule)

print(horario_restricciones)
print(audiencia_total)


{'V20': [('Valencia-RealSociedad', 0.52)], 'S12': [('Mallorca-Eibar', 0.14217500000000002), ('Athletic-Barcelona', 0.3932500000000001), ('Betis-Valladolid', 0.22687500000000005)], 'S16': [], 'S18': [('Alavés-Levante', 0.54), ('Atlético-Getafe', 0.54)], 'S20': [('Espanyol-Sevilla', 0.9)], 'D12': [('Villareal-Granada', 0.3375)], 'D16': [], 'D18': [('Leganés-Osasuna', 0.39949999999999997)], 'D20': [], 'L20': [('Celta-RealMadrid', 0.52)]}
4.519299999999999


In [100]:
##Recocido simulado

###############################################################################
# SIMULATED ANNEALING
###############################################################################

#Funcion de probabilidad para aceptar peores soluciones
def probabilidad(T,d):
  if random.random() <  math.exp( -1*d / T)  :
    return True
  else:
    return False

#Funcion de descenso de temperatura
def bajar_temperatura(T):
  return T*0.99

In [127]:
def recocido_simulado(dicEmparejamientos, dicSchedule, TEMPERATURA ):

    horario = horarioAleatorio(dicEmparejamientos)
    solucion_referencia, distancia_referencia = aplicarRestricciones(horario,dicSchedule)

    mejor_solucion = []
    mejor_distancia = 0
    mejor_resultado = solucion_referencia

    N=0
    while TEMPERATURA > .0001:
        N+=1
        #Genera una solución vecina
        horario = horarioAleatorio(dicEmparejamientos)
        solucion_vecina, distancia_vecina = aplicarRestricciones(horario,dicSchedule)

        #Si es la mejor solución de todas se guarda(siempre!!!)
        if distancia_vecina > mejor_distancia:
            mejor_solucion = solucion_vecina
            mejor_distancia = distancia_vecina

        #Si la nueva vecina es mejor se cambia
        #Si es peor se cambia según una probabilidad que depende de T y delta(distancia_referencia - distancia_vecina)
        if distancia_vecina > distancia_referencia or probabilidad(TEMPERATURA, abs(distancia_referencia - distancia_vecina)):
            solucion_referencia = solucion_vecina
            distancia_referencia = distancia_vecina

        #Bajamos la temperatura
        TEMPERATURA = bajar_temperatura(TEMPERATURA)

    return mejor_solucion, mejor_distancia

inicio = time.time()

sol, dist  = recocido_simulado(dicEmparejamientos, dicSchedule, 10000000)

fin = time.time()
tiempo_ejecucion = fin - inicio

print("La mejor solución encontrada es: \n \n" , end="")
print(sol)
print("\nDistancia total: " , end="")
print(dist)
print("\nTiempo de ejecución:", tiempo_ejecucion, "segundos")

La mejor solución encontrada es: 
 
{'V20': [('Celta-RealMadrid', 0.52)], 'S12': [('Betis-Valladolid', 0.41250000000000003)], 'S16': [('Leganés-Osasuna', 0.32899999999999996)], 'S18': [('Villareal-Granada', 0.6000000000000001)], 'S20': [('Atlético-Getafe', 0.9)], 'D12': [('Mallorca-Eibar', 0.2115)], 'D16': [('Espanyol-Sevilla', 0.675)], 'D18': [('Alavés-Levante', 0.765)], 'D20': [('Athletic-Barcelona', 1.3)], 'L20': [('Valencia-RealSociedad', 0.52)]}

Distancia total: 6.2330000000000005

Tiempo de ejecución: 0.02132582664489746 segundos


## Conclusión

El algoritmo de recocido simulado ofrece una solución óptima en un tiempo relativamente bajo, aunque no siempre garantiza la mejor solución posible. Sin embargo, su eficiencia radica en su capacidad para producir resultados competitivos en un corto periodo de tiempo, especialmente considerando que su complejidad temporal para este caso está en el orden de milisegundos.

Este enfoque de búsqueda heurística es especialmente valioso cuando se enfrenta a problemas complejos donde encontrar la solución óptima en un tiempo razonable es difícil o impracticable debido a la complejidad del espacio de búsqueda. El recocido simulado equilibra la exploración y la explotación del espacio de búsqueda, lo que le permite encontrar soluciones prometedoras mientras evita quedarse estancado en óptimos locales.