# Algoritmia
## Práctica 2 - Divide y Vencerás
### Curso 2023 - 2024
---
 

#### Autores:
* Iván Estépar Rebollo
* Jimena Arnaiz González

---
Resuelva la siguiente práctica.

Importe las librerías que desees
**Recuerda**: 
* Solamente puedes utilizar bibliotecas nativas (https://docs.python.org/es/3.8/library/index.html)
* Las funciones que importes no son "gratis", cada una tendrá una complejidad temporal y espacial que se tendrá que tener en cuenta.

In [1]:
#testeable
# imports
import time
import random

In [2]:
#testeable
# Versión ligeramente modificada de la clase Video de la Práctica 1

# Se ha incluido una propiedad 'fee', correspondiente a los costes 
# semanales de licenciamiento del contenido
class Video:
    """
    Clase Video. 
    Representa una serie o película.
    """    
    
    def __init__(self, name, size, fee):
        """Crea un objeto de clase Video

        Parameters
        ----------
        name : str
            Nombre de la serie/película
        size : number
            Tamaño en memoria de la serie/película
        """
        self.name = name
        self.size = size
        self.fee = fee
        
        diccUsuarios = {}
    
    
    
    def __hash__(self):
        """Genera el valor hash identificativo del vídeo

        Returns
        -------
        int
            Valor hash
        """        
    
        return hash(self.name)
    
    
    
    def __str__(self):
        """Genera una cadena descriptiva del objeto

        Returns
        -------
        str
            Cadena descriptiva
        """    
        return f"{self.name}"
    
    
    
    def __repr__(self):
        """Genera una cadena descriptiva del objeto dentro de colecciones

        Returns
        -------
        str
            Cadena descriptiva
        """      
        return str(self)
       
        
        
    def set_users(self, country, users):
        """Dado un pais y un número de usuarios
           almacena para este vídeo la cantidad de espectadores que tiene.

        Parameters
        ----------
        country : str
            País desde donde se ve la serie/película
        users : int
            Número de espectadores
        """        
        
        #Si el país ya está en el diccionario, actualiza la cantidad de usuarios
        if country in self.diccUsuarios:
            self.diccUsuarios[country] += users
        #Si no, se agrega una nueva entrada
        else:
            self.diccUsuarios[country] = users
    
    
    
    def get_users(self, country):
        """Dado un país, obtiene el número de usuarios.

        Parameters
        ----------
        country : str
            País desde donde se ve la serie/película

        Returns
        -------
        int
            Número de espectadores para el país `country`
        """  
    
        return self.diccUsuarios.get(country, 0)
    
    def __le__(self, other):
        """Método de comparación para ordenar Video

        Parameters
        ----------
        other : Video
            El otro objeto Video con el que comparar
        
        Returns
        -------
        bool
            True si self es menor que other, False en otro caso
        """
        return self.fee <= other.fee
    

    def __lt__(self, other):
        """Método de comparación para ordenar Video

        Parameters
        ----------
        other : Video
            El otro objeto Video con el que comparar
        
        Returns
        -------
        bool
            True si self es menor que other, False en otro caso
        """
        return self.fee < other.fee

In [3]:
#testeable
def key_sort(seq, key_function=lambda x:x, reverse=False):
    """Ordena ascendentemente una secuencia utilizando una función clave.

    Parameters
    ----------
    seq : sequence
        Secuencia a ordenar, por ejemplo una lista
    key_function : int
        Función que devuelve para los elementos de la secuencia un valor
        clave para la ordenación
    reverse: boolean
        Si es True Invierte el orden de la ordenación.
    
    Notes
    -----
    No tiene retorno. Ordena en el sitio la secuencia de entrada.
    """      
        
    def merge_sort(v, primero, ultimo):
        medio = 0
        i = 0
        j = 0
        k = 0
        
        if primero < ultimo:
            medio = (primero + ultimo) // 2
            merge_sort(v, primero, medio)
            merge_sort(v, medio + 1, ultimo)
            i = k = primero
            j = medio + 1
            tmp = [None] * (ultimo + 1)
            
            while i <= medio and j <= ultimo:
                if key_function(v[i]) <= key_function(v[j]):
                    tmp[k] = v[i]
                    i += 1
                else:
                    tmp[k] = v[j]
                    j += 1
                k += 1
                
            while i <= medio:
                tmp[k] = v[i]
                k += 1
                i += 1
                
            while j <= ultimo:
                tmp[k] = v[j]
                k += 1
                j += 1
                
            for i in range(primero, ultimo + 1):
                v[i] = tmp[i]
                
               
    merge_sort(seq, 0, len(seq) - 1)  # Pasamos primero y ultimo aquí
    if reverse:
        seq.reverse()
        
 

In [4]:
#testeable
def max_emission_profit(video, forecast, ingresos_por_usuario, method="bruteforce"):
    """Calcula el máximo beneficio obtenible emitiendo un vídeo según 
       la previsión de espectadores disponible.

    Parameters
    ----------
    video : Video
        Vídeo a emitir.
    forecast : iterable
        Previsión de espectadores.
    ingresos_por_usuario: float
        Ingresos brutos que proporciona cada usuario.
    method: String
        Algoritmo a emplear 'bruteforce' o 'divideandconquer'.
    
    Returns
    -------
    float
        Máximo beneficio obtenible.
        
    Notes
    -----
    El máximo beneficio se calcula considerando la mejor combinación 
    posible de momento de inicio y finalización dentro del periodo de 
    forecast, el coste de licenciamiento del vídeo (fee) y los beneficios 
    obtenidos por cada espectador. Si el vídeo no puede emitirse de forma
    rentable, el método devuelve 0.
    'video' debe disponer de una propiedad 'fee' que establece los costes
    de licenciamiento en periodos equivalentes a las previsiones de 'forecast'.
    """      
   
    if method == "divideandconquer":
        return max_emission_profit_divide_conquer(video, forecast, ingresos_por_usuario)
    else:
        return max_emission_profit_bruteforce(video, forecast, ingresos_por_usuario)

def max_emission_profit_bruteforce(video, forecast, ingresos_por_usuario):
    max_profit = 0
    for i in range(len(forecast)):
        for j in range(i + 1, len(forecast) + 1):
            viewers = sum(forecast[i:j])
            total_income = viewers * ingresos_por_usuario
            total_cost = (j - i) * video.fee
            profit = total_income - total_cost
            max_profit = max(max_profit, profit)
    return max_profit


def max_emission_profit_divide_conquer(video, forecast, ingresos_por_usuario):
    def divide_and_conquer(start, end):
        if end - start <= 1:  # Caso base: solo un elemento o ningún elemento
            total_income = sum(forecast[start:end]) * ingresos_por_usuario
            total_cost = video.fee * (end - start)
            return max(0, total_income - total_cost)

        mid = (start + end) // 2
        left_profit = divide_and_conquer(start, mid)
        right_profit = divide_and_conquer(mid, end)

        # Calcular el beneficio de la parte cruzada
        max_left = 0
        max_right = 0
        left_sum = 0
        right_sum = 0
        for i in range(mid - 1, start - 1, -1):
            left_sum += forecast[i]
            total_income = left_sum * ingresos_por_usuario
            total_cost = (mid - i) * video.fee
            max_left = max(max_left, total_income - total_cost)
        
        for j in range(mid, end):
            right_sum += forecast[j]
            total_income = right_sum * ingresos_por_usuario
            total_cost = (j - mid + 1) * video.fee
            max_right = max(max_right, total_income - total_cost)

        cross_profit = max_left + max_right

        return max(left_profit, right_profit, cross_profit)

    return divide_and_conquer(0, len(forecast))




            

In [5]:
#testeable
def optimize_content_grid(videos, forecasts, ingresos_por_usuario, k=None):
    """Obtiene los vídeos rentables para su emisión según la previsión
    de espectadores y los ingresos por usuario.

    Parameters
    ----------
    videos : list of Video
        Vídeos a analizar.
    forecasts : list of list of int
        Secuencia de previsiones para los vídeos
    ingresos_por_usuario: float
        Ingresos brutos que proporciona cada usuario.
    k: int
        Obtiene los k elementos más rentables.
    
    Returns
    -------
    list
        Lista con los k elementos más rentables.
        
    Notes
    -----
    La rentabilidad de los vídeos se considera tomando el periodo
    óptimo de emisión para cada uno. El método sólo devuelve resultados
    con rentabilidad mayor que 0.
    """      
    
    # Calcula la rentabilidad de cada vídeo utilizando el método max_emission_profit
    profits = []
    for video, forecast in zip(videos, forecasts):
        profit = max_emission_profit(video, forecast, ingresos_por_usuario)
        profits.append((video, profit))
    
    # Filtra los resultados para obtener solo aquellos con rentabilidad mayor que 0
    profitable_videos = []
    for video, profit in profits:
        if profit > 0:
            profitable_videos.append((video, profit))
    
    # Ordena los vídeos rentables por su rentabilidad en orden descendente
    profitable_videos.sort(key=lambda x: x[1], reverse=True)
    
    # Si se especifica un valor de k, devuelve los k vídeos más rentables
    if k is not None:
        return [video for video, profit in profitable_videos[:k]]
    
    # Si no se especifica un valor de k, devuelve todos los vídeos rentables
    return [video for video, profit in profitable_videos]
    

### Caso de ejemplo

In [6]:
import unittest,random

# Vídeos de ejemplo para tests
videos_test = [Video("Vikings: Valhalla", 150, 1500), #Título, tamaño, fee
               Video("New Amsterdam", 56, 980),
               Video("Juego de Tronos",152, 2500),
               Video("La casa de papel", 76, 800),
               Video("Breaking Bad", 160, 1230),
               Video("Pasión de gavilanes", 125, 350),
               Video("The Sinner", 89, 1900),
               Video("El Cid", 35, 410),
               Video("Raised by wolves",80, 1900),
               Video("Euphoria",90, 2000),
               Video("Peacemaker",40, 1000)]

# Audiencias previstas para los anteriores
forecasts_test = [[ 500, 1000, 2000,  150, 2000, 1500,  200, 1200,  700],
                  [1000,  800,  500,  250, 4000,  500,  100,  200,  300],
                  [1200, 1000,  900,  900, 1220, 1100,  900, 1000, 1000],
                  [ 900,  700,  500,  200, 1600,  200,  300,  250,  100],
                  [ 600,  900, 1240,  250, 2100, 1000,  350, 1000,  800],
                  [ 190, 1060,  500,  200,  250,  700,  200,  400,  400],
                  [ 150, 1100, 2500,  600,  800, 3000,  200, 1000,  900],
                  [ 160,  100,  200,  200,  150,  200,   50,  200,  190],
                  [ 900,  850,  960,  950, 1100,  100,  350,  900,  800],
                  [ 600,  900, 1200,  300, 1900, 1000,  650,  850,  800],
                  [ 510,  500,  500,  500,  500,  500,  500,  500,  510]]

class TestBasico(unittest.TestCase):

    def test_basic_sort(self):
        v = list(range(100))
        random.seed = 1234
        random.shuffle(v)
        key_sort(v)
        self.assertEqual(v, list(range(100))) 

    def test_max_profit(self):   
        for m in ["bruteforce", "divideandconquer"]:
            self.assertEqual(max_emission_profit(Video("test", 99, 1), [1]*10, 1, method=m), 0)
            self.assertEqual(max_emission_profit(Video("test", 99, 1), [1]*10, 1, method=m), 0)
            self.assertEqual(max_emission_profit(Video("test", 99, 1), [2]*10, 1, method=m), 10)


        
if __name__ == "__main__":
    unittest.main(argv=['first-arg-is-ignored'], exit=False)

..
----------------------------------------------------------------------
Ran 2 tests in 0.002s

OK


##### **Tests**

Para probar que tu solución pasa los tests. Utilice el comando:

```bash
$ python tests-py3<version de python> <mi notebook>
```

Los tests necesitan de la librería `nbformat`

```bash
$ pip install nbformat
```

###### Explicación de los tests
* `test_ej1_basic_sort`: Comprueba que se ordenen correctamente listas de números.
* `test_ej1_key_sort`: Comprueba que se ordenan correctamente listas según su función clave.
* `test_ej1_video_sort`: Comprueba que se pueden ordenar vídeos.
* `test_ej2_max_profit`: Comprueba que se obtiene el beneficio máximo tanto por fuerza bruta como por divide y vencerás para listas de números simples.
* `test_ej2_max_profit_dataset`: Comprueba que se obtiene el beneficio máximo tanto por fuerza bruta como por divide y vencerás para listas más complejas.
* `test_ej2_optimize_content_grid`: Comprueba el buen desempeño de la función `optimize_content_grid`.

---

### **Informe**
Contesta a las siguientes preguntas.

#### **Complejidad**

1. Método `key_sort`
    * **Complejidad temporal**: El tiempo de ejecución total es O(n log n). Esto se debe a que la lista se divide por la mitad logarítmicamente y cada división requiere recorrer la lista completa para combinar las sublistas.
2. Método `max_emission_profit`
    * **Complejidad temporal**:
   <br>Bruteforce:<br>
El método max_emission_profit_bruteforce utiliza dos bucles anidados para iterar sobre todas las combinaciones posibles de inicio y finalización del vídeo en el periodo de pronóstico.
La complejidad temporal de este enfoque es O(n^2), donde 'n' es la longitud de la previsión de espectadores.
<br>Divide and Conquer:<br>
El método max_emission_profit_divide_conquer divide recursivamente el problema en subproblemas de tamaño n/2 y combina sus soluciones.
La complejidad temporal de este enfoque es O(n log n), ya que la división y combinación se realizan en cada nivel del árbol de recursión, y en cada nivel hay O(n) operaciones.
2. Método `optimize_content_grid`
    * **Complejidad temporal**: 
El método calcula la rentabilidad de cada vídeo llamando al método max_emission_profit para cada uno.
Luego, filtra los vídeos rentables y los ordena según su rentabilidad.
Finalmente, devuelve los k vídeos más rentables si se especifica un valor de k, de lo contrario, devuelve todos los vídeos rentables.
La complejidad temporal de este método depende en gran medida del método max_emission_profit.
Si consideramos el método max_emission_profit:
El método max_emission_profit_bruteforce tiene una complejidad de O(n^2).
El método max_emission_profit_divide_conquer tiene una complejidad de O(n log n).
Por lo tanto, la complejidad temporal del método optimize_content_grid sería al menos O(n^2) si se utiliza max_emission_profit_bruteforce y O(n log n) si se utiliza max_emission_profit_divide_conquer.


#### **Ranking de contenidos.**

* ¿Cómo afecta la función clave, que proporciona el criterio de ordenación, a la complejidad temporal del algoritmo?

La función clave puede afectar la complejidad temporal del algoritmo dependiendo de cómo esté implementada. En el caso del algoritmo de ordenación Merge Sort, la función clave se aplica para calcular los valores que se utilizan para comparar los elementos durante la ordenación. La función clave es llamada nlogn veces en el peor de los casos (una vez por cada elemento durante la combinación de las sublistas), por lo tanto, su complejidad temporal puede afectar a la complejidad total del algoritmo.

Si la función clave tiene una complejidad temporal significativa, esto se suma a la complejidad del algoritmo de ordenación. Por ejemplo, si la función clave tiene una complejidad de O(k), donde k es el tamaño de los elementos que están siendo procesados, entonces la complejidad total del algoritmo podría ser O(n*log(n)*k)

#### **Optimización de la compra de contenidos.**

* ¿Has conseguido mejorar la complejidad temporal mediante la solución Divide y Vencerás? 
* ¿Por qué ha mejorado? ¿Cuánto ha mejorado? <br>
<sub>Pon algunos ejemplos numéricos especulativos que relacionen el tamaño del problema con el tiempo de ejecución en ambas versiones. Contrástalos de forma empírica empleando para ello tu implementación.</sub>

Sí, se ha mejorado la complejidad temporal mediante la solución Divide y Vencerás. El método max_emission_profit_divide_conquer tiene una complejidad temporal de O(n log n), mientras que el método max_emission_profit_bruteforce tiene una complejidad temporal de O(n^2).
<br>
<br>
La mejora se debe a que el enfoque de Divide y Vencerás divide el problema en subproblemas más pequeños y luego combina sus soluciones, lo que permite reducir la complejidad total del algoritmo. El enfoque de fuerza bruta, por otro lado, examina todas las combinaciones posibles, lo que resulta en una complejidad cuadrática.
<br>
<br>
Ejemplos numéricos especulativos y empíricos:<br>
Supongamos que tenemos una lista de previsiones de espectadores para un vídeo con diferentes longitudes, y queremos comparar los tiempos de ejecución de los dos métodos. Vamos a tomar longitudes de 100, 1000 y 10000 para fines de comparación.<br>
<br>Para el enfoque de fuerza bruta:
<br>Longitud 100: 100^2 = 10,000 operaciones
<br>Longitud 1000: 1000^2 = 1,000,000 operaciones
<br>Longitud 10000: 10000^2 = 100,000,000 operaciones
<br><br>Para el enfoque de Divide y Vencerás:
<br>Longitud 100: 100 log(100) ≈ 664 operaciones
<br>Longitud 1000: 1000 log(1000) ≈ 9965 operaciones
<br>Longitud 10000: 10000 log(10000) ≈ 132878 operaciones

In [7]:
def generate_forecast(length):
    return [random.randint(1, 100) for _ in range(length)]

def measure_execution_time(func, *args):
    start_time = time.time()
    func(*args)
    end_time = time.time()
    return end_time - start_time


# Tamaños de entrada
input_sizes = [10, 100, 1000, 1500, 2000, 2500, 3000]

for size in input_sizes:
    forecast = generate_forecast(size)
    video = Video("Sample", 1, 1)  # Creamos un video de ejemplo
    ingresos_por_usuario = 10  # Ingresos brutos por usuario

    # Medimos el tiempo de ejecución para el enfoque de fuerza bruta
    brute_force_time = measure_execution_time(max_emission_profit_bruteforce, video, forecast, ingresos_por_usuario)

    # Medimos el tiempo de ejecución para el enfoque de divide y vencerás
    divide_conquer_time = measure_execution_time(max_emission_profit_divide_conquer, video, forecast, ingresos_por_usuario)

    print(f"Tamaño de entrada: {size}")
    print(f"Tiempo de ejecución para fuerza bruta: {brute_force_time:.6f} segundos")
    print(f"Tiempo de ejecución para divide y vencerás: {divide_conquer_time:.6f} segundos")
    print("-----------------------")


Tamaño de entrada: 10
Tiempo de ejecución para fuerza bruta: 0.000000 segundos
Tiempo de ejecución para divide y vencerás: 0.000000 segundos
-----------------------
Tamaño de entrada: 100
Tiempo de ejecución para fuerza bruta: 0.003125 segundos
Tiempo de ejecución para divide y vencerás: 0.000000 segundos
-----------------------
Tamaño de entrada: 1000
Tiempo de ejecución para fuerza bruta: 1.281004 segundos
Tiempo de ejecución para divide y vencerás: 0.003000 segundos
-----------------------
Tamaño de entrada: 1500
Tiempo de ejecución para fuerza bruta: 3.972881 segundos
Tiempo de ejecución para divide y vencerás: 0.000000 segundos
-----------------------
Tamaño de entrada: 2000
Tiempo de ejecución para fuerza bruta: 9.147976 segundos
Tiempo de ejecución para divide y vencerás: 0.015625 segundos
-----------------------
Tamaño de entrada: 2500
Tiempo de ejecución para fuerza bruta: 17.617364 segundos
Tiempo de ejecución para divide y vencerás: 0.009633 segundos
-----------------------


Como se puede observar en las ejecuciones anteriores,  definitivamente se ha mejorado la complejidad temporal 
mediante la solución Divide y Vencerás. 
En el análisis presentado, podemos ver que a medida que el tamaño de 
entrada aumenta, el tiempo de ejecución de la solución de fuerza bruta crece significativamente más rápido
que el de la solución de divide y vencerás.