### Universidad de Burgos - Algoritmia - Curso 2022/2023
---
# Práctica Obligatoria 5 - Divide y vencerás
*6 Créditos (15 horas). Peso en la calificación final: 10%*

---

#### Autor:

---


La aplicación de las técnicas de optimización desarrolladas ha supuesto un salto cualitativo en la capacidad comercial de Sopas y Caldos, S.L., propiciando la hiper-automatización de sus líneas de producción y su expansión internacional. Mientras las ventas suben, contándose por millones de unidades, el Departamento de Marketing de la compañía se lamenta: ya no puede obtener con agilidad la popularidad global de cada plato.

Para tratar de solventar esta dificultad, el Departamento de Producción da acceso al Departamento de Marketing al *data warehouse* CUCHARA (*Centralized Unit for Customer History and Analysis of Restaurant Activities*), que contiene un registro con una entrada por cada unidad de plato preparado vendida en todo el mundo.

Ante la incapacidad de manejar la cantidad de información contenida en CUCHARA con sus recursos habituales, la empresa os contrata para ayudar al Departamento de Marketing a calcular de manera eficiente la popularidad de los platos preparados.
# 1. Problemas a resolver
Resuelve los siguientes problemas sobre este mismo notebook. Implementa las funciones indicadas con _pass_.

## 1.1 Ordenar registro de unidades vendidas

CUCHARA es capaz de disponer de la lista de unidades vendidas, ordenada por cualquiera de los campos predefinidos, en tiempo constante (al que habría que añadir un coste lineal para comunicar o copiar los datos). 
Dado que se trata de un sistema en producción muy delicado, Sopas y Caldos S.L. no os proporciona acceso a CUCHARA, y por lo tanto debéis implementar una ordenación lo más eficiente posible para poder avanzar en el desarrollo, trabajando con grandes conjuntos de datos de muestra. Se pide:
1. Implementar un algoritmo de ordenación eficiente, basado en el paradigma Divide y Vencerás, que permita ordenar ascendentemente una secuencia de sopas según un criterio arbitrario. Debe disponerse de un método con los siguientes parámetros: una función que devuelve un valor numérico para cada elemento (clave de ordenación), una secuencia (por ejemplo, una lista) y un parámetro opcional para invertir el sentido de la ordenación. 
2. Comprobar que puede ordenar diferentes secuencias de sopas por criterios como el coste, el id o cualquier otro valor clave.
*NOTA: Dado que el ejercicio consiste en implementar un algoritmo de ordenación, no se permite emplear las funciones de ordenación disponibles en las bibliotecas nativas de Python ni en ninguna otra externa*

## 1.2 Calcular la popularidad de las sopas

Dado un registro de unidades vendidas obtenido de CUCHARA, el Departamento de Marketing necesita contar cuántas unidades se han vendido de cada tipo de plato. El registro de unidades vendidas es simplemente una secuencia que contiene un objeto Sopa de un determinado tipo por cada unidad vendida de ese tipo en todo el mundo. Cada tipo de Sopa se distingue por un id; dado que se venden muchas unidades del mismo plato habrá elementos con el id repetido. Por ejemplo, un posible registro de unidades vendidas podría ser el siguiente:

> Sopa de pollo (id: 0) | Vichyssoise (id: 1) | Caldo montañés (id: 4) | Sopa de cocido (id: 3) | Vichyssoise (id: 1) | Sopa de pollo (id: 0) | Sopa de pollo (id: 0) | Sopa de pollo (id: 0) | Sopa de pollo (id: 0)


Se pide:
1. Diseñar un algoritmo que calcule el número de platos de cada tipo vendidos, recorriendo secuencialmente todo el registro y acumulando las apariciones de cada tipo de plato. Para el caso de la tabla anterior, la salida debería especificar que se han vendido 6 uds. de Sopa de pollo, 2 de Vichyssoise etc.
2. Dado que CUCHARA puede proporcionar los resultados ordenados, asume que dispones del registro de unidades vendidas ordenado por id y explota este hecho para resolver más eficientemente el problema anterior, empleando una estrategia Divide y Vencerás. Observa que, en este caso, en cualquier subsecuencia de elementos consecutivos cuyos extremos coincidan tenemos garantizado que todos los elementos son iguales.
3. Compara de manera empírica los tiempos de ejecución de ambas versiones sobre registros, ordenados por id, de diferentes tamaños.

---
**Recuerda**
* Solamente puedes utilizar librerías nativas (https://docs.python.org/es/3.7/library/index.html).
* Las funciones que importes no son "gratis", cada una tendrá una complejidad temporal y espacial que se tendrá que tener en cuenta.

**Entrega**
* Nombra el fichero a entregar como: `<apellidos>_dv.ipynb`.
* Verifica que la entrega no está corrupta. En caso de que el archivo entregado no pueda abrirse, se evaluará con **0 puntos**.

# 2. Preguntas sobre la actividad
Tras resolver los problemas planteados, responde a las preguntas que se plantean al final de este notebook.

---

# Rúbrica

### Código (6/10)

**Ordenar registro de unidades vendidas (50%)**
* Funcionalidad correcta: 7/10 puntos
* Complejidad temporal de la solución: 2/10 puntos
* Complejidad espacial de la solución: 1/10 puntos

**Calcular la popularidad de las sopas (50%)**
* Funcionalidad correcta: 7/10 puntos
* Complejidad temporal de la solución: 2/10 puntos
* Complejidad espacial de la solución: 1/10 puntos

### Respuesta a las preguntas (4/10)
* Análisis temporal y espacial: 4/10 puntos
* Respuesta al resto de cuestiones planteadas: 6/10 puntos

In [6]:
# Versión ligeramente modificada de la práctica anterior que incluye
# un campo entero id que identifica el tipo de Sopa
class Sopa:
    """
    Clase Sopa. 
    Representa una sopa o caldo.
    """    
    
    def __init__(self, nombre, coste, id):
        """Crea un objeto de clase Sopa

        Parameters
        ----------
        nombre : str
            Nombre de la sopa
        coste : number
            Coste de hacer una olla de sopa
        """
        self.nombre = nombre
        self.coste = coste
        self.id = id
    
    def __hash__(self):
        """Genera el valor hash identificativo de la sopa

        Returns
        -------
        int
            Valor hash
        """        
        pass
    
        return hash(str(self))
    
    def __str__(self):
        """Genera una cadena descriptiva del objeto

        Returns
        -------
        str
            Cadena descriptiva
        """        
        pass
    
        return f"({self.id}){self.nombre} - {self.coste} €"
    
    def __repr__(self):
        """Genera una cadena descriptiva del objeto dentro de colecciones

        Returns
        -------
        str
            Cadena descriptiva
        """  
        pass
        
        return str(self)
    
    """Funciones del profesor"""
    def __eq__(self, obj):
        return self.nombre == obj.nombre and self.id == obj.id
    
    def __lt__(self, obj):
        return self.id < obj.id

In [7]:
def key_sort(seq, key_function=lambda x:x, reverse=False):
    """Ordena ascendentemente una secuencia utilizando una función clave.

    Parameters
    ----------
    seq : sequence
        Secuencia a ordenar, por ejemplo una lista
    key_function : int
        Función que devuelve para los elementos de la secuencia un valor
        clave para la ordenación
    reverse: boolean
        Si es True Invierte el orden de la ordenación.
    
    Notes
    -----
    No tiene retorno. Ordena en el sitio la secuencia de entrada.
    """
    
    pass


In [8]:
def calcula_popularidad(registro, method="bruteforce"):
    """Calcula la popularidad de cada tipo de sopa.

    Parameters
    ----------
    registro : sequence
        Secuencia de unidades vendidas de tipo Sopa
    method: String
        Algoritmo a emplear, 'bruteforce' o 'divideandconquer'.
    
    Returns
    -------
    dict
        Diccionario de tipos únicos de sopa (claves) y unidades
        vedidas de cada tipo (valores). El resultado sólo contiene
        claves para los tipos de sopa con al menos una ud. vendida
        
    Notes
    -----
    Si se emplea el método "divideandconquer" se asume que registro
    está ordenado por tipo de sopa. 
    
    """    
    pass


### Comparación de tiempos de ejecución
Compara de manera empírica a continuación los tiempos de ejecución de ambas versiones de *calcula_popularidad* sobre registros, ordenados por id, de diferentes tamaños. Añade las celdas que necesites.

Utiliza el modulo *time* (https://docs.python.org/3/library/time.html) o simplemente el comando mágico de Jupyter *%time* (
https://ipython.readthedocs.io/en/stable/interactive/magics.html)

Trata de investigar los siguientes aspectos:
* ¿Cómo crece el tiempo de ejecución en función del tamaño de la entrada?
* ¿Sobre qué tamaño máximo podrías calcular la popularidad de las sopas vendidas en un tiempo razonable, utilizando una versión o la otra?

Recuerda que asumimos que partimos del registro de ventas ordenado por id.


**Ejemplo de tests básicos**

---
**CUIDADO**: Este test trivial se proporciona a modo de ejemplo. **Superar este test no implica, ni mucho menos, que la solución a los ejercicios esté correctamente diseñada y/o implementada.**
El alumno puede incluir sus propios test y conjuntos de datos, derivados de los enunciados, para comprobar la corrección de la solución.



In [9]:
import unittest,random

# Catálogo de sopas, caldos y estofados
s0 = Sopa("Sopa de pollo", 2, 0) # nombre, coste, id
s1 = Sopa("Vichyssoise", 4, 1)
s2 = Sopa("Crema de espárragos", 1.5, 2)
s3 = Sopa("Sopa de cocido", 1.2, 3)
s4 = Sopa("Caldo montañés", 5, 4)
s5 = Sopa("Sopa de langosta", 9, 5)

# registro de ventas
registro_test = [s1, s0, s2 ,s3, s1, s3, s4, s0, s0, s0]

class TestKeySort(unittest.TestCase):
    
    def test_basic_sort(self):
        v = list(range(100))
        random.seed = 1234
        random.shuffle(v)
        key_sort(v)
        self.assertEqual(v, list(range(100))) 
    
    def test_sopas_sort(self):
        v = registro_test.copy()
        key_sort(v) # ordena por el criterio de comparación definido en Sopa(id)
        self.assertEqual(v,list(sorted(registro_test)))
        
        key_sort(v, key_function=lambda x:x.coste, reverse=True)
        self.assertEqual(v,list(sorted(registro_test,key=lambda x:x.coste, reverse = True)))

class TestPopularidad(unittest.TestCase):
    
    def test_popularidad_basico(self):
        self.assertDictEqual (calcula_popularidad(registro_test),
                              {s0: 4, s1: 2, s2: 1, s3: 2, s4: 1})
        self.assertDictEqual (calcula_popularidad(sorted(registro_test), method="divideandconquer"),
                              {s0: 4, s1: 2, s2: 1, s3: 2, s4: 1})
        self.assertDictEqual (calcula_popularidad(sorted(registro_test*2), method="divideandconquer"),
                              {s0: 8, s1: 4, s2: 2, s3: 4, s4: 2})
        self.assertDictEqual (calcula_popularidad([s0]*40+[s1]*50+[s2]*60),
                              {s0: 40, s1: 50, s2: 60})  
        self.assertDictEqual (calcula_popularidad([s0]*40+[s1]*50+[s2]*60, method="divideandconquer"),
                              {s0: 40, s1: 50, s2: 60})       

if __name__ == "__main__":
    unittest.main(argv=['first-arg-is-ignored'], exit=False)
    

...
----------------------------------------------------------------------
Ran 3 tests in 0.004s

OK


### **Preguntas sobre la actividad**
Contesta a las siguientes preguntas.


#### **Análisis de la complejidad**

1. Método `key_sort`
    * **Complejidad temporal**: _contesta aquí justificando la respuesta_
    * **Complejidad espacial**: _contesta aquí justificando la respuesta_
    
2. Método `calcular_popularidad`. Asume que el número de sopas distintas es siempre menor que una constante.
    * **Complejidad temporal**: _contesta aquí justificando la respuesta_
    * **Complejidad espacial**: _contesta aquí justificando la respuesta_

#### **Ordenar registro de unidades vendidas**

* ¿Como afecta la funcion clave, que proporciona el criterio de ordenacion, a la complejidad temporal del algoritmo?

_Contesta aquí justificando la respuesta_

* ¿Qué estrategia crees que emplea CUCHARA para devolver el registro ordenado en O(1)?

_Contesta aquí justificando la respuesta_

#### **Calcular popularidad de las sopas**

* ¿Has conseguido mejorar la complejidad temporal mediante la solucion Divide y Venceras? ¿Por que ha mejorado? ¿Cuanto ha mejorado? Pon algunos ejemplos numericos especulativos que relacionen el tamano del problema con el tiempo de ejecucion en ambas versiones. Contrástalos de forma empírica empleando para ello tu implementación.

_Contesta aquí justificando la respuesta_

* Al emplear la versión 'divideandconquer' se asume que la entrada está ordenada por tipo de sopa. Si no es así, la salida de la popularidad de los platos será arbitraria, posiblemente incorrecta. ¿Sería razonable implementar alguna medida para detectar si la entrada no está ordenada?

_Contesta aquí justificando la respuesta_