# Algoritmia
## Práctica Obligatoria 1
### Curso 2024 - 2025
###### Métodos Voraces y Divide y Vencerás
---
 

#### Autores:
* Pablo Martínez Ibáñez
* Marcos Zamorano Lasso

---
Resuelva la siguiente práctica.

Importe las librerías que desees
**Recuerda**: 
* Solamente puedes utilizar bibliotecas nativas (https://docs.python.org/es/3.10/library/index.html) -> Usar una biblioteca no nativa supondrá un 0 en la práctica.
* Las funciones que importes no son "gratis", cada una tendrá una complejidad temporal y espacial que se tendrá que tener en cuenta.
* Solo se ejecutarán en los tests las celdas que comiencen por #TESTEABLE

In [1]:
#TESTEABLE
# Imports

In [4]:
#TESTEABLE
def key_sort(seq, key_function=lambda x: x, reverse=False):
    """Ordena ascendentemente una secuencia in-place utilizando una función clave.

    Parameters
    ----------
    seq : sequence
        Secuencia a ordenar, por ejemplo una lista
    key_function : function
        Función que devuelve para los elementos de la secuencia un valor
        clave para la ordenación, por defecto es la identidad.
    reverse: boolean
        Si es True Invierte el orden de la ordenación.

    Notes
    -----
    No tiene retorno. Ordena en el sitio la secuencia de entrada.
    """
    def _quicksort_inplace(seq, low, high):
        if low < high:
            pivot_idx = _partition(seq, low, high)
            _quicksort_inplace(seq, low, pivot_idx - 1)
            _quicksort_inplace(seq, pivot_idx + 1, high)

    def _partition(seq, low, high):
        pivot = key_function(seq[high])
        i = low - 1
        for j in range(low, high):
            # Comparación basada en reverse
            if (not reverse and key_function(seq[j]) <= pivot) or \
               (reverse and key_function(seq[j]) >= pivot):
                i += 1
                seq[i], seq[j] = seq[j], seq[i]
        seq[i + 1], seq[high] = seq[high], seq[i + 1]
        return i + 1

    _quicksort_inplace(seq, 0, len(seq) - 1)


In [76]:
#TESTEABLE
class Video:
    """
    Clase Video. 
    Representa una serie o película.
    """    
    
    def __init__(self, name, size, fee):
        """Crea un objeto de clase Video

        Parameters
        ----------
        name : str
            Nombre de la serie/película
        size : number
            Tamaño en memoria de la serie/película
        fee : number
            Coste de visualización de la serie/película
        """
        self.name = name
        self.size = size
        self.fee = fee
        self.usuarios = {}
    
    def __hash__(self):
        """Genera el valor hash identificativo del vídeo

        Returns
        -------
        int
            Valor hash
        """

        return self.fee ^ self.size
    
    def __str__(self):
        """Genera una cadena descriptiva del objeto

        Returns
        -------
        str
            Cadena descriptiva
        """
        return f'Video {self.name}'

    
    def __repr__(self):
        """Genera una cadena descriptiva del objeto dentro de colecciones

        Returns
        -------
        str
            Cadena descriptiva
        """
        texto = f"Video [Nombre: {self.name}, Tamaño: {self.size}, Coste: {self.fee}, Pais:Usuarios {{"
        for country, users in self.usuarios.items():
            texto += f"{country}:{users}, "
        texto += "}] "
        #return f'Video [Nombre: {self.name}, Tamaño: {self.size}, Coste: {self.fee}] '
        return texto

       
    def set_users(self, country, users):
        """Dado un pais y un número de usuarios
           almacena para este vídeo la cantidad de espectadores que tiene.

        Parameters
        ----------
        country : str
            País desde donde se ve la serie/película
        users : int
            Número de espectadores
        """

        self.usuarios[country] = users

    
    def get_users(self, country):
        """Dado un país, obtiene el número de usuarios.

        Parameters
        ----------
        country : str
            País desde donde se ve la serie/película

        Returns
        -------
        int
            Número de espectadores para el país `country`
        """        
        return self.usuarios.get(country, 0)
v1 = Video("peli1", 1, 100)
v2 = Video("peli2", 1, 200)
v3 = Video("peli3", 1, 300)
v1.set_users("España", 100)
v2.set_users("Portugal", 150)
v3.set_users("España", 100)
v3.set_users("Portugal", 100)

print(v1)
print(v2)
print(v3)

Video peli1
Video peli2
Video peli3


In [84]:
#TESTEABLE
class ServidorCache:
    """
    Clase del servidor caché donde se almacenan parte de series/películas.
    """
    
    def __init__(self, identifier, country, capacity):
        """Instancia un Servidor de Caché

        Parameters
        ----------
        identifier : int
            Valor que identifica un servidor.
        country : str
            País donde está el servidor.
        capacity : int
            Cantidad de memoria de almacenamiento disponible.
        """
        self.identifier = identifier
        self.country = country
        self.capacity = capacity
        self.videosAlmacenados = {}
        
    def __hash__(self):
        """Genera el valor hash identificativo del servidor

        Returns
        -------
        int
            Valor hash
        """     
        return self.identifier ^ self.capacity
    
    def __str__(self):
        """Genera una cadena descriptiva del objeto

        Returns
        -------
        str
            Cadena descriptiva
        """      
        return f'ServidorCache {self.identifier}'
        
    def __repr__(self):
        """Genera una cadena descriptiva del objeto en colecciones

        Returns
        -------
        str
            Cadena descriptiva
        """      
        return f'ServidorCache [Id: {self.identifier}, Pais: {self.country}, Capacidad: {self.capacity}] '
            
    def rellena(self, videos):
        """Dada una colección de videos,
           seleccionar de cada uno cuanta cantidad (entre 0 y 1)
           se almacena en el servidor.
           Se ha de optimizar para que el tiempo de emisión
           sea el máximo posible.

        Parameters
        ----------
        videos : collection
            Colección de videos que se quieren almacenar en el servidor.
        """

        videos_copia = videos.copy()
        usuarios_por_video = {}

        for video in videos_copia:
            try:
                usuarios_por_video[video] = video.get_users(self.country)
            except KeyError:
                usuarios_por_video[video] = 0

        key_sort(videos_copia, key_function=lambda v: usuarios_por_video[v], reverse=True)

        capacidad_restante = self.capacity
        self.videosAlmacenados.clear()

        for video in videos_copia:
            espectadores = usuarios_por_video[video]

            if espectadores == 0 or video.size <= 0:
                continue

            if capacidad_restante >= video.size:
                self.videosAlmacenados[video] = 1.0
                capacidad_restante -= video.size
            else:
                fraccion = capacidad_restante / video.size
                self.videosAlmacenados[video] = fraccion
                break


    def disponible(self, video):
        """Obtiene la cantidad de vídeo disponible en el servidor.

        Parameters
        ----------
        video : Video object
            Vídeo del cual se quiere saber la disponibilidad

        Returns
        -------
        float
            Cantidad del vídeo disponible          
        """ 
        return self.videosAlmacenados.get(video, 0.0)
    
    def almacenados(self):
        """Material almacenado en el servidor

        Returns
        -------
        set
            Conjunto de tuplas (video, cantidad) de los videos ALMACENADOS en el servidor.
        """
        return self.videosAlmacenados.items()

    def tiempo_emision(self):
        """A partir de los datos almacenados
           devolver número de usuarios satisfechos
           siguiendo la fórmula:
           \\sum_{i}^{v} \\text{espectadores}_i*\\text{size}_i*\\text{cantidadAlmacenada}_i

        Returns
        -------
        number
            Tiempo de Emision
        """
        total_emision = 0.0
        for video, fraccion in self.videosAlmacenados.items():
            espectadores = video.get_users(self.country)
            total_emision += espectadores * video.size * fraccion

        return total_emision

200.0
0.5
0.0
1


In [85]:
#TESTEABLE
class ServidorMaestro:
    """
    Servidor central que gestiona las conexiones entre servidores cache
    """
    
    def __init__(self, servidores, distancias):
        """Instancia el servidor central

        Parameters
        ----------
        servidores : Iterable
            Conjunto de servidores cache disponibles
        distancias : dict{ServidorCache: dict{ServidorCache: int}}
            Grafo de distancias en milisegundos entre servidores.
        """        
        self.servidores = set(servidores)
        self.distancias = distancias

    
    def get_grafo(self):
        """Devuelve el grafo de distancias recibido

        Returns
        -------
        dict{ServidorCache: dict{ServidorCache: int}}
            Grafo de distancias en milisegundos entre servidores.
        """        
        return self.distancias

    def get_grafo_simplificado(self):
        """Devuelve el grafo de distancias simplificado

        Returns
        -------
        dict{ServidorCache: dict{ServidorCache: int}}
            Grafo de distancias en milisegundos entre servidores.
        """        
        # Paso 1: Convertir self.distancias a formato plano para Kruskal
        grafo_arcos = {}
        for s1 in self.distancias:
            for s2 in self.distancias[s1]:
                if (s2, s1) in grafo_arcos:  # Evita duplicados (grafo no dirigido)
                    continue
                grafo_arcos[(s1, s2)] = self.distancias[s1][s2]

        # Paso 2: Ejecutar Kruskal sobre el grafo de aristas
        grafo_minimo = kruskal(grafo_arcos)

        # Paso 3: Convertimos el resultado de nuevo a formato dict de dict
        self.grafo_simplificado = {s: {} for s in self.servidores}
        for (origen, destino), peso in grafo_minimo.items():
            self.grafo_simplificado[origen][destino] = peso
            self.grafo_simplificado[destino][origen] = peso

    def simplifica_grafo(self):
        """A partir del grafo de distancias
           hacer una simplificación de la estrucutra
           de datos para ahorrar espacio y tiempo.
        """
        return getattr(self, "grafo_simplificado", {})
        
    def mas_cercano(self, servidor):
        """Reporta el servidor más cercano al dado por parámetro

        Parameters
        ----------
        servidor : ServidorCache

        Returns
        -------
        ServidorCache
            Servidor más cercano
        """        
        vecinos = self.grafo_simplificado.get(servidor, {})
        if not vecinos:
            return None
        return min(vecinos, key=vecinos.get)

### Caso de ejemplo

In [86]:
import unittest
import json

def carga_dataset(data):
    with open(data) as f:    
        test_datasets = json.load(f)

    videos = list()
    for v in test_datasets["videos"]:
        v_obj = Video(v["name"], v["size"], v["fee"])
        for c, u in v["users"].items():
            v_obj.set_users(c, u)
        videos.append(v_obj)
            
    servers = dict()
    for s in test_datasets["servers"]:
        servers[s["country"]] = ServidorCache(s["identifier"], s["country"], s["size"])

    
    pings = test_datasets["pings"]
    p_ = dict()
    for s in servers.values():
        p_[s] = dict()
        for p in pings[s.country]:
            p_[s][servers[p]] = pings[s.country][p]
    maestro = ServidorMaestro(servers.values(), p_)
    
    return videos, servers, maestro

In [87]:
import random

class TestBasico(unittest.TestCase):
    
    def test_carga_simple(self):

        datos = [random.randint(0, 100) for _ in range(100)]
        ordenados = sorted(datos)
        key_sort(datos)
        self.assertEqual(ordenados, datos)

        v, s, m = carga_dataset("toy.json")

        spain = s["Spain"]
        spain.rellena(v)
        self.assertEqual(spain.tiempo_emision(), 578000)
        almacenados = spain.almacenados()
        self.assertIn((v[3], 0.5), almacenados)
        
        m.simplifica_grafo()
        self.assertEqual(m.mas_cercano(s["Spain"]), s["France"])
        m.simplifica_grafo()
        self.assertEqual(m.mas_cercano(s["Spain"]), s["France"])
        self.assertEqual(m.mas_cercano(s["France"]), s["Spain"])


if __name__ == "__main__":
    unittest.main(argv=['first-arg-is-ignored'], exit=False)

F
FAIL: test_carga_simple (__main__.TestBasico.test_carga_simple)
----------------------------------------------------------------------
Traceback (most recent call last):
  File "/tmp/ipykernel_307/4189745998.py", line 19, in test_carga_simple
    self.assertIn((v[3], 0.5), almacenados)
AssertionError: (Video [Nombre: La sustancia, Tamaño: 400, Coste: 1000, Pais:Usuarios {Spain:400, France:100, Ireland:600, Poland:1000, }] , 0.5) not found in dict_items([(Video [Nombre: The Brutalist, Tamaño: 300, Coste: 1000, Pais:Usuarios {Spain:660, France:200, Ireland:1800, Poland:800, }] , 1), (Video [Nombre: Anora, Tamaño: 100, Coste: 1000, Pais:Usuarios {Spain:200, France:700, Ireland:100, Poland:400, }] , 1), (Video [Nombre: Dune: Parte 2, Tamaño: 200, Coste: 1000, Pais:Usuarios {Spain:300, France:800, Ireland:400, Poland:100, }] , 1), (Video [Nombre: Flow, Tamaño: 500, Coste: 1000, Pais:Usuarios {Spain:600, France:100, Ireland:600, Poland:1000, }] , 0.8)])

-----------------------------------

[Video [Nombre: Anora, Tamaño: 100, Coste: 1000, Pais:Usuarios {Spain:200, France:700, Ireland:100, Poland:400, }] , Video [Nombre: Dune: Parte 2, Tamaño: 200, Coste: 1000, Pais:Usuarios {Spain:300, France:800, Ireland:400, Poland:100, }] , Video [Nombre: The Brutalist, Tamaño: 300, Coste: 1000, Pais:Usuarios {Spain:660, France:200, Ireland:1800, Poland:800, }] , Video [Nombre: La sustancia, Tamaño: 400, Coste: 1000, Pais:Usuarios {Spain:400, France:100, Ireland:600, Poland:1000, }] , Video [Nombre: Flow, Tamaño: 500, Coste: 1000, Pais:Usuarios {Spain:600, France:100, Ireland:600, Poland:1000, }] ]


##### **Tests**

Para probar que tu solución pasa los tests. Utilice el comando:

```bash
$ python tests-py3<version de python> <mi notebook>
```

Los tests necesitan de las librerías `networkx` y `nbformat`

```bash
$ pip install networkx nbformat
```

###### Explicación de los tests
* `test_ejemplo`: Es el mismo que el caso de ejemplo.
* `test_ej1_basic_sort`: Comprueba que se ordenen correctamente listas de números.
* `test_ej1_key_sort`: Comprueba que se ordenan correctamente listas según su función clave.
* `test_ej1_video_sort`: Comprueba que se pueden ordenar vídeos.
* `test_ej2_emision_correcta`: Comprueba que el tiempo de emisión del servidor caché es correcto.
* `test_ej2_sin_espacio`: Comprueba que ante un servidor sin espacio, el tiempo de emisión es 0.
* `test_ej2_espacio_infinito`: Comprueba que ante un servidor con espacio infinito, el tiempo de emisión es el máximo.
* `test_ej2_pais_no_existe`: Comprueba que ante pais que no tiene servidor cache, el tiempo de emisión es 0.
* `test_ej3_estructura_datos_mas_simple`: Comprueba que la estructura de datos que se utiliza para almacenar la red de servidores es más simple que la original.
* `test_ej3_red_servidores_consistente`: Comprueba que la red de servidores es constitente con el mapa original, es decir, no hay conexiones nuevas y los costes son los mismos.
* `test_ej3_sistema_conexo`: Comprueba que la red de servidores cache es conexa.

---

### **Informe**
Contesta a las siguientes preguntas.

#### **Complejidad**

1. Método `key_sort`
    * **Complejidad temporal**: _contesta aquí_
2. Método `ServidorCache.rellena`
    * **Complejidad temporal**: _contesta aquí_
3. Método `ServidorMaestro.simplifica_grafo`
    * **Complejidad temporal**: _contesta aquí_


#### **Ranking de contenidos.**

* ¿Cómo afecta la función clave, que proporciona el criterio de ordenación, a la complejidad temporal del algoritmo?

_Contesta aquí justificando la respuesta_

* ¿Has usado alguna estructura de datos adicional?
_Contesta aquí justificando la respuesta_

#### **Servidores cache.**

* ¿La solución es óptima (maximiza siempre el tiempo de emisión) o es aproximada (encuentra un máximo local)?

_Contesta aquí justificando la respuesta_

* ¿Qué ocurriría si solo se admitiese almacenar vídeos completos en cada servidor?

_Contesta aquí justificando la respuesta_

* ¿Que estructuras de datos has utilizado?

_Contesta aquí justificando la respuesta_

#### **Red de servidores cache**

* ¿La solución es óptima (la red es lo más simple posible) o es aproximada (encuentra un mínimo local)?

_Contesta aquí justificando la respuesta_

* ¿Cómo afecta el número de conexiones entre servidores a la complejidad temporal del algoritmo empleado?

_Contesta aquí justificando la respuesta_

* ¿Qué estructuras de datos has utilizado?

_Contesta aquí justificando la respuesta_