# Algoritmia
## Práctica Obligatoria 3
### Curso 2022 - 2023
###### Programación dinámica
---
 

#### Autores:
* Pablo Zarzosa Buitrago
* Iñigo Sanz Delgado

---
Resuelva la siguiente práctica.

Importe las librerías que desees
**Recuerda**: 
* Solamente puedes utilizar librerías nativas (https://docs.python.org/es/3.7/library/index.html).
  * <sub><sup>_Importe las librerías que desees._</sup></sub>
* Se recomienda utilizar un entorno con la versión 3.7 (`conda create -n <nombre_entorno> python=3.7`). Más información en https://conda.io/projects/conda/en/latest/user-guide/tasks/manage-environments.html.
* Las funciones que importes no son "gratis", cada una tendrá una complejidad temporal y espacial que se tendrá que tener en cuenta.
* Las funciones que crees, han de estar en una celda que comience por `#testeable` para que se importe en los test.

**Entrega**
* Poner el nombre del fichero como: `<apellidosPrimerAlumno>_<apellidosSegundoAlumno>_voraz.ipynb`.
    * En caso de que el fichero no tenga ese nombre, la entrega tendrá una penalización de **2 puntos**
* Verificar que la entrega no está corrupta.
    * En caso de que la entrega está corrupta, se evaluará con **0 puntos**.
* Ambos alumnos tendrán que hacer la entrega.
    * En caso de que uno no la haga se evaluará como **No presentado**, si las entregas son diferentes tendrá cada una una penalización de **2 puntos** y se corregirán por separado.

In [1]:
#testeable
# Imports utiles

## Datos Perdidos S.L.

In [2]:
#testeable
class BaseDatosCorrupta:
    """
    Clase BaseDatosCorrupta que contiene una cadena de texto corrupta.

    Parameters
    ----------
    cadenaCorrupta : str
        Cadena de texto corrupta, no debe de reemplazarse.
    """
    def __init__(self, cadenaCorrupta):
        self.cadenaCorrupta = cadenaCorrupta
        self.cadenaEncontrada = ""
        self.cadenaCompleta = False

    def recuperacion_datos(self, seq, character_null=""):
        """
        Dadas las cadenas seq, devuelve una subsecuencia de seq y cadenaCorrupta que tiene la longitud máxima de
        todas las subsecuencias comunes.

        Parameters
        ----------
        seq : str
        character_null: str
            Carácter a ignorar
        """
        if character_null == " ":
            # Si character_null es un espacio en blanco, reemplazamos todas las ocurrencias en seq y cadenaCorrupta con ""
            seq = seq.replace(" ", "")
            self.cadenaCorrupta = self.cadenaCorrupta.replace(" ", "")

        # Construimos la matriz de abajo hacia arriba utilizando listas de comprensión
        matriz = [[0] * (len(self.cadenaCorrupta) + 1) for _ in range(len(seq) + 1)]

        # Rellenamos la matriz
        for i in range(1, len(seq) + 1):
            for j in range(1, len(self.cadenaCorrupta) + 1):
                if seq[i - 1] == self.cadenaCorrupta[j - 1] and seq[i - 1] != character_null:
                    matriz[i][j] = matriz[i - 1][j - 1] + 1
                else:
                    matriz[i][j] = max(matriz[i - 1][j], matriz[i][j - 1])

        # matriz[len(seq)][len(self.cadenaCorrupta)] contiene la longitud de la subsecuencia más larga
        # Ahora recuperamos la subsecuencia de caracteres
        subsecuencia = ""
        i = len(seq)
        j = len(self.cadenaCorrupta)
        while i > 0 and j > 0:
            if seq[i - 1] == self.cadenaCorrupta[j - 1] and seq[i - 1] != character_null:
                subsecuencia = seq[i - 1] + subsecuencia
                i -= 1
                j -= 1
            elif matriz[i - 1][j] > matriz[i][j - 1]:
                i -= 1
            else:
                j -= 1

        self.cadenaEncontrada = subsecuencia
        self.cadenaCompleta = len(subsecuencia) == len(seq)

    def get_cadenaEncontrada(self):
        """
        Devuelve los datos encontrados tras la llamada a recuperacion_datos.

        Returns
        -------
        str
        
        """
        return self.cadenaEncontrada

    def encontradaCadenaCompleta(self):
        """
        Indica si la llamada a recuperacion_datos encontró la secuencia de datos 

        Returns
        -------
        bool
        
        """
        return self.cadenaCompleta


### Ministerio de Transporte, Movilidad y Agenda Urbana

In [3]:
#testeable
class RedComarcas:
    """
    Red de comarcas para conectar con carreteras.

    Parameters
    ----------
    nombreComarcas : list
        Lista con los nombres de las comarcas que aparecen en el grafo
    grafo : dict
        Diccionario que contiene un grafo dirigido, la clave es una tupla con el par ("comarcaOrigen", "comarcaDestino")
        el valor de cada clase es el peso del arco, ej: {("c1", "c2"): 1}
    """
    def __init__(self, nombreComarcas, grafo):
        self.nombreComarcas = nombreComarcas
        self.grafo = grafo
        self.distancias = {}
        self.sig = {}

    def calcularRutas(self):
        """
        Calcula la ruta distancias optimas entre cualquier comarca.
        """
        # Inicializamos las distancias y los caminos
        for i in self.nombreComarcas:
            for j in self.nombreComarcas:
                if i == j:
                    self.distancias[(i, j)] = 0
                elif (i, j) in self.grafo:
                    self.distancias[(i, j)] = self.grafo[(i, j)]
                else:
                    self.distancias[(i, j)] = float('inf')
                self.sig[(i, j)] = j

        # Calculamos las distancias y los caminos
        for k in self.nombreComarcas:
            for i in self.nombreComarcas:
                if self.distancias[(i, k)] == float('inf'):
                    continue  # Evita cálculos innecesarios si la distancia es infinita
                for j in self.nombreComarcas:
                    if self.distancias[(i, j)] > self.distancias[(i, k)] + self.distancias[(k, j)]:
                        self.distancias[(i, j)] = self.distancias[(i, k)] + self.distancias[(k, j)]
                        self.sig[(i, j)] = self.sig[(i, k)]

    def distancia(self, origen, destino):
        """
        Devuelve la distancia del camino mínimo ente origen y destino.
        Si no hay camino devuelve None.

        Parameters
        ----------
        string:origen
        string:destino

        Returns
        -------
        int
        """
        # Si no hay camino devuelve None
        if (origen, destino) in self.distancias:
            return self.distancias[(origen, destino)]
        else:
            return None

    def camino(self, origen, destino):
        """
        Devuelve en una lista de nodos el camino mínimo entre origen y destino.
        Si no hay camino devuelve None.

        Parameters
        ----------
        string:origen
        string:destino

        Returns
        -------
        list
            Lista con el nombre de las comarcar a cruzar para llegar al destino, ejemplo:
            Para ir de c1 a c3 pasando por c2: ["c1", "c2", "c3"]
            Para ir de c2 a c3: ["c2", "c3"]

        """
        # Si no hay camino devuelve None
        if (origen, destino) not in self.sig:
            return None
        # Construimos el camino
        camino = [origen]
        # Mientras no lleguemos al destino, añadimos el siguiente nodo
        while origen != destino:
            # Obtenemos el siguiente nodo
            origen = self.sig[(origen, destino)]
            # Lo añadimos al camino
            camino.append(origen)
        return camino


### Caso de ejemplo 1

In [4]:
import unittest

In [5]:
bd_str = "0poeiarhgpaeoLimuxirghpaeiguAnahapeiguhsenighIsabeluseñpgiohsegrpighusdñifRomanghnp688732017202331666heogisdkfjgh9"
bd = BaseDatosCorrupta(bd_str)

class TestBaseDatos(unittest.TestCase):

    def test_cadenaEncontrada1(self):
        bd.recuperacion_datos("Ana Isabel Roman", "")
        self.assertEqual(bd.get_cadenaEncontrada(), "AnaIsabelRoman")

    def test_cadenaEncontrada2(self):
        bd.recuperacion_datos("ES6887320871720233166658", "")
        self.assertEqual(bd.get_cadenaEncontrada(), "688732017202331666")


    def test_contieneCadenaComun1(self):
        bd.recuperacion_datos("Ana Isabel Roman", " ")
        self.assertTrue(bd.encontradaCadenaCompleta())

        bd.recuperacion_datos("Ana Isabel Roman", "")
        self.assertFalse(bd.encontradaCadenaCompleta())

    def test_ignorarCaracterExistene1(self):
        """
        No tiene utilidad, pero es posible ignorar caracteres dentro de la cadena que se busca
        """
        bd.recuperacion_datos("Ana Isabel Roman", "A")
        self.assertEqual(bd.get_cadenaEncontrada(), "naIsabelRoman")

### Caso de ejemplo 2

In [6]:
nombreComarcas = ["Palencia","Burgos","Valladolid","Segovia"]
grafo = {
    ("Palencia", "Segovia"): 1,
    ("Segovia", "Palencia"): 2,
    ("Palencia", "Burgos"): 8,
    ("Burgos", "Valladolid"): 3,
    ("Valladolid", "Palencia"): 4,
    ("Segovia", "Burgos"): 10,
    ("Segovia", "Valladolid"): 9
}

# Origen, destino, red, distancia
pruebas = [
    ["Palencia", "Palencia", ["Palencia"], 0],
    ["Palencia", "Burgos", ["Palencia", "Burgos"], 8],
    ["Palencia", "Valladolid", ["Palencia", "Segovia", "Valladolid"], 10],
    ["Palencia", "Segovia", ["Palencia", "Segovia"], 1],
    ["Burgos", "Palencia", ["Burgos", "Valladolid", "Palencia"], 7],
    ["Burgos", "Burgos", ["Burgos"], 0],
    ["Burgos", "Valladolid", ["Burgos", "Valladolid"], 3],
    ["Burgos", "Segovia", ["Burgos", "Valladolid", "Palencia", "Segovia"], 8],
    ["Valladolid", "Palencia", ["Valladolid", "Palencia"], 4],
    ["Valladolid", "Burgos", ["Valladolid", "Palencia", "Burgos"], 12],
    ["Valladolid", "Valladolid", ["Valladolid"], 0],
    ["Valladolid", "Segovia", ["Valladolid", "Palencia", "Segovia"], 5],
]

red = RedComarcas(nombreComarcas, grafo)
red.calcularRutas()

class TestRedComarcas(unittest.TestCase):

    def test_caminos_correctos1(self):
        for prueba in pruebas:
            self.assertEqual(red.camino(prueba[0], prueba[1]), prueba[2])

    def test_distancias_correctos1(self):
        for prueba in pruebas:
            self.assertEqual(red.distancia(prueba[0], prueba[1]), prueba[3])

In [7]:
if __name__ == "__main__":
    unittest.main(argv=['first-arg-is-ignored'], exit=False)

......
----------------------------------------------------------------------
Ran 6 tests in 0.008s

OK


##### **Tests**

Para probar que tu solución pasa los tests. Utilice el comando:

```bash
$ python tests-py3<version de python> <mi notebook>
```


Los tests necesitan de las librerías numpy y pandas

```bash
$ pip install numpy pandas
```

###### Explicación de los tests
* `test_ej1_cadenaEncontrada`: Comprueba que encuentra la cadena.
* `test_ej1_ignorarCaracterExistente`: Comprueba que es capaz de ignorar un caracter existente.
* `test_ej1_limite`: Comprueba casos límite, como que la cadena esté vacía, que no encuentre ninguna cadena, que el caracter a ignorar no esté en la cadena, etc.
* `test_ej2_caminos_correctos`: Comprueba que encuentra los caminos correctos entre dos ciudades.
* `test_ej2_distancias_correctos`: Comprueba que encuentra las distancias correctas entre dos ciudades.
* `test_ej2_ciudad_inexistente`: Comprueba que el algoritmo no falla en caso de que intente encontrar un camino entre dos ciudades que no existen.

---

### **Informe**
Contesta a las siguientes preguntas.

#### **Complejidad**
1. Método `BaseDatosCorrupta.recuperacion_datos`
    * **Complejidad temporal**: es O(n*m), donde n es la longitud de la cadena seq y m es la longitud de la cadena self.cadenaCorrupta. Esto se debe a que el algoritmo utiliza una matriz de tamaño (n+1) x (m+1) para almacenar los resultados parciales de la programación dinámica
    * **Complejidad espacial**: es O(n*m), ya que la matriz mencionada anteriormente requiere de este espacio para almacenarse en memoria. Además, se utiliza espacio adicional para almacenar la subsecuencia más larga encontrada, que tiene una longitud máxima de min(n,m), lo que da lugar a una complejidad espacial total de O(min(n,m))
2. Método `RedComarcas.calcularRutas`
    * **Complejidad temporal**: es O(n^3), donde n es el número de comarcas en self.nombreComarcas. Esto se debe a que el algoritmo utiliza tres bucles anidados para recorrer todas las combinaciones posibles de comarcas y actualizar las distancias y caminos más cortos utilizando el algoritmo de Floyd-Warshall. La complejidad de este algoritmo es de O(n^3) en el peor de los casos.
    * **Complejidad espacial**: es O(n^2), ya que se utiliza una matriz de tamaño n x n para almacenar las distancias más cortas entre las comarcas y otra matriz de tamaño n x n para almacenar los caminos más cortos entre las comarcas. En total, la complejidad espacial es de O(n^2) porque las matrices de distancias y caminos ocupan este espacio en memoria.

#### **Datos Perdidos S.L.**

* Describa brevemente como sería un método de fuerza bruta (que no se debería de haber implementado en la práctica) para resolver este problema.

El método de fuerza bruta que se podría haber implementado para resolver este problema sería generar todas las subsecuencias posibles de ambas cadenas y compararlas para encontrar la subsecuencia común más larga. Sin embargo, esto sería extremadamente ineficiente, ya que el número de subsecuencias posibles crece exponencialmente con la longitud de las cadenas.

* ¿Cómo serviría de utilidad el algoritmo implementado en un software de control de versiones como git, subversion, bazaar...?

Este algoritmo podría ser muy útil en un software de control de versiones como git, subversion o bazaar, ya que estos sistemas tienen que manejar y fusionar múltiples versiones de archivos.

Cuando dos personas trabajan en diferentes versiones de un archivo, pueden surgir conflictos en las partes que han sido editadas por ambos. El algoritmo LCS podría utilizarse para encontrar la subsecuencia más larga de un archivo que ha sido editada por ambas partes, lo que permitiría al software fusionar las dos versiones de manera inteligente y conservar la mayor cantidad posible de cambios.

#### **Ministerio de Transporte, Movilidad y Agenda Urbana**

* ¿La solución es óptima (minimiza siempre el valor pedido) o es aproximada (encuentra un mínimo local)?

Utilizamos el algoritmo de Floyd-Warshall para calcular la ruta de distancia óptima entre todas las comarcas en el grafo. Este algoritmo es conocido por encontrar la solución exacta al problema del camino más corto en grafos con pesos no negativos, lo que significa que la solución encontrada por el algoritmo es siempre el mínimo global en este tipo de grafos.

* Existiendo el camino a->b con coste 10 y el camino óptimo a->c->b con coste 4+5, describe como tu algoritmo encuentra este segundo.

Si existe un camino directo entre a y b con un costo de 10, y un camino óptimo a través de c con un costo total de 4+5, entonces el algoritmo de Floyd-Warshall primero inicializa todas las distancias a infinito. Luego, establece la distancia entre a y b en 10 y la distancia entre a y c, y entre c y b en 4 y 5 respectivamente.

Luego, el algoritmo comienza a buscar rutas más cortas que las existentes. En este caso, el algoritmo comparará la distancia entre a y b directamente con la distancia entre a y c más la distancia entre c y b. Si la distancia a través de c es menor, entonces el algoritmo actualizará la distancia entre a y b y establecerá que la ruta óptima entre a y b es a través de c.

El algoritmo repite este proceso para cada posible combinación de comarcas en el grafo, de modo que finalmente puede encontrar la ruta más corta entre cualquier par de comarcas en el grafo, incluyendo la ruta óptima entre a y b a través de c.