<h1 align="center">Práctica 4. Divide y vencerás</h1>
<h3 style="display:block; margin-top:5px;" align="center">Estructuras de datos</h3>
<h3 style="display:block; margin-top:5px;" align="center">Grado en Ciencia de Datos</h3>
<h3 style="display:block; margin-top:5px;" align="center">2023-2024</h3>    
<h3 style="display:block; margin-top:5px;" align="center">Universitat Politècnica de València</h3>
<br>

**Pon/poned aquí tú/vuestros nombre(s):**
- Pablo Pertusa Canales

## Índice
1. ### [Introducción](#intro)
1. ### [Actividad 1: Generar productos y sus cajas](#act1)
1. ### [Actividad 2: Emparejar productos y sus cajas utilizando fuerza bruta](#act2)
1. ### [Actividad 3: Emparejar productos y sus cajas mediante divide y vencerás](#act3)

<a id='intro'></a>
## Introducción

Tenemos N productos caracterizados por su tamaño. Para cada producto se ha fabricado una caja para empaquetarlo. Solamente podemos empaquetar o guardar un producto en la caja que le corresponde (su mismo tamaño), ya que no cabrá en una caja más pequeña y si lo metemos en una caja mayor:

- No será seguro transportarlo, puede moverse en su interior.
- Seguro que el producto adecuado para esa caja quedará sin empaquetar, ya que no hay más cajas que las que se han fabricado para cada producto.

Todo sencillo hasta ahora ¿no? Lamentablemente alguien (llamado `random.shuffle`) ha metido la pata y ha desordenado los productos y no sabemos qué producto va en cada caja.

Para empeorar las cosas, no es posible medir los productos ni medir las cajas (esto se traduce en que está prohibido utilizar el campo `_size` de cajas y productos y en que no es posible usar los operadores de comparación).

La única forma de resolver el problema consiste en utilizar el método `empaquetable` de la clase `Caja` que recibe un producto y devuelve uno de estos 3 mensajes:

- `'encaja'` si tiene el tamaño adecuado.
- `'no cabe'` si el producto es mayor que la caja.
- `'sobra'` si la caja es mayor que el producto.

A continuación se proponen 3 actividades:

1. Familiarizarse con las clases `Producto` y `Caja` y con funciones para generar y comprobar.
2. Resolver el problema por fuerza bruta (probando).
3. Resolver el problema con una técnica de tipo *Divide y vencerás* inspirada en Quicksort.

<a id='act1'></a>
## Actividad 1: Generar productos y sus cajas

Tenemos dos clases Python llamadas, respectivamente, `Producto` y `Caja`. Cada producto debe ser embalado pero solamente puede hacerse con una caja de su mismo tamaño.

Ambas clases tienen un atributo privado `_size`, por lo que **solamente debes acceder de manera indirecta mediante los métodos públicos**. Es decir:

- No debes modificar estas clases en ningún momento.
- Tampoco debes acceder directamente al atributo `_size`.

Hemos sobrecargado los métodos `__eq__` para que siempre devuelvan `False`, por lo que:

- No podremos utilizar estos objetos como clave de un diccionario (o de un conjunto).
- No podremos ver si dos productos o dos cajas son iguales.
- No podremos preguntar si están en una lista.

No hemos definido ni `__lt__` ni similares, por lo que no podemos comparar el tamaño de productos entre sí ni de cajas entre sí.

Los productos y sus respectivas cajas se crean pasándoles el tamaño de las mismas. Es posible que existan varias cajas y productos con el mismo tamaño. Para ver si una caja sirve para un producto hay que llamar al método `empaquetable`:

```python
caja = Caja(1234)
producto = Producto(1234)
print(caja.empaquetable(producto))
```

El método `empaquetable` devuelve uno de estos tres valores:
- `'encaja'` si tiene el tamaño adecuado.
- `'no cabe'` si el producto es mayor que la caja.
- `'sobra'` si la caja es mayor que el producto.

Es peligroso empaquetar un producto en una caja mayor porque puede moverse durante el transporte y romperse. Solamente podremos empaquetar productos en cajas donde el resultado sea `encaja`.

Para resolver el problema por *fuerza bruta* bastaría con saber si encaja o no. La información extra de si no cabe o sobra será vital para resolver el problema mediant *divide y vencerás*.

Estudia las siguientes clases. **No hay que modificar el siguiente código:**

In [10]:
class Producto:
    def __init__(self, size):
        self._size = size
    def __eq__(self, other):
        """
        No está permitido comparar productos.
        Eso impide también usarlos como clave en diccionarios
        o buscarlos en una lista :(
        """
        return False

class Caja:
    def __init__(self, size):
        self._size = size
        
    def __eq__(self, other):
        """
        No está permitido comparar cajas.
        Eso impide también usarlos como clave en diccionarios
        o buscarlas en una lista :(
        """
        return False
    
    def empaquetable(self, producto):
        if self._size == producto._size:
            return 'encaja'
        elif self._size < producto._size:
            return 'no cabe'
        else:
            return 'sobra'

La primera actividad es probar la siguientes funciones para crear 2 vectores de cajas y sus respectivos productos y ver que es posible realizar el empaquetado de todos ellos:

In [11]:
import random

def genera(talla):
    productos = []
    cajas = []
    for i in range(talla):
        sz = random.randint(0,1000_000)
        productos.append(Producto(sz))
        cajas.append(Caja(sz))
    return cajas, productos

A continuación debes comprobar que es posible empaquetar todos los productos en las cajas que ocupan las mismas posiciones en la lista de cajas. Para ello utiliza la siguiente función:

In [12]:
def podemos_empaquetar(cajas, productos):
    if len(cajas) != len(productos):
        return False
    for i,caja in enumerate(cajas):
        if caja.empaquetable(productos[i]) != 'encaja':
            return False
    return True

# también es válida esta otra versión:
def podemos_empaquetar2(cajas, productos):
    return (len(cajas) == len(productos) and
            all(caja.empaquetable(producto) == 'encaja'
                for caja, producto in zip(cajas,productos)))

En este punto debes crear un par de listas de cajas y productos que contengan cada una 10 mil elementos y luego pasárselos a la función `podemos_empaquetar`:

In [13]:
cajas, productos = genera(10_000)
# COMPLETAR para probar que es posible empaquetar los productos con las cajas
podemos_empaquetar(cajas, productos)


True

A continuación utiliza esta otra función para generar cajas y productos donde la lista de productos ha sido desordenada:

In [14]:
def genera_desordenado(talla):
    cajas, productos = genera(talla)
    random.shuffle(productos) # ops! hemos perdido la correspondencia!!! :'(
    return cajas, productos

Crea una lista de cajas y otra de productos de talla 10 mil que estén desordenadas y comprueba que `podemos_empaquetar` devuelve `False`:

In [15]:
cajas, productos = genera_desordenado(10_000)
# COMPLETAR para probar que es posible empaquetar los productos con las cajas
podemos_empaquetar(cajas, productos)

False

<a id='act2'></a>
## Actividad 2:  Emparejar productos y sus cajas utilizando fuerza bruta

En el apartado anterior has creado dos listas con 10 mil cajas y sus respectivos productos, salvo que esos productos están desordenados y, por tanto, no es posible empaquetarlos tal cual.

El objetivo de este apartado es recuperar el orden de los productos (orden que hemos perdido al realizar `random.shuffle` para desordenarlos).

Vamos a utilizar **fuerza bruta** que, como su nombre indica, es MUY INEFICIENTE.

Completa la función `emparejar_fuerza_bruta` que debe devolver una lista con los mismos productos de modo que la función `podemos_empaquetar` devuelva `True`. Para ello:

1. En primer lugar haremos una copia de la lista de productos, de modo que podamos modificar esta lista sin modificar la lista que nos pasan como argumento.
2. A continuación, recorreremos la lista de cajas y, para cada una, buscaremos (en la copia del punto anterior) un producto que encaje y lo quitaremos de esa lista (que es una copia de la que nos pasan, por eso hemos hecho la copia).

    > **Nota:** Es importante quitarlo con `del` y no utilizar el método `remove`, ya que este último dará error porque hace uso de comparaciones y hemos deshabilitado el método `__eq__`. Por este motivo, debes mantener de alguna manera el índice del elemento a borrar (ej: usando `enumerate`).
    
3. Cada vez que encontremos un producto que encaje con la caja visitada, guardaremos el producto en una lista resultado, lo quitaremos de nuestra copia y pararemos el bucle interno (puedes utilizar `break` si quieres).

    > **Nota:** Es importante parar una vez hayamos encontrado el producto. En otro caso podría encontrar otro producto del mismo tamaño y asociar dos productos a una misma caja, lo cual sería incorrecto.
    
4. Al finalizar el bucle hay que devolver la lista resultado.

Tras llamar a la función podremos comprobar que podemos empaquetar esa lista de productos con la lista de cajas utilizada.

In [18]:
def emparejar_fuerza_bruta(cajas, productos):
    """
    Debe devolver una lista con los mismos productos
    reorganizados para que pueda ser embalado por la
    caja de su misma posición
    """
    prods = productos.copy()
    resul = []
    for caja in cajas:
        for i, p in enumerate(prods):
            if caja.empaquetable(p) == 'encaja':
                resul.append(p)
                del prods[i]
                break
    return resul

El siguiente código mide el tiempo que le cuesta emparejar todas las piezas y después comprueba que están bien emparejadas. Lo hemos puesto en 2 celdas porque `%%time` ha de estar al inicio de una celda (sirve para medir el tiempo de ejecución):

In [21]:
%%time
cajas, productos = genera_desordenado(10_000)
productos_ordenado = emparejar_fuerza_bruta(cajas, productos)
podemos_empaquetar(cajas, productos_ordenado)

CPU times: total: 4.27 s
Wall time: 4.29 s


True

Tras un buen rato debe salir algo similar a esto:

```
CPU times: user 7.23 s, sys: 7.23 ms, total: 7.24 s
Wall time: 7.25 s

True
```

**Nota:** es posible que salga un tiempo menor o mayor según la potencia del ordenador y creo que en Windows solamente sale un tiempo (Wall) y no varios (CPU,...).

<a id='act3'></a>
## Actividad 3:  Emparejar productos y sus cajas mediante divide y vencerás

En el apartado anterior hemos emparejado todas las piezas y ha tardado (al menos en mi ordenador) unos 7 segundos (en otro ordenador me ha tardado el doble).

> **Nota:** Lo importante es la diferencia de tiempos con la versión "Divide y vencerás" que veremos a continuación. Lo ideal sería medir estos tiempos para varias tallas y ver la diferencia en el coste asintótico, ya que ambos tienen un coste asintótico distinto y la diferencia aumenta de manera no proporcional conforme aumentamos la talla.

Veamos si aplicando la estrategia "Dividir y Vencer" podemos mejorar esos tiempos.

El objetivo ahora es implementar una función con esta cabecera:

```python
def emparejar_DyV(cajas, productos):
    ...
```

La función devuelve **dos listas** (una lista de cajas y otra de productos en el orden adecuado para empaquetarlos con las cajas de la lista, es decir, que la llamada a `podemos_empaquetar` devuelva `True`).

Para ello vamos a inspirarnos en al algoritmo *Quicksort* eligiendo una caja cualquiera (la primera por ejemplo) que llamaremos *pivote*. Usando la caja pivote vamos a dividir los productos en 3 listas:

- Los productos que no caben en la caja (caja demasiado pequeña).
- Los productos que encajan.
- Los productos para los que la caja sobra (caja demasiado grande).

> **Nota** No hace falta crear 3 listas explícitamente, puedes crear un diccionario:
> ```python
> d = { 'encaja':[], 'no cabe':[], 'sobra':[] }
> ```
> y hacer appends a la clave que devuelva el método `empaquetable` de la clase `Caja`
> Posteriormente puedes acceder y utilizar estas listas para lo que necesites.

Con cualquiera de los productos que encajen (debe existir al menos uno) se dividen las cajas en 3 listas análogas:

- Cajas demasiado grandes para el producto.
- Cajas del tamaño correcto.
- Cajas demasiado pequeñas para el producto.

y luego:

- Ponemos juntas todas las cajas que encajen con el producto y en la otra lista todos los productos que encajen en la caja (puedes utilizar el método `extend` de la clase `list`).
- Llamamos recursivamente con la lista de productos que no encajan (son demasiado grandes) y las cajas más grandes que el producto pivote. Eso nos devolverá 2 lista con las que extenderemos (nuevament `extend`) las listas de cajas y productos, respectivamente.
- Hacemos lo mismo (llamada recursiva) con la lista de productos más pequeños (la caja sobra) y las cajas más pequeñas que el producto.
- Finalmente devolvemos las listas de cajas y productos construidas de esta manera (las listas `rcajas` y `rprod` que hemos ido extendiendo).

> **Nota:** Obviamente hay un caso base que es cuando las lista que nos llegan están vacías.

In [28]:
def emparejar_DyV(cajas, productos):
    rcajas, rprod = [], []
    if len(cajas)>0:
        cajapivot = cajas[0]
        dprods = { 'encaja':[], 'no cabe':[], 'sobra':[] }
        for p in productos:
            dprods[cajapivot.empaquetable(p)].append(p)
        prodEncaja = dprods['encaja'][0]
        cajasPequeñas = []
        cajasIguales = []
        cajasGrandes = []
        for c in cajas:
            if c.empaquetable(prodEncaja) == 'sobra':
                cajasGrandes.append(c)
            elif c.empaquetable(prodEncaja) == 'encaja':
                cajasIguales.append(c)
            else:
                cajasPequeñas.append(c)
        rcajas.extend(cajasIguales)
        rprod.extend(dprods['encaja'])
        l1,l2 = emparejar_DyV(cajasGrandes, dprods['no cabe'])
        rcajas.extend(l1)
        rprod.extend(l2)
        l3, l4 = emparejar_DyV(cajasPequeñas, dprods['sobra'])
        rcajas.extend(l3)
        rprod.extend(l4)
            
    return rcajas, rprod


In [34]:
%%time
cajas, productos = genera_desordenado(10_000)
rcajas, rprods = emparejar_DyV(cajas, productos)
podemos_empaquetar(rcajas, rprods)

CPU times: total: 203 ms
Wall time: 210 ms


True

Si el código es correcto deberá devolver `True`. Además pondrá el tiempo de ejecución. En mi ordenador ha dado la siguiente salida:

```
CPU times: user 117 ms, sys: 2 µs, total: 117 ms
Wall time: 117 ms

True
```

¿Cuántas veces más rápido resulta que la fuerza bruta?

No obstante, puesto que ambos algoritmos tienen un coste asintótico diferente, ese ratio crecerá más y más a medida que aumentemos la talla del problema.

> El que tenga interés y ganas (¡ojo, no se evalúa!) puede probar con diversas tallas de vector para ver la tendencia de ambos algoritmos.
