### Conjunto de problemas (estructuras de datos básicas y heaps)

Temas cubiertos:

  - Estructuras de datos básicas
  - Estructuras de datos heap
  - Uso de heaps y arreglos para implementar funcionalidades interesantes.

### Problema 1 (estructura de datos para los k elementos menores)

Hemos visto cómo los min-heaps permiten consultar eficientemente el elemento mínimo en un heap (arreglo). En este ejercicio, queremos modificar los min-heaps para diseñar una estructura de datos que mantenga los __k elementos menores__ para un dado $k \geq 1$, siendo $$k = 1$$ la estructura de datos de min-heap.

Nuestro diseño consiste en mantener dos arreglos:
  - (a) un arreglo ordenado A de $k$ elementos que conforma nuestros k elementos menores; y
  - (b) un min-heap H con los restantes $n-k$ elementos.

La estructura de datos será un par de arreglos (A, H) con la siguiente propiedad:
 - H debe ser un min-heap.
 - A debe estar ordenado y tener tamaño $k$.
 - Cada elemento de A debe ser menor que cada elemento de H.

Las operaciones clave a implementar en esta asignación incluyen:
  - Insertar un nuevo elemento en la estructura de datos
  - Eliminar un elemento existente de la estructura de datos.

Primero se te pedirá diseñar la estructura de datos y luego implementarla.

#### (A) Diseña el algoritmo de inserción

Supón que deseas insertar un nuevo elemento con clave $j$ en esta estructura de datos. Describe el pseudocódigo. Tu pseudocódigo debe abordar dos casos: cuando el elemento insertado $j$ estaría entre los k elementos menores (es decir, pertenece al arreglo A); o cuando el elemento insertado pertenece al heap H. ¿Cómo distinguirías entre ambos casos?

- Puedes asumir que las operaciones de heap, como insert(H, key) y delete(H, index), están definidas.
- Asume que el heap está indexado como H[1], ..., H[n-k], siendo H[0] no utilizado.
- Asume que $n > k$, es decir, ya existen más de $k$ elementos en la estructura de datos.

¿Cuál es la complejidad de la operación de inserción en el peor caso en términos de $k$ y $n$?


Tu respuesta aquí

#### (B) Diseña el algoritmo de eliminación

Supón que deseas eliminar el índice $j$ del arreglo top-k $A$. Diseña un algoritmo para realizar esta eliminación. Asume que el heap no está vacío; en caso contrario, se puede asumir que la eliminación falla.

- Puedes asumir que las operaciones de heap, como insert(H, key) y delete(H, index), están definidas.
- Asume que el heap está indexado como H[1], ..., H[n-k] (con H[0] sin usar).
- Asume que $n > k$, es decir, ya existen más de $k$ elementos en la estructura de datos.

¿Cuál es la complejidad de la operación de inserción en el peor caso en términos de $k$ y $n$?


Tu respuesta aquí

#### (C) Programa tu solución completando el código a continuación

Ten en cuenta que, aunque el diseño de tu algoritmo asume que estás insertando y eliminando en casos donde $n \geq k$, la implementación de la estructura de datos a continuación debe manejar el caso en que $n < k$ también. Hemos proporcionado implementaciones para esa parte para ayudarte.

In [None]:
# Completemos primero la implementación de una estructura de min-heap.
# Por favor, completa las partes faltantes a continuación.

class MinHeap:
    def __init__(self):
        self.H = [None]  # Usamos H[0] como posición sin usar
 
    def size(self):
        return len(self.H) - 1
    
    def __repr__(self):
        return str(self.H[1:])
        
    def satisfies_assertions(self):
        for i in range(2, len(self.H)):
            assert self.H[i] >= self.H[i // 2], f'La propiedad de min-heap falla en la posición {i // 2}, elemento padre: {self.H[i // 2]}, elemento hijo: {self.H[i]}'
    
    def min_element(self):
        return self.H[1]

    # Función bubble_up en el índice dado
    # ADVERTENCIA: esta función se ha copiado y pegado para el siguiente problema también
    def bubble_up(self, index):
        assert index >= 1
        if index == 1:
            return
        # Completa el codigo
    
    # Función bubble_down en el índice dado
    # ADVERTENCIA: esta función se ha copiado y pegado para el siguiente problema también
    def bubble_down(self, index):
        assert index >= 1 and index < len(self.H)
        # Completa el codigo
        # Aplica bubble_down en el índice del hijo menor
        self.bubble_down(min_child_index)
        
    # Función: insert (inserta un elemento en el heap)
    # Usa las funciones bubble_up y bubble_down
    def insert(self, elt):
        self.H.append(elt)
        self.bubble_up(len(self.H) - 1)
        
    # Función: delete_min (elimina el elemento mínimo del heap)
    def delete_min(self):
        if self.size() == 0:
            raise Exception("El heap está vacío")

        self.H[1] = self.H[-1]
        # Elimina el último elemento
        self.H.pop()
        if self.size() > 0:  # Si aún queda algún elemento, aplica bubble_down
            self.bubble_down(1)

In [None]:
h = MinHeap()
print('Insertando: 5, 2, 4, -1 y 7 en ese orden.')
h.insert(5)
print(f'\t Heap = {h}')
assert(h.min_element() == 5)
h.insert(2)
print(f'\t Heap = {h}')
assert(h.min_element() == 2)
h.insert(4)
print(f'\t Heap = {h}')
assert(h.min_element() == 2)
h.insert(-1)
print(f'\t Heap = {h}')
assert(h.min_element() == -1)
h.insert(7)
print(f'\t Heap = {h}')
assert(h.min_element() == -1)
h.satisfies_assertions()

print('Eliminando el menor elemento')
h.delete_min()
print(f'\t Heap = {h}')
assert(h.min_element() == 2), 'El elemento mínimo del heap ya no es 2'
h.delete_min()
print(f'\t Heap = {h}')
assert(h.min_element() == 4)
h.delete_min()
print(f'\t Heap = {h}')
assert(h.min_element() == 5)
h.delete_min()
print(f'\t Heap = {h}')
assert(h.min_element() == 7)
h.delete_min()
print(f'\t Heap = {h}')
print('All tests passed: 10 points!')

In [None]:
class TopKHeap:
    
    # Constructor: inicializa una estructura de datos vacía
    def __init__(self, k):
        self.k = k
        self.A = []
        self.H = MinHeap()
        
    def size(self):
        return len(self.A) + self.H.size()
    
    def get_jth_element(self, j):
        assert 0 <= j < self.k
        assert j < self.size()
        return self.A[j]
    
    def satisfies_assertions(self):
        # Verificar que A esté ordenado
        for i in range(len(self.A) - 1):
            assert self.A[i] <= self.A[i + 1], f'El arreglo A no está ordenado en la posición {i}: {self.A[i]}, {self.A[i+1]}'
        # Verificar que H sea un heap (propiedad de min-heap)
        self.H.satisfies_assertions()
        # Verificar que cada elemento de A sea menor o igual que el elemento mínimo de H
        for i in range(len(self.A)):
            assert self.A[i] <= self.H.min_element(), f'El elemento A[{i}] = {self.A[i]} es mayor que el elemento mínimo del heap {self.H.min_element()}'
        
    # Función: insert_into_A
    # Esta función auxiliar inserta un elemento 'elt' en self.A.
    # Si el tamaño es menor que k, simplemente se agrega 'elt' al final del arreglo A
    # y se reubica para que A permanezca ordenado.
    def insert_into_A(self, elt):
        print("k =", self.k)
        assert(self.size() < self.k)
        self.A.append(elt)
        j = len(self.A) - 1
        while j >= 1 and self.A[j] < self.A[j - 1]:
            # Intercambiar A[j] y A[j-1]
            (self.A[j], self.A[j - 1]) = (self.A[j - 1], self.A[j])
            j = j - 1
        return
    
    # Función: insert -- inserta un elemento en la estructura de datos
    # El código para el caso cuando self.size() < self.k ya está proporcionado
    def insert(self, elt):
        size = self.size()
        # Si tenemos menos de k elementos, se maneja de forma especial
        if size <= self.k:
            self.insert_into_A(elt)
            return
        # Escribe tu algoritmo a partir de aquí:
        else:
            if elt < self.A[-1]:
                self.H.insert(self.A[-1])
                self.A = self.A[0:-1]
                self.A.append(elt)
                j = len(self.A) - 1
                while j >= 1 and self.A[j] < self.A[j - 1]:
                    (self.A[j], self.A[j - 1]) = (self.A[j - 1], self.A[j])
                    j = j - 1
                self.H.bubble_up(self.H.size())
            else:
                self.H.insert(elt)
        return
    
    # Función: delete_top_k
    # Elimina un elemento del arreglo A, es decir, elimina el elemento en la posición j (donde j = 0 es el menor)
    # j debe estar en el rango de 0 a self.k - 1
    def delete_top_k(self, j):
        k = self.k
        assert self.size() > k  # se asume que hay más de k elementos
        assert j >= 0
        assert j < self.k
        # Completa el código
        

In [None]:
h = TopKHeap(5)
# Forzar el arreglo A
h.A = [-10, -9, -8, -4, 0]
# Forzar el heap con estos elementos
[h.H.insert(elt) for elt in [1, 4, 5, 6, 15, 22, 31, 7]]

print('Estructura de datos inicial: ')
print('\t A = ', h.A)
print('\t H = ', h.H)

# Insertar el elemento -2
print('Test 1: Insertando el elemento -2')
h.insert(-2)
print('\t A = ', h.A)
print('\t H = ', h.H)
assert h.A == [-10, -9, -8, -4, -2]
assert h.H.min_element() == 0, 'El elemento mínimo del heap ya no es 0'
h.satisfies_assertions()

print('Test2: Insertando el elemento -11')
h.insert(-11)
print('\t A = ', h.A)
print('\t H = ', h.H)
assert h.A == [-11, -10, -9, -8, -4]
assert h.H.min_element() == -2
h.satisfies_assertions()

print('Test 3 delete_top_k(3)')
h.delete_top_k(3)
print('\t A = ', h.A)
print('\t H = ', h.H)
h.satisfies_assertions()
assert h.A == [-11, -10, -9, -4, -2]
assert h.H.min_element() == 0
h.satisfies_assertions()

print('Test 4 delete_top_k(4)')
h.delete_top_k(4)
print('\t A = ', h.A)
print('\t H = ', h.H)
assert h.A == [-11, -10, -9, -4, 0]
h.satisfies_assertions()

print('Test 5 delete_top_k(0)')
h.delete_top_k(0)
print('\t A = ', h.A)
print('\t H = ', h.H)
assert h.A == [-10, -9, -4, 0, 1]
h.satisfies_assertions()

print('Test 6 delete_top_k(1)')
h.delete_top_k(1)
print('\t A = ', h.A)
print('\t H = ', h.H)
assert h.A == [-10, -4, 0, 1, 4]
h.satisfies_assertions()
print('Pasamos todas las pruebas')

### Problema 2: Estructura de heap para mantener/extrayer la mediana

Hemos visto cómo los min-heaps permiten extraer eficientemente el elemento mínimo y mantenerlo al insertar/eliminar elementos. De forma similar, los max-heaps mantienen el elemento máximo. En este ejercicio, combinamos ambos para mantener el elemento "mediana".

La mediana es el elemento central de una lista de números. 
- Si la lista tiene tamaño $n$ (impar), la mediana es el elemento $(n-1)/2^{th}$ (recordando que el índice 0 es el menor y el índice $(n-1)$ el mayor).
- Si $n$ es par, se define la mediana como el promedio del elemento $(n/2-1)^{th}$ y $(n/2)^{th}$.

##### **Ejemplo**

- La lista $[-1, 5, 4, 2, 3]$ tiene tamaño $5$, la mediana es el 2° elemento (recordando que el primer elemento es el 0°) que es $3$.
- La lista $[-1, 3, 2, 1]$ tiene tamaño $4$. La mediana es el promedio del 1° elemento (1) y el 2° elemento (2), es decir, $1.5$.

##### **Mantener la mediana usando dos heaps**

Los datos se mantendrán como la unión de los elementos de dos heaps: $H_{\min}$ (min-heap) y $H_{\max}$ (max-heap). Se mantendrá el siguiente invariante:
  - El elemento máximo de $H_{\max}$ será menor o igual que el elemento mínimo de $H_{\min}$.
  - Los tamaños de $H_{\max}$ y $H_{\min}$ serán iguales (si el número de elementos es par) o $H_{\max}$ puede tener un elemento menos que $H_{\min}$ (si el número de elementos es impar).

##### **(A) Diseña el algoritmo de inserción**

Supón que la estructura de datos actual se divide entre $H_{\max}$ y $H_{\min}$ y deseas insertar un elemento $e$. Describe el algoritmo para insertar, decidiendo en cuál de los dos heaps se insertará $e$ y cómo mantener la condición de equilibrio de tamaños.

Describe el algoritmo a continuación y la complejidad global de la operación de inserción. (Esta parte no será calificada).

Tu respuesta aquí

##### **(B) Diseña el algoritmo para encontrar la mediana**

Implementa un algoritmo para obtener la mediana dados los heaps $H_{\min}$ y $H_{\max}$. ¿Cuál es su complejidad?

Tu respuesta aquí

##### **(C) Implementa el algoritmo**

Completa la implementación para la estructura de datos max-heap.
Primero completa la implementación de MaxHeap. Aunque podrías copiar y pegar partes relevantes de problemas anteriores, se recomienda escribir una única implementación que pueda servir tanto para min-heap como para max-heap en función de un flag (bandera).

In [None]:
class MaxHeap:
    def __init__(self):
        self.H = [None]  # H[0] no se usa
        
    def size(self):
        return len(self.H) - 1
    
    def __repr__(self):
        return str(self.H[1:])
        
    def satisfies_assertions(self):
        for i in range(2, len(self.H)):
            # En max-heap, cada hijo debe ser menor o igual que su padre
            assert self.H[i] <= self.H[i // 2], f'La propiedad de max-heap falla en la posición {i // 2}, elemento padre: {self.H[i // 2]}, elemento hijo: {self.H[i]}'
    
    def max_element(self):
        return self.H[1]
    
    def bubble_up(self, index):
        # Completa el código: sube el elemento en el heap hasta restaurar la propiedad de max-heap
        
            
    def bubble_down(self, index):
        # Completa el código: baja el elemento en el heap hasta restaurar la propiedad de max-heap
               
    # Función: insert
    # Inserta un elemento en el max-heap usando bubble_up
    def insert(self, elt):
        self.H.append(elt)
        self.bubble_up(self.size())
        
    # Función: delete_max
    # Elimina el elemento máximo del heap usando bubble_down
    def delete_max(self):
        if self.size() == 0:
            return
        if self.size() == 1:
            self.H.pop()
            return
        self.H[1] = self.H.pop()
        self.bubble_down(1)

In [None]:
h = MaxHeap()
print('Insertando: 5, 2, 4, -1 y 7 en ese orden.')
h.insert(5)
print(f'\t Heap = {h}')
assert(h.max_element() == 5)
h.insert(2)
print(f'\t Heap = {h}')
assert(h.max_element() == 5)
h.insert(4)
print(f'\t Heap = {h}')
assert(h.max_element() == 5)
h.insert(-1)
print(f'\t Heap = {h}')
assert(h.max_element() == 5)
h.insert(7)
print(f'\t Heap = {h}')
assert(h.max_element() == 7)
h.satisfies_assertions()

print('Eliminando el maximo elemento')
h.delete_max()
print(f'\t Heap = {h}')
assert(h.max_element() == 5)
h.delete_max()
print(f'\t Heap = {h}')
assert(h.max_element() == 4)
h.delete_max()
print(f'\t Heap = {h}')
assert(h.max_element() == 2)
h.delete_max()
print(f'\t Heap = {h}')
assert(h.max_element() == -1)
h.delete_max()
print(f'\t Heap = {h}')
print('Pasaste todas las pruebas!')

In [None]:
m = MedianMaintainingHeap()
print('Insertando 1, 5, 2, 4, 18, -4, 7, 9')

m.insert(1)
print(m)
print(m.get_median())
m.satisfies_assertions()
assert m.get_median() == 1, f'se esperaba la mediana = 1, tu código devolvió {m.get_median()}'

m.insert(5)
print(m)
print(m.get_median())
m.satisfies_assertions()
assert m.get_median() == 3, f'se esperaba la mediana = 3.0, tu código devolvió {m.get_median()}'

m.insert(2)
print(m)
print(m.get_median())
m.satisfies_assertions()
assert m.get_median() == 2, f'se esperaba la mediana = 2, tu código devolvió {m.get_median()}'

m.insert(4)
print(m)
print(m.get_median())
m.satisfies_assertions()
assert m.get_median() == 3, f'se esperaba la mediana = 3, tu código devolvió {m.get_median()}'

m.insert(18)
print(m)
print(m.get_median())
m.satisfies_assertions()
assert m.get_median() == 4, f'se esperaba la mediana = 4, tu código devolvió {m.get_median()}'

m.insert(-4)
print(m)
print(m.get_median())
m.satisfies_assertions()
assert m.get_median() == 3, f'se esperaba la mediana = 3, tu código devolvió {m.get_median()}'

m.insert(7)
print(m)
print(m.get_median())
m.satisfies_assertions()
assert m.get_median() == 4, f'se esperaba la mediana = 4, tu código devolvió {m.get_median()}'

m.insert(9)
print(m)
print(m.get_median())
m.satisfies_assertions()
assert m.get_median() == 4.5, f'se esperaba la mediana = 4.5, tu código devolvió {m.get_median()}'

print('Todas las pruebas pasaron!')