<a href="https://colab.research.google.com/github/OscarRojasG/ADA-Informes/blob/presentaciones/HeapSort.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# HeapSort

## 2.1 Código

In [None]:
def build_heap(A, n):
   for i in range(n//2 - 1, -1, -1):
      heapify(A, n, i)

def heapify(A, n, i):
  left = 2*i + 1
  right = 2*i + 2
  largest = i

  if left < n and A[left] > A[largest]:
    largest = left

  if right < n and A[right] > A[largest]:
    largest = right

  if largest != i:
    A[i], A[largest] = A[largest], A[i]
    heapify(A, n, largest)

def heap_sort(A):
  n = len(A)
  build_heap(A, n)

  for i in range(n-1, 0, -1):
    A[0], A[i] = A[i], A[0]
    heapify(A, i, 0)

A = [6,4,3,5,1,2,8,7]
heap_sort(A)
print(A)

[1, 2, 3, 4, 5, 6, 7, 8]


## 2.2 Descripción del algoritmo

El algoritmo recibe como entrada un arreglo de tamaño $n$ con números aleatorios y retorna un arreglo ordenado con los mismos valores. Los pasos del algoritmo son los siguientes:

1. La función `build_heap` reordena el arreglo de modo que se cumpla la propiedad del montículo, es decir, que cada nodo tenga un valor mayor al de sus hijos.

2. Una vez reconstruido el montículo, la función `heap_sort` elimina la raíz hasta que el montículo tenga un único elemento. Luego de eliminar todos los nodos, el arreglo estará ordenado.

Los pasos de la función `build_heap` son los siguientes:

1. Se comienza iterando el arreglo desde la posición $i = n/2 - 1$ hasta $i = 0$. Los últimos $n/2$ elementos corresponden a los nodos hoja, por lo tanto ya cumplen la propiedad.

2. La función `heapify` busca el nodo hijo que sea mayor. Las posiciones del hijo izquierdo y derecho del nodo $i$ son $2i + 1$ y $2i + 2$ respectivamente. 

3. Si el nodo padre es mayor a sus hijos, se avanza a la siguiente iteración.

4. En caso contrario, el nodo padre se intercambia con el nodo hijo mayor. Luego, se debe verificar que el nodo padre (en su nueva posición), siga cumpliendo la propiedad. Se vuelve a llamar a la función `heapify` hasta que la propiedad se cumpla.

5. Luego de finalizar la última iteración, se habrá reconstruido el montículo. 

Los pasos de la función `heap_sort` son los siguientes:

1. Se reconstruye el montículo a partir del arreglo de entrada.

2. Se elimina cada nodo raíz hasta vaciar el montículo. Eliminar un nodo raíz consiste en intercambiarlo con el último elemento y disminuir el tamaño del montículo en 1. Notemos que al final del arreglo se irán ubicando todos los nodos eliminados, y se irá formando un sub-arreglo ordenado de menor a mayor.

3. Después de cada eliminación, se debe verificar que el nuevo nodo raíz cumpla la propiedad. Para ello, se llama a la función `heapify` las veces que sea suficiente hasta que el nodo quede bien ubicado. Luego se prosigue con la siguiente iteración hasta que el montículo quede vacío.



# 2.3 Ejemplo

Consideremos el siguiente arreglo:

$A = [4, 1, 8, 2, 3, 5]$

Primero, llamaremos a la función `build_heap` para que reconstruya el montículo.

Comenzaremos iterando desde el elemento $n/2 - 1$, en este caso $i = 2$ que corresponde al 8.

Hijo izquierdo = $A[2i + 1] = A[2 ̇\cdot 2 + 1] = A[5] = 5$

Hijo derecho = $A[2i + 2] = A[2 ̇\cdot 2 + 2] = A[6] = ∄$

Comparamos el 8 con el 5. Como $8 > 5$, no hay intercambios.

Luego, seguimos con el elemento anterior $i = 1$ que corresponde al 1.

Hijo izquierdo = $A[2i + 1] = A[2 ̇\cdot 1 + 1] = A[3] = 2$

Hijo derecho = $A[2i + 2] = A[2 ̇\cdot 1 + 2] = A[4] = 3$

Como el hijo mayor es el derecho, comparamos el 1 con el 3. Como $1 < 3$, se intercambian. El arreglo queda de la siguiente manera: 

$A = [4, 3, 8, 2, 1, 5]$

Ahora, se debe comprobar que la nueva posición del 1 cumpla la propiedad. En este caso no es necesario, ya que el elemento quedó en la posición de un nodo hoja, y por lo tanto, no tiene hijos.

Por último, seguimos con el elemento $i = 0$ que corresponde al 4.

Hijo izquierdo = $A[2i + 1] = A[2 ̇\cdot 0 + 1] = A[1] = 3$

Hijo derecho = $A[2i + 2] = A[2 ̇\cdot 0 + 2] = A[2] = 8$

Como $4 < 8$, se intercambian. El arreglo queda de la siguiente forma:

$A = [8,3,4,2,1,5]$

Se verifica que el 4 cumpla la propiedad en su nueva posición.

Hijo izquierdo = $A[2i + 1] = A[2 ̇\cdot 2 + 1] = A[5] = 5$

Hijo derecho = $A[2i + 2] = A[2 ̇\cdot 2 + 2] = A[6] = ∄$

Como $5 > 4$, se intercambian.

$A = [8,3,5,2,1,4]$

Luego, se verifica que el 4 siga cumpliendo la propiedad. Como el 4 ahora es un nodo hoja, la propiedad se cumple.

Finalmente se forma el siguiente montículo:

![picture](https://drive.google.com/uc?export=view&id=1_JF1rslYc-RwVbFkX83xMqxXjXTt1Xcf)

Luego, se va eliminando el nodo raíz uno por uno. A continuación se muestra el estado del montículo y del arreglo por cada eliminación.

![picture](https://drive.google.com/uc?export=view&id=1TKJ57F_iObp-EiqVBrFxB8hipaiqJkth)

$A = [5,4,2,1,3,8]$

![picture](https://drive.google.com/uc?export=view&id=10uGFMKWAf_aRSzohg5pD1T7keplwsdbV)

$A = [4,3,1,2,5,8]$

![picture](https://drive.google.com/uc?export=view&id=1fiduUsGvtASFbZeOnSqphkwOJVXZzr8H)

$A = [3,2,1,4,5,8]$

![picture](https://drive.google.com/uc?export=view&id=1vFcr5gueVirI_7rVXcDbsVpk85JXwPlu)

$A = [2,1,3,4,5,8]$

![picture](https://drive.google.com/uc?export=view&id=1COO3l55HiZ1ZvxPkmpQleF8gWVAJFg64)

$A = [1,2,3,4,5,8]$

# 3. Correctitud

### **Teorema 1 (Correctitud de la función build_heap).**

*La función build_heap construye un max-heap a partir de un arreglo con $n$ elementos.*

## Prueba del Teorema

Para probar el teorema podemos considerar la siguiente **propiedad invariante de bucle**:

> Al comienzo de cada iteración los nodos i+1,i+2,…, son raíces de un max-heap.

**Inicialización**

Como la primera iteración comienza desde $i = n/2 - 1$, se cumple que todos los i+1,i+2,..., corresponden a nodos hoja, en donde cada uno es parte de la raíz de un sub-montículo con un único elemento.

**Mantención**

Aplicando un razonamiento inductivo, asumiremos que la propiedad se cumple en la iteración $i+1$. Luego, en la siguiente iteración el elemento $i$ será reubicado de modo que cumpla la propiedad del montículo. En general, existen dos casos:

1. El nodo $i$ es mayor a sus hijos. En este caso, no ocurren intercambios en el arreglo, ya que el nodo se encuentra correctamente ubicado. Luego, al finalizar la iteración y al comienzo de la siguiente, la propiedad seguirá cumpliéndose para los nodos i,i+1,i+2,...

2. El nodo $i$ es menor al menos a uno de sus hijos. Llamaremos $n_{i}$ al nodo actual en la posición $i$, $n_{0}$ al nodo inicial en la posición $i$, $n_{1}$ al hijo mayor de $n_{0}$ y $n_{2}$ al hijo menor de $n_{0}$ y hermano de $n_{1}$. Sabemos que, inicialmente, $n_{1} > n_{0}$, por lo cual ocurre un intercambio entre ambos nodos, tal que $n_{i} = n_{1}$. Luego, existen dos situaciones:

* No ocurren más intercambios. En este caso, los hijos de $n_{i} = n_{1}$ corresponderán a $n_{0}$ y $n_{2}$. Sabemos que $n_{0}$ se intercambió inicialmente con su hijo mayor $n_{1}$, por lo cual se tiene que $n_{i} = n_{1} > n_{0}, n_{2}$, de modo que se cumple la propiedad.

* El nodo $n_{0}$ continuará intercambiandose hasta una posición en que cumpla la propiedad del montículo. En este caso, los hijos de $n_{i} = n_{1}$ corresponderán a $n_{2}$ y al hijo mayor de $n_{1}$. Observemos que nuevamente se cumple que $n_{i}$ es mayor a sus dos hijos.

Luego, como la propiedad se cumple para $n_{i}$, y por la hipótesis inductiva también se cumple para $n_{i+1}$,$n_{i+2}$... queda demostrada la mantención de la propiedad.

**Correctitud**

Finalmente, como la propiedad de bucle invariante es verdadera al inicio del bucle y se mantiene en cada iteración, podemos decir que al **finalizar la última iteración del algoritmo**, se genera un montículo tal que los nodos 1,2,...,n son raíces de un max-heap.$\Box$

### **Teorema 2 (Correctitud del algoritmo HeapSort).**

*El algoritmo **HeapSort** genera un arreglo: $[a_1',a_2',...,a_n']$, con los mismos elementos del montículo de entrada ordenados de menor a mayor, es decir,* $a_1'\leq a_2' \leq... \leq a_n'$.

## Prueba del Teorema

Para probar el teorema podemos considerar la siguiente **propiedad invariante de bucle**:

> Al comienzo de cada iteración, el sub-arreglo $A[0...i]$ es un max-heap que contiene los menores elementos del arreglo, y todos los nodos $i+1,i+2...$ forman un sub-arreglo ordenado que contiene los mayores elementos.

**Inicialización**

Como la primera iteración comienza desde $i = n - 1$, se cumple que $A[0...n-1]$ es un max-heap ya que corresponde al montículo inicial formado por la función `build_heap`. Además, no existen nodos $i+1,i+2,...$ por lo cual el sub-arreglo ordenado que se forma al final del arreglo está vacío, por lo cual se cumple trivialmente la propiedad.

**Mantención**

Usando inducción, asumiremos que la propiedad se cumple para la iteración $i+1$. En la siguiente iteración $i$ (recordar que por cada iteración la variable $i$ disminuye), se eliminará el nodo raíz y quedará en la posición $i$, además el arreglo $A[0...i-1]$ se reordenará mediante la función `heapify` para reconstruir un nuevo montículo de tamaño $i$.

Por inducción sabemos que $n_{i} \leq n_{i+1} \leq n_{i+2} \leq \;...$, por lo cual se cumple que el sub-arreglo seguirá estando ordenado al finalizar la iteración y al comienzo de la siguiente.

**Correctitud**

Finalmente, como la propiedad de bucle invariante es verdadera al inicio del bucle y se mantiene en cada iteración, podemos decir que al **finalizar la i-ésima iteración del algoritmo**, se genera un arreglo ordenado $[a_i,a_{i+1},...,a_n]$ con los mismos elementos del montículo ordenados de menor a mayor.

# 4. Tiempo de ejecución

### **Teorema 3 (Tiempo de ejecución de la función build-heap).**

*La función **build-heap** tiene un **tiempo de ejecución de** $O(n)$ en el peor y mejor caso.*

## Prueba del teorema

Sabemos que la función build-heap realiza $n/2$ llamadas a la función `heapify`. En el peor caso, la función `heapify` deberá sumergir el nodo raíz hacia una hoja, pasando por $log_{2}{n}$ nodos, por lo cual podríamos pensar intuitivamente que la función build-heap tiene un tiempo de ejecución $O(n\;log(n))$. Esto último es correcto, sin embargo, existe una cota superior más ajustada para el algoritmo.

Observemos que no todos los nodos del montículo se encuentran a la misma altura, es decir, en el peor caso en que todos los nodos se intercambien hasta llegar al último nivel, algunos requerirán más comparaciones que otros. El tiempo que requiere la función `heapify` será variable, por lo tanto lo expresaremos como $O(h)$ pues depende de la altura.

La cantidad **máxima** de nodos por cada nivel de altura $h$ se puede calcular como $\lceil\frac{n}{2^{h+1}}\rceil$, luego, el tiempo total de todas las llamadas a la función `heapify` se puede calcular con la siguiente fórmula:

$T(n)=\sum\limits_{h=0}^{\lfloor \log_2n \rfloor} \lceil\frac{n}{2^{h+1}}\rceil O(h) = O \left( n \sum\limits_{h=0}^{\lfloor \log_2n \rfloor} \frac{h}{2^{h}} \right)$

Luego, aplicando la fórmula:

$\sum\limits_{k=0}^{∞} kx^k = \frac{x}{(1-x)^2}$ para $|x|< 1$

Tenemos que:

$\sum\limits_{h=0}^{\lfloor \log_2n \rfloor} \frac{h}{2^{h}} \leq \sum\limits_{h=0}^\infty \frac{h}{2^{h}}=\sum\limits_{h=0}^\infty h{(\frac{1}{2})^{h}} = \frac{1/2}{(1-1/2)^2} = 2$

Finalmente:

$O \left( n \sum\limits_{h=0}^{\lfloor \log_2n \rfloor} \frac{h}{2^{h}} \right) = O(n \cdot 2) = O(n)$

Por otro lado, en el mejor caso el arreglo inicial ya será un max-heap, por lo cual no ocurrirán intercambios, sin embargo el algoritmo deberá verificar esto realizando una comparación por cada nodo, es decir, el tiempo de ejecución será $T(n) = n/2 \cdot O(1) = O(n)$

