# Algoritmo Merge-Sort

Estas notas están diseñadas para complementar la presentación del algoritmo **merge-sort** expuesta en la clase.

La idea principal detrás del algoritmo merge-sort para una lista de tamaño `n` es:  
  1. Dividir la lista en dos "sublistas" de tamaño `n/2`.  
  2. Ordenar las sublistas.  
  3. Combinar los resultados.  


### Combinación de listas ordenadas

Primero nos centraremos en el procedimiento de combinación (merge) que, dado dos listas `lst1` y `lst2` ordenadas en orden ascendente, devuelve una lista que contiene todos los elementos de `lst1` y `lst2` en orden.

La idea principal detrás de la combinación es mantener dos índices `i1` e `i2`, donde:  
  - `i1` es un índice para `lst1`.  
  - `i2` es un índice para `lst2`.


### Procedimiento:

- Si `lst1[i1] <= lst2[i2]`, tomamos el elemento `lst1[i1]` y lo añadimos al final de nuestra lista de salida. Luego avanzamos el índice `i1`.
- Si `lst1[i1] > lst2[i2]`, tomamos `lst2[i2]` y lo añadimos al final de nuestra lista de salida. Luego avanzamos el índice `i2`.

---

### Caso especial:

Si durante este proceso llegamos al final de alguna de las listas, simplemente copiamos los elementos restantes de la otra lista.

In [None]:
def mergeLists(lst1, lst2):
    n1 = len(lst1)
    n2 = len(lst2)
    if n1 == 0:  # `lst1` está vacía
        return list(lst2)
    elif n2 == 0:  # `lst2` está vacía
        return list(lst1)
    else:
        output_lst = []  # Esta es la lista que devolveremos
        i1 = 0
        i2 = 0
        while (i1 < n1 or i2 < n2):
            if i1 < n1 and i2 < n2:  # Estamos procesando ambas listas
                if (lst1[i1] <= lst2[i2]):  # `lst1[i1]` es el elemento más pequeño
                    output_lst.append(lst1[i1])  # Añadir al final de la lista de salida
                    i1 = i1 + 1  # Avanzar el índice `i1`
                else:
                    output_lst.append(lst2[i2])  # Añadir al final de la lista de salida
                    i2 = i2 + 1  # Avanzar el índice `i2`
            elif i1 < n1:  # Hemos llegado al final de `lst2`
                output_lst.append(lst1[i1])  # Añadir elementos restantes de `lst1`
                i1 = i1 + 1
            else:  # Hemos llegado al final de `lst1`
                output_lst.append(lst2[i2])  # Añadir elementos restantes de `lst2`
                i2 = i2 + 1
        return output_lst


In [None]:
# Casos de prueba
lst1 = mergeLists([0, 2, 3, 7, 10], [1, 4, 5, 6, 7, 8, 9, 10, 11, 12])
print('lst1: %s' % str(lst1))
assert lst1 == [0, 1, 2, 3, 4, 5, 6, 7, 7, 8, 9, 10, 10, 11, 12]

lst2 = mergeLists([0,2],[1,3,6])
print('lst2: %s' % str(lst2))
assert lst2 == [0, 1, 2, 3, 6]

lst3 = mergeLists([0], [0])

print('lst3: %s' % str(lst3))
assert lst3 == [0, 0]

lst4 = mergeLists([], [0, 1, 5])
print('lst4: %s' % str(lst4))
assert lst4 == [0, 1, 5]

lst5 = mergeLists([0, 1, 5], [])
print('lst5: %s' % str(lst5))
assert lst5 == [0, 1, 5]


## Correctitud del algoritmo de combinación (Merge)

La correctitud del algoritmo de combinación se establece mediante el siguiente **"invariante del bucle"**, que se mantiene durante cada iteración del bucle principal del algoritmo.

```python
while (i1 < n1 or i2 < n2):  ## BUCLE WHILE
    if i1 < n1 and i2 < n2: 
        if (lst1[i1] <= lst2[i2]): 
            output_lst.append(lst1[i1]) 
            i1 = i1 + 1 
        else:
            output_lst.append(lst2[i2]) 
            i2 = i2 + 1 
    elif i1 < n1: 
        output_lst.append(lst1[i1]) 
        i1 = i1 + 1
    else: 
        output_lst.append(lst2[i2]) 
        i2 = i2 + 1
```


### **Invariante del bucle**

El invariante del bucle es la condición que se mantiene en cada iteración del bucle `while` cuando el control llega al encabezado del bucle. Para este algoritmo, los invariantes clave son:

- `0 <= i1 <= n1` y `0 <= i2 <= n2`
- `output_lst` es la combinación de las _sublistas_ `lst1[0:i1]` y `lst2[0:i2]`.
  - Nota: en Python, `lst[0:j]` se refiere a todos los elementos desde 0 hasta `j-1`. En particular, si `j == 0`, es la sublista vacía.
- Si `output_lst` no está vacía y `i1 < n1`, entonces el último elemento de `output_lst` es menor o igual a `lst1[i1]`.
- Si `output_lst` no está vacía y `i2 < n2`, entonces el último elemento de `output_lst` es menor o igual a `lst2[i2]`.
- `output_lst` está ordenada en orden ascendente.


### **NOTA #1**  
Convéncete de que los invariantes del bucle se mantienen desde el principio cuando se inicializan `i1`, `i2` y `output_lst` de la siguiente manera:
  - `i1 = i2 = 0`
  - `output_lst = []`

---

### **NOTA #2**  
Convéncete de que, si al inicio de una iteración del bucle las condiciones invariantes se cumplen, también deben cumplirse después de una iteración adicional.
  - Esto puede ser tedioso, pero es un ejercicio muy útil.


### **Finalización del Bucle**

El bucle `while` solo termina cuando `i1 = n1` e `i2 = n2`. Por lo tanto, los invariantes del bucle implican que, al finalizar el bucle:

- `output_lst` es la combinación de las listas `lst1` y `lst2`.
- `output_lst` está ordenada en orden ascendente.


### **Terminación**

Observa que `i1` o `i2` deben aumentar en cada iteración del bucle, y `i1` no puede exceder `n1`, al igual que `i2` no puede exceder `n2`. Por lo tanto, el bucle no puede ejecutarse indefinidamente.

In [None]:
def swap(lst, i, j):
    n = len(lst)
    assert( i >= 0 and i < n)  # Verificamos que el índice `i` esté dentro de los límites de la lista
    assert( j >= 0 and j < n)  # Verificamos que el índice `j` esté dentro de los límites de la lista
    # Podemos usar una asignación simultánea para intercambiar los valores
    (lst[i], lst[j]) = (lst[j], lst[i])
    return 

def copy_back(output_lst, lst, left, right):
    # Aseguramos que la lista de salida tenga la longitud correcta para copiarla de nuevo
    assert(len(output_lst) == right - left + 1)
    for i in range(left, right + 1):
        lst[i] = output_lst[i - left]  # Copiamos los elementos de la lista `output_lst` a la lista original `lst`
    return 
    
def mergeHelper(lst, left, mid, right):
    # Realiza una combinación (merge) en las sublistas lst[left:mid+1] y lst[mid+1:right+1]
    # Este es el mismo algoritmo de combinación que se mostró anteriormente, pero aquí 
    # se copian los elementos de vuelta a la lista original.
    if left > mid or mid > right:  # Una de las dos sublistas está vacía
        return
    i1 = left
    i2 = mid + 1
    output_lst = []  # Lista donde almacenamos la combinación ordenada
    while (i1 <= mid or i2 <= right):
        if (i1 <= mid and i2 <= right):  # Comparando elementos de ambas sublistas
            if lst[i1] <= lst[i2]:  # Si el elemento de la izquierda es menor o igual
                output_lst.append(lst[i1])  # Añadimos el elemento de la izquierda
                i1 = i1 + 1  # Avanzamos el índice `i1`
            else:
                output_lst.append(lst[i2])  # Añadimos el elemento de la derecha
                i2 = i2 + 1  # Avanzamos el índice `i2`
        elif i1 <= mid:  # Si hemos llegado al final de la sublista derecha
            output_lst.append(lst[i1])  # Añadimos el elemento restante de la izquierda
            i1 = i1 + 1
        else:  # Si hemos llegado al final de la sublista izquierda
            output_lst.append(lst[i2])  # Añadimos el elemento restante de la derecha
            i2 = i2 + 1
    copy_back(output_lst, lst, left, right)  # Copiamos la lista combinada de vuelta a la lista original
    return 
    
def mergesortHelper(lst, left, right):
    if (left == right):  # La región a ordenar es un único elemento
        return 
    elif (left + 1 == right):  # La región a ordenar tiene dos elementos
        if (lst[left] > lst[right]):  # Comparamos
            swap(lst, left, right)   # e intercambiamos si es necesario
    else: 
        mid = (left + right) // 2  # Calculamos el punto medio
        mergesortHelper(lst, left, mid)  # Ordenamos la mitad izquierda
        mergesortHelper(lst, mid + 1, right)  # Ordenamos la mitad derecha
        mergeHelper(lst, left, mid, right)  # Combinamos ambas mitades
        
# Función mergesort
# Ordena la lista "in place" (en su lugar) modificándola para que `lst` esté ordenada cuando la función termine.
def mergesort(lst):
    if len(lst) <= 1:
        return  # No hay nada que ordenar
    else:
        mergesortHelper(lst, 0, len(lst) - 1)


In [None]:
#Casos de prueba 

lst = [0, 5, 6, 2, 19, -1, 2, 3, 0, 4, 5, 8]
mergesort(lst)
print(lst)

lst1 = [0, 1, 2, 6, 18, 19, -20, -45, -23, 25, 56, 19, 81, 123, 122]
mergesort(lst1)
print(lst1)

lst2 = [4,3,2,1]
mergesort(lst2)
print(lst2)

lst4 = [1]
mergesort(lst4)
print(lst4)

lst5 = []
mergesort(lst5)
print(lst5)

### Correctitud de Mergesort

```python
def mergesortHelper(lst, left, right):
    if (left == right):  # La región a ordenar es un único elemento
        return 
    elif (left + 1 == right):  # La región a ordenar tiene dos elementos
        if (lst[left] > lst[right]):  # Comparamos 
            swap(lst, left, right)  # e intercambiamos si es necesario
    else: 
        mid = (left + right) // 2  # Calculamos el punto medio
        mergesortHelper(lst, left, mid)  # Ordenamos la mitad izquierda
        mergesortHelper(lst, mid + 1, right)  # Ordenamos la mitad derecha
        mergeHelper(lst, left, mid, right)  # Combinamos ambas mitades
```


Establecemos las siguientes propiedades cada vez que se llama a la función `mergesortHelper` con los argumentos `lst, left, right`:
  - `0 <= left <= right < len(lst)`.

Debemos asumir que `mergeHelper` combina correctamente las dos sublistas ordenadas `lst[left:mid+1]` y `lst[mid+1:right+1]`, produciendo una sublista combinada y ordenada `lst[left:right+1]`.

---

Podemos probar por inducción que, al salir de `mergesortHelper`, la sublista `lst[left:right+1]` está ordenada. Recordemos la notación de sublistas:

1. **Caso base:**
   - `left == right`: La sublista contiene un solo elemento y, trivialmente, está ordenada.
   - `left + 1 == right`: La sublista tiene dos elementos. Al inspeccionar el código, vemos que al comparar `lst[left]` y `lst[right]` y hacer un intercambio si es necesario, el algoritmo garantiza que `lst[left:right+1]` queda ordenada.

2. **Paso inductivo:**
   - Sea `k = right - left + 1` el tamaño de la región que se debe ordenar.  
   - Supongamos que `mergesortHelper` ordena correctamente siempre que la región de ordenamiento tenga un tamaño estrictamente menor que `k`.  
   - Por lo tanto, tras las llamadas para ordenar la mitad izquierda y la mitad derecha, garantizamos que las dos sublistas `lst[left:mid+1]` y `lst[mid+1:right+1]` estén ordenadas.
   - Finalmente, gracias a la correctitud del método `mergeHelper`, podemos concluir que la sublista completa `lst[left:right+1]` queda ordenada al salir del procedimiento `mergesort`.

### Complejidad del tiempo de ejecución de Mergesort

Observamos que la complejidad del tiempo de ejecución de **mergesort** es $\Theta(n \log(n))$ para una lista de entrada de tamaño $n$.

### **Explicación del análisis**:

1. **División del problema:**
   - En cada paso, el algoritmo divide la lista en dos sublistas de tamaño aproximado $\frac{n}{2}$.
   - Esto ocurre recursivamente hasta que las sublistas tienen un solo elemento.

2. **Costo de combinación:**
   - En cada nivel de la recursión, combinar las sublistas toma un tiempo proporcional al número de elementos en la lista completa, es decir, $O(n)$.

3. **Número de niveles:**
   - Como cada paso reduce el tamaño de la lista a la mitad, el número de niveles de recursión es aproximadamente $\log_2(n)$.

4. **Complejidad total:**
   - Sumando el costo en todos los niveles, el tiempo total es:
     $$
     T(n) = O(n) \times O(\log(n)) = \Theta(n \log(n))
     $$


Por lo tanto, la complejidad temporal del algoritmo **mergesort** es **$\Theta(n \log(n))$**, tanto en el mejor caso, peor caso y caso promedio.