## Algoritmos de ordenamiento

Quicksort se basa en un concepto llamado partición, por lo que abordaremos eso primero. 

### Particionamiento

Dividir un arreglo es tomar un valor aleatorio, que luego se llama `pivote` y asegurarse de que cada número menor que el pivote termina a la izquierda del pivote, y que cada número mayor que el pivote termina a la derecha del pivote. 

Digamos que tenemos el siguiente arreglo: 

<img src="Imagenes/C1.png"  width="200"/>

En aras de la coherencia, siempre seleccionaremos el valor más a la derecha para que sea el pivote (aunque técnicamente podemos elegir otros valores). En este caso, el número 3 es nuestro pivote. Lo indicamos rodeándolo con un círculo: 

<img src="Imagenes/C2.png"  width="200"/>


Luego asignamos "punteros", uno al valor más a la izquierda de la arreglo y otro al valor más a la derecha de la arreglo, excluyendo el pivote en sí:

<img src="Imagenes/C3.png"  width="280"/>

Ahora estamos listos para comenzar la partición real, que sigue estos pasos:

1. El puntero izquierdo se mueve continuamente una celda hacia la derecha hasta que alcanza un valor mayor o igual que el pivote y luego se detiene. 

2. El puntero derecho se mueve continuamente una celda hacia la izquierda hasta que alcanza un valor que es menor o igual que el pivote y luego se detiene. El puntero derecho también se detendrá si llega al principio del arreglo. 

3. Una vez que el puntero derecho se ha detenido, llegamos a un `cruce`. Si el puntero izquierdo ha alcanzado (o superado) al puntero derecho, pasamos al paso 4. De lo contrario, intercambiamos los valores a los que apuntan los punteros izquierdo y derecho, y luego volvemos a repetir los pasos 1, 2 y 3 nuevamente. 

4. Finalmente, intercambiamos el pivote con el valor al que apunta actualmente el puntero izquierdo. 



**Ejercicio:** Aplica los pasos anteriores en el arreglo de ejemplo dado.

In [None]:
// Tu respuesta

### Algoritmo Quicksort

El algoritmo Quicksort es una combinación de particiones y recursividad. Funciona de la siguiente manera:

1. Particiona el arreglo. El pivote está ahora en su lugar correcto.

2. Trata los subarreglos a la izquierda y a la derecha del pivote como sus propios arreglos y repita recursivamente los pasos 1 y 2. Eso significa que dividiremos cada subarreglo y terminaremos con sub-subarreglos aún más pequeños a la izquierda y a la derecha de cada pivote del subarreglo. Luego dividimos esos sub-subconjuntos, y así sucesivamente.

3. Cuando tenemos un subarreglo que tiene cero o un elemento, ese es nuestro caso base y no hacemos nada.


**Ejemplo:** 

Comenzamos con el arreglo `[0, 5, 2, 1, 6, 3]` y ejecutamos una sola partición en todo el arreglo. Dado que quicksort comienza con una partición de este tipo, significa que ya hemos pasado en parte por el proceso de quicksort. Nos quedamos con:

<img src="Imagenes/C4.png"  width="250"/>

El valor 3 es el pivote original. Ahora que el pivote está en el lugar correcto, debemos ordenar lo que esté a la izquierda y a la derecha del pivote. Ten en cuenta que en el ejemplo, sucede que los números a la izquierda del pivote ya están ordenados, pero la computadora aún no lo sabe.

El siguiente paso después de la partición es tratar todo a la izquierda del pivote como un arreglo y particionarlo.
Ocultaremos el resto de la arreglo por ahora:

<img src="Imagenes/C5.png"  width="250"/>


Ahora, de este subarreglo `[0, 1, 2]`, haremos que el elemento más a la derecha sea el pivote, o sea el número 2:

<img src="Imagenes/C6.png"  width="250"/>

Estableceremos los punteros izquierdo y derecho:


<img src="Imagenes/C7.png"  width="300"/>

Y ahora estamos listos para dividir este subarreglo. 

Comparamos el puntero izquierdo (0) con el pivote (2). Como el 0 es menor que el pivote, seguimos moviendo el puntero izquierdo.

Movemos el puntero izquierdo una celda a la derecha, y ahora apunta al mismo valor que apunta el puntero derecho:

<img src="Imagenes/C8.png"  width="300"/>


Comparamos el puntero izquierdo con el pivote. Como el valor 1 es menor que el pivote, seguimos adelante.

Movemos el puntero izquierdo una celda a la derecha, que resulta ser el pivote:

<img src="Imagenes/C9.png"  width="300"/>

En este punto, el puntero izquierdo apunta a un valor que es igual al pivote (¡ya que es el pivote!), entonces se detiene. 

Observa cómo el puntero izquierdo logró colarse más allá del puntero derecho. Eso está bien, el algoritmo está diseñado para funcionar incluso con tal ocurrencia.

Ahora, activamos el puntero derecho. Sin embargo, debido a que el valor del puntero derecho (1) es menor que el pivote, permanece inmóvil. 

Dado que el puntero izquierdo ha pasado al puntero derecho, hemos terminado de mover los punteros
en total en esta partición.

A continuación, intercambiamos el pivote con el valor del puntero izquierdo. Ahora, da la casualidad de que el puntero izquierdo apunta al pivote mismo, por lo que intercambiamos el pivote consigo mismo, lo que no produce ningún cambio. 

En este punto, la partición está completa y el pivote (2) ahora está en su lugar correcto:

<img src="Imagenes/C10.png"  width="250"/>


Ahora tenemos un subarreglo de `[0, 1]` a la izquierda del pivote (el 2) y ningún subarreglo a su derecha. El siguiente paso es particionar recursivamente el subarreglo a la izquierda del pivote, que nuevamente es `[0, 1]`. 

No tenemos que lidiar con ningún subarreglo a la derecha del pivote ya que no existe tal subarreglo.

Debido a que todo lo que nos enfocaremos en el siguiente paso es el subarreglo `[0, 1]`, bloquearemos el resto del arreglo para que se vea así:

<img src="Imagenes/C11.png"  width="300"/>

Para particionar el subarreglo, `[0, 1]`, haremos que el elemento más a la derecha (el 1) sea el pivote. ¿Dónde pondremos los punteros izquierdo y derecho? 

Bueno, el puntero izquierdo apuntará al 0, pero el puntero derecho también apuntará al 0, ya que siempre comenzamos el puntero derecho en una celda a la izquierda del pivote. Esto nos da:

<img src="Imagenes/C12.png"  width="300"/>

Ahora estamos listos para comenzar la partición.

Comparamos el puntero izquierdo (0) con el pivote (1):

<img src="Imagenes/C13.png"  width="300"/>

Es menos que el pivote, así que seguimos adelante.

Desplazamos el puntero izquierdo una celda hacia la derecha. Ahora apunta al pivote:

<img src="Imagenes/C14.png"  width="330"/>

Dado que el valor del puntero izquierdo (1) no es inferior al pivote (ya que es el pivote), el puntero izquierdo deja de moverse.

Comparamos el puntero derecho con el pivote. Como apunta a un valor que es menor que el pivote, ya no lo movemos. Y dado que el puntero izquierdo ha pasado al puntero derecho, hemos terminado de mover los punteros para esta partición.

Ahora intercambiamos el puntero izquierdo con el pivote. Nuevamente, en este caso, el puntero izquierdo en realidad apunta al pivote en sí, por lo que el intercambio en realidad no cambia nada. El pivote ahora está en su lugar correcto y hemos terminado con esta partición.

Eso nos deja con esto:

<img src="Imagenes/C15.png"  width="250"/>

A continuación, necesitamos dividir el subarreglo a la izquierda del pivote más reciente. En este caso, ese subarreglo es `[0]`, un arreglo de un solo elemento. Una arreglo de cero o uno elementos es nuestro caso base, por lo que no hacemos nada. Se considera que el elemento está en su lugar correcto automáticamente. Entonces, ahora tenemos:

<img src="Imagenes/C16.png"  width="250"/>

Comenzamos tratando a 3 como nuestro pivote y particionamos recursivamente el subarreglo a su izquierda `([0, 1, 2])`. Ahora debemos volver a dividir recursivamente el subarreglo a la derecha del `3`, que es `[6, 5]`.


Ocultaremos `[0, 1, 2, 3]`, ya que ya los hemos ordenado, y ahora solo nos estamos enfocando en `[6, 5]`:


<img src="Imagenes/C17.png"  width="250"/>


En la siguiente partición, trataremos el elemento más a la derecha (el 5) como el pivote. Eso nos da:

<img src="Imagenes/C18.png"  width="250"/>

Al configurar la próxima partición, los punteros izquierdo y derecho terminan apuntando al 6:

<img src="Imagenes/C19.png"  width="250"/>

Comparamos el puntero izquierdo (6) con el pivote (5). Dado que 6 es mayor que el pivote, el puntero izquierdo no se mueve más.

El puntero de la derecha también apunta al 6, por lo que teóricamente pasaríamos a la siguiente celda a la izquierda. Sin embargo, no hay más celdas a la izquierda del 6, por lo que el puntero derecho deja de moverse. Dado que el puntero izquierdo ha llegado al puntero derecho, hemos terminado de mover los punteros por completo para esta partición. Eso significa que estamos listos para el paso final.

Cambiamos el pivote con el valor del puntero izquierdo:

<img src="Imagenes/C20.png"  width="250"/>

El pivote (5) ahora está en su lugar correcto, dejándonos con:

<img src="Imagenes/C21.png"  width="250"/>

A continuación, técnicamente necesitamos particionar recursivamente el subarreglo a la izquierda y derecha del subarreglo `[5, 6]`. Dado que no hay un subarreglo a su izquierda, eso significa que solo necesitamos dividir el subarreglo a la derecha. Dado que el subarreglo a la derecha del 5 es un solo elemento de `[6]`, ese es el caso base y no hacemos nada: automáticamente se considera que el 6 está en su lugar correcto:

<img src="Imagenes/C22.png"  width="250"/>



### Implementación del algoritmo

Considera una arreglo $x_0 , x_1 , x_2 ,\dots, x_{n-1}$ . Si tomamos el último elemento, $x_{n-1}$, como pivote, y colocamos un iterador $i$ en la posición $0$ y otro iterador $j$ en la posición $n -2$. Si $x_i$ es más pequeño que el pivote, aumenta $i$ en uno. 
Además, si $x_j$ es mayor o igual que el pivote, disminuye $j$ en uno. En el caso de que $x_i$ sea mayor o igual que el pivote y que $x_j$ sea menor que el pivote, intercambia ambos elementos y continúa. 

El proceso se detiene cuando $i$ es mayor que $j$. Finalmente, simplemente intercambia $x_i$ y el pivote. Este se asegurará de que el pivote esté en la posición correcta. Repite el proceso con el subarreglo en el lado izquierdo del pivote y con el subarreglo en el lado derecho del pivote. Al final, se ordenará todo el arreglo. 


El algoritmo muestra la lógica detrás de Quick Sort para ordenar un arreglo $X$ desde la posición $a$ hasta la posición $b$.


<img src="Imagenes/C23.png"  width="600"/>

El peor de los casos es cuando todos los elementos se ordenan en orden no ascendente, porque todos los elementos estarán ubicados en el lado derecho del pivote en cada iteración. Para el primer pivote habrá $n -1$ elementos a su derecha, para el próximo pivote será $n - 2$, y así sucesivamente. 

Para evitar esto, muchos algoritmos ejecutan un algoritmo de ordenación aleatoria antes de ejecutar quick sort alcanzando $O(n\log n)$ la mayoría de las veces.

El código siguiente implementa quick sort para ordenar un arreglo $X$ de $n$ elementos ($1 \leq n < 20$). La entrada consiste en el número $n$ y los $n$ números que forman $X$. La salida es $X$ con sus elementos ordenados en orden ascendente.


**Complejidad del tiempo:** $O(n^2)$,

Es importante decir que la complejidad de tiempo promedio de este algoritmo es $O(n \log n)$, y es por eso que se usa ampliamente.

Entrada:

- n: El número de elementos en el arreglo.
- X:  Arreglo a ordenar.

Salida:

El arreglo ordenado.


In [None]:
#include <algorithm>
#include <cstdio>
using namespace std;

int X[20];
int n;

void quicksort(int, int);
int getPivot(int, int);

int main() {
   scanf("%d", &n);
   for (int i = 0; i < n; i++) {
    scanf("%d", &X[i]);
    }
    
    quicksort(0, n - 1);

    for (int i = 0; i < n; i++) {
      printf("%d ", X[i]);
    }
    printf("\n");

    return 0;
}

La función `quicksort` definida a continuación, recibe dos enteros que corresponden al intervalo a ordenar. Usando el pivote, se llama a sí mismo para ordenar el subintervalo a la izquierda del pivote y el subintervalo a la derecha del pivote.


In [None]:
void quicksort(int a, int b) {
    if (a < b) {
        int p = getPivot(a, b);
        quicksort(a, p - 1);
        quicksort(p + 1, b);
    }
}

La parte clave del algoritmo Quick Sort consiste en colocar en la posición correcta el pivote. La función `getPivot` coloca el pivote en la posición correcta en el intervalo `[a, b]` según el algoritmo descrito anteriormente.

In [None]:
int getPivot(int a, int b) {
    int i = a;
    int j = b - 1;
    int p = b;
    
    while (i <= j) {
     if (X[i] < X[p]) {
      i++;
     } else if (X[j] >= X[p]) {
      j--;
     } else if (X[i] >= X[p] && X[j] < X[p]) {
      swap(X[i++], X[j--]);
     }
    }
    swap(X[i], X[p]);
    return i;

}

### La eficiencia de Quicksort

Para averiguar la eficiencia de Quicksort, primero determinemos la eficiencia de una sola partición.

Cuando desglosemos los pasos de una partición, notaremos que una partición implica dos tipos principales de pasos:

- Comparaciones: Comparamos cada uno de los valores que tenemos a mano con el pivote.

- Swaps: cuando corresponda, intercambiamos los valores señalados por los punteros izquierdo y derecho.

Cada partición tiene al menos `n` comparaciones, es decir, comparamos cada elemento de la matriz con el pivote.

Sin embargo, el número de swaps dependerá de cómo se clasifiquen los datos. 

En el siguiente diagrama, dividimos seis elementos en solo tres swaps:

<img src="Imagenes/C24.png"  width="300"/>

En promedio, hacemos alrededor de $n$ comparaciones y $n/ 4$ swaps. Podemos decir, entonces, que hay alrededor de $1.25n$ pasos para $n$ elementos de datos. 

En notación O  diríamos que una partición se ejecuta en tiempo $O(N)$.


**Ejercicio:** Comprueba la aseveración anterior.

In [None]:
// Tu respuesta.

### Quicksort con más particiones


Para visualizar esto más fácilmente, aquí hay un diagrama que muestra el quicksort en un arreglo de ocho elementos.

<img src="Imagenes/C25.png"  width="600"/>



Vemos que donde la arreglo original tiene ocho elementos, Quicksort toma alrededor de 21 pasos. Esto supone el mejor de los casos o el escenario promedio, donde el pivote termina aproximadamente en el medio del subarreglo después de cada partición. 

|  n | Pasos Quicksort (approx) |
|:--:|:------------------------:|
|  4 |             8            |
|  8 |            24            |
| 16 |            64            |
| 32 |            160           |



### ¿Cómo categorizamos quicksort en términos de notación  O?

La cantidad de pasos de quicksort para N elementos en la arreglo es aproximadamente `n` multiplicado por `log N`, como se muestra en la siguiente tabla:

|  n | log n | n * log n  | Pasos Quicksort (approx) |
|:--:|:-----:|:----------:|:------------------------:|
|  4 |   2   |      8     |             8            |
|  8 |   3   |     24     |            24            |
| 16 |   4   |     64     |            64            |
| 32 |   5   |     160    |            160           |


¿Cuántas veces podemos dividir un arreglo en mitades hasta que lo hayamos dividido completamente hasta el punto en que cada subarreglo sea de tamaño 1? Para una arreglo de tamaño `n`, esto nos llevará `log n` veces. Fíjate en el siguiente diagrama:

<img src="Imagenes/C26.png"  width="600"/>


 Así es como se ve realmente un ejemplo más realista, donde ignoramos el pivote después de cada partición:
 
 <img src="Imagenes/C27.png"  width="600"/>

### Quicksort en el peor de los casos 

El peor de los casos para quicksort es uno en el que el pivote siempre termina en un lado del subarreglo en lugar de en el medio. Esto puede suceder cuando el arreglo  está en perfecto orden ascendente o descendente. 

La visualización de este proceso se muestra aquí:

 <img src="Imagenes/C28.png"  width="600"/>
 
En el peor de los casos, tenemos particiones de $8 + 7 + 6 + 5 + 4 + 3 + 2 + 1$ elementos, lo que da un total de $36$ comparaciones.

Para poner esto un poco más en forma de fórmula, diríamos que para $n$ elementos, hay $n + (n - 1) + (n - 2) + (n - 3) \dots + 1$  pasos y esto se calcua con $N^2/2$ pasos, que para los propósitos de la notación es $O(N^2)$. 

Entonces, en el peor de los casos, Quicksort tiene una eficiencia de $O(N^2)$.



**Ejercicio** Realiza una comparación entre el algoritmo insertion sort y quicksort en el peor de los casos, caso promedio y el mejor de los casos.

In [None]:
// Tu respuesta

**Ejercicio:** Revisa [QuickSelect: The Quick Select Algorithm Explained With Code Examples](https://www.freecodecamp.org/news/quickselect-algorithm-explained-with-examples/) e implementa el algoritmo `quickselect` en C++.

In [None]:
// Tu respuesta

## Mergesort

Supongamos que queremos ordenar los elementos de un vector X en orden no decreciente de las posiciones a a b. Este algoritmo consiste de cuatro pasos:

1. Divide el vector en dos partes encontrando el valor medio $X_m$ , donde $m = (a + b)/2$.

2. Ordena los elementos en el lado izquierdo.

3. Ordena los elementos en el lado derecho.

4. Combina los elementos del lado izquierdo con los elementos del lado derecho de tal manera que el vector resultante esté ordenado. 

El paso 4 es el más importante. Veamos el proceso del algoritmo.


**Iteración 1**


<img src="Imagenes/D1.png"  width="230"/>

**Iteración 2**

<img src="Imagenes/D2.png"  width="230"/>


**Iteración 3**

<img src="Imagenes/D3.png"  width="200"/>


**Iteración 4**

<img src="Imagenes/D4.png"  width="240"/>


**Iteración 5**

<img src="Imagenes/D5.png"  width="200"/>


**Iteración 6**

<img src="Imagenes/D6.png"  width="240"/>


**Iteración 7**

<img src="Imagenes/D7.png"  width="240"/>

**Iteración 8**


<img src="Imagenes/D8.png"  width="280"/>



Al principio hay $n$ elementos en el arreglo, luego se divide en dos mitades de $n/2$ elementos cada uno, y cada mitad se divide nuevamente en dos mitades de $n/4$ elementos, y así sucesivamente. Luego, el tiempo de ejecución depende de cuántas veces dividamos el arreglo. 

Sabemos que no podemos dividir el arreglo si solo hay un elemento, esto es cuando $n/2k = 1$. Resolviendo para k, tenemos que $k = \log 2 n$, y cada vez que necesitamos realizar el proceso el tiempo la complejidad de Merge Sort es $O(n \log n)$. 



### Implementación del algoritmo

El programa  recibe un número entero $n$ ($1 \leq n \leq 100$) que representa el número de elementos en el arreglo X. Los siguientes $n$ números son los elementos de X. 

La salida es el arreglo X ordenada usando el algoritmo Merge Sort.

**Complejidad del tiempo:** $O(n \log n)$,

Entrada:

- n: El número de elementos en el arreglo.
- X:  Arreglo a ordenar.

Salida:

El arreglo ordenado.



In [None]:
#include <cstdio>
#define N 101
using namespace std;

int X[N], C[N];
int n;

void mergeSort(int, int);
void merge(int, int, int);

int main() {
    scanf("%d", &n);

    // Lee los numeros a ser ordenados
    for (int i = 0; i < n; i++) {
        scanf("%d", &X[i]);
    }

    // Aplicamos merge sort
    mergeSort(0, n - 1);

    // Imprimimos el arreglo ordenado
    for (int i = 0; i < n; i++) {
        printf("%d ", X[i]);
    }
    printf("\n");

    return 0;
}


La función `mergeSort` recibe un intervalo de los elementos para ordenar, calcula el elemento medio y recursivamente se vuelve a llamar para ordenar ambas mitades del intervalo. 

Finalmente se juntan ambas mitades ordenando todos los elementos del intervalo.

In [None]:
void mergeSort(int i, int j) {
 if (i != j) {
    int m = (i + j) / 2;
     mergeSort(i, m);
     mergeSort(m + 1, j);
     merge(i, m, j);
    }
}

El proceso explicado anteriormente tiene lugar en la función `merge`, que recibe los índices i y j del intervalo a ordenar, y el punto medio m, y ordena ambas mitades del arreglo.


In [None]:
void merge(int i, int m, int j) {
    // p y q son los indices que se moverán a través 
    // de cada mitad respectivamente.
    int p = i;
    int q = m + 1;
    int r = i;
    // Sigue comparando los valores de X[p] y X[q] 
    // hasta llegar al final de una de las mitades

    while (p <= m && q <= j) {
        if (X[p] <= X[q]) {
          C[r++] = X[p++];
        } else {
          C[r++] = X[q++];
        }
    }
    
    //Agregamos los elementos restantes de la primera mitad.
    while (p <= m) {
        C[r++] = X[p++];
    }

    //Agregamos los elementos restantes de la segunda mitad.
    while (q <= j) {
        C[r++] = X[q++];
    }

    // Actualizamos el arreglo original
    for (r = i; r <= j; r++) {
      X[r] = C[r];
    }
}

**Ejercicio:** Suponga que recibes $k$ arreglos ordenados, cada uno con $n$ elementos, y deseas combinarlos en un solo arreglo ordenado de $kn$ elementos. 

Un enfoque es usar la subrutina `merge` repetidamente, combinar los dos primeros arreglos, luego combinar el resultado con el tercer arreglo, luego con el cuarto arreglo y así sucesivamente hasta que se combine en el arreglo de entrada enésima y final. ¿Cuál es el tiempo de ejecución?

In [None]:
// Tu respuesta

La información de este cuaderno está basada en el libro de David Esparza Alba, Algorithms for Competitve Programming.

**Repaso:** Estudia las demostraciones dados aquí: https://homepages.bluffton.edu/~nesterd/apps/SortingDemo.html 

In [None]:
// Tus respuestas