$\newcommand{\O}[1]{\mathcal{O}({#1})}$
# Estadísticas de orden

Dada una secuencia de $n$ números $A$,

¿Cómo podemos encontrar el menor elemento de $A$?

    Tengo que recorrer todos -> $\O{n}$.

¿y el segundo menor?

    Puedo recorrer primero en $\O{n}$, luego otra vez con los $n-1$ en $\O{n}$

¿y encontrar el $i$-ésimo menor?

    Lo más complicado sería encontrar la mediana.
Si nos vamos al otro extremo, $i=n$, podemos invertir el problema y encontrar el mayor.

¿Es necesario gastar $\O{n \log n}$ para ordenar y tener que encontrar el elemento del medio?

## Algoritmo más inteligente

Dado un $x \in A$ arbitrario, podemos contar cuántos son mayores y menores a $x$ para saber su posición.

Además, podemos hacer dos listas para ambos grupos.

Sea la secuencia $A = \{ 7, 3, 5, 2, 1, 9, 7, 8, 6, 4, 3\}$

Supongamos que escogimos el 6.

Ahora, las listas de menores y mayores serían

Menores: $\{ 3, 5, 2, 1, 4, 3 \}$

Mayores: $\{7, 9, 7, 8 \}$

Sabemos que el 6 estará en la séptima posición, ya que hay seis elementos en la lista de menores.

Ahora, como la lista de menores tiene más elementos, la recursión continúa tomando un elemento del conjunto "menores". En general, si la posición elegida queda a la derecha de la mediana toma el siguiente pivote en "menores", y del conjunto "mayores" si queda a la izquierda.

Una vez que el elemento elegido está en la posición $\dfrac{n}{2}$, esa es la mediana.


    partition(A, i, f):
        p = pivote aleatorio en A[i, f]
        m, M = listas vacías
        for x in A[i, f]:
            if x < p:
                inserta x al final de m
            elif x > p:
                inserta x al final de M
        A[i, f] = concatenar m, [p], M
        return i + |m|


    median(A):
        i = 0
        f = n - 1
        p = partition(A, i, f)
        while p != floor(n/2):
            if p < n/2:
                i = p + 1
            else:
                f = p - 1
            p = partition(A, i, f)
        return A[p]

De hecho, el algoritmo median(A) se puede adaptar en la condición del while para retornar el $j$-ésimo menor, cambiando por:
     
     while p != j.

En ese caso se denomina **quickSelect(A, j)**.

En el peor caso, a medida que voy particionando el conjunto, como es aleatorio, podría siempre elegir el máximo de los conjuntos. P. ej, reviso el mayor, luego el menor, segundo mayor, segundo menor, alternadamente. Con esto, habré revisado en $\O{n^2}$ por la suma aritmética. 

¿Se puede aprovechar que haya elementos repetidos?

Sí, se podrían agrupar y mover de a varios. Si hay elementos iguales al pivote actual, se pueden almacenar como un conjunto. Ahora, debemos retornar los índices donde empieza y termina la zona de iguales para no volver a considerarla. Esta versión se conoce como _3-way partition_.

El peor caso se da cuando el pivote escogido hace que una de las dos listas, $m, M$ quedan vacías. Si esto pasa en todos los casos, toma tiempo en $\O{n^2}$

Muchas implementaciones de partition escogen como pivote el primer elemento. Esto hace que el peor caso se dé cuando los datos vienen en orden.

Usar un pivote aleatorio permite que el peor caso sea impredecible, por lo que no es posible causar el peor caso intencionalmente.

### Podemos usar partition para ordenar! Presentamos: QuickSort

    quicksort(A, i, f):
        if i<=f:
            p = partition(A, i, f) // p ahora va a estar en la posición final
            quicksort(A, i, p - 1)
            quicksort(A, p + 1, f)

El peor caso pasa igual que en quickSelect, es $\O{n}$, si elijo malos pivotes que dejan alguna de $m, M$ vacías.

La mejor forma de evitarlo sigue siendo escoger un pivote aleatorio.

El mejor caso es $\O{n \log n}$, ya que le pegamos justo a la mediana en el primer ciclo, luego reduce el problema en 2 (similar a búsqueda binaria). Si a los otros subproblemas también le pego a la mitad al p, queda $\O{\log n}$ llamadas a quickSort y partition, que es $\O{n}$.