# Ordenación de matrices

Hasta este punto nos hemos ocupado principalmente de las herramientas para acceder y operar con datos de arrays con NumPy.
Este notebook cubre algoritmos relacionados con la ordenación de valores en arrays NumPy.
Estos algoritmos son un tema favorito en los cursos introductorios de informática: si alguna vez has tomado uno, probablemente has tenido sueños (o, dependiendo de tu temperamento, pesadillas) sobre *ordenaciones de inserción*, *ordenaciones de selección*, *ordenaciones de fusión*, *ordenaciones rápidas*, *ordenaciones de burbuja*, y muchas, muchas más.
Todos son medios para realizar una tarea similar: ordenar los valores de una lista o matriz.

Por ejemplo, una simple *ordenación por selección* encuentra repetidamente el valor mínimo de una lista, y hace intercambios hasta que la lista está ordenada. Podemos codificar esto en unas pocas líneas de Python:

In [None]:
import numpy as np

def selection_sort(x:np.array) -> np.array:
    for i in range(len(x)):
        swap = i + np.argmin(x[i:])
        (x[i], x[swap]) = (x[swap], x[i])
    return x

In [None]:
x = np.array([2, 1, 4, 3, 5])
selection_sort(x)

Como cualquier estudiante de primer año de informática le dirá, la ordenación por selección es útil por su simplicidad, pero es demasiado lenta para ser útil para matrices más grandes.
Para una lista de $N$ valores, requiere $N$ bucles, cada uno de los cuales hace en orden $\sim N$ comparaciones para encontrar el valor de intercambio.
En términos de la notación "big-O" utilizada a menudo para caracterizar estos algoritmos, la ordenación por selección tiene un promedio de $\mathcal{O}[N^2]$: si se duplica el número de elementos de la lista, el tiempo de ejecución se multiplicará por cuatro aproximadamente.

Sin embargo, incluso la ordenación por selección es mucho mejor que mi algoritmo de ordenación favorito de todos los tiempos, el *bogosort*:

In [None]:
def bogosort(x:np.array) -> np.array:
    while np.any(x[:-1] > x[1:]):
        np.random.shuffle(x)
    return x

In [None]:
x = np.array([2, 1, 4, 3, 5])
bogosort(x)

Este tonto método de ordenación se basa en el puro azar: se aplica repetidamente una mezcla aleatoria de la matriz hasta que el resultado resulta estar ordenado.
Con un escalado medio de $\mathcal{O}[N veces N!]$, (es decir, *N* veces *N* factorial) esto debería -de forma bastante obvia- no utilizarse nunca para ningún cálculo real.

Afortunadamente, Python contiene algoritmos de ordenación incorporados que son *mucho* más eficientes que cualquiera de los algoritmos simplistas que acabamos de mostrar. Empezaremos viendo los algoritmos incorporados en Python, y luego echaremos un vistazo a las rutinas incluidas en NumPy y optimizadas para arrays NumPy.

## Ordenación rápida en NumPy: ``np.sort`` y ``np.argsort``

Aunque Python tiene incorporadas las funciones ``sort`` y ``sorted`` para trabajar con listas, no las discutiremos aquí porque la función ``np.sort`` de NumPy resulta ser mucho más eficiente y útil para nuestros propósitos.
Por defecto, ``np.sort`` utiliza un algoritmo $\mathcal{O}[N\log N]$, *quicksort*, aunque también están disponibles *mergesort* y *heapsort*. Para la mayoría de las aplicaciones, el quicksort por defecto es más que suficiente.

Para devolver una versión ordenada de la matriz sin modificar la entrada, puede utilizar ``np.sort``:

In [None]:
x = np.array([2, 1, 4, 3, 5])
np.sort(x)

Si prefieres ordenar el array en su lugar, puedes utilizar el método ``sort`` de arrays:

In [None]:
x.sort()
print(x)

Una función relacionada es ``argsort``, que devuelve los *índices* de los elementos ordenados:

In [None]:
x = np.array([2, 1, 4, 3, 5])
i = np.argsort(x)
print(i)

El primer elemento de este resultado da el índice del elemento más pequeño, el segundo valor da el índice del segundo más pequeño, y así sucesivamente.
Si se desea, estos índices pueden utilizarse (mediante indexación de fantasía) para construir la matriz ordenada:

In [None]:
x[i]

### Ordenación por filas o columnas

Una característica útil de los algoritmos de ordenación de NumPy es la capacidad de ordenar a lo largo de filas o columnas específicas de un array multidimensional utilizando el argumento ``axis``. Por ejemplo:

In [None]:
rand = np.random.RandomState(42)
X = rand.randint(0, 10, (4, 6))
print(X)

In [None]:
# ordena cada columna de X
np.sort(X, axis=0)

In [None]:
# ordena cada fila de X
np.sort(X, axis=1)

Tenga en cuenta que esto trata cada fila o columna como una matriz independiente, y cualquier relación entre los valores de fila o columna se perderá.

## Ordenaciones parciales: Partición

A veces no estamos interesados en ordenar todo el array, sino que simplemente queremos encontrar los *k* valores más pequeños del array. NumPy proporciona esto en la función ``np.partition``. ``np.partition`` toma un array y un número *K*; el resultado es un nuevo array con los *K* valores más pequeños a la izquierda de la partición, y el resto de valores a la derecha, en orden arbitrario:

In [None]:
x = np.array([7, 2, 3, 1, 6, 5, 4])
np.partition(x, 3)

Observe que los tres primeros valores de la matriz resultante son los tres más pequeños de la matriz, y las restantes posiciones de la matriz contienen los valores restantes.
Dentro de las dos particiones, los elementos tienen un orden arbitrario.

De forma similar a la ordenación, podemos particionar a lo largo de un eje arbitrario de una matriz multidimensional:

In [None]:
np.partition(X, 2, axis=1)

El resultado es una matriz en la que las dos primeras ranuras de cada fila contienen los valores más pequeños de esa fila, y los valores restantes llenan las ranuras restantes.

Por último, al igual que existe un ``np.argsort`` que calcula los índices de la ordenación, existe un ``np.argpartition`` que calcula los índices de la partición.
Veremos esto en acción en la siguiente sección.

<!--NAVIGATION-->
< [ Comparaciones de mascaras y logica booleana](5-Comparaciones_mascaras_logica_booleana.ipynb) | [Matrices estructuradas de NumPy](7-Matrices_estructuradas_de_NumPy.ipynb) >
