<a href="https://colab.research.google.com/github/jugernaut/ProgramacionEnParalelo/blob/main/Introduccion/04_RadixBucket.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

<font color="Teal" face="Comic Sans MS,arial">
  <h1 align="center"><i>RadixSort y BucketSort (análisis)</i></h1>
  </font>
    <font color="Black" face="Comic Sans MS,arial">
  <h5 align="center"><i>Profesor: M. en C. Miguel Angel Pérez León</i></h5>
    <h5 align="center"><i>Ayudante: Jesús Iván Coss Calderón</i></h5>
    <h5 align="center"><i>Ayudante: Andrea Fernanda Muñiz Patiño</i></h5>
  <h5 align="center"><i>Materia: Seminario de programación en paralelo</i></h5>
  </font>

# Introducción

Este par de algoritmos de ordenamiento (*RadixSort* y *BucketSort*) los podemos considerar algoritmos "exóticos", ya que a diferencia de los algoritmos vistos previamente, estos no se basan en comparaciones entre los elementos a ordenar.

Por otro lado estos algoritmos requieren de conocimientos a priori de los datos a ordenar, por ejemplo la longitud en términos de dígitos decimales de los elementos a ordenar.

# *RadixSort*

Este algoritmo ordena los elementos de manera similar a como funcionan los tableros que anuncian las llegadas de los aviones en un aeropuerto. Imaginemos que los valores a ordenar los podemos colocar en renglones donde cada renglón contiene casillas para cada dígito del elemento a ordenar, algo así.

$$
\begin{array}{ccccc}
\left[d_{n}\right] & \left[\ldots\right] & \left[d_{2}\right] & \left[d_{1}\right] & \left[d_{0}\right]\end{array}
$$

La idea detrás de este algoritmo es ordenar cada dígito de derecha a izquierda por cada elemento a ordenar, modificando la posición del elemento a ordenar en caso de que el dígito a ordenar haya sufrido alguna modificación respecto a la posición en la colección.

<center>
<img src="https://github.com/jugernaut/ManejoDatos/blob/desarrollo/Imagenes/AlgoritmosOrdenamiento/RadixSort.png?raw=1" width="600"> 
</center>

## Descripción

Para que el algoritmo *RadixSort* funcione de manera correcta hay que **conocer la longitud (en términos) de dígitos** del elemento más extenso a ordenar, una vez que se conoce esta longitud se completan con ceros (a la izquierda del dígito $d_{n}$ en caso de ser necesario). Una vez que todos los elementos a ordenar tienen la misma longitud comienza el algoritmo con los siguientes pasos:


1.   Comenzamos a ordenar la columna correspondiente al $d_{0}$ (que se le conoce como el dígito menos significativo), se realizan las respectivas modificaciones en las posiciones de los renglones en caso de ser necesario y se continua con la columna $d_{1}$.
2.   Se ordena la columna $d_{1}$, de manera similar a como se hizo con la columna anterior y se procede a la siguiente.
3.   Continuamos ordenando todas las columnas (con sus respectivas modificaciones sobre los renglones), hasta llegar a la columna $d_{n}$ (el dígito más significativo).
4.   Al ordenar el dígito más significativo de cada renglón termina el algoritmo.





## Ejemplo

Supongamos que se tiene el siguiente conjunto de datos a ordenar que podemos organizarlos de la siguiente manera.

$$
\begin{array}{ccc}
\left[d_{2}\right] & \left[d_{1}\right] & \left[d_{0}\right]\\
\left[1\right] & \left[0\right] & \left[5\right]\\
\left[0\right] & \left[2\right] & \left[5\right]\\
\left[3\right] & \left[0\right] & \left[1\right]
\end{array}
$$

Ahora la idea es comenzar a ordenar la primer columna (la columna correspondiente al digito $d_{0}$) se ordena esa columna, considerando que el $d_{0}$ pertenece a todo un renglon y por lo tanto si el $d_{0}$ de algún renglón cambia su posición, también lo debe hacer todo el renglón. Después de ordenar el $d_{0}$, esta colección de datos se ve de la siguiente forma.

$$
\begin{array}{ccc}
\left[d_{2}\right] & \left[d_{1}\right] & \left[\color{green}{d_{0}}\right]\\
\left[3\right] & \left[0\right] & \left[\color{green}1\right]\\
\left[1\right] & \left[0\right] & \left[\color{green}5\right]\\
\left[0\right] & \left[2\right] & \left[\color{green}5\right]
\end{array}
$$

Se procede a ordenar la columna correspondiente al $d_{1}$ y podemos notar que no hay cambios en los renglones, ya que la columna $d_{1}$ ya se encuentra ordenada.

$$
\begin{array}{ccc}
\left[d_{2}\right] & \left[\color{green}{d_{1}}\right] & \left[\color{green}{d_{0}}\right]\\
\left[3\right] & \left[\color{green}0\right] & \left[\color{green}1\right]\\
\left[1\right] & \left[\color{green}0\right] & \left[\color{green}5\right]\\
\left[0\right] & \left[\color{green}2\right] & \left[\color{green}5\right]
\end{array}
$$

Por último, se ordena la columna $d_{2}$ y la colección queda de la siguiente forma.

$$
\begin{array}{ccc}
\left[\color{green}{d_{2}}\right] & \left[\color{green}{d_{1}}\right] & \left[\color{green}{d_{0}}\right]\\
\left[\color{green}0\right] & \left[\color{green}2\right] & \left[\color{green}5\right]\\
\left[\color{green}1\right] & \left[\color{green}0\right] & \left[\color{green}5\right]\\
\left[\color{green}3\right] & \left[\color{green}0\right] & \left[\color{green}1\right]
\end{array}
$$

Y la colección queda ordenada.


## Análisis y Orden de Complejidad

Dado que este algoritmo no se basa en comparaciones podemos pensar que el ordenar cada columna ($d_{i})$ tiene un costo lineal, es decir $O(n)$ ya que unicamente estamos organizando cada elemento respecto al dígito, tarea muy **similar a cuando organizamos elementos dentro de contenedores o cubetas**.

Ahora supongamos que el elemento de mayor longitud dentro de la colección está conformado por $k-digitos$, entonces se tendrían que ordenar $k$ columnas, por lo tanto el algoritmo *RadixSort* pertenece al orden de complejidad $O(kn)$.

Así que podemos pensar que el peor caso para este algoritmo es cuando $k$ es demasiado grande (y sobretodo si son pocos los elementos que poseén la misma longitud). Pensemos que $k\approx n$, entonces el orden al que pertenecería este algoritmo sería $O(nn)=O(n²)$.



# Ordenamiento por cubetas (*BucketSort*)

Este algoritmo (no comparativo) consiste en generar contenedores (cubetas) que cumplan con determinadas caracteristicas, enviar a los elementos que cumplan con estas a su respectivo contenedor y ordenar cada contenedor de manera individual.

## Descripción

De manera similar a *RadixSort*, para el óptimo funcionamiento de este algoritmo se requieren ciertas caracteristicas y en este caso es que los elementos a ordenar se ecuentren distribuidos de manera uniforme sobre el espacio a ordenar. A continuación una descripción de como funciona este algoritmos:

1.   Dado que se conoce a priori el espacio donde se distribuyen los elementos a ordenar, se genéran contenedores (cubetas) con ciertas caracteristicas, por ejemplo un rango de valores, para almacenar a los elementos que cumplan con estas caracteristicas.
2.   Se recorren todos los elementos a ordenar y se va colocando uno a uno en el contenedor correspondiente.
2.   Se ordena cada contenedor de manera individual con este mismo algoritmo (o con alguno visto previamente.
3.   Se extraen los elementos de cada contenedor comenzando con el contenedor que almacene a los elementos de menor valor y finalizando con el contenedor que almacena a los elementos de mayor valor.
4.   El algoritmo termina cuando los elementos del último contener han sido extraidos.

<center>
<img src="https://github.com/jugernaut/ManejoDatos/blob/desarrollo/Imagenes/AlgoritmosOrdenamiento/BucketSort.jpg?raw=1" width="550">
</center> 

## Ejemplo

En la imagen superior se muestra un ejemplo en el cuál se busca ordenar los datos.

$$
\left[11\right]\left[9\right]\left[21\right]\left[8\right]\left[17\right]\left[19\right]\left[13\right]\left[1\right]\left[24\right]\left[12\right]$$

Dado que se conoce a priori el rango en el cuál se encuentran distribuidos los datos, podemos generar 5 contenedores que abarcan los rangos.

$$
\left[0,5\right),\left[5,10\right),\left[10,15\right),\left[15,20\right),\left[20,26\right)
$$

Y al organizar los datos en los contenedres se verían así:

$$
\begin{array}{cc}
\left[0,5\right): & 1\\
\left[5,10\right): & 9,8\\
\left[10,15\right): & 11,13,12\\
\left[15,20\right): & 17,19\\
\left[2,26\right): & 21,24
\end{array}
$$

Después de ordenar cada contenedor individualmente, los contenedores se ven así:

$$
\begin{array}{cc}
\left[0,5\right): & 1\\
\left[5,10\right): & 8,9\\
\left[10,15\right): & 11,12,13\\
\left[15,20\right): & 17,19\\
\left[2,26\right): & 21,24
\end{array}
$$

Y al extraer todos los datos de cada contenedor, de manera ordenada los datos finalmente quedan ordenados.

$$
\left[1\right]\left[8\right]\left[9\right]\left[11\right]\left[12\right]\left[13\right]\left[17\right]\left[19\right]\left[21\right]\left[24\right]$$






## Análisis y Orden de complejidad

Para llevar a cabo el análisis de la complejidad hay que preguntarse ¿qué tipo de algoritmo de ordenamiento se usará para ordenar individualmente cada cubeta y eso ayuda a determinar el orden de complejidad al que pertenece este algoritmo.

Algunos autores consideran a *RadixSort* un caso particular de *BucketSort*. 

Se deja como ejercicio determinar el orden de complejidad al que pertenece el algoritmo *BucketSort*.

# Ordenando Objetos

Es importante notar que este y todos los algoritmos de ordenamiento vistos funcionan con cualquier objeto que sea ordenable (realizando las respectivas adecuaciones), es decir, con todo clase de objetos en la que podamos establecer un orden, por ejemplo: $\mathbb{N},\,\mathbb{Z},\,\mathbb{Q},\,\mathbb{R}$, incluso con $\mathbb{C}$ o elementos más complejos como **vectores, matrices, palabras o todo aquello en lo que podamos establecer un orden**.

## Algoritmos de ordenamiento en paralelo

Todos los algoritmos vistos funcionan de manera **secuencial**, es decir se realiza un paso (operación) a la vez, sin embargo esta estrategia (secuencial) es prácticamente obsoleta.

¿Si tuvieramos más de una unidad de procesamiento (CPU), podríamos **implementar algunos de estos algoritmos en paralelo**?.

#Referencias

1. Thomas H. Cormen: Introduction to Algorithms.
2. Libro Web: [Introduccion a Python](https://uniwebsidad.com/libros/algoritmos-python/capitulo-20/cuanto-cuesta-el-merge-sort?from=librosweb).
3. Daniel T. Joyce: Object-Oriented Data Structures.
4. John C. Mitchell: Concepts in programing Languages.