<a href="https://colab.research.google.com/github/jugernaut/ManejoDatos/blob/desarrollo/AlgoritmosOrdenamiento/03_RadixBucket.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

<font color="Teal" face="Comic Sans MS,arial">
  <h1 align="center"><i>RadixSort y BucketSort (análisis)</i></h1>
  </font>
  <font color="Black" face="Comic Sans MS,arial">
  <h5 align="center"><i>Profesor: M.en.C. Miguel Angel Pérez León.</i></h5>
    <h5 align="center"><i>Ayudante: Jesús Iván Coss Calderón</i></h5>
    <h5 align="center"><i>Ayudante: Jonathan Ramŕez Montes</i></h5>
  <h5 align="center"><i>Manejo de Datos</i></h5>
  </font>

# Introducción

Este par de algoritmos de ordenamiento (RadixSort y BucketSort) los podemos considerar algoritmos "exóticos", ya que a diferencia de los algoritmos vistos previamente, estos no se basan en comparaciones entre los elementos a ordenar.

Por otro lado estos algoritmos requiere de conocimientos a priori de los datos a ordenar, por ejemplo la longitud en terminos de digitos decimales de los elementos a ordenar.

# *RadixSort*

Este algoritmo ordena los elementos de manera similar a como funcionan los tableros que anuncian las llegadas de los aviones en un aeropuerto. Imaginemos que los valores a ordenar los podemos colocar en renglones donde cada renglón contiene casillas para cada dígito del elemento a ordenar, algo así.

$$
\begin{array}{ccccc}
\left[d_{n}\right] & \left[\ldots\right] & \left[d_{2}\right] & \left[d_{1}\right] & \left[d_{0}\right]\end{array}
$$

La idea detrás de este algoritmo es ordenar cada digito de derecha a izquierda por cada elemento a ordenar, modificando la posición del elemento a ordenar en caso de que el dígito a ordenar haya sufrido alguna modificación respecto a la posición en la colección.

<center>
<img src="https://github.com/jugernaut/ManejoDatos/blob/desarrollo/Imagenes/AlgoritmosOrdenamiento/RadixSort.png?raw=1" width="600"> 
</center>

## Descripción

Para que el algoritmo *RadixSort* funcione de manera correcta hay que **conocer la longitud (en términos) de dígitos** del elemento más extenso a ordenar, una vez que se conoce esta longitud se completan con ceros (a la izquierda del dígito $d_{n}$ en caso de ser necesario). Una vez que todos los elementos a ordenar tienen la misma longitud comienza el algoritmo con los siguientes pasos:


1.   Comenzamos a ordenar la columna correspondiente al $d_{0}$ (que se le conoce como el dígito menos significativo), se realizan las respectivas modificaciones en las posiciones de los renglones en caso de ser necesario y se continua con la columna $d_{1}$.
2.   Se ordena la columna $d_{1}$, de manera similar a como se hizo con la columna anterior y se procede a la siguiente.
3.   Continuamos ordenando todas las columnas (con sus respectivas modificaciones sobre los renglones), hasta llegar a la columna $d_{n}$ (el dígito más significativo).
4.   Al ordenar el dígito más significativo de cada renglón termina el algoritmo.





## Ejemplo

Supongamos que se tiene el siguiente conjunto de datos a ordenar que podemos organizarlos de la siguiente manera.

$$
\begin{array}{ccc}
\left[d_{2}\right] & \left[d_{1}\right] & \left[d_{0}\right]\\
\left[1\right] & \left[0\right] & \left[5\right]\\
\left[0\right] & \left[2\right] & \left[5\right]\\
\left[3\right] & \left[0\right] & \left[1\right]
\end{array}
$$

Ahora la idea es comenzar a ordenar la primer columna (la columna correspondiente al digito $d_{0}$) se ordena esa columna, considerando que el $d_{0}$ pertenece a todo un renglon y por lo tanto si el $d_{0}$ de algún renglón cambia su posición, también lo debe hacer todo el renglón. Después de ordenar el $d_{0}$, esta colección de datos se ve de la siguiente forma.

$$
\begin{array}{ccc}
\left[d_{2}\right] & \left[d_{1}\right] & \left[\color{green}{d_{0}}\right]\\
\left[3\right] & \left[0\right] & \left[\color{green}1\right]\\
\left[1\right] & \left[0\right] & \left[\color{green}5\right]\\
\left[0\right] & \left[2\right] & \left[\color{green}5\right]
\end{array}
$$

Se procede a ordenar la columna correspondiente al $d_{1}$ y podemos notar que no hay cambios en los renglones, ya que la columna $d_{1}$ ya se encuentra ordenada.

$$
\begin{array}{ccc}
\left[d_{2}\right] & \left[\color{green}{d_{1}}\right] & \left[\color{green}{d_{0}}\right]\\
\left[3\right] & \left[\color{green}0\right] & \left[\color{green}1\right]\\
\left[1\right] & \left[\color{green}0\right] & \left[\color{green}5\right]\\
\left[0\right] & \left[\color{green}2\right] & \left[\color{green}5\right]
\end{array}
$$

Por último, se ordena la columna $d_{2}$ y la colección queda de la siguiente forma.

$$
\begin{array}{ccc}
\left[\color{green}{d_{2}}\right] & \left[\color{green}{d_{1}}\right] & \left[\color{green}{d_{0}}\right]\\
\left[\color{green}0\right] & \left[\color{green}2\right] & \left[\color{green}5\right]\\
\left[\color{green}1\right] & \left[\color{green}0\right] & \left[\color{green}5\right]\\
\left[\color{green}3\right] & \left[\color{green}0\right] & \left[\color{green}1\right]
\end{array}
$$

Y la colección queda ordenada.


## Análisis y Orden de Complejidad

Dado que este algoritmo no se basa en comparaciones podemos pensar que el ordenar cada columna ($d_{i})$ toma tiene un costo lineal, es decir $O(n)$ ya que unicamente estamos organizando cada elemento respecto al dígito, tarea muy **similar a cuando organizamos elementos dentro de contenedores o cubetas**.

Ahora supongamos que el elemento de mayor longitud dentro de la colección esta conformado por $k-digitos$, entonces se tendrían que ordenar $k$ columnas, por lo tanto el algoritmo *RadixSort* pertenece al orden de complejidad $O(kn)$.

Así que podemos pensar que el peor caso para este algoritmo es cuando $k$ es demasiado grande (y sobretodo si son pocos los elementos que poseén la misma longitud). Pensemos que $k\approx n$, entonces el orden al que pertenecería este algoritmo sería $O(nn)=O(n²)$.



## Algoritmo básico

A continuación se muestra el pseudocódigo del algoritmo para ordenar por mezcla.

<center>
<img src="https://github.com/jugernaut/Numerico2021/blob/master/Imagenes/Merge/merge.PNG?raw=1" width="600"> 
</center>

In [None]:
# Algoritmo de ordenamiento
def mergeSort(lista):
    # si la coleccion es de tamano 1 o 0 se devuelve
    if (len(lista) < 2):
        return lista # 1 operacion
    # si no se parte la coleccion y se ordena recursivamente    
    else:
        medio = len(lista)//2
        izquierda = mergeSort(lista[:medio]) #T(n/2)
        derecha = mergeSort(lista[medio:])  #T(n/2)
        # se mezclan ambas listas (n operaciones)
        return merge(izquierda, derecha)

# Algoritmo que mezcla 2 listas ordenadas
def merge(l1, l2):
    i,j=0,0
    mezcla=[]
    # mientras haya elementos, se comparan y se mezclan
    while(i < len(l1) and j < len(l2)):
        if l1[i] <= l2[j]:
            mezcla.append(l1[i])
            i = i+1
        else:
            mezcla.append(l2[j])
            j = j+1  
    # agrega lo que falta, si i o j ya son len(lista) no agregan
    mezcla += l1[i:]
    mezcla += l2[j:]
    # se devuelve la coleccion ordenada
    return mezcla

print(mergeSort([2,8,5,3,9,4,1,7]))

[1, 2, 3, 4, 5, 7, 8, 9]


## ¿Qué sucede con colecciones de tamaño $n$?

Dado el análisis (y el pseudocódigo del algoritmo) podemos ver que ordenar una colección de tamaño $n$ tomara $2T(\frac{n}{2})+a\cdot n$. Pero este valor aun no permite identificar a que orden de complejidad pertenece este algoritmo.

Es por eso que necesitamos definir la función de recurrencia de la siguiente forma.

Función de recurrencia para el algoritmo de ordenamiento *MergeSort*:

$$T(n)=\begin{cases}
b & n=0\,\acute{o}\,n=1\\
2T(\frac{n}{2})+a\cdot n & n\geq2
\end{cases} \tag{1}$$

A la función (1), se le conoce como la función de recurrencia asociada al algoritmo de ordenamiento *MergeSort*. Ya que conocemos la función de recurrencia podemos tratar de determinar de manera formal cuantas operaciones le toma a este algoritmo ordenar una colección de datos.


## Demostración

Esta demostración se sustenta en el análisis realizado previamene y en el [teorema maestro](https://es.wikipedia.org/wiki/Teorema_maestro).

Sea $T(n)$ el numero de operaciones que le toma al algoritmo anterior ordenar una lista de tamaño $n$ y dada la función de recurrencia. 

P.D. $$T(n)=n\cdot b+a\cdot n\cdot\log_{2}n$$

Para mayor claridad de la demostración definimos $n=2^{k}$

$$\begin{eqnarray*}
T(n)	& = &	T(2^{k}) \\
  & = & 2T(2^{k-1})+a\cdot2^{k}....Definición\\
  & = & 2(2T(2^{k-2})+a\cdot2^{k-1})+a\cdot2^{k}.....Leyes\,exponentes\,y\,Función\,recurrencia \\
  & = & 2^{2}T(2^{k-2})+a\cdot2^{k}+a\cdot2^{k}.......Algebra\,elemental\\
	& = & 2^{2}(2T(2^{k-3})+a\cdot2^{k-2})+2\cdot a\cdot2^{k}.....Función\,recurrencia\\ 
i-veces & \vdots & \\
	& = & 2^{i}T(2^{k-i})+i\cdot a\cdot2^{k} \\
i=k		& \vdots & \\
	& = & 2^{k}T(2^{k-k})+k\cdot a\cdot2^{k}......2^{k-k}=1 \\
	& = &	2^{k}b+k\cdot a\cdot2^{k}........T(1)=b \\
	& = &	n\cdot b+k\cdot a\cdot n......n=2^{k} \\
	& = &	n\cdot \color{red}b+ \color{red}a\cdot n\cdot\log_{2}n....(2) \\
\end{eqnarray*}$$



## Orden de complejidad (cota superior asintótica)

Ya que $a$ y $b$ son constantes podemos concluir que de la ecuación (2), la función que 'crece' más rápido es 

$$a\cdot n\cdot\log_{2}n$$

Esa es la función que **acota superiormente el desempeño del algoritmo** *MergeSort*.

Finalmente si asumimos que $a=c$, entonces se puede concluir que $T(n)\in O(n\cdot\log_{2}n)$, es decir que el orden de complejidad al cual pertenece el algoritmo *MergeSort* es $n\cdot\log_{2}n$.

En otras palabras podemos decir que el numero de operaciones que le toma a *MergeSort* ordenar una colección de tamaño $n$ es proporcional a $n\cdot\log_{2}n$.

Esto significa (con sustento matemático) que *MergeSort* tiene un mejor desempeño que *InsertionSort, SeleccionSort* o *BubbleSort* en cuanto a la cantidad de operaciones (tiempo) que le toma ordenar una colección de datos.

En otros términos podemos decir que si pusiéramos a competir (en términos de tiempo) a *MergeSort* contra, por ejemplo *BubbleSort*, el ganador seria *MergeSort*.


# QuickSort

Otro de los algoritmos que ha mostrado un desempeño muy bueno en términos de tiempo de ejecución es el algoritmo conocido como *QuickSort*.
 
La forma en la que funciona *QuickSort* es muy similar a *MergeSort* en el sentido de que inicialmente se tiene un conjunto o estructura de datos (lista, vector, arreglo, etc) de tamaño $n$ que se encuentran desordenados y que mediante algún atributo podemos ordenar. La diferencia entre ambos algoritmos es que *QuickSort* se toma un **pivote** para poder acomodar a los menores y mayores. 

1.   Tomamos un valor de la lista de datos a ordenar (que idealmente parte a la colección a la mitad), a ese valor le llamamos pivote.
2.   Una vez que se eligió al pivote, comparamos a todos los elementos contra el pivote y **almacenamos los menores al lado izquierdo del pivote y a los mayores del lado derecho** los cual nos deja 2 subconjuntos de tamaño $\frac{n}2$.
2.   Posteriormente volvemos a tomar un pivote en cada una de las respectivas subconjuntos, e idealmente volvemos a dividir estas en 4 subconjuntos de tamaño $\frac{n}4$, se repite este proceso hasta que se tienen subconjuntos de tamaño 2.
3.   Ya que se tienen conjuntos de tamaño a lo mas 2, se ordenan de manera individual cada uno de ellos.
4.   Cada uno de estos subconjuntos ordenados se mezclan de manera recursiva y ordenada, hasta que todo el conjunto de datos se encuentran ordenados.

<center>
<img src="https://github.com/jugernaut/ProgramacionEnParalelo/blob/desarrollo/Imagenes/Introduccion/quicksort.jpg?raw=1" width="550">
</center> 

## Análisis

Para el caso cuando se requiere ordenar una colección (lista) de tamaño 1 (o 0 caso trivial), basta con devolver dicha lista ya que esta ya esta ordenada, lo cual toma tiempo constante, digamos $b$, podemos pensar que este valor $b$ **es el tiempo que le toma al microprocesador de propósito general ejecutar la instrucción** *return*.

Para el caso de una colección de tamaño 2 ó mayor, es necesario partir a la mitad dicha colección, ordenar ambas subcolecciones y mezclarlas. Ahora consideremos que para simplificar el análisis de la complejidad diremos que $a$ es el **tiempo que toma al microprocesador realizar una operación lógica o aritmética**.

Es por esto que ordenar una colección de tamaño $n$ tomará en total.

$$2T(\frac{n}{2})+a\cdot n$$

Similar al tiempo que le toma ordenar una colección al algoritmo MergeSort.

In [None]:
# Definicion recursiva de quicksort
def quickSort(lista):
  # si la lista es de tamano 1 o menor se devuelve
  if len(lista) < 2:
    return lista
  # en otro caso se parte la lista y se resuelve recursivamente
  else:
    # se parte la lista original (n operaciones)
    menores, pivote, mayores = particion(lista) 
    # 2*T(n/2)
    return quickSort(menores)+[pivote]+quickSort(mayores)

# Definicion del algoritmo para partir una lista en mayores y menores
def particion(lista):
  mayores, menores = [], []
  # pivote para realizar la comparación
  pivote = lista[0]
  for i in range(1,len(lista)):
    if lista[i] < pivote:
      menores.append(lista[i])
    else:
      mayores.append(lista[i])
  # se devuelven ambas listas y el pivote
  return menores, pivote, mayores

print(quickSort([2,8,5,3,9,4,1,7]))

[1, 2, 3, 4, 5, 7, 8, 9]


## Orden de complejidad (cota superior asintótica)

Dado que la función de recurrencia de *QuickSort* es idéntica a la del algoritmo *MergeSort*, el orden de complejidad al que pertenece el algoritmo *QuickSort* es idéntico al de *MergeSort*, es decir $T(n)\in O(n\cdot\log_{2}n)$.



# Ordenando Objetos

Es importante notar que este y todos los algoritmos de ordenamiento vistos funcionan con cualquier objeto que sea ordenable (realizando las respectivas adecuaciones), es decir, con todo clase de objetos en la que podamos establecer un orden, por ejemplo: $\mathbb{N},\,\mathbb{Z},\,\mathbb{Q},\,\mathbb{R}$, incluso con $\mathbb{C}$ o elementos más complejos como vectores, matrices, palabras o todo aquello en lo que podamos establecer un orden.

## Ley de Amdahal

Sea $f$ la fracción de operaciones en un calculo computacional que será llevado a cabo de manera secuencial, donde $0\leq f\leq1$. La máxima velocidad $\Psi$ alcanzada mediante programación en paralelo con una computadora con $p$ procesadores enfocados en el mismo calculo es:

$$\Psi\leq\frac{1}{f+(1-f)/p}$$

#Referencias

1. Thomas H. Cormen: Introduction to Algorithms.
2. Libro Web: [Introduccion a Python](https://uniwebsidad.com/libros/algoritmos-python/capitulo-20/cuanto-cuesta-el-merge-sort?from=librosweb).
3. Daniel T. Joyce: Object-Oriented Data Structures.
4. John C. Mitchell: Concepts in programing Languages.