<a href="https://colab.research.google.com/github/RodolfoFigueroa/madi2022-1/blob/main/6_Algoritmos_de_Ordenamiento.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

En esta sesión veremos algunos algoritmos de ordenamiento. Se irán presentando implementaciones de dichos algoritmos, el alumno deberá analizarlos y determinar cosas como correctitud, es decir, si el algoritmo en efecto ordena los elementos de una lista dada, complejidades en tiempo y en espacio, así como identificar si es algún algoritmo visto previamente en clase.

A modo de nota, siempre supondremos que la lista de números que se nos está dando es no vacía.

In [None]:
import random 

# Lista = [random.uniform(0,20) for i in range(10)]
Lista = [random.randrange(10, 20, 1) for i in range(10)] 

print(Lista)

[13, 14, 11, 19, 14, 19, 17, 11, 10, 12]


*Ejemplo 1.* 

In [None]:
def sort1(L):
  maxi = L[0]
  mini = L[0]
  for i in range (1, len(L)):
    if(maxi < L[i]): 
      maxi = L[i]
    if(mini > L[i]):
      mini = L[i]
  arr = [0]*(maxi - mini + 1)
  for i in range(0, len(L)):
    arr[L[i] - mini] += 1
  for i in range(0, len(arr)):
    for j in range(0, arr[i]):
      print(i + mini)

sort1(Lista)
  

10
11
11
12
13
14
14
17
19
19


El algoritmo anterior es conocido como *counting sort*, que justamente consiste en contar las ocurrencias de cada número, lo que nos permitirá saber el orden de los elementos de la lista, siempre y cuando los elementos de la lista sean enteros (o tengamos información suficiente sobre las diferencias de los elementos). ¿Cuáles son las complejidades de este algoritmo? Tanto en tiempo como en memoria se tiene que es $O(n+k)$, donde $k$ es la longitud del intervalo entre el mayor y el menor elemento de la lista. Dicha $k$ se puede reducir utilizando diccionarios y hashes, para evitar los números que no aparecen en la lista y están en el intervalo entre el menor y el mayor elemento de la lista.

*Ejemplo 2.* 

In [None]:
def sort2(Lis):
  L = Lis.copy()
  for i in range (len(L), 0, -1):
    for j in range(1, i):
      if(L[j] < L[j-1]):
        L[j-1], L[j] = L[j], L[j-1]
  print(L)

sort2(Lista)

[0, 1, 4, 7, 7, 9, 9, 10, 12, 17]


Este es el algoritmo de ordenamiento llamado *Bubble sort*, que consiste en recorrer la lista suficientes veces, de modo que en cada recorrido de la lista, si entontramos dos números adyacentes tales que no estén ordenados, los invierte, es decir, los cambia de posición. ¿Cuáles son sus complejidades? En cuanto a memoria únicamente requerimos $O(1)$ de memoria auxiliar, mientras que en tiempo se toma $O(n^2)$, ya que podrían llegar a haber $i$ inversiones, para cada $i$ entre $1, n$.

*Ejemplo 3.*

In [None]:
def sort3(L):
  if(len(L) == 1):
    return
  else:
    m = len(L)//2
    left = L[:m]
    right = L[m:]
    sort3(left)
    sort3(right)
    l = r = k = 0
    while(l < len(left) and r < len(right)):
      if(left[l] < right[r]):
        L[k] = left[l]
        l += 1
      else:
        L[k] = right[r]
        r += 1
      k += 1
    while(l < len(left)):
      L[k] = left[l]
      k += 1
      l += 1
    while(r < len(right)):
      L[k] = right[r]
      k += 1
      r += 1


Lista_prueba = Lista.copy()
sort3(Lista_prueba)
print(Lista_prueba)

[0, 1, 4, 7, 7, 9, 9, 10, 12, 17]


Este algoritmo es *merge sort*, el cual actúa bajo el principio de divide y vencerás, es decir, divide la lista inicial en dos, ordena cada sección de lalista por separado, y una vez que están ordenados, los unifica en una nueva lista, que dará como resultado el ordenamiento de nuestra lista inicial. ¿Cuáles son las complejidades de este algoritmo? Es $O(n log n)$ en tiempo, mientras que en espacio auxiliar es $O(n)$, pues se puede acotar el espacio que utiliza por $3n$.

*Ejemplo 4.*

In [None]:
def sort4(L):
  for i in range(0, len(L)):
    new = L[i]
    idx = i-1
    while(idx >= 0 and L[idx] > new):
      L[idx + 1] = L[idx]
      idx -= 1
    L[idx + 1] = new
  return

Lista_prueba = Lista.copy()
sort4(Lista_prueba)
print(Lista_prueba)

[3, 4, 6, 7, 7, 11, 14, 14, 17, 17]


Este algoritmo de ordenamiento es llamado *insertion sort*, su nombre describe lo que se hace, en cada iteración del ciclo for lo que hacemos es crear una lista ordenada con los primeros $i$ elementos, insertando el nuevo elemento donde corresponda. ¿Cuáles son sus complejidades? Se tiene que su complejidad en tiempo es $O(n^2)$, pues iteramos sobre los $n$ elementos de la lista, y en cada una de estas iteraciones podríamos llegar a tener $i-1$ iteraciones dentro del `while`, lo que hace que sea cuadrático en tiempo. En espacio adicional únicamente almacenamos los iteradores y el valor del nuevo elemento de la lista, por lo que es $O(1)$.

*Ejemplo 5*

In [None]:
def aux_sort(L, pos):
  cnt = [0]*10
  for i in range(0, len(L)):
    aux = L[i]//pos
    cnt[(aux%10)] += 1
  for i in range(1, 10): # Recuperamos las posiciones que nos indica el counting sort
    cnt[i] += cnt[i-1]
  ord = [0] * len(L)
  for i in range(len(L)-1, -1, -1):
    aux = L[i]//pos
    ord[cnt[aux%10] - 1] = L[i]
    cnt[aux%10] -= 1
  for i in range(0, len(L)):
    L[i] = ord[i]

def sort5(L):
  pos = 1
  maxi = max(L)
  while(pos <= maxi):
    aux_sort(L, pos)
    pos *= 10
  
Lista_prueba = Lista.copy()
sort5(Lista_prueba)
print(Lista_prueba)

[2, 5, 6, 8, 8, 11, 14, 14, 15, 15]


Notemos que nuestro algoritmo funciona únicamente para listas que tienen puros enteros positivos. Este algoritmo se llama *radix sort*, el cual consiste en ir ordenando los números según sis dígitos, del dígito que representa menor valor (el de las unidades) hasta el que representa el mayor valor. Este algoritmo también se puede adaptar a problemas como ordenar una lista de strings alfabéticamente. 

**Ejercicios.**

1.   Implementa el algoritmo de ordenamiento *quicksort*.
2.   Utilizando radix sort, implementa un algoritmo que permita ordenar alfabéticamente una lista de strings. Puedes suponer que las strings no tienen espacios y contienen únicamente caracteres que son letras minúsculas.
Verifica tu algoritmo con las listas: `['aaaaa', 'zapatos', 'bien', 'zapatillas', 'datos', 'dddatos', 'das', 'ciencia', 'aaa', 'alas', 'problema', 'comando', 'oopera'], ['ddddescarga', 'usando', 'nuevo', 'nuevos', 'version', 'verifica', 'ooo', 'eeee', 'goool', 'golazooo', 'goolazo', 'compartir']`
3.   Determina cuál es el mínimo número de comparaciones necsarias dada una lista $L$ de $n$ números para poder determinar si está ordenada o no. Describe un algoritmo con dicho mínimo y argumenta por qué con menos comparaciones no se puede.

