En esta sesión veremos algunos algoritmos de ordenamiento. Se irán presentando implementaciones de dichos algoritmos, el alumno deberá analizarlos y determinar cosas como correctitud, es decir, si el algoritmo en efecto ordena los elementos de una lista dada, complejidades en tiempo y en espacio, así como identificar si es algún algoritmo visto previamente en clase.

A modo de nota, siempre supondremos que la lista de números que se nos está dando es no vacía.

In [None]:
import random 

Lista = [random.randint(1, 10) for i in range(10)] 

print(Lista)

[6, 5, 6, 3, 4, 6, 8, 3, 5, 10]


# Counting sort

In [None]:
def counting_sort(L):
    maxi = L[0]
    mini = L[0]
    for i in range (1, len(L)):
        if maxi < L[i]: 
            maxi = L[i]
        if mini > L[i]:
            mini = L[i]
            
    arr = [0]*(maxi - mini + 1)
    for i in range(0, len(L)):
        arr[L[i] - mini] += 1
        
    for i in range(0, len(arr)):
        for j in range(0, arr[i]):
            print(i + mini)

counting_sort(Lista)

3
3
4
5
5
6
6
6
8
10


El algoritmo anterior consiste en contar las ocurrencias de cada número, lo que nos permitirá saber el orden de los elementos de la lista, siempre y cuando los elementos de la lista sean enteros (o tengamos información suficiente sobre las diferencias de los elementos). ¿Cuáles son las complejidades de este algoritmo? Tanto en tiempo como en memoria se tiene que es $O(n+k)$, donde $k$ es la longitud del intervalo entre el mayor y el menor elemento de la lista. Dicha $k$ se puede reducir utilizando diccionarios y hashes, para evitar los números que no aparecen en la lista y están en el intervalo entre el menor y el mayor elemento de la lista.

# Bubble sort

In [None]:
def bubble_sort(L):
    L = L.copy()
    for i in range (len(L), 0, -1):
        for j in range(1, i):
            if(L[j] < L[j-1]):
                L[j-1], L[j] = L[j], L[j-1]
    return L

bubble_sort(Lista)

[3, 3, 4, 5, 5, 6, 6, 6, 8, 10]

Este es el algoritmo de ordenamiento llamado *Bubble sort*, que consiste en recorrer la lista suficientes veces, de modo que en cada recorrido de la lista, si entontramos dos números adyacentes tales que no estén ordenados, los invierte, es decir, los cambia de posición. ¿Cuáles son sus complejidades? En cuanto a memoria únicamente requerimos $O(1)$ de memoria auxiliar, mientras que en tiempo se toma $O(n^2)$, ya que podrían llegar a haber $i$ inversiones, para cada $i$ entre $1, n$.

# Merge sort

In [None]:
def merge_sort(L, copy=True):
    if(len(L) == 1):
        return
    
    if copy:
        L = L.copy()
    m = len(L)//2
    left = L[:m]
    right = L[m:]
    merge_sort(left, copy=False)
    merge_sort(right, copy=False)
    
    l = r = k = 0
    while l < len(left) and r < len(right):
        if left[l] < right[r]:
            L[k] = left[l]
            l += 1
        else:
            L[k] = right[r]
            r += 1
        k += 1
    while l < len(left):
        L[k] = left[l]
        k += 1
        l += 1
    while(r < len(right)):
        L[k] = right[r]
        k += 1
        r += 1
    return L

merge_sort(Lista)

[3, 3, 4, 5, 5, 6, 6, 6, 8, 10]

Este algoritmo es *merge sort*, el cual actúa bajo el principio de divide y vencerás, es decir, divide la lista inicial en dos, ordena cada sección de lalista por separado, y una vez que están ordenados, los unifica en una nueva lista, que dará como resultado el ordenamiento de nuestra lista inicial. ¿Cuáles son las complejidades de este algoritmo? Es $O(n log n)$ en tiempo, mientras que en espacio auxiliar es $O(n)$, pues se puede acotar el espacio que utiliza por $3n$.

# Insertion sort

In [None]:
def insertion_sort(L):
    L = L.copy()
    for i, l in enumerate(L):
        j = i - 1
        while j >= 0 and L[j] > l:
            L[j+1] = L[j]
            j -= 1
        L[j + 1] = l
    return L

insertion_sort(Lista)

[3, 3, 4, 5, 5, 6, 6, 6, 8, 10]

Este algoritmo de ordenamiento es llamado *insertion sort*, su nombre describe lo que se hace, en cada iteración del ciclo for lo que hacemos es crear una lista ordenada con los primeros $i$ elementos, insertando el nuevo elemento donde corresponda. ¿Cuáles son sus complejidades? Se tiene que su complejidad en tiempo es $O(n^2)$, pues iteramos sobre los $n$ elementos de la lista, y en cada una de estas iteraciones podríamos llegar a tener $i-1$ iteraciones dentro del `while`, lo que hace que sea cuadrático en tiempo. En espacio adicional únicamente almacenamos los iteradores y el valor del nuevo elemento de la lista, por lo que es $O(1)$.

# Radix sort

In [None]:
def _radix_aux(L, pos):
    count = [0] * 10
    for m in L:
        aux = m//pos
        count[(aux%10)] += 1
        
    for i in range(1, 10): # Recuperamos las posiciones que nos indica el counting sort
        count[i] += count[i-1]
        
    ordered = [0] * len(L)
    for m in reversed(L):
        aux = m//pos
        ordered[count[aux%10] - 1] = m
        count[aux%10] -= 1
        
    for i in range(len(L)):
        L[i] = ordered[i]

def radix_sort(L):
    L = L.copy()
    pos = 1
    while pos <= max(L):
        _radix_aux(L, pos)
        pos *= 10
    return L
    


Notemos que nuestro algoritmo funciona únicamente para listas que tienen puros enteros positivos. Este algoritmo se llama *radix sort*, el cual consiste en ir ordenando los números según sus dígitos, del dígito que representa menor valor (el de las unidades) hasta el que representa el mayor valor. Este algoritmo también se puede adaptar a problemas como ordenar una lista de strings alfabéticamente. 

**Ejercicios.**

1.   Implementa el algoritmo de ordenamiento *quicksort*.
2.   Utilizando radix sort, implementa un algoritmo que permita ordenar alfabéticamente una lista de strings. Puedes suponer que las strings no tienen espacios y contienen únicamente caracteres que son letras minúsculas.
Verifica tu algoritmo con las listas: `['aaaaa', 'zapatos', 'bien', 'zapatillas', 'datos', 'dddatos', 'das', 'ciencia', 'aaa', 'alas', 'problema', 'comando', 'oopera'], ['ddddescarga', 'usando', 'nuevo', 'nuevos', 'version', 'verifica', 'ooo', 'eeee', 'goool', 'golazooo', 'goolazo', 'compartir']`
3.   Determina cuál es el mínimo número de comparaciones necsarias dada una lista $L$ de $n$ números para poder determinar si está ordenada o no. Describe un algoritmo con dicho mínimo y argumenta por qué con menos comparaciones no se puede.



# 1 Implementa el algoritmo de ordenamiento quicksort.

Lo que hace este algoritmo es divirir la lista total en  dos sublistas , despues se agarr  un pivote, en este caso  será el ultimo elemento de la lista no ordenada, y vamos comparando los elementos de la lista con el pivote, si el elemento es menor se va a lista 1 si es mayor a lista 2, este proceso se repite para las dos listas  hasta que todo el arreglo este ordenado

In [None]:
def  qs(lista):
  if len(lista) <= 1:
    return lista
  else:
    lista1=[]
    lista2=[]
    pivote=lista.pop()
    
    for i in lista:
      if i< pivote:
        lista1.append(i)
      else:
        lista2.append(i)
    return qs(lista1)+ [pivote]+qs(lista2)



In [None]:
lista=[2,5,6,9,55,7,12,0,-3]
qs(lista)

[-3, 0, 2, 5, 6, 7, 9, 12, 55]

# 2 Utilizando radix sort, implementa un algoritmo que permita ordenar alfabéticamente una lista de strings. Puedes suponer que las strings no tienen espacios y contienen únicamente caracteres que son letras minúsculas. Verifica tu algoritmo con las listas: 

Lo que haremos será convertir las plabras a su correspondiente en ASCII, pero para que nos lo ordene de menor a mayor las palabras, requerimos que todas las palabras tengan la misma longitud,despues utilizamos  Radix sort,  una vez hecho esto se genera una nueva lista, con las palabras ASCII ordenaadas y por ultimo las convertimos en letras

In [None]:
lista1=['aaaaa', 'zapatos', 'bien', 'zapatillas', 'datos', 'dddatos', 'das', 'ciencia', 'aaa', 'alas', 'problema', 'comando', 'oopera']
lista2=['ddddescarga', 'usando', 'nuevo', 'nuevos', 'version', 'verifica', 'ooo', 'eeee', 'goool', 'golazooo', 'goolazo', 'compartir']

In [None]:
def longig(lista): 
  
  for i in range(len(lista)):
    lista[i]= lista[i].upper() 

  len_palabras=[]
  for i in range(len(lista)):
    len_palabras.append(len(lista[i])) 

  lista_nueva_palabras=[]
  for j in range(len(lista)):
    nuev_palabra=lista[j]+((max(len_palabras)-len_palabras[j])*'.')  
    lista_nueva_palabras.append(nuev_palabra) 
  return lista_nueva_palabras
def ASCII(lista_palabras):  
  lista_ASCII=[]
  for i in range(len(longig(lista_palabras))):
    palabra_ASCII=''
    for j in range(len(longig(lista_palabras)[i])):
      palabra_ASCII=palabra_ASCII+str(ord(longig(lista_palabras)[i][j])) 
    lista_ASCII.append(palabra_ASCII)

  for k in range(len(lista_ASCII)):
    lista_ASCII[k]=int(lista_ASCII[k]) 

  return lista_ASCII

def lista_origen_destino(lista_palabras):
  lista_indice=[]
  for i in lista_palabras:
    lista_indice.append([i]) 

  for j in range(len(lista_indice)):
    lista_indice[j].append(j)  

  l=0
  for k in ASCII(lista_palabras):
    lista_indice[l].append(int(radix_sort(ASCII(lista_palabras)).index(k))) 
    l+=1

  return lista_indice

def lista_origen_destino(lista_palabras):
  lista_indice=[]
  for i in lista_palabras:
    lista_indice.append([i]) 

  for j in range(len(lista_indice)):
    lista_indice[j].append(j)  

  l=0
  for k in ASCII(lista_palabras):
    lista_indice[l].append(int(radix_sort(ASCII(lista_palabras)).index(k))) 
    l+=1

  return lista_indice

def _radix_aux(L, pos):
    count = [0] * 10
    for m in L:
        aux = m//pos
        count[(aux%10)] += 1
        
    for i in range(1, 10): # Recuperamos las posiciones que nos indica el counting sort
        count[i] += count[i-1]
        
    ordered = [0] * len(L)
    for m in reversed(L):
        aux = m//pos
        ordered[count[aux%10] - 1] = m
        count[aux%10] -= 1
        
    for i in range(len(L)):
        L[i] = ordered[i]

def radix_sort(L):
    L = L.copy()
    pos = 1
    while pos <= max(L):
        _radix_aux(L, pos)
        pos *= 10
    return L
def radix_sort_str(lista_palabras):
  lista_nuevo_orden= [None] * len(ASCII(lista_palabras)) 
  for i in range(len(lista_origen_destino(lista_palabras))):
    lista_nuevo_orden[lista_origen_destino(lista_palabras)[i][2]]= lista_origen_destino(lista_palabras)[i][0] 
  for x in range(len(lista_nuevo_orden)):
    lista_nuevo_orden[x]= lista_nuevo_orden[x].lower() 
    
  return lista_nuevo_orden


In [None]:
radix_sort_str(lista1)

['aaa',
 'aaaaa',
 'alas',
 'bien',
 'ciencia',
 'comando',
 'das',
 'datos',
 'dddatos',
 'oopera',
 'problema',
 'zapatillas',
 'zapatos']

In [None]:

radix_sort_str(lista2)

['compartir',
 'ddddescarga',
 'eeee',
 'golazooo',
 'goolazo',
 'goool',
 'nuevo',
 'nuevos',
 'ooo',
 'usando',
 'verifica',
 'version']

# 3 Determina cuál es el mínimo número de comparaciones necsarias dada una lista  L  de  n  números para poder determinar si está ordenada o no. Describe un algoritmo con dicho mínimo y argumenta por qué con menos comparaciones no se puede.

# Respuesta
Si tenemos un lista odenada tendriá que hacer $n-1$ comparaciones ya que se podría ser que el ultimo elemento no este ordenado, por lo que se tiene que fijar hasta el final de la lista, pero la comparación empieza con el segundo elemento con el primero, por eso tenemos un menos uno.

Por otro lado si tenemos que la lista no esta ordenada solo tenemos que  encontrar un  elemento de la lista que sea menor a alguno o varios de sus antecesores, con eso ya sabemos que no esta ordenada.

Por lo tanto para poder decir la respuesta sin temor a equivocarnos requerimos $n-1$ comparaciones.

# Algoritmo




pedir la lista que quieres comparar

  i=1

  mientras  i < len(lista)

  el i+1 elemento de la lista lo comparamos con el i-elemento

  i +=1

  si i > i+1 regresar no es ordenada

   de otra forma regresar es ordenada
