# Ordenar listas para resolver problemas más fácilmente

## La complejidad de ordenar una lista
Durante los primeros semestres, todos, o casi todos, tuvimos que ordenar una lista de números como deber. La opción más fácil para ordenar una lista es utilizar dos `for` y comparar el primer número con todos los demás. Este algoritmo se denomina Bubble Sort.


In [5]:
lista = [2,3,4,5,6,1,9,100,23,45,25,6,7,8,9,87]
def BubbleSort(listat):
    for i in range(len(lista)):
        for j in range(i+1,len(lista)):
            if(lista[j]<lista[i]):
                temporal = lista[j]
                lista[j] = lista[i]
                lista[i] = temporal
    return lista
print(BubbleSort(lista))

[1, 2, 3, 4, 5, 6, 6, 7, 8, 9, 9, 23, 25, 45, 87, 100]


Sin embargo, existe una forma más eficiente de ordenar una lista. Merge Sort consiste en dividir la lista de números a la mitad, y luego esas mitad se dividen nuevamente a la mitad. De tal forma que las comparaciones se reduzcan al mínimo.
* lista = [100,23,45]
* lista1 = [100,23], lista2 = [45]
* lista1-1 = [100], lista1-2 = [23], lista2 = [45]  

Se compara el 100 con el 23, luego tienes una lista de dos elementos: [23,100] y creas una nueva lista comparandola con el 45: [23,45,100].  
Para notar la diferencia debemos pensar en una lista de 1000 elementos. Bubble sort compara el primer elemento con 999, el segundo elemento con 998, el tercero con 997. Esto consume mucho tiempo de procesamiento:  $O(n2)$.  
Merge Sort sólo realiza la comparación del primer elemento contra el segundo, luego contra el tercero y el cuarto, luego contra los siguientes cuatro. Es verdad que el número de comparaciones crece, pero sigue siendo inferior a Bubble Sort: $O(n \times{log (n)})$.

In [14]:
lista = [2,3,4,5,6,1,9,100,23,45,25,6,7,8,9,87]
def MergeSort(lista):
    if(len(lista)==1):
        return lista
    else:
        centro = len(lista)//2
        lista1 = MergeSort(lista[:centro])
        lista2 = MergeSort(lista[centro:])
        i,j = 0,0
        fi,fj = len(lista1),len(lista2)
        nueva_lista=[]
        while(True):
            if(i==fi and j ==fj):
                break
            if(i==fi):
                nueva_lista.append(lista2[j])
                j+=1
                continue
            if(j==fj):
                nueva_lista.append(lista1[i])
                i+=1
                continue
            if(lista1[i]<lista2[j]):
                nueva_lista.append(lista1[i])
                i+=1
            else:
                nueva_lista.append(lista2[j])
                j+=1
        return nueva_lista
print(MergeSort(lista))
            
        
        
        

[1, 2, 3, 4, 5, 6, 6, 7, 8, 9, 9, 23, 25, 45, 87, 100]


## Prueba de velocidad

In [62]:
import numpy as np
lista = np.random.randint(0,1000,10000) # lista de 10000 enteros aleatorios
print(lista[:10])

[151 549 319 771 665 757 631 477  86 465]


In [73]:
import time
start = time.time()
new_lista = BubbleSort(lista)
end = time.time()
print("Tiempo de ejecución:",end - start)
print(new_lista[100:120])

Tiempo de ejecución: 19.119133949279785
[ 9 10 10 10 10 10 11 11 11 11 11 11 11 11 11 12 12 12 12 12]


In [74]:
start = time.time()
new_lista = MergeSort(lista)
end = time.time()
print("Tiempo de ejecución:",end - start)
print(new_lista[100:120])

Tiempo de ejecución: 0.09985041618347168
[9, 10, 10, 10, 10, 10, 11, 11, 11, 11, 11, 11, 11, 11, 11, 12, 12, 12, 12, 12]


Si quieren pueden ejecutar ambos algoritmos, la diferencia de tiempo es clara. MergeSort no se demora nada en comparación, menos de un segundo.

## Usar Sorted de Python

Cuando descrubrí este algoritmo yo competía en Java, así que resultó útil. Sin embargo, python ya tiene una función para ordenar elementos de una lista de forma eficiente:

In [75]:
start = time.time()
new_lista = sorted(lista)
end = time.time()
print("Tiempo de ejecución:",end - start)
print(new_lista[100:120])

Tiempo de ejecución: 0.0
[9, 10, 10, 10, 10, 10, 11, 11, 11, 11, 11, 11, 11, 11, 11, 12, 12, 12, 12, 12]


Es más eficiente que una implementación propia, así que lo mejor será usar la función propia de python. Lo importante era saber el funcionamiento de este método, si quieren trabajar con microcontroladores, por ejemplo, necesitarán métodos eficientes.

## Primer problema que se resuelve más fácilmente ordenando una lista

Imagina que, dada una lista de números, quieres saber si los elementos son únicos.  
Aquí puedes usar una algoritmo similar a BubbleSort y comparar el primer elemento con todos los siguientes, luego el segundo con los elementos restantes y así, un algoritmo muy lento. Lo mejor es utilizar una lista ordenada para reducir la complejidad. Lo único que debes hacer, en una lista ordenada, es comparar cada elemento con el siguiente y nignún otro más.

In [93]:
for t in range(10):
    lista = np.random.randint(0,100,10) #lista de diez elementos aleatorios
    lista = sorted(lista)
    repetido=False
    for i in range(len(lista)-1):
        if(lista[i]==lista[i+1]):
            repetido=True
            break
    if(repetido):
        print("La lista tiene elementos reptidos")
    else:
        print("La lista no tiene elementos reptidos")

La lista tiene elementos reptidos
La lista no tiene elementos reptidos
La lista no tiene elementos reptidos
La lista tiene elementos reptidos
La lista no tiene elementos reptidos
La lista no tiene elementos reptidos
La lista no tiene elementos reptidos
La lista no tiene elementos reptidos
La lista no tiene elementos reptidos
La lista tiene elementos reptidos


En este problema tenemos complejidad $O(N)$ por el `for` y $O(n \times{log (n)})$ gracias a Sorted.