<a href="https://colab.research.google.com/github/tirabo/Algoritmos-y-Programacion/blob/main/busqueda_quick_insertion_selection_.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

## Ordenamiento por selección (selection sort) y por inserción (insertion sort)

Siempre tratamos de ordenar una lista de elementos comparables (`int` o `str`, por ejemplo) 

**Ordenamiento por selección.** En  este caso se tiene la primera parte de una lista (de `0` a `i-1`) y `lista[:i]` está ordenada.  Además todos los elementos de `lista[:i]` son `<=` que los del resto de la lista (`lista[i:]`). Se elige el mínimo del resto, es decir de `lista[i:]`, y se permuta por el primer elemento de esa sublista. Luego  la primera parte se agranda  a `lista[:i+1]`.   

**Una idea sencilla para ordenar.** Supongamos que tenemos una fila con  `n` personas y las queremos acomodar por orden alfabético ascendente. 
- Entonces, a la primera persona y le damos el primer lugar (posición `0`). 
- Miramos la segunda persona comparamos su  apellido con la de posición `0` y la acomodamos donde corresponde. Así quedan asignados 2 lugares, por ejemplo: `Benitez`, `Pérez`. 
- Cuando miramos la tercera persona comparamos su  apellido con las que ya están y según esa comparación la acomodamos,  si  la persona es `Álvarez` la insertamos en el primer lugar, si es `González` la insertamos en el segundo lugar y si es `Sánchez`  en el tercer lugar.
- Hacemos algo análogo con todas las personas siguientes. 

**Ordenamiento por inserción.** En  este caso se tiene la primera parte de una lista (de `0` a `i-1`) y `lista[:i]` está ordenada.  Se toma el elemento `lista[i]` y se lo inserta en el lugar correspondiente. Más concretamente,
- Si `elemento = lista[i]`, nos fijamos recorriendo  la sublista `lista[:i]` en forma descendente cual es el primer índice `k` donde 
`lista[k] <= elemento`.
- Insertamos `elemento` en el lugar `k+1`. 
- Hacemos algo análogo para todos los índices.

Ahora bien, hay dos formas de insertar el elemento, digamos `elemento`, en el lugar correspondiente:
1. Vamos "swapeando" `elemento` con los elementos que son mayores (en orden descendente) hasta que llegamos a un elemento que es menor o igual a `elemento` y ahí nos detenemos (ver `insertion_sort_v1()`). 
2. Vamos "corriendo" los elementos más grandes que `elemento`, poniéndolos un lugar más arriba de donde están. El proceso se detiene cuando llegamos a un elemento menor o igual a `elemento`.  Luego ubicamos `elemento` en la posición que quedo "libre" (pues el elemento que estaba ahí fue corrido).   Esta última implementación es la preferida,  debido a que usa menos asignaciones  (ver `insertion_sort()`) 

In [None]:
from random import randint

lista_1 = [randint(1,20) for i in range(50)]
print(lista_1)

lista_2 = [randint(1,200) for i in range(20)]
print(lista_2)


[4, 6, 20, 16, 10, 7, 13, 6, 2, 4, 10, 2, 4, 1, 10, 13, 13, 13, 12, 12, 14, 5, 4, 14, 7, 15, 6, 16, 16, 6, 5, 2, 18, 7, 11, 13, 6, 14, 3, 8, 17, 15, 4, 17, 3, 5, 6, 11, 11, 1]
[54, 78, 183, 178, 129, 112, 193, 124, 47, 192, 33, 67, 15, 167, 167, 150, 116, 144, 117, 137]


In [None]:
def insertion_sort_v1(lista: list):
  # pre: lista es una list de elementos comparables (int o str, por ahora).
  # post: devuelve una lista con los elementos de lista ordenados en forma creciente. 
  #       El ordenamiento se hace insertando en el orden correcto. 
  for i in range(len(lista)):
    # inserta lista[i] en la sublista ordenada lista[:i] 
    elemento = lista[i]
    k = i - 1 
    while k >= 0 and lista[k] > elemento:
      lista[k + 1], lista[k]   = lista[k],  elemento
      k = k - 1
      # Ahora  lista[k] <= elemento = lista[k+1] < lista[k+2]
      # luego lista[:i+1] ordenada


def insertion_sort(lista: list):
  # pre: lista es una list de elementos comparables (int o str, por ahora).
  # post: devuelve una lista con los elementos de lista ordenados en forma creciente. 
  #       El ordenamiento se hace insertando en el orden correcto. 
  for i in range(len(lista)):
    # inserta lista[i] en la sublista ordenada lista[:i] 
    elemento = lista[i]
    k = i - 1 
    while k >= 0 and lista[k] > elemento:
      lista[k + 1] = lista[k]
      k = k - 1
    # Ahora lista[k] <= elemento y lista[k+1] = lista[k+2] > elemento
    # Inserto lista[i] en la posición k + 1
    lista[k + 1] = elemento
    # Ahora  lista[k] <= elemento = lista[k+1] < lista[k+2]
    # luego lista[:i+1] ordenada

insertion_sort_v1(lista_1)
print(lista_1)
insertion_sort_v1(lista_2)
print(lista_2)

[1, 1, 2, 2, 2, 3, 3, 4, 4, 4, 4, 4, 5, 5, 5, 6, 6, 6, 6, 6, 6, 7, 7, 7, 8, 10, 10, 10, 11, 11, 11, 12, 12, 13, 13, 13, 13, 13, 14, 14, 14, 15, 15, 16, 16, 16, 17, 17, 18, 20]
[15, 33, 47, 54, 67, 78, 112, 116, 117, 124, 129, 137, 144, 150, 167, 167, 178, 183, 192, 193]


##Concatenación de listas

En  la proxima celda de código vamos a programar quick sort de tal forma que devuelve otra lista (no modifica la lista a ordenar). Para hacer esta definición es necesario comprender el concepto de *concatenación de listas*. 

Si  tenemos 

```
lst_1 = [40, 11, 8, 17], lst_2 = [3, 10, 25]
```
la concatenacón de dos listas es hacer una lista con los elementos de la primera al comienzo y a continuación los elementos de la segunda.


```
lst_1 + lst_2 == [40, 11, 8, 17, 3, 10, 25]
```

Esto se generaliza fácilmente:
```
lst_1 = [a_0, a_1, ..., a_n], lst_2 = [b_0, b_1, ..., b_n]
```
entonces
```
lst_1 + lst_2 == [a_0, a_1, ..., a_n, b_0, b_1, ..., b_n]
```







Una primera aproximación a quick sort (la versión que devuelve otra lista) es la siguiente:

In [None]:
def qsort(lista: list) -> list:
  if lista == []:
    lista_ord = []
  else:
    lst_1 = []
    for x in lista[1:]:
      if x <= lista[0]:
        lst_1.append(x)
    # lst_1 = todos los elemtos de lista <= lista[0]
    lst_2 = []
    for x in lista[1:]:
      if x > lista[0]:
        lst_2.append(x)
    # lst_2 = todos los elementos de lista > lista[0]
    lista_ord = qsort(lst_1) + lista[0:1] + qsort(lst_2)
  return lista_ord

# Observación. lista[0:1] = [lista[0]] o [] si la lista es vacía. 

lista_2 = [randint(1,10**8) for i in range(10**5)]
# print(lista_2)
print(qsort(lista_2)[5000:5020])


[5054941, 5056286, 5056648, 5058669, 5059859, 5060047, 5060994, 5062080, 5062402, 5063043, 5066668, 5066743, 5067601, 5068178, 5068244, 5069184, 5070698, 5071303, 5071392, 5071640]


Gracias a listas por comprensión de podemos obtener un código más compacto (y posiblemente más eficiente)

In [None]:

def qsort(lista: list) -> list:
  if lista == []:
    lista_ord = []
  else:
    lst_1 = [x for x in lista[1:] if x <= lista[0]] # lst_1 = todos los elemtos de lista <= lista[0]
    lst_2 = [x for x in lista[1:] if x > lista[0]]  # lst_2 = todos los elemtos de lista > lista[0]
    lista_ord = lista_ord = qsort(lst_1) + lista[0:1] + qsort(lst_2)
  return lista_ord


lista_2 = [randint(1,10**8) for i in range(10**5)]
# print(lista_2)
print(qsort(lista_2)[5000:5020])

[5026481, 5026569, 5026935, 5028761, 5029613, 5031465, 5031803, 5035043, 5035804, 5037105, 5037788, 5038195, 5038801, 5040553, 5042483, 5043350, 5045846, 5048522, 5049473, 5051330]


O mejor aún:

In [None]:
  def qsort(lista: list) -> list:
    if lista == []:
      lista_ord = []
    else:
      lista_ord = qsort([x for x in lista[1:] if x <= lista[0]]) + lista[0:1] + qsort([x for x in lista[1:] if x > lista[0]])
    return lista_ord

lista_2 = [randint(1,10**8) for i in range(10**5)]
# print(lista_2)
print(qsort(lista_2)[5000:5020])


[5040960, 5041771, 5041967, 5043594, 5048015, 5048265, 5049314, 5049746, 5049870, 5054313, 5054366, 5055028, 5056535, 5057599, 5058941, 5059544, 5061619, 5062127, 5062552, 5062790]


Ahora definiremos los tres algoritmos de búsqueda (selección, inserción  y quick) y compararemos los tiempos de ejecución para ordenar listas (bastante) desordenadas,  es decir un caso genérico. 

In [None]:
def selection_sort(lista: list):
    for i in range(len(lista)):
        i_min = i
        for j in range(i + 1, len(lista)):
            if lista[j] < lista[i_min]:
                i_min = j
        lista[i], lista[i_min] = lista[i_min], lista[i]


def insertion_sort(lista: list):
  for i in range(len(lista)):
    elemento = lista[i]
    k = i - 1 
    while k >= 0 and lista[k] > elemento:
      lista[k + 1] = lista[k]
      k = k - 1
    lista[k + 1] = elemento


def quick_sort(lista: list) -> list:
  if lista == []:
    lista_ord = []
  else:
    lista_ord = qsort([x for x in lista[1:] if x < lista[0]]) + lista[0:1] + qsort([x for x in lista[1:] if x >= lista[0]])
  return lista_ord



In [None]:
# Hacemos listas aleatorias 
lista_1 = [randint(10**2,10**4) for i in range(10**4)]
# print(lista_1)


Para medir el tiempo de ejecución de los algoritmos importamos la biblioteca `time` usamos la función `time.time()` que nos devuelve el tiempo en segundos transcurridos desde epoch con una precisión de millonésimas de segundo.   

In [None]:
# Medir tiempo algoritmos
import time

print('Ordenando una lista de ',len(lista_1),' enteros')
x0 = time.time() # devuelve el tiempo en segundos desde epoch con una precision de millonésima de segundo
lista = lista_1[:] # copiamos lista_1  a lista (así lista_1 no se modifica)
selection_sort(lista)
print('Selección:',time.time() - x0) # 

x0 = time.time() # devuelve el tiempo en segundos desde epoch con una precision de millonésima de segundo
lista = lista_1[:]
insertion_sort(lista)
print('Inserción:', time.time() - x0) # 

x0 = time.time() # devuelve el tiempo en segundos desde epoch con una precision de millonésima de segundo
lista = lista_1[:]
quick_sort(lista)
print('QS:',time.time() - x0) # 


Ordenando una lista de  10000  enteros
Selección: 4.808238983154297
Inserción: 5.838040590286255
QS: 0.04121685028076172


Variando el tamaño de la lista a ordenar se verá:
1. selección e inserción tardan más o menos lo mismo,
2. quick es mucho más rápido que selección e inserción. 
3. Aumentando el tamaño de la lista la diferencia entre quick y  selección e inserción es cada vez más pronunciada. 
4. Si la lista excede los 50.000 items selección e inserción tardarán varios años o no terminarán nunca. 

En  el caso de  quick sort es posible ordenar en tiempos razonables listas "grandes", por ejemplo,  de 1 millón de enteros.

In [None]:

lista_2 = [randint(10**7, 10**8) for i in range(10**6)]
x0 = time.time() # devuelve el tiempo en segundos desde epoch com una precision de millonésima de segundo
lista = lista_2[:]
quick_sort(lista)
print('\nOrdenando quick_sort una lista de ',len(lista_2),' enteros')
print('quick_sort:',time.time() - x0) # 
#lista = lista_2[:]
#qs2(lista)
#print('\nOrdenando qs2 una lista de ',len(lista_2),' enteros')
#print('qs2:',time.time() - x0) # 



Ordenando quick_sort una lista de  1000000  enteros
quick_sort: 7.480283498764038


## Algortimos de búsqueda en casos especiales

¿Qué ocurre si queremos ordenar una lista ordenada?

Probemos los algoritmos en la lista `[0,1,...,n]`




In [None]:
lista_1 = [i for i in range(10**4)]

print('Ordenando una lista de ',len(lista_1),' enteros ordenados')
x0 = time.time() 
lista = lista_1[:] # copiamos lista_1  a lista (así lista_1 no se modifica)
selection_sort(lista)
print('Selección:',time.time() - x0) # 

x0 = time.time() 
lista = lista_1[:]
insertion_sort(lista)
print('Inserción:', time.time() - x0) # 

x0 = time.time() # devuelve el tiempo en segundos desde epoch con una precision de millonésima de segundo
lista = lista_1[:]
# quick_sort(lista_1)
# print('QS:',time.time() - x0) # 


Ordenando una lista de  10000  enteros ordenados
Selección: 4.790849924087524
Inserción: 0.0026216506958007812


Habrán observado en el ejemplo anterior que selección tardó un tiempo parecido al que hubiera tardado con un arreglo desordenado. En  cambio inserción tardó muy poco (¿por qué?).

Finalmente, quick sort,  si lo descomentamos, nos da error, pues de la forma que está programado requiere niveles de profundidad en la recursión (tamaño de la pila) que no están permitidos  en Python. Con un arreglo ordenado,  ni siquiera quick sort puede terminar para 1000 elementos.

Eligiendo aleatoriamente el pivot se puede solucionar este problema.

In [None]:
def qsort_v2(lista: list) -> list:
  if lista == []:
    lista_ord = []
  else:
    k = randint(0, len(lista) - 1)
    lst_1 = [x for x in lista[:k] + lista[k+1:]  if x <= lista[k]] # lst_1 = todos los elemtos de lista <= lista[k]
    lst_2 = [x for x in lista[:k] + lista[k+1:]  if x > lista[k]]  # lst_2 = todos los elemtos de lista > lista[k]
    lista_ord = lista_ord = qsort_v2(lst_1) + lista[k:k+1] + qsort_v2(lst_2)
  return lista_ord

In [None]:
lista_1 = [i for i in range(10**5)]
x0 = time.time() 
qsort_v2(lista_1)
print('QS de lista ordenada:',time.time() - x0) # 

lista_1 = [randint(0,10**6) for i in range(10**5)]
x0 = time.time() 
qsort_v2(lista_1)
print('QS de lista no ordenada:',time.time() - x0) # 

QS de lista ordenada: 0.7327911853790283
QS de lista no ordenada: 0.7312116622924805


In [None]:
def partition(lista, start, end):
    pivot = lista[start]
    low = start + 1
    high = end

    while low <= high:
        while low <= high and lista[high] >= pivot:
            high = high - 1
        while low <= high and lista[low] <= pivot:
            low = low + 1
        if low <= high:
            lista[low], lista[high] = lista[high], lista[low]

    lista[start], lista[high] = lista[high], lista[start]
    return high


def quick_sort(lista, start, end):
    if start >= end:
        return
    p = partition(lista, start, end)
    quick_sort(lista, start, p-1)
    quick_sort(lista, p+1, end)

In [None]:
lista_1 = [randint(0,10**6) for i in range(10**5)]
x0 = time.time() 
quick_sort(lista, 0, len(lista) - 1)
print('QS de lista no ordenada:',time.time() - x0) # 

QS de lista no ordenada: 0.03686857223510742
