#**InsertionSort**

##1. Descripción del Problema 

El ordenamiento de datos es quizá uno de los problemas de computación más estudiados, existiendo diversos algoritmos capaces evaluar casos de distinta complejidad y resolverlos. Para ordenar se requiere una serie de datos ordinales (*n* elementos) almacenados en una estructura de datos que los relacione, contando con aquello, el algoritmo debe de ser capaz de entregar una lista ordenada con los datos examinados. El tamaño del problema dependerá de la cantidad de elementos *n* que se busque ordenar.

---

#### **Entradas y Salidas:**

**Entrada**: Serie de n números en una estructura de datos. Ejemplo: $[n_1,n_2,...,n_m]$

**Salida**: Secuencia ordenada en base de los datos de entrada. Por lo que si la salida es un arreglo $[n_1',n_2',...,n_m']$, se cumple que $n_1'\leq n_2' \leq... \leq n_m'$ o $n_1'\ge n_2' \ge... \ge n_m'$.

##2. Descripción del Algoritmo

Uno de los algoritmos diseñados para la solución del problema anteriormente descrito es el InsertionSort. Este método intenta aplicar un ordenamiento simple y cotidiano en una secuencia de *n* elementos, los cuales recibe en una lista o arreglo, y conforman la entrada de datos. Además, el InsertionSort es capaz de ordenar los elementos sin ayuda de una estructura auxiliar, es decir, cambia de posición los datos para después entregar la lista o arreglo ordenado.

---
###Pasos a Seguir:

A continuación se detallará la implementación del algoritmo en un arreglo "$a$", los datos de entrada serán números y en la salida se espera que vayan en orden cresciente:

1. En un arreglo inicial de *n* elementos se considera al primer dato $a[0]$ como "Ordenado". Por lo será necesario avanzar dentro del arreglo.
2. Utilizando un ciclo, el algoritmo recorrerá las *n* posiciones del arreglo. En cada iteración $i$ se realizará una comparación entre $a[i-1]$ (El número de la posición anterior) y $a[i]$ (El número de la posición actual).
3. Si $a[i]$ es menor que $a[i-1]$, significa que el elemento en la posición $i$ no está en su ubicación correcta. Entonces el algoritmo comparará el valor clave $a[i]$ con todos los datos encontrados en posiciones anteriores, intercambiando su posición con cada elemento antecesor en el arreglo que sea menor que aquel.
4. Una vez que se encontró la posición correcta del valor clave $a[i]$, el ciclo se repetirá hasta haber recorrido todas las posiciones del arreglo.

---

###Ejemplo de Ejecución:

A continuación se muestra un ejemplo de la aplicación del algoritmo:

* Considerando el arreglo: 
####$[5,1,6,2,4,3]$

* En la primera iteración **1** es el dato clave y se cambia de posición con **5**.
####$[1,5,6,2,4,3]$

* En la segunda iteración **6** es el dato clave no necesita un cambio de posición, puesto a que es el número más grande hasta el momento.
####$[1,5,6,2,4,3]$

* En la tercera iteración el dato clave **2** se intercambia con **6** y con **5**, mas no con **1** ya que este si está en una posición válida respecto a **2**.
####$[1,2,5,6,4,3]$

* En la cuarta iteración, el dato clave **4** se intercambia de posición hasta quedar entre el **2** y el **5**.
####$[1,2,4,5,6,3]$

* En la quinta iteración, el **3** se mueve de posición hasta llegar a su ubicación indicada.
####$[1,2,3,4,5,6]$

* Al finalizar la iteración anterior, el ciclo termina y se entrega el arreglo con los elementos originales ordenados.
####Resultado: [1, 2, 3, 4, 5, 6]

---










##3. Implementación del Algoritmo

Para demostrar como funciona el algoritmo de ordenamiento InsertionSort, se expone más abajo un ejemplo de código:

In [None]:
from termcolor import colored, cprint

#Función Insertion Sort
def insertionSort (a, comp, verbose):
  for i in range (1, len(a)):
    #Definir Dato Clave o Pivote.
    key = a[i]
    if verbose == True: #Opción Verbose.
      print("----------------")
      print(f"Iteración {i}:")
      print(f"Dato Clave: {key}")
    #Ciclo para Encontrar la Posición del Dato Clave.
    for k in range (i-1, -1, -1):
      #Contador de Comparaciones.
      comp += 1
      if verbose == True: #Opción Verbose.
        print(f"\nComparación {comp}:")
        if k == 0:
          print(f"Arreglo:", colored(f"{str(a[k:k+2])[1:-1]},","red"),str(a[k+2:])[1:-1])
        elif k == len(a)-2:
          print(f"Arreglo: {str(a[:k])[1:-1]},", colored(f"{str(a[k:k+2])[1:-1]}","red"))
        else:
          print(f"Arreglo: {str(a[:k])[1:-1]},", colored(f"{str(a[k:k+2])[1:-1]},","red"),str(a[k+2:])[1:-1])
      #Condición que Verifica si el número Clave está en su posición correcta.
      if a[k] < key:
        if verbose == True: #Opción Verbose.
          print("¡NO HAY Swap!")
        break
      #Intercambiar de posición los números comparados.
      a[k+1] = a[k]
      a[k] = key
      if verbose == True: #Opción Verbose.
        print("¡Swap!")
        if k == 0:
          print(f"Arreglo:", colored(f"{str(a[k:k+2])[1:-1]},","blue"),str(a[k+2:])[1:-1])
        elif k == len(a)-2:
          print(f"Arreglo: {str(a[:k])[1:-1]},", colored(f"{str(a[k:k+2])[1:-1]}","blue"))
        else:
          print(f"Arreglo: {str(a[:k])[1:-1]},", colored(f"{str(a[k:k+2])[1:-1]},","blue"),str(a[k+2:])[1:-1])
  return a, comp #Devolver el Arreglo Ordenado y el Número de Comparaciones realizadas.

#Datos del Ejemplo
datos = [5,1,6,4,3,2]
print("======================================")
print("Arreglo Original: ", datos)
datosOrdenados, numComp = insertionSort(datos, 0, verbose = False)
print("======================================")
print("Arreglo Ordenado: ", datosOrdenados)
print("N° de Comparaciones: ", numComp)
print("Media de Retrocesos por Elemento:", numComp/len(datos))

##4. Análisis y Propiedades del Algoritmo

A continuación se detallarán algunas propiedades que cumple el algoritmo para problemas de ordenamiento InsertionSort.

---
###Tiempo de Ejecución:
El Algoritmo tiene una complejidad temporal de $O(n^2)$ en el peor caso. Esto se aprecia mejor cuando se cuentan la cantidad de operaciones/comparaciones que realiza el algoritmo en el siguiente ejemplo:


In [None]:
#Datos del Ejemplo.
datos = [16,9,4,1]
numComp = 0 #Número de Comparaciones.
verbose = True
print("======================================")
print("Arreglo Original: ", datos)
datosOrdenados, numComp = insertionSort(datos, numComp, verbose)
print("======================================")
print("Arreglo Ordenado: ", datosOrdenados)
print("N° de Comparaciones: ", numComp)
print("Media de Retrocesos por Elemento:", numComp/len(datos))

Se puede observar en el ejemplo que en todas las **comparaciones** fue necesario realizar un intercambio, lo que conlleva a realizar la mayor cantidad de iteraciones en ambos ciclos *for*. Esto se debe a que el dato **menor** en cada **iteración** se encuentra al final del arreglo, así es como cada *Dato Clave* tuvo que moverse 1, 2 y 3 espacios respectivamente, generando el peor caso posible para el algoritmo.

Matemáticamente, se puede expresar la complejidad del peor caso con la fórmula $(n*(n-1))/2$, la cual indicará siempre la cantidad de comparaciones a realizar. Al reducir la expresión quedará $O(n^2)$.

---
###Correctitud:
Se establece el siguiente teorema para el **InsertionSort**: El algoritmo generará un arreglo que conformado por los mismos elementos que recibió de entrada, pero estarán ordenados de menor a mayor (orden cresciente) en el arreglo de salida.

El anterior teorema se cumple no sólo entre la entrada y salida de los elementos, sino también después de cada iteración en el bucle principal si se considera un sub-arreglo que va desde el elemento $0$ al $i-1$. Esta propiedad se llama Invariante de Bucle y en el siguiente ejemplo se pone a prueba:

In [None]:
#Función Insertion Sort
def insertionSort (a, comp, verbose):
  for i in range (1, len(a)):
    #Definir Dato Clave o Pivote.
    key = a[i]
    if verbose == True: #Opción Verbose.
      print("----------------")
      print(f"Iteración {i}:")
      if i == len(a)-1:
        aux = colored(a[:i], "blue") + ' ' + colored(a[i], "red")
      else:
        aux = colored(a[:i], "blue") + ' ' + colored(a[i], "red") + ' ' + colored(a[i+1:len(a)], "green")
      print(f"Antes de la Iteración: {aux}")
    #Ciclo para Encontrar la Posición del Dato Clave.
    for k in range (i-1, -1, -1):
      #Contador de Comparaciones.
      comp += 1
      #Condición que Verifica si el número Clave está en su posición correcta.
      if a[k] < key:
        break
      #Intercambiar de posición los números comparados.
      a[k+1] = a[k]
      a[k] = key
    if verbose == True: #Opción Verbose.
      if i == len(a)-2:
        aux = colored(a[:i+1], "blue") + ' ' + colored(a[i+1], "red")
      elif i == len(a)-1:
        aux = colored(a[:i+1], "blue") 
      else:
        aux = colored(a[:i+1], "blue") + ' ' + colored(a[i+1], "red") + ' ' + colored(a[i+2:len(a)], "green")
      print(f"Después de la Iteración: {aux}")
  return a, comp #Devolver el Arreglo Ordenado y el Número de Comparaciones realizadas.


#Datos del Ejemplo.
datos = [7,2,5,4]
numComp = 0 #Número de Comparaciones.
verbose = True
print("======================================")
print("Arreglo Original: ", datos)
datosOrdenados, numComp = insertionSort(datos, numComp, verbose)
print("======================================")
print("Arreglo Ordenado: ", datosOrdenados)
print("N° de Comparaciones: ", numComp)
print("Media de Retrocesos por Elemento:", numComp/len(datos))

Con los resultados del ejemplo anterior, se observan dos pruebas que verifican la propiedad invariante de bucle:
 - **Inicialización**: Antes de la primera iteración, el primer elemento del arreglo forma un sub-arreglo de color azul y de un solo dato, este conjunto cumple con el teorema y por ende, aporta veracidad a la propiedad.
 - **Mantención**: A lo largo de las 3 iteraciones, se observa que tanto el sub-arreglo inicial como el final están ordenados de menor a mayor. Por lo que cada dato analizado por el algoritmo InsertionSort termina en un sub-arreglo ordenado, lo que cumple con el teorema y permite confirmar la propiedad.

Con la propiedad de bucle invariante reafirmada, se puede establecer el teorema de correctitud del algoritmo InsertionSort queda validado, y en consecuencia, el algoritmo funciona correctamente.

---

##5. Experimentación

Para complementar el análisis hecho, se presentarán una serie de gráficos que experimentan con las características del algoritmo de ordenamiento. Estos gráficos experimentarán con el tiempo de ejecución del InsertionSort:

---

###Comparaciones en el Mejor y Peor Caso:
Para analizar más en detalle el número de comparaciones que se generan en el algoritmo, se utilizará un gráfico para comparar 3 casos:
- Cantidad de comparaciones en el *Mejor Caso* $[O(n)]$.
- Cantidad de comparaciones en el *Peor Caso* $[O(n^2)]$.
- Cantidad de comparaciones con una entrada aleatoria de elementos.

El siguiente código creará entradas para ordenar que tengan entre 5 y 20 números. Los números de cada entrada varían entre 1 y 100.

In [None]:
import matplotlib.pyplot as plt
import random

x=[n for n in range(5,21)] 
y1=[n*(n-1)/2 for n in range(5,21)] #Peor Caso
y2=[n-1 for n in range(5,21)] #Mejor Caso
y=[]; 

for n in range(5,21): #Crear una Entrada Aleatoria
  a = random.sample(range(1, 100), n)
  num = 0
  a,counter = insertionSort(a, num, verbose = False)
  y.append(counter)

plt.plot(x,y)
plt.plot(x,y1)
plt.plot(x,y2)
plt.legend(["Entradas Aleatorias", "Peor Caso O(n^2)", "Mejor Caso O(n)"])

plt.xlabel('Cantidad de elementos (n) en la entrada')
plt.ylabel('Cantidad de Comparaciones')
plt.show()

**Análisis**: Si bien, la línea dibujada por las entradas aleatorias quedó por debajo del *Peor Caso* teórico, se puede observar un crecimiento similar en el número de operaciones realizadas a medida de que la cantidad de elementos de entrada aumentan.

**Explicación**: El crecimiento similiar entre el *Peor Caso* y las entradas aleatorias demuestran que hay un promedio de casos que operan con una complejidad temporal de $O(n^2). Los casos simulados también se alejan mucho del *Mejor Caso*, por lo que se infiere que es muy poco probable que aquel se presente.

---

###Arreglo Casi Ordenado:

Para verificar si es posible acercarse en la realidad al *Mejor Caso* teórico, el siguiente código probará comparar la cantidad de comparaciones entre arreglos que estén "casi" ordenados. Los arreglos serán de 10 elementos y contendrán los números del 1 al 10, sin embargo, cada caso presentará un par de números fuera de lugar. Los arreglos serán:
- Arreglo de 10 elementos. Los 2 números fuera de su posición serán el 1 y el 6.
- Arreglo de 10 elementos. Los 2 números fuera de su posición serán el 1 y el 4.
- Arreglo de 10 elementos. Los 2 números fuera de su posición serán el 1 y el 2.
- Un arreglo ordenado (*Mejor Caso*).

In [None]:
y1=[6,2,3,4,5,1,7,8,9,10]
y2=[4,2,3,1,5,6,7,8,9,10]
y3=[2,1,3,4,5,6,7,8,9,10]
y=[1,2,3,4,5,6,7,8,9,10] #Mejor Caso

dato1, num1 = insertionSort(y1, num, verbose = False)
dato2, num2 = insertionSort(y2, num, verbose = False)
dato3, num3 = insertionSort(y3, num, verbose = False)
dato4, num4 = insertionSort(y, num, verbose = False)

print("N° de Comparaciones de:")
print(f"Arreglo 1:        {num1}, resultado: {dato1}")
print(f"Arreglo 2:        {num2}, resultado: {dato2}")
print(f"Arreglo 3:        {num3},  resultado: {dato3}")
print(f"Arreglo Ordenado: {num4},  resultado: {dato4}")

**Análisis**: La idea que los números desordenados tengan cierta distancia 
demostró que mientras menos posiciones en el arreglo separen a los elementos en desorden, menos comparaciones serán necesarias, y por ende, más cerca queda el algoritmo a su *Mejor Caso* teórico.

**Explicación**: El número de comparaciones no depende sólo de que tan ordenado esté el arreglo, sino también de la distancia entre los elementos en desorden, esto se debe a que el algoritmo al encontrar un número en una posición inadecuada comenzará a buscar posición por posición (hacia atrás) el lugar indicado del elemento.

###Comparación entre InsertionSort y BubbleSort:
Otro experimento posible para probar la eficiencia de un algoritmo de ordenamiento, es comparar su rendimiento con otro algortimo. En este caso, se utilizará el método de BubbleSort ordenar arreglos con números aleatorios que tengan entre 25 y 500 elementos.

A continuación se presenta el código del BubbleSort a utilizar:

In [None]:
def bubble_sort(a, verbose=False):
    n = len(a)
    T = 0 #contador de comparaciones
    for i in range(1,n+1):
        # Flag que indica si el arreglo ya se encuentra ordenado
        already_sorted = True
        # Se recorre el arreglo
        for j in range(n - i):
            T +=1
            if a[j] > a[j + 1]:
                # Si el elemento es mayor al siguiente se intercambia
                a[j], a[j + 1] = a[j + 1], a[j]
                already_sorted = False
        if already_sorted:
            break
    return a, T

El siguiente trozo de código creará una gráfica que comparará ambos métodos de ordenamiento:

In [None]:
import datetime
from timeit import repeat

x=[]; y=[]
x1=[]; y1=[]

for n in range(25,500):

  a = random.sample(range(1, 500), n)

  num = 0
  verbose = False
  #La función repeat ejecuta 20 veces los algoritmos de ordenamiento con el arreglo a y retorna el mejor tiempo obtenido.
  t = repeat(setup="from __main__ import insertionSort", stmt=f"insertionSort({a},{num},{verbose})", repeat=1, number=10)
  t2 = repeat(setup="from __main__ import bubble_sort", stmt=f"bubble_sort({a})", repeat=1, number=10)

  x.append(n)
  y.append(t)
  x1.append(n)
  y1.append(t2)


plt.plot(x,y)
plt.plot(x1,y1)
plt.legend(["InsertionSort","BubbleSort"])

plt.xlabel('Cantidad de Elementos en el Arreglo')
plt.ylabel('Tiempo en Milisegundos')
plt.show()


**Análisis**: Se puede observar que el BubbleSort tiende a tardar un poco más que el InsertionSort en ordenar los arreglos aleatorios. Es de resaltar que ambos algoritmos presentaron *peaks* en ciertos puntos del gráfico, al ser un experimento aleatorio, es esperable.

**Explicación**: Pese a que se aprecia una diferencia en el tiempo que deja ver al InsertionSort como más eficiente, ambos algoritmos presentan un crecimiento cuadrático evidenciable conforme aumenta la cantidad de elementos en el arreglo generado. Bajo lo anterior, se confirma que ambos tienen complejidad $O(n^2)$.