# *Introduccion*

QuickSort y Medians-Of-Medians son dos algoritmos, de ordenamiento y de seleccion en tiempo lineal respectivamente, los cuales utilizan la estrategia "divide y conquista", en la cual se realizan particiones de algun arreglo para llegar a su objetivo. Ambos pueden ser implementados de forma que trabajen recursivamente. Este curso trata los temas relacionados al analisis de algoritmos, relaciones de recurrencia, y algoritmos "divide and conquer" (particionamiento), por lo que se quiere realizar un reporte para estudiar mas a fondo los algoritmos ya mencionados.

# *Marco de estudio*

* Estudiar, analizar e implementar versiones propias de los algoritmos "divide y conquista" (QuickSort y Medians Of Medians)
* Proponer un algoritmo propio y eficiente para ordenar 5 objetos (sort5)
* Realizar el analisis O-Grande de cada algoritmo y validar la solucion con casos de prueba
* Calcular el tiempo de corrida de los algoritmos (modulo timeit)
* Generar datos CSV para visualizar de mejor manera el analisis O-Grande de cada algoritmo
* Investigar sobre otros temas (GitHub, Profilling, OOP en Python, entre otros) que complementen el proyecto y amplien nuestro aprendizaje en general

# *Desarrollo de soluciones*


## *Medians-of-Medians*

### QUE ES?

Los **"Median-Finding algorithms"** son algoritmos con los que podemos obtener el *n*-esimo numero mas pequeno de una arreglo **desordenado**, donde *n* es un numero dentro del rango de la longitud del arreglo dado. Estos son frecuentemente utilizados para diferentes objetivos, por ejemplo, obtener un buen pivote para ordenar un arreglo con ***QuickSort***, en estadistica de ordenamiento para conseguir la mediana, el maximo y el minimo de un arreglo, entre otros..

Si quisieramos obtener la mediana de un arreglo de enteros, podriamos empezar ordenando el arreglo y seguido, conseguir la mediana con solo retornar el valor, del arreglo ordenado, con el indice del medio. El problema es que, entre los mejores y mas conocidos  algoritmos de ordenamiento, ninguno ha logrado ir mas rapido que ***nlog(n)***. De hecho, en el peor de los casos, ordenar un arreglo puede tomar tiempo ***O(n²)***. Aqui es donde entra en juego el algoritmo **Medians-Of-Medians**, el cual puede obtener el mismo valor pero en tiempo ***O(n)*** siempre.


### FUNCIONAMIENTO

El algoritmo trabaja recibiendo un arreglo ***A*** y un indice ***k***, el cual indica la posicion del arreglo que queremos obtener:

### *median_of_medians(A, k)*

##### 1 )Dividir el arreglo en sublistas de tamano cinco

Se creara una lista de sublistas llamadas ***sublists*** y ***sublist*** respectivamente

##### 2) Ordenar cada sublista

Se implemento un algoritmo propio para ordenar un arreglo de **5 elementos** llamado **sort5(*A*)**, donde ***A*** es el arreglo a ordenar. Para ordenar cada sublista se usara este algoritmo, sin embargo, esta version propia funciona si y solo si el tamano del arreglo es de 5, por lo cual, si el tamano es diferente a 5, se usara la funcion de C ***sorted***.

Ademas, debemos tomar en cuenta que ordenar listas muy pequenas toma tiempo lineal ***O(n)***

##### 3) Crear una lista compuesta por las medianas de las sublistas

Como cada sublista ya esta ordenada, para obtener el valor de la mediana de cada una de estas, bastara con retornar el valor con el indice medio de cada sublista e ingresarlo a la nueva lista llamada ***medians***

##### 4) Obtener la mediana de la lista medians

Este valor se utilizara en el siguiente paso como pivote (***pivot***)

##### 5) Particionamiento

Se crearan dos listas, una con los valores menores a ***pivot***, llamada ***SL***, y la otra con los valores mas grandes, llamada ***SR***. El tiempo de llenar las listas mediante comparaciones toma tiempo ***0(n)***.

##### 6) Llamada recursiva

Se podran dar 3 casos:
    
1) Si el tamano de la lista ***SL*** es mayor al indice ***k*** recibido por parametro, se hara una llamada recursiva de median_of_medians con ***SL*** y el mismo indice ***k***: ***median_of_medians(SL, k)***
   
2) Si el tamano de la lista ***SR*** es mayor al indice ***k*** recibido por parametro, se hara una llamada recursiva de median_of_medians con ***SR*** y el indice ***k*** menos el tamano de ***SL*** menos 1: ***median_of_medians(SR, k - len(SL) - 1)***

3) Si ninguno de los casos anteriores se cumple, quiere decir que el pivote es el indice ***k*** que se estaba buscando, por lo que lo retornamos: ***return pivot***

In [14]:
#Implementacion propia de sort5

def sort5(A):

        if A[0] > A[1]:
            A[0], A[1] = A[1], A[0]
        if A[2] > A[3]:
            A[2], A[3] = A[3], A[2]
        
        if A[1] > A[3]:
            A[1], A[3] = A[3], A[1]
            A[1], A[2] = A[2], A[1]
            if A[1] < A[0]:
                A[1], A[0] = A[0], A[1]
            if A[1] > A[2]:
                A[1], A[2] = A[2], A[1]
        elif A[0] > A[2]:
            A[1], A[2], A[0] = A[0], A[1], A[2]
        elif A[1] > A[2]:
             A[1], A[2] = A[2], A[1]
        
        if A[4] > A[3]:   
            pass
        elif A[4] > A[2]:
            A[3], A[4] = A[4], A[3]
        elif A[4] > A[1]:
            A[2], A[3], A[4] = A[4], A[2], A[3]
        elif A[4] > A[0]:
            A[1], A[2], A[3], A[4] = A[4], A[1], A[2], A[3]
        else:
            A[0], A[1], A[2], A[3], A[4] = A[4], A[0], A[1], A[2], A[3]

#Implementacion de medians of medians
            
def median_of_medians(A, k):

        sublists = [(A[j:j+5]) for j in range(0, len(A), 5)] #Paso 1
        
        for i in range(len(sublists)): #Paso 2
            if len(sublists[i]) != 5:
                sublists[i] = sorted(sublists[i])
            else:
                sort5(sublists[i])
        
        medians = [sublist[len(sublist) // 2] for sublist in sublists] #Paso 3
            
        if len(medians) != 5:
            medians = sorted(medians)
        else:
            sort5(medians)
    
        pivot = medians[len(medians) // 2] #Paso 4
    
        SL = [x for x in A if x < pivot] #Paso 5
        SR = [x for x in A if x > pivot] 
    
        #Paso 6
    
        if len(SL) > k: 
            return median_of_medians(SL, k) 
        elif len(SL) < k:
            return median_of_medians(SR, k-len(SL)-1)
        return pivot
    
#Aqui se detallan algunos ejemplos para mostrar el funcionamiento del algoritmo

A = [8, 17, 32, 3, 22, 10, 29]

B = [12, 12, 20, 58, 6, 44, 30]

print("Minimo de A: {}".format(median_of_medians(A, 0))) #deberia ser 3 (minimo)
print("Mediana de A: {}".format(median_of_medians(A, len(A) // 2))) #deberia ser 17 (mediana)
print("Maximo de B: {}".format(median_of_medians(B, len(B) - 1))) #deberia ser 58 (maximo)

Minimo de A: 3
Mediana de A: 17
Maximo de B: 58
