<a href="https://colab.research.google.com/github/Aranzasuu/ADA-Informes/blob/main/Select.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# **1. Descripción del problema**

![image](https://yosoytuprofe.20minutos.es/wp-content/uploads/2021/10/grafico-de-barras-1024x576.png?crop=1)

##${↪}$ **PROBLEMA DE SELECCIÓN**

La estadística de orden es una herramienta fundamental en la estadística, el objetivo es encontrar el k-ésimo menor elemento en un conjunto, a esto se le llama estadístico de orden k, donde incluye casos como para encontrar el mínimo, máximo y la mediana.

Es por esto que el problema de la seleción está directamente relacionado con esto.

**${↪}$ 𝙴𝚗𝚝𝚛𝚊𝚍𝚊:** Conjunto de $n$ elementos diferentes no ordenados A más un índice $i$.

**${↪}$ 𝚂𝚊𝚕𝚒𝚍𝚊:** Elemento $x$ perteneciente de A, que es menor a exactamente $i - 1$ elementos de A.

# **2. ALGORITMO SELECT**

Corresponde a un algoritmo recursivo, que tiene la capacidad de encontrar un estadístico de orden i-ésimo. Donde con la ayuda del algoritmo $Pivot Selection$ escoge el pivote para poder implementar la función $Partition$ y encontrar el elemento buscado.

**¿Pero cómo funciona?**

1. Debemos tener claro el elemento que debemos buscar $(i$: corresponde a la posición del i-ésimo elemento$)$ y llamamos a la función $Pivot-Selection$ donde dividimos el conjunto de n elementos en n/5 grupos de 5 elementos cada uno (el último grupo queda con menos elementos).

2. Con la ayuda del algoritmo $Insertion Sort$ ordenamos cada grupo y luego encontramos la mediana de cada uno. Así obteniendo un conjunto compuesto sólo de las medianas.

3. Se aplica recursivamente la función $PivotSelection$ para encontrar la mediana $m$ de las medianas calculadas con anterioridad.

4. Ya teniendo nuestra $m$, se le asignará ese valor como pivote para realizar la partición.

5. Si nuestra $i$ es el mismo que $q$ (posición del pivote) retornamos el valor. En caso que $i < q$ continuamos con la parte izquierda del arreglo $[0...q]$, en caso contrario continuamos con la parte derecha del arreglo $[q+1...n]$.

6. Finalmente como la función $Select$ es recursiva, repetimos el proceso hasta encontrar el elemento buscado.

## **2.1 CÓDIGO**

A continuación, el código implementa el algoritmo para poder solucionar el problema de selección.

In [2]:
# Importación de las librerías a utilizar
import matplotlib.pyplot as plt
import math
import datetime
from statistics import median_low
from timeit import repeat
import numpy as np
import random
from termcolor import colored

In [1]:
def insertionSort(b):
    for i in range(1, len(b)):
        up = b[i]
        j = i - 1
        while j >= 0 and b[j] > up: 
            b[j + 1] = b[j]
            j -= 1
        b[j + 1] = up  
    return b 

In [3]:
def crearGrupos(A):
  n = len(A)
  aux = []
  grupos = []

  for i in range(n):
    aux.append(A[i])
    if(len(aux) % 5 == 0):
      grupos.append(aux)
      aux = [] 
  
  if len(aux) < 5 and len(aux) > 0:
    grupos.append(aux)

  return grupos
    

In [4]:
def calcularMediana(A):
  medianas = []
  # ordeno los grupos
  for i in range(len(A)):
    A[i] = insertionSort(A[i])
  
  for j in range(len(A)):
    medianas.append(median_low(A[j]))
  return medianas



In [5]:
def partition(A, low, high, pivot):
    p = A[pivot]
    A[high - 1], A[pivot] = A[pivot], A[high - 1]
    i = low - 1
    for j in range(low, high):
        if A[j] <= p:
            i += 1
            A[i], A[j] = A[j], A[i]
    return i

In [12]:
def PivotSelection(A):
  if len(A) == 1: return A[0]

  # dividir el conjunto n en grupos de 5 elementos
  grupos = crearGrupos(A)

  # guardamos las medianas
  medianas = calcularMediana(grupos)

  return PivotSelection(medianas)

In [None]:
def Select(A, low, high, i):

  if i > 0 and i <= high - low + 1:
    par = PivotSelection(A)  # pivote para la partición
  # par = partition(A,0,len(A),pivot) # posición del pivote

    if i - low == par - 1: return A[par]

    # el pivote es menor
    if par - low > i - 1: return Select(A, low, par - 1, i)
  return Select(A, par + 1, high, i - par + low - 1)

  

A = [8,5,1,9,7,10,2,4,3,6]
i = 1
min = Select(A, 0, len(A), i)
print("resultado >>", min)





## **2.2 EJEMPLO**

Para poder entender de mejor manera el funcionamiento de este algoritmo, vamos a ver un ejemplo paso a paso:

**${↪}$ 𝙴𝚗𝚝𝚛𝚊𝚍𝚊:** $[8,5,1,9,7,10,2,4,3,6]$

**${↪}$ 𝚂𝚊𝚕𝚒𝚍𝚊:** $1$

Supongamos que estamos buscando el menor elemento, por lo que nuestra $i = 1$.

1. Dividimos el arreglo en grupos de 5 elementos, como podemos observar el arreglo tiene 10 elementos, por lo que ningún subarreglo tendrá menos de 5 elementos:

> $[8,5,1,9,7]$ $;$ $[10,2,4,3,6]$

2. Con la función $Insertion Sort$ ordenamos los grupos:

> $[1,5,7,8,9]$ $;$ $[2,3,4,6,10]$

3. Debemos obtener la mediana de los grupos, así teniendo:

> $[7,4]$

4. Aplicamos recursivamente la función $PivotSelection$ para encontrar la mediana $m$ de las medianas obtenidas con anterioridad, las ordenamos y la buscamos:

> $[$**4**$,7]$

5. Obteniendo como pivote $q = 4$ para particionar la entrada con la función $Partition$:

> $[1,2,3,4,8,5,9,7,10,6]$

6. Como buscamos el menor $(i < q)$, continuamos con la parte izquierda, así repitiendo el proceso ya que es recursivo, así también ordenando:

> $[1,2,3,4]$

7. Calculamos nuevamente el pivote $q = 2$, como es menor continuamos con la parte izquierda, teniendo como menor $= 1$ y finalmente retornandolo:

> $[1,2]$ ${↦}$ $[1]$

# **3. CORRECTITUD**

Para poder comprobar la correctitud de Select, utilizaremos **inducción matemática**, para probarla debemos:

1. Probar $P(n)$ para un caso base, por ejemplo $P(1)$

2. Probar que si $P(m)$ es cierto $m < n$, entonces $P(n)$ también lo es.

> **Caso Base:** En el caso que el conjunto contenga sólo un elemento, se asume que ese único elemento es el menor, ya que $A[low] = A[high]$
>
> **Caso Promedio:** En el caso que el conjunto tenga más de un elemento, se debe calcular la(s) mediana(s) para poder realizar el proceso de partición. Al ser recursivo se llegará al punto de obtener el caso base, así retornando el elemento buscado. Donde:
>
> En el caso que el índice buscado sea menor a la partición $(q)$, debemos poceder desde el lado izquierdo tomando en cuenta al pivote. $A[low...q]$
>
> En el caso contrario, debemos proceder del lado derecho al pivote. $A[q+1...high]$
>
> Así probando la correctitud del algoritmo.

# **4. TIEMPO DE EJECUCIÓN**

La complejidad de este algoritmo corresponde a:

> $T(n) = T(n/5) + T(7n/10) + O(n)$

Donde dividir el arreglo en n/5 grupos toma una complejidad de $O(n)$. Para buscar la mediana de forma recursiva toma un tiempo de T(n/5). Particionar el arreglo según la mediana tiene una complejidad de O(n). En el peor de los casos, 3n/10 son los menores, pero en este caso se utilizará la parte compuesto por el 7n/10 del conjunto.

Por inducción matemática quedaría algo asi:

$$T(n) =$$\begin{cases}
  O(1)  & \\
  T(\frac{n}{5}) + T(\frac{7n}{10}+6) + O(n) & \
\end{cases}
>
> $T(n) ≤ a*n + T(7n/10) + T(n/5)$
>
> $c * n ≤ cn/5 + 7cn/10 + a*n$
>
> $c*n ≤ 9cn/10 + a*n$
>
> $c*n ≤ 9*(cn/10) + a*n$
>
> $cn/10 ≤ a*n$
>
> $T(n) = O(n)$

Concluyendo así que el tiempo de ejecucuión del algoritmo es lineal, es decir $O(n)$.

# **5. EXPERIMENTACIÓN**