<a href="https://colab.research.google.com/github/EldritchBear/ADA-Informes/blob/main/Select.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# 1. Descripción del problema

La estadística de orden es una herramienta fundamental de la estadística no paramétrica y de inferencia que busca encontrar el elemento más pequeño en una muestra de datos, siendo este llamado estadístico de orden.

La reducción de problemas se basa en reutilizar soluciones de un problema similar al que se quiere resolver, transformando un problema nuevo en uno que yá se encuentra resuelto, lo que nos puede demostrar que el problema que se buscaba resolver no era más complicado que el resuelto con anterioridad.

Entrada: El algoritmo recibe un conjunto con n números y un índice $i$ que es el elemento a buscar.

Salida: El elemento llamado estadístico de orden i-ésimo, el cual es mayor a $i-1$ elementos del conjunto de datos.



#2. Descripción del algoritmo

El algoritmo recibe un arreglo de n elementos junto a un indice $i$ el cual es el estadístico de orden que se quiere buscar.

1. El arreglo se divide en subarreglos de 5 elementos cada uno.

2. Cada subarreglo se ordena utilizando $Insertion Sort$.

3. Se calcula la mediana de cada subarreglo y se guardan en otro subarreglo.

4. Se ordena el subarreglo de medianas utilizando el $Insertion Sort$ para luego calcular la mediana de este.

5. Utilizando la mediana de las medianas se particiona el arreglo original, dejando elementos menores o iguales al pivote o mediana a la izquierda y los mayores a la derecha.

6. Se compara el orden estadístico entre el pivote y el elemento a busca, si el elemento es menor se busca en la partición izquierda, si es igual se retorna el pivote, y si el elemento es mayor se busca en la partición derecha.

El algoritmo al ser recursivo se va a estar llamando continuamente hasta que llegue al caso en que el pivote y el i-ésimo elemento que se buscaban tengan el mismo orden, esto se puede ver en el paso 6, que es donde se revisa si se retorna el pivote o se sigue buscando recursivamente. Se puede observar que el algoritmo solo necesita el arreglo original al buscar el mejor pivote, o en otras palabras, la mediana de las medianas, puesto que luego al momento de buscar el i-ésimo valor solo se usan particiones del arreglo original, lo que podría significar un tiempo de ejecución de $O(nlogn)$.


In [13]:
def insertionSort(arreglo):
  n = len(arreglo)
  
  for i in range(0,n):
    dato = arreglo[i]
    while (i > 0 and arreglo[i-1] > dato):
      arreglo[i] = arreglo[i-1]
      i = i - 1
      arreglo[i] = dato
  return arreglo

In [316]:
def partition(arreglo,low,high):
  if verbose:
    print("entrando a función partition")

  piv = arreglo[high]
  i = low - 1

  for j in range(low, high):
    if arreglo[j] <= piv:
      i += 1
      arreglo[i], arreglo[j] = arreglo[j], arreglo[i]

  arreglo[i+1], arreglo[high] = arreglo[high], arreglo[i+1]

  if verbose:
    print("saliendo de función partition con pivote igual a: ", i+1)

  return i+1

In [331]:
import math
cont = 0

def pivotSelect(arreglo, low, high):
  global cont
  cant = math.ceil((high-low+1)/5)
  medianas = []

  for k in range(cant):
    auxLow = low + 5*k
    auxHigh = low + 4 + 5*k
    if (auxHigh > high):
      auxHigh = high
  
    arreglo[auxLow:auxHigh+1] = insertionSort(arreglo[auxLow:auxHigh+1])
    medianas.append((auxHigh + auxLow)//2)
  
  medianas = insertionSort(medianas)
  n = len(medianas)
  pivote = select(medianas, 0, n-1, n//2, verbose)
  cont += 1

  for k in range(cant):
    if pivote == arreglo[k]:
      pivote = k

  if verbose:
    print("mediana de medianas: ",pivote)

  arreglo[auxHigh-1], arreglo[pivote] = arreglo[pivote], arreglo[auxHigh-1]
  
  return partition(arreglo,low,high)


In [322]:
def select(arreglo, low, high, i, verbose):
  if (low == high or len(arreglo) == 0 or len(arreglo) == 1):
    return arreglo[low]

  if verbose:
    print("\n")
    print("arreglo entrando al select: ",arreglo)

  q = pivotSelect(arreglo, low, high)
  k = q - low + 1

  if verbose:
    print("estadístico de orden: ",k)

  if i == k:
    return arreglo[q]
  elif i < k:
    return select(arreglo, low, q-1, i, verbose)
  else:
    return select(arreglo, q+1, high, i-k, verbose)  

In [332]:
arreglo = [3, 7, 8, 1, 4, 6, 9, 5]
i = int(input("ingrese elemento "))
n = len(arreglo)
print(arreglo)
verbose = False
a = select(arreglo,0,n-1,i, verbose)
print(a)

ingrese elemento 6
[3, 7, 8, 1, 4, 6, 9, 5]
7


In [327]:
arreglo = [3, 7, 8, 1, 4, 6, 9, 5]
i = int(input("ingrese elemento "))
n = len(arreglo)
print("arreglo original: ",arreglo)
verbose = True
a = select(arreglo,0,n-1,i, verbose)
print("\n")
print("dato i-ésimo: ",a)
print("cantidad de comparaciones por funcion pivot selection: ", cont)
cont = 0

ingrese elemento 6
arreglo original:  [3, 7, 8, 1, 4, 6, 9, 5]


arreglo entrando al select:  [3, 7, 8, 1, 4, 6, 9, 5]


arreglo entrando al select:  [4, 6]
mediana de medianas:  0
entrando a función partition
saliendo de función partition con pivote igual a:  1
estadístico de orden:  2
mediana de medianas:  4
entrando a función partition
saliendo de función partition con pivote igual a:  7
estadístico de orden:  8


arreglo entrando al select:  [1, 3, 4, 7, 6, 5, 8, 9]


arreglo entrando al select:  [4, 5]
mediana de medianas:  0
entrando a función partition
saliendo de función partition con pivote igual a:  1
estadístico de orden:  2
mediana de medianas:  4
entrando a función partition
saliendo de función partition con pivote igual a:  6
estadístico de orden:  7


arreglo entrando al select:  [1, 3, 4, 6, 5, 7, 8, 9]


arreglo entrando al select:  [4, 7]
mediana de medianas:  0
entrando a función partition
saliendo de función partition con pivote igual a:  1
estadístico de orden:  2


# Tiempo de Ejecucción

