<a href="https://colab.research.google.com/github/Rocio206/ADA-Informes/blob/main/Select_Informe_6.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Problema de Selección (estadísticos de orden)

En ciencias de la computación, un algoritmo de selección es un algoritmo para encontrar el k-ésimo menor número en una lista o arreglo; a este número se le llama estadístico de orden k.

El algoritmo **Select** se presenta como una forma de resolver el siguiente problema:

> **Entrada:** Conjunto de **$n$** números diferentes **$A[1,...,n]$**, más un índice $i ∈ $ { $1, . . . , n$ }.


> **Salida:** Elemento $x ∈ A$, que es exactamente mayor a $i-1$ elementos de $A$.

Donde el elemento $x$ corresponde al **estadístico de orden $i$** para el conjunto $A$.



#Implementación 

##**Función PivotSelection**
**Entrada:** Conjunto de **$n$** números diferentes **$A[1,...,n]$**, más un índice $i ∈ $ { $1, . . . , n$ }.

**Salida:** El elemento  $m ∈ A$, correspondiente a la mediana de las medianas de $n/5$ subconjuntos de A.

La función realiza lo siguiente:


1.   Divide los $n$ elementos de la entrada en $n/5$ grupos de hasta 5 elementos cada uno.

2.   Calcula la mediana de cada grupo usando **InsertionSort** y la agrega a un arreglo $M[1,..., \frac{n}{5}]$.

3.  De forma recursiva calcula la mediana de $M$.


![image](https://imagizer.imageshack.com/v2/640x480q90/924/PuP8BT.png)


###**Código** 
El siguiente código muestra una implementación de la función **PivoteSelection.**

In [7]:
import random

def InsertionSort(A, p, r):
  for j in range(p + 1, r + 1):
    actual = A[j]
    i = j - 1 
    while i >= p  and A[i] > actual:
      A[i + 1] = A[i]
      i -= 1 
    A[i+1] = actual

def PivotSelection(A, p, r, i):
  if r - p + 1  <= 5:
    InsertionSort(A, p, r)
    return A[i]

  n_grups = (r-p+1)//5      
  M = [0] * n_grups
 
  for j in range(0, n_grups):
    u = p + 5 * j + 4
    if r < u: u = r

    print("# Iteracion:", j+1)
    print("Subconjunto:", A[p+5*j:u+1])
    InsertionSort(A, p + 5 * j, u)
    M[j] = A[((p + 5 * j + u)//2)]
    print("Mediana =", M[j])
    print()

  print("M =", M)
  return PivotSelection(M, 0, n_grups -1, n_grups//2)

#Ejemplo

M = random.sample(range(1,100), 21)

print("Entrada :", M)
print()
pivote = PivotSelection(M, 0, 20, 1)
print()
print("Salida :", pivote)

Entrada : [28, 72, 73, 32, 45, 78, 9, 83, 91, 15, 61, 65, 56, 42, 31, 88, 79, 2, 87, 93, 54]

# Iteracion: 1
Subconjunto: [28, 72, 73, 32, 45]
Mediana = 45

# Iteracion: 2
Subconjunto: [78, 9, 83, 91, 15]
Mediana = 78

# Iteracion: 3
Subconjunto: [61, 65, 56, 42, 31]
Mediana = 56

# Iteracion: 4
Subconjunto: [88, 79, 2, 87, 93]
Mediana = 87

M = [45, 78, 56, 87]

Salida : 78


##**Algoritmo Select**

Select es un algoritmo de selección que, similar al algoritmo de ordenamiento QuickSort, **realiza particiones para dividir  el problema**; excepto que hace la recursión sobre un solo lado de la partición. 

Utiliza una versión de **Partition** al cual se le pasa el
elemento pivote, junto a la **función PivotSelection** para garantizar que las particiones sobre el arreglo sea **siempre balanceadas**.


> **Entrada:** Conjunto de **$n$** números diferentes **$A[1,...,n]$**, más un índice $i ∈ $ { $1, . . . , n$ }.


> **Salida:** Elemento $x ∈ A$, que es mayor a exactamente $i-1$ elementos de $A$.


**Select realiza lo siguiente:**

1.   Utiliza la función PivotSelection para seleccionar un **pivote** adecuado para particionar los elementos de entrada, garantizando una **particion balanceada**.
2.   Comprueba si el indice del pivote luego de **Partition** ($q$) es el índice buscado, de lo contrario, continua buscando **recurcivamente** sobre el subproblema correspondiente .

###**Código**

El código a continuacion muestra un implementación del **algoritmo Select.**


In [2]:
def InsertionSort(A, p, r):
  for j in range(p + 1, r + 1):
    actual = A[j]
    i = j - 1 
    while i >= p  and A[i] > actual:
      A[i + 1] = A[i]
      i -= 1 
    A[i+1] = actual

def PivotSelection(A, p, r, i):
  if r - p + 1  <= 5:
    InsertionSort(A, p, r)
    return A[i]

  n_grups = (r-p+1)//5      
  M = [0] * n_grups
 
  for j in range(0, n_grups):
    u = p + 5 * j + 4
    if r < u: u = r
    InsertionSort(A, p + 5 * j, u)
    M[j] = A[((p + 5 * j + u)//2)]
  
  return PivotSelection(M, 0, n_grups -1, n_grups//2)

def Partition(A, p, r, x):
  i = p - 1
  for k in range(p, r + 1):
    if A[k] < x:
      i += 1
      A[i], A[k] = A[k], A[i]

  i += 1
  for m in range(i, r):
    if A[m] == x: 
      A[i], A[m] = A[m], A[i]
      break
  return i

def Select(A, p , r, i, verbose=True):
  if verbose == True:
    print("Entrada Select :",A[p:r+1] ,"i =", i)
    print()

  if r - p + 1  <= 5:    ##caso base
    InsertionSort(A, p, r)
    return A[i]

  x =  PivotSelection(A, p, r, i)

  if verbose == True: 
    print("Pivote :",x)

  q = Partition(A, p, r, x)

  if verbose == True: print("Patition:", A)

  k = q - p + 1
  if i == k:
    return A[q]
  elif i < k:
    return Select(A, p, q-1, i)
  else:
    return Select(A, q+1, r, i-k)

print("EJEMPLO")

A = [54, 6, 8, 30, 60, 2, 74, 96, 78, 98, 97, 46, 62, 77]
E_orden = random.randint(1, len(A))
print("Arreglo:" , A)
print("Estadistico de orden:", E_orden)
print()
h = Select(A, 0, len(A) - 1, E_orden - 1)

print("Salida :",h)

EJEMPLO
Arreglo: [54, 6, 8, 30, 60, 2, 74, 96, 78, 98, 97, 46, 62, 77]
Estadistico de orden: 13

Entrada Select : [54, 6, 8, 30, 60, 2, 74, 96, 78, 98, 97, 46, 62, 77] i = 12

Pivote : 78
Patition: [6, 8, 30, 54, 60, 2, 74, 46, 62, 77, 78, 97, 96, 98]
Entrada Select : [97, 96, 98] i = 1

Salida : 8


#Correctitud del algoritmo Select

Demostración por inducción en el tamaño $n$. **Se asume que todos los elementos son distintos.**

> **Caso** $n \leq 5$ : Se ordena el arreglo , entonces el $i$-ésimo es $A[i]$.


> **Caso $n > 5$** : **PivoteSelection** reordena $A$ y retorna el pivote $q$, tal que $A[j] < A[q] < A[k]$ para todo $j$ y $k$ con $p \leq j < q < k \leq r$.

Para $k = q - p + 1$, tenemos que:

*   El $k$-ésimo de $A[p,...,r]$ es $A[q]$.

*   Si $i < k$, el $i$-ésimo de $A[p,...,r]$ es el $i$-ésimo de $A[p...q-1]$.

*   Si $i> k $, el $i$-ésimo de $A[p,...,r]$ es el $(i-k)$-ésimo de $A[p...q-1]$.

Entonces, por HI, el algoritmo **Select es correcto**.


#Analisis del tiempo de ejecución

##**Peor caso**

> **Acotamos el número de elementos mayores estrictos al pivote $x$**:

Como los elementos son distintos, la mitad de las medias son $≥ x$. Por lo tanto, la mitad de los grupos contribuyen 3 elementos **mayores estrictos** a $x$ excepto:

1.   El grupo al que pertenece $x$
2.   El último grupo que puede tener menos de 5 elementos (cuando $n$ no es divisibel por 5)

El número de elementos **mayores estrictos** a $x$ es al menos:

> ## $3([\frac{1}{2}[\frac{n}{5}]-2] ≥ \frac{3n}{10}-6 $


El número de elementos **menores estrictos** a $x$ en $n$ menos el número de elementos mayores a $x - 1$. Este numero es como maximo:


> ## $n - (\frac{3n}{10}-6) -1 = \frac{7n}{10} +6 -1 = \frac{7n}{10}+5$

De forma similar se muestra que ele numero de leemnetos mayores estrictos a $x$ es a lo sumo $\frac{7n}{10}+5$

Debido a esto, **segunda recursión** es sobre un arreglo de tamaño menor o igual a $\frac{7n}{10}+5$

La **primera recursión** (para calcular la media de la medias) es siempre sobre un arreglo de tamaño $\frac{n}{5}$

Asuminedo que $T(n)$ es una funcion monotona, obtenemos:

**Caso base:** $O(1)$   **; si $n< 5$**


> ## $T(n) \leq T(\frac{n}{5}) + T(\frac{7n}{10}+5) + O(n)$  **; si $n≥5$**
Donde el término $O(n)$ contabiliza todos los tiempos excepto las dos recurciones.

Para terminar demostramos que $T(n) \leq cn$, sea $c$ una constante, tal que $T(n) \leq cn$ para todo $n < 5$ y $a$ la constante para el término $O(n)$ para todo $n>0$.



$T(n) \leq T(\frac{n}{5}) + T(\frac{7n}{10}+5) + O(n)$.

$\leq c(\frac{n}{5}) + c(\frac{7n}{10}+5) + an$

$\leq c(\frac{n}{5}+1) + c(\frac{7n}{10}+6) + an$

$ = c(\frac{9n}{10}+7)+an$

$ = cn-(\frac{cn}{10} -7c - an)$

De esta forma se verifica $\frac{cn}{10} -7c - an ≥ 0$ y entonces $T(n) \leq cn$ para todo $n$.

#Experimentos y Analisis

##**Número de comparaciones**
comparar el número de comparaciones realizadas experimentalmente con el mejor y peor caso teóricos.

##**Select vs Randomized-Select**

El algoritmo **Randomized-Select** es la contraparte **no determinista** (randomizado) de **Select** con tiempo de ejecucion esperado lineal para cualquier entrada (de elementos distintos).

Sin asumir nada particular sobre los elementos, podemos hacer
selección en tiempo lineal **sin necesidad de ordenar los elementos**.

**Randomized-Select** es un algoritmo simple pero su análisis es
complejo.

**Select** es un algoritmo complejo pero su análisis es más simple

In [None]:
import random

def RandomizedPartition(A, p, r):
  x = random.randint(p,r)
  return Partition(A, p, r, A[x])

def RandomizedSelect(A, p, r, i):
  if p == r: return A[p]
  q = RandomizedPartition(A, p, r)
  k = q - p + 1 
  if i == k : 
    return A[q]
  elif i<k: 
    return RandomizedSelect(A, p, q-1, i)
  else:
    return RandomizedSelect(A, q+1, r, i-k)




