# 1. Pivot Selection

## 1.1. Descripción del problema

Se busca encontrar el elemento de la posición i-ésima de tal manera que existan i-1 elementos menores que éste.

**Entrada**: Arreglo A y valor i.

**Salida**: Valor del elemento que cumpla la condición de que hayan i-1 elementos menores que él.

In [1]:
def insertionSort(arr, verbose=False):
    n = len(arr)
    c = 0 # Contador de comparaciones
    if verbose == True:
        print('\nInput array:', arr)
    # Se recorre el arreglo
    for i in range(1, n):
        c += 1
        if verbose == True:
            print('\nPasada', i)
        elemento = arr[i]
        j = i-1
        # Cambia la posición del elemento si es menor que su predecesor
        while j >= 0 and elemento < arr[j]:
            c += 1
            arr[j+1] = arr[j]
            j -= 1
        arr[j+1] = elemento
        if verbose == True:
            print('\nArray:', arr)
    if verbose == True:
        print('\nDone')
    return arr

In [2]:
def pivotSelection(A, verbose=False):
    sublists = [A[j:j+5] for j in range(0, len(A), 5)]
    if verbose:
        print(f'Subarreglos agrupados: {sublists}')
        print(f'Subarreglos agrupados y ordenados: {[insertionSort(sublist) for sublist in sublists]}')
    medians = [insertionSort(sublist)[len(sublist)//2] for sublist in sublists]
    if verbose:
        print(f'Lista de medianas: {medians}')
    # Si la lista que recibe es menor a 5 elementos, solo retorna el valor
    if len(medians) <= 5:
        pivot = insertionSort(medians)[len(medians)//2]
        if verbose:
            print(f'Mediana de la lista: {pivot}')
        return pivot
    # Si la lista que recibe tiene más de 5 elementos, repite el proceso
    # recursivamente con la nueva lista
    else:
        pivot = pivotSelection(medians, len(medians)//2)
        return pivot

## 1.2. Descripción del algoritmo

El algoritmo _pivotSelection_ se encarga de escoger el pivote para usar en _Select_. Lo que hace es dividir el arreglo de entrada en $\frac{n}{5}$ grupos de 5 elementos. Luego los ordena usando _Insertion Sort_ y obtiene la mediana de cada grupo. Junta todas las medianas y aplica recursivamente _pivotSelection_ con el nuevo subarreglo de medianas hasta que obtenga una única mediana, que es el valor que retorna.

# 2. Select Sort

In [3]:
def partition(A, verbose=False):
    m = pivotSelection(A, verbose)
    if verbose:
        print(f'Lista antes de particionar: {A}')
    low = [j for j in A if j<m]
    high = [j for j in A if j>m]
    if verbose:
        print(f'Subarreglo izquierdo: {low}')
        print(f'Subarreglo derecho: {high}')
    return m, low, high

In [4]:
def select(A, i, verbose=False):
    if verbose:
        print(f'Input: {A}')
    pivot, low, high = partition(A, verbose)
    if verbose:
        print(f'Pivote: {pivot}')
    k = len(low)
    if i < k:
        if verbose:
            print(f'Subarreglo izquierdo: {low}\n')
        return select(low, i, verbose)
    elif i > k:
        if verbose:
            print(f'Subarreglo derecho: {high}\n')
        return select(high, i-k-1, verbose)
    else:
        if verbose:
            print(f'Resultado: {pivot}\n')
        return pivot

## 2.1. Descripción del algoritmo

El algoritmo recibe un arreglo de números y un valor $i$, que corresponde al i-ésimo menor elemento del arreglo. Primero revisa el caso en que el arreglo tiene un único elemento y lo retorna si es así. Luego particiona el arreglo: en _partition_ se calcula el pivote con _pivotSelection_, y el resto de la ejecución es similar a la de _partition_ en _quicksort_, en el que entrega como valor la posición del pivote. Se calcula $k$ que es la cantidad de elementos del subarreglo izquiero más 1 por el pivote y se compara: si $i=k$ se retorna el pivote, que es el elemento que se buscaba; si $i<k$ se aplica _select_ recursivamente con el subarreglo izquierdo, y si $i>k$ se aplica _select_ recursivamente con el subarreglo derecho.

In [5]:
# Bloque de código que sirve para 
a = [90, 97, 73, 43, 25, 8, 12, 21, 46, 56, 54, 31, 20, 35, 100, 24, 88, 98, 95, 96, 19, 33, 55, 52, 94]
a.sort()
print(a)

[8, 12, 19, 20, 21, 24, 25, 31, 33, 35, 43, 46, 52, 54, 55, 56, 73, 88, 90, 94, 95, 96, 97, 98, 100]


In [6]:
a = [90, 97, 73, 43, 25, 8, 12, 21, 46, 56, 54, 31, 20, 35, 100, 24, 88, 98, 95, 96, 19, 33, 55, 52, 94]
b = 8
print(f'Entrada: {a}\n')
x = select(a, b, True)
print(f'\nElemento en la posición {b+1}: {x}')

Entrada: [90, 97, 73, 43, 25, 8, 12, 21, 46, 56, 54, 31, 20, 35, 100, 24, 88, 98, 95, 96, 19, 33, 55, 52, 94]

Input: [90, 97, 73, 43, 25, 8, 12, 21, 46, 56, 54, 31, 20, 35, 100, 24, 88, 98, 95, 96, 19, 33, 55, 52, 94]
Subarreglos agrupados: [[90, 97, 73, 43, 25], [8, 12, 21, 46, 56], [54, 31, 20, 35, 100], [24, 88, 98, 95, 96], [19, 33, 55, 52, 94]]
Subarreglos agrupados y ordenados: [[25, 43, 73, 90, 97], [8, 12, 21, 46, 56], [20, 31, 35, 54, 100], [24, 88, 95, 96, 98], [19, 33, 52, 55, 94]]
Lista de medianas: [73, 21, 35, 95, 52]
Mediana de la lista: 52
Lista antes de particionar: [90, 97, 73, 43, 25, 8, 12, 21, 46, 56, 54, 31, 20, 35, 100, 24, 88, 98, 95, 96, 19, 33, 55, 52, 94]
Subarreglo izquierdo: [43, 25, 8, 12, 21, 46, 31, 20, 35, 24, 19, 33]
Subarreglo derecho: [90, 97, 73, 56, 54, 100, 88, 98, 95, 96, 55, 94]
Pivote: 52
Subarreglo izquierdo: [43, 25, 8, 12, 21, 46, 31, 20, 35, 24, 19, 33]

Input: [43, 25, 8, 12, 21, 46, 31, 20, 35, 24, 19, 33]
Subarreglos agrupados: [[43, 25

# 3. Correctitud Select

**Caso base**: $n = 1$

Con $n=1$ se tiene que $i=1$ y $low = high$, así que el i-ésimo elemento sería $A[low] = A[high]$.

**Caso general**: $n>1$

El pivote $q$ es la mediana de las medianas y cumple que $A[j]<A[q]<A[k]$ para todo $j$ y $k$ que cumplan $low \leq j < q < k \leq high$.

Para $k=low-high+1$ (cantidad de elementos del subarreglo izquierdo más 1 por el pivote) se tiene:

- El k-ésimo elemento de $A[low ... high]$ es $A[q]$
- Si $i<k$, el i-ésimo elemento de $A[low ... high]$ es el i-ésimo elemento de $A[low ... q-1]$
- Si $i>k$, el i-ésimo elemento de $A[low ... high]$ es el $(i-k-1)$-ésimo elemento de $A[q+1 ... high]$

Por lo tanto, se prueba la correctitud de _Select_ por inducción.

## 4. Complejidad temporal Select

La función de recursión de Select tiene la forma: $T(n)=T($tamaño subproblema 1$) + T($tamaño subproblema 2$) + O(n)$.

El tamaño del subproblema 1 es $\frac{n}{5}$. El tamaño del segundo es $?$.

Para obtener $?$ se probará el siguiente lema:

**Lema 30-70**: _Para cada lista de entrada con largo_ $n \geq 2$_, el subarreglo entregado a las llamadas recursivas de Select tiene tamaño como máximo de_ $\frac{7n}{10}$.

**Demostración**: $k = \frac{n}{5}$ es el número de grupos de 5 elementos. $x_i$ es el i-ésimo menor elemento del grupo, $x_1, ..., x_k$ son los elementos del grupo en orden ascendente. La mediana de medianas corresponde a $x_{\frac{k}{2}}$ o $x_{⌈\frac{k}{2}⌉}$ para $k$ impar. Al menos un $50\%$ de los grupos tiene una mediana menor y al menos un $60\%$ de los elementos de esos grupos son menores o iguales al valor obtenido. Por lo tanto, al menos un $50\% \cdot 60\% = 30\%$ de los elementos del arreglo original son menores o iguales al pivote. Similarmente, al menos un $30\%$ de los elementos del arreglo original son mayores que el pivote. Así queda demostrado el _Lema 30-70_.

Como el lema se cumple, $?$ equivale a $\frac{7n}{10}$.

$T(n)=T(\frac{n}{5}) + T(\frac{7n}{10}) + O(n)$

$T(1) = 1$ $\rightarrow$ $\frac{1}{5}+\frac{7}{10} < 1$

Se probará por inducción que $T(n) = O(n)$:

Existe una constante $l>0$ tal que $T(n) \leq l \cdot n$

$T(n) \leq T(\frac{n}{5}) + T(\frac{7n}{10}) + c \cdot n$

$T(n) \leq l \cdot \frac{n}{5} + l \cdot \frac{7n}{10} + c \cdot n$

$T(n) \leq n\left(\frac{9}{10} \cdot l + c\right) \rightarrow$ se escoge convenientemente $l = 10c \Rightarrow \frac{9l}{10} + c = 10c = l$ (como $c$ es constante, $l$ también lo es).

Finalmente queda $T(n) \leq l \cdot n = O(n)$, por lo que se demuestra la inducción.