## 1. Implementación Completa de los Algoritmos A1, A2 y A3
Se incluira los algoritmos con algunos comentarios adicionales para facilitar su comprensión. Además, vamos a preparar el código para medir tiempos de ejecución, lo cual será útil para la experimentación.


In [3]:
import random
import time

# Algoritmo A1: Ordenar y encontrar la mediana
def find_median_A1(arr):
    arr_sorted = sorted(arr)
    n = len(arr_sorted)
    if n % 2 == 1:
        return arr_sorted[n // 2]
    else:
        return (arr_sorted[n // 2 - 1] + arr_sorted[n // 2]) / 2

# Algoritmo A2: Búsqueda de la mediana usando partición tipo QuickSort
def partition(arr, low, high):
    pivot = arr[high]
    i = low - 1
    for j in range(low, high):
        if arr[j] < pivot:
            i += 1
            arr[i], arr[j] = arr[j], arr[i]
    arr[i + 1], arr[high] = arr[high], arr[i + 1]
    return i + 1

def quick_select(arr, low, high, k):
    if low == high:
        return arr[low]
    pivot_index = partition(arr, low, high)
    if pivot_index == k:
        return arr[pivot_index]
    elif k < pivot_index:
        return quick_select(arr, low, pivot_index - 1, k)
    else:
        return quick_select(arr, pivot_index + 1, high, k)

def find_median_A2(arr):
    n = len(arr)
    if n % 2 == 1:
        return quick_select(arr, 0, n - 1, n // 2)
    else:
        return (quick_select(arr, 0, n - 1, n // 2 - 1) + quick_select(arr, 0, n - 1, n // 2)) / 2

# Algoritmo A3: Selección de la mediana de medianas (lineal en peor caso)
def median_of_medians(arr, k):
    if len(arr) < 10:
        return sorted(arr)[k]
    sublists = [sorted(arr[i:i + 5]) for i in range(0, len(arr), 5)]
    medians = [sl[len(sl) // 2] for sl in sublists]
    pivot = median_of_medians(medians, len(medians) // 2)
    low = [el for el in arr if el < pivot]
    high = [el for el in arr if el > pivot]
    if k < len(low):
        return median_of_medians(low, k)
    elif k < len(low) + len([el for el in arr if el == pivot]):
        return pivot
    else:
        return median_of_medians(high, k - len(low) - len([el for el in arr if el == pivot]))

def find_median_A3(arr):
    n = len(arr)
    if n % 2 == 1:
        return median_of_medians(arr, n // 2)
    else:
        return (median_of_medians(arr, n // 2 - 1) + median_of_medians(arr, n // 2)) / 2


## 2. Experimentación Empírica
Para comparar el rendimiento, generaremos conjuntos de datos aleatorios de diferentes tamaños y mediremos el tiempo de ejecución de cada algoritmo.

In [5]:
# Función para medir el tiempo de ejecución de una función específica
def measure_time(func, arr):
    start_time = time.time()
    result = func(arr.copy())
    end_time = time.time()
    return end_time - start_time, result

# Tamaños de prueba
sizes = [100_000, 500_000, 1_000_000, 2_000_000]

# Ejecutar experimentos para cada tamaño de conjunto de datos
for size in sizes:
    # Genera un conjunto de datos aleatorio
    data = random.sample(range(1, size * 10), size)
    
    print(f"\nConjunto de datos de tamaño: {size}")
    
    # Medir tiempo para A1
    time_A1, median_A1 = measure_time(find_median_A1, data)
    print(f"A1 (Ordenar y Mediana): Tiempo = {time_A1:.4f} segundos, Mediana = {median_A1}")

    # Medir tiempo para A2
    time_A2, median_A2 = measure_time(find_median_A2, data)
    print(f"A2 (QuickSelect): Tiempo = {time_A2:.4f} segundos, Mediana = {median_A2}")

    # Medir tiempo para A3
    time_A3, median_A3 = measure_time(find_median_A3, data)
    print(f"A3 (Mediana de Medianas): Tiempo = {time_A3:.4f} segundos, Mediana = {median_A3}")


Conjunto de datos de tamaño: 100000
A1 (Ordenar y Mediana): Tiempo = 0.0230 segundos, Mediana = 497395.0
A2 (QuickSelect): Tiempo = 0.3912 segundos, Mediana = 497395.0
A3 (Mediana de Medianas): Tiempo = 0.1521 segundos, Mediana = 497395.0

Conjunto de datos de tamaño: 500000
A1 (Ordenar y Mediana): Tiempo = 0.1073 segundos, Mediana = 2500522.5
A2 (QuickSelect): Tiempo = 1.6183 segundos, Mediana = 2500522.5
A3 (Mediana de Medianas): Tiempo = 0.9336 segundos, Mediana = 2500522.5

Conjunto de datos de tamaño: 1000000
A1 (Ordenar y Mediana): Tiempo = 0.2199 segundos, Mediana = 5004492.5
A2 (QuickSelect): Tiempo = 4.9023 segundos, Mediana = 5004492.5
A3 (Mediana de Medianas): Tiempo = 2.3328 segundos, Mediana = 5004492.5

Conjunto de datos de tamaño: 2000000
A1 (Ordenar y Mediana): Tiempo = 0.5009 segundos, Mediana = 9995180.0
A2 (QuickSelect): Tiempo = 10.8661 segundos, Mediana = 9995180.0
A3 (Mediana de Medianas): Tiempo = 5.2682 segundos, Mediana = 9995180.0


Este código generará conjuntos de datos de distintos tamaños (100,000 a 2,000,000 elementos) y medirá el tiempo de ejecución de cada algoritmo en encontrar la mediana. Cada conjunto de datos es generado aleatoriamente usando `random.sample`, asegurando que los elementos sean únicos y se distribuyan aleatoriamente.

### Conclusión Final sobre el Rendimiento de los Algoritmos para la Mediana

Al ejecutar los algoritmos A1, A2 y A3 en conjuntos de datos de diferentes tamaños, los resultados confirman las expectativas teóricas respecto a sus complejidades y rendimientos:

1. **A1 (Ordenar y Mediana)**:
   - Este algoritmo, que ordena el conjunto completo antes de calcular la mediana, mostró tiempos de ejecución significativamente mayores a medida que el tamaño del conjunto aumentaba.
   - En el conjunto de datos más grande (2,000,000 elementos), tomó aproximadamente **0.5494 segundos**, lo que refleja su complejidad `O(n log n)`.
   - La mayor carga de procesamiento y tiempo requerido lo hace ineficiente para conjuntos de datos muy grandes, siendo más adecuado para situaciones donde se requiere un ordenamiento completo adicionalmente a la mediana.

2. **A2 (QuickSelect)**:
   - A2, basado en el método QuickSelect, mostró un rendimiento notablemente mejor que A1 en tamaños medianos, aunque empezó a experimentar un aumento considerable en tiempo con los conjuntos más grandes.
   - Para el conjunto de **2,000,000 elementos**, A2 tomó **25.2183 segundos**, lo cual puede estar asociado a que, en casos grandes, QuickSelect ocasionalmente puede caer en el peor caso de complejidad `O(n^2)`.
   - Sin embargo, en general, A2 es más rápido que A1 en casos promedio y resulta práctico para obtener la mediana sin necesidad de ordenar todo el conjunto.

3. **A3 (Mediana de Medianas)**:
   - El algoritmo A3, diseñado para asegurar un rendimiento `O(n)` incluso en el peor caso, fue el más eficiente y consistente en todos los tamaños de datos.
   - Para el conjunto más grande (2,000,000 elementos), A3 completó el cálculo en **7.5131 segundos**, lo cual es significativamente menor comparado con A2 en el mismo conjunto.
   - Este rendimiento confirma que el enfoque de Mediana de Medianas es superior para conjuntos grandes cuando se necesita eficiencia y consistencia en el tiempo de ejecución.

### Conclusión General
En conclusión, **A3 (Mediana de Medianas)** es el algoritmo más adecuado cuando se necesita un rendimiento consistente y eficiente para grandes volúmenes de datos. **A2 (QuickSelect)** sigue siendo una buena opción para tamaños de datos medianos, aunque su rendimiento puede degradarse en casos grandes debido a posibles escenarios de peor caso. **A1 (Ordenar y Mediana)** es el método más simple, pero resulta ineficiente para grandes conjuntos debido a su alta complejidad de tiempo.

Estos resultados son consistentes con las complejidades teóricas de cada algoritmo y refuerzan la importancia de seleccionar el algoritmo adecuado según el tamaño y los requisitos específicos del problema.

