# Análisis de Rendimiento de Algoritmos de Ordenamiento

Este notebook carga los resultados de un *profiler* (contador de operaciones) para tres algoritmos de ordenamiento: **Bubble Sort**, **Selection Sort** e **Insertion Sort**.

El objetivo es graficar y comparar su rendimiento en tres escenarios:
1.  **Caso Promedio** (Lista aleatoria)
2.  **Mejor Caso** (Lista ya ordenada)
3.  **Peor Caso** (Lista en orden inverso)

In [1]:
import pandas as pd
import altair as alt

# Habilita el renderizador de Altair para el notebook
alt.renderers.enable('default')

RendererRegistry.enable('default')

## 1. Cargar los Datos

Define la ruta a tu archivo CSV en la celda de código de abajo. El archivo debe estar en formato CSV con las columnas esperadas (`Algorithm`, `Case`, `Size (n)`, `Comparisons`, `Movements`, `Time (ms)`).

In [2]:
# --- ¡MODIFICA ESTA LÍNEA! ---
# Especifica la ruta a tu archivo CSV (ej. 'sorting_results.csv')
ruta_del_archivo = 'sorting_profile_results.csv'
# -----------------------------

try:
    # Intentar cargar el archivo CSV desde la ruta especificada
    df = pd.read_csv(ruta_del_archivo)
    
    # Mostrar los primeros registros para verificar
    print(f"Archivo '{ruta_del_archivo}' cargado exitosamente.")
    print("Primeras 5 filas:")
    display(df.head())

except FileNotFoundError:
    print(f"Error: No se encontró el archivo en la ruta '{ruta_del_archivo}'.")
    print("Por favor, asegúrate de que el archivo CSV esté en el mismo directorio que el notebook o proporciona la ruta completa.")
    # Crear un DataFrame vacío para que el resto del notebook no falle al ejecutarse
    df = pd.DataFrame()
except Exception as e:
    print(f"Ocurrió un error inesperado al cargar el archivo: {e}")
    df = pd.DataFrame()

Archivo 'sorting_profile_results.csv' cargado exitosamente.
Primeras 5 filas:


Unnamed: 0,Algorithm,Case,Size (n),Comparisons,Movements,Time (ms)
0,Bubble Sort,Average Case,50,1215,741,0.0
1,Selection Sort,Average Case,50,1225,47,0.0
2,Insertion Sort,Average Case,50,787,741,0.0
3,Bubble Sort,Average Case,100,4929,2703,1.000166
4,Selection Sort,Average Case,100,4950,97,0.0


## 2. Gráfica: Tiempo de Ejecución vs. Tamaño (n)

Comparamos el tiempo real (en milisegundos) que tomó cada algoritmo para diferentes tamaños de lista (n), separado por cada caso de prueba.

In [3]:
# Solo ejecutar si el DataFrame no está vacío
if not df.empty:
    chart_time = alt.Chart(df).mark_line(point=True).encode(
        # Eje X: Tamaño de la lista
        x=alt.X('Size (n)', title='Tamaño de la Lista (n)'),
        
        # Eje Y: Tiempo de ejecución
        y=alt.Y('Time (ms)', title='Tiempo de Ejecución (ms)'),
        
        # Color: Una línea por cada algoritmo
        color=alt.Color('Algorithm', title='Algoritmo'),
        
        # Tooltip: Mostrar detalles al pasar el mouse
        tooltip=['Algorithm', 'Case', 'Size (n)', 'Time (ms)', 'Comparisons', 'Movements']
    ).properties(
        title='Tiempo de Ejecución vs. Tamaño de la Lista'
    ).facet(
        # Columnas: Separar los gráficos por 'Caso de Prueba'
        column=alt.Column('Case', title='Caso de Prueba', header=alt.Header(titleOrient="bottom", labelOrient="bottom"))
    ).interactive() # Habilitar zoom y pan

    display(chart_time)
else:
    print("No se pueden generar gráficos porque no se cargaron datos.")

  col = df[col_name].apply(to_list_if_array, convert_dtype=False)
  col = df[col_name].apply(to_list_if_array, convert_dtype=False)


## 3. Gráfica: Comparaciones vs. Tamaño (n)

Comparamos cuántas comparaciones (`if a < b`) realizó cada algoritmo. Este es un indicador clave de la complejidad teórica.

In [4]:
# Solo ejecutar si el DataFrame no está vacío
if not df.empty:
    chart_comparisons = alt.Chart(df).mark_line(point=True).encode(
        x=alt.X('Size (n)', title='TamaLp de la Lista (n)'),
        y=alt.Y('Comparisons', title='Número de Comparaciones'),
        color=alt.Color('Algorithm', title='Algoritmo'),
        tooltip=['Algorithm', 'Case', 'Size (n)', 'Time (ms)', 'Comparisons', 'Movements']
    ).properties(
        title='Número de Comparaciones vs. Tamaño de la Lista'
    ).facet(
        column=alt.Column('Case', title='Caso de Prueba', header=alt.Header(titleOrient="bottom", labelOrient="bottom"))
    ).interactive()

    display(chart_comparisons)
else:
    print("No se pueden generar gráficos porque no se cargaron datos.")

  col = df[col_name].apply(to_list_if_array, convert_dtype=False)
  col = df[col_name].apply(to_list_if_array, convert_dtype=False)


## 4. Gráfica: Movimientos vs. Tamaño (n)

Comparamos cuántos movimientos de datos (intercambios o desplazamientos) realizó cada algoritmo.

In [5]:
# Solo ejecutar si el DataFrame no está vacío
if not df.empty:
    chart_movements = alt.Chart(df).mark_line(point=True).encode(
        x=alt.X('Size (n)', title='TamaLp de la Lista (n)'),
        y=alt.Y('Movements', title='Número de Movimientos'),
        color=alt.Color('Algorithm', title='Algoritmo'),
        tooltip=['Algorithm', 'Case', 'Size (n)', 'Time (ms)', 'Comparisons', 'Movements']
    ).properties(
        title='Número de Movimientos/Intercambios vs. Tamaño de la Lista'
    ).facet(
        column=alt.Column('Case', title='Caso de Prueba', header=alt.Header(titleOrient="bottom", labelOrient="bottom"))
    ).interactive()

    display(chart_movements)
else:
    print("No se pueden generar gráficos porque no se cargaron datos.")

  col = df[col_name].apply(to_list_if_array, convert_dtype=False)
  col = df[col_name].apply(to_list_if_array, convert_dtype=False)


## 5. Conclusiones Clave de los Datos

1.  **Complejidad O(n^2):** En los casos "Promedio" y "Peor", las tres gráficas (Tiempo, Comparaciones y Movimientos) muestran curvas cuadráticas (parábolas). Esto confirma la teoría de que son algoritmos O(n^2).

2.  **Mejor Caso (¡La gran diferencia!):**
    * **Bubble Sort** e **Insertion Sort** son *adaptativos*. Sus gráficas de Tiempo y Comparaciones son planas (casi cero). Detectan que la lista está ordenada y terminan en tiempo O(n).
    * **Selection Sort** *no es adaptativo*. Su gráfica de Tiempo y Comparaciones en el "Mejor Caso" es idéntica a la del "Caso Promedio". Siempre realiza O(n^2) comparaciones, sin importar el orden inicial.

3.  **Eficiencia en Movimientos:**
    * La gráfica de **Selection Sort** en "Movimientos" es casi plana en todos los casos. Esto confirma su ventaja única: realiza O(n) intercambios, sin importar qué. Es ideal si las operaciones de "escribir" o "intercambiar" son muy costosas.
    * **Bubble Sort** e **Insertion Sort** realizan O(n^2) movimientos en el peor caso y el promedio.