### **Profiling** 

In [None]:
from treap import Treap
from RandomizedTreap import RandomizedTreap
from RandomizedTreapProfiling import profile_height, profile_cpu, profile_height_ordered_sequence, profile_cpu_ordered_sequence, profile_memory


**treap.py**

Este archivo de Python implementa un Treap, que es una estructura de datos que combina las propiedades de un árbol binario de búsqueda (BST) y un heap (min-heap). En este Treap se almacenan pares formados por una clave y una prioridad, garantizando que el árbol cumpla la propiedad de búsqueda en las claves y, a la vez, la propiedad de min-heap en las prioridades, considerando como prioridad más alta aquel valor numérico menor. 

Además, se implementa un bloqueo de lectura/escritura (`ReadWriteLock`) para gestionar el acceso concurrente a la estructura, permitiendo que múltiples hilos realicen operaciones de lectura simultáneamente mientras que las escrituras se efectúan de forma exclusiva, asegurando la integridad de los datos.

La clase principal `Treap` es genérica y utiliza la subclase `Entry` para encapsular los pares `(clave, prioridad)`. Internamente, se utiliza la clase anidada `TreapNode` para representar cada nodo del árbol, el cual contiene punteros a sus hijos izquierdo y derecho, además del nodo padre. TreapNode incorpora métodos para insertar nuevos elementos, buscar y eliminar nodos, y ejecutar rotaciones `(rotateLeft y rotateRight)` que permiten mantener las invariantes de BST y min-heap. Los métodos `bubbleUp` y `pushDown` ajustan la posición de los nodos cuando se modifica su prioridad.

Entre las funcionalidades del Treap se incluyen métodos para obtener el tamaño, la altura, el elemento mínimo y el máximo, así como para actualizar prioridades, remover elementos y verificar las invariantes del árbol. Las funciones top y peek facilitan extraer o visualizar el nodo raíz, respectivamente.

Por último, el bloque principal `(if __name__ == '__main__':)` realiza pruebas básicas insertando diversas entradas y mostrando propiedades importantes del Treap, lo que demuestra el correcto funcionamiento y la integridad de la estructura. La implementación asegura alta eficiencia y gran robustez en entornos concurrentes.

**RandomizedTreap.py**

Este archivo implementa una variante aleatorizada de un Treap, denominada `RandomizedTreap`, que aprovecha una asignación aleatoria de prioridades para lograr que, en promedio, el árbol permanezca balanceado. La idea central es basarse en la implementación del Treap definida en otro módulo (treap.py), encapsulando su funcionalidad y proporcionando una interfaz sencilla para trabajar con datos genéricos.

La clase `RandomizedTreap` es genérica, lo que permite almacenar elementos de cualquier tipo. Internamente, mantiene un objeto de la clase Treap, en el cual cada elemento se asocia a una prioridad de tipo float generada de forma aleatoria mediante el módulo `random` de Python. Al añadir un elemento, se crea una nueva entrada del Treap que contiene el valor y una prioridad obtenida llamando a `rnd.random()`. Esta asignación de prioridades aleatorias es fundamental porque garantiza que la estructura del árbol se comporte de forma balanceada en promedio, evitando los peores escenarios de un árbol de búsqueda binario desbalanceado.

Los métodos implementados en `RandomizedTreap` son, en su mayoría, wrappers de los métodos del Treap subyacente. Entre ellos se destacan:

- **add(element)**: Inserta un nuevo elemento con prioridad aleatoria, delegando en el método add del Treap.
- **remove(element)**: Elimina un nodo basado en la clave especificada, utilizando el método removeKey.
- **clear()**: Borra todos los elementos del Treap.
- **min() y max()**: Devuelven, respectivamente, el elemento mínimo y el máximo según el orden de las claves.
- **search(element)**: Realiza una búsqueda para encontrar un elemento determinado.
- **isEmpty(), size() y height()**: Proporcionan información sobre si el árbol está vacío, el número total de elementos y la altura del árbol.
- **_checkTreapInvariants() y _checkBSTInvariants()**: Permiten verificar que se cumplen las propiedades invariantes tanto del Treap (combinación de BST y min-heap) como del árbol de búsqueda binaria.

Finalmente, el bloque principal del script demuestra un ejemplo de uso: se crean varias entradas, se realizan inserciones, búsquedas y se muestran propiedades clave del árbol (tamaño, altura, mínimo, máximo e invariantes), lo que confirma la correcta integración y funcionamiento de la implementación aleatorizada.

In [None]:
%run treap.py
%run RandomizedTreap.py



**RandomizedTreapProfiling**

Este archivo se dedica a realizar pruebas de desempeño (profiling) comparando dos estructuras de datos: un árbol de búsqueda binario iterativo (BST) implementado en el mismo script y un `RandomizedTreap` importado desde otro módulo. La implementación del BST es completamente iterativa, lo que evita problemas de profundidad de recursión al trabajar con secuencias ordenadas o de gran tamaño, mientras que el RandomizedTreap utiliza prioridades asignadas aleatoriamente (números float) para mantener, en promedio, un árbol balanceado.

La clase BST definida en el archivo contiene métodos esenciales para la manipulación de la estructura: 

- **add(element)**: inserta un elemento de forma iterativa, asegurando que al recorrer el árbol se llegue a la posición correcta sin recurrir a llamadas recursivas profundas.  
- **remove(element)**: elimina un elemento encontrado de forma iterativa. Este proceso busca el nodo a remover, y mediante el método _removeNode se encarga de gestionar los tres casos de eliminación: nodos hoja, nodos con un solo hijo y nodos con dos hijos. En este último caso, se decide aleatoriamente entre utilizar el predecesor o el sucesor para reemplazar el nodo eliminado.  
- Además, cuenta con métodos como **search**, **min**, **max**, **isEmpty**, **size** (calculado de forma iterativa usando una pila) y **height** (calculado a partir de un recorrido BFS iterativo). También incluye un método **checkBSTInvariants** que verifica, mediante un recorrido in-order iterativo, que se cumpla la propiedad del BST.

Por otro lado, el script contiene diversas funciones para generar perfiles comparativos entre ambas estructuras. Algunas de estas funciones son:

- **profile_height()**: Realiza inserciones y eliminaciones aleatorias sin duplicados (usando random.sample y evitando duplicados con un ciclo while) en ambos árboles. Para cada tamaño de prueba (aumentando gradualmente desde 1000 hasta 40000 elementos) y en varias repeticiones, registra las alturas del BST y del RandomizedTreap, guardando los datos obtenidos en un archivo CSV.

- **profile_height_ordered_sequence()**: Inserta elementos en orden creciente. En este caso, el BST se degenera (crece como una lista enlazada) mientras que el RandomizedTreap mantiene una estructura más balanceada. Se comprueba que la altura del RandomizedTreap no sea mayor que la del BST y se guarda la información en CSV.

- **profile_cpu() y profile_cpu_ordered_sequence()**: Realizan pruebas de carga en CPU con operaciones aleatorias y secuenciales, respectivamente.  
- **profile_memory()**: Evalúa el uso de memoria al insertar cadenas en ambas estructuras.

Finalmente, el bloque principal (__main__) orquesta las pruebas, ejecutándolas en secuencia e imprimiendo mensajes informativos. De esta forma, el script permite comparar de manera exhaustiva el comportamiento de un BST iterativo y un RandomizedTreap en cuanto a altura, consumo de CPU y memoria, generando datos en formato CSV para su posterior análisis.

In [None]:
%run RandomizedTreapProfiling.py

#### **Visualización y análisis de alturas en BST y Treap**

Analizamos y visualizamos estadísticas relacionadas con la altura de dos estructuras de datos: un árbol de búsqueda binario (BST) iterativo y un RandomizedTreap. Para ello, se utiliza la biblioteca Pandas para la manipulación de datos y Matplotlib para la generación de gráficos, asegurando además un formato de salida en línea (mediante `%matplotlib inline`) para su uso en entornos interactivos como Jupyter Notebook.

Inicialmente, se importan las librerías necesarias, entre ellas Pandas, Matplotlib y Math, y se definen las rutas de dos archivos CSV que contienen estadísticas de dos pruebas distintas: una con inserciones aleatorias (archivo `bst_vs_rt_random_50000.csv`) y otra con secuencias ordenadas (archivo `bst_vs_rt_worst-case.csv`). Cada CSV registra el tamaño de la entrada (`n`) y las alturas de los árboles (`height_bst` y `height_rt`). 

In [None]:
%matplotlib inline
import pandas as pd
import matplotlib.pyplot as plt
import matplotlib.ticker as ticker
import math

from typing import List

import pandas as pd
import matplotlib.pyplot as plt
import matplotlib.ticker as ticker
import math

In [None]:
treap_random_stats = 'resultados/bst_vs_rt_random_50000.csv'
treap_ordered_sequence_stats = 'resultados/bst_vs_rt_worst-case.csv'


In [None]:
df = pd.read_csv(treap_random_stats)

Una columna adicional, `log_n`, es creada a partir del logaritmo base 2 de `n`, lo que permite comparar las alturas de los árboles con un crecimiento logarítmico esperado en estructuras balanceadas.


In [None]:
df['log_n'] = df['n'].apply(lambda x: math.log(x) / math.log(2))

In [None]:
df.info

El núcleo del script es la función `plot_test_case_mean(df: pd.DataFrame)`, que recibe un DataFrame con los datos de una prueba. Dentro de esta función se agrupan los datos por el tamaño de la entrada (`n``) y se promedian las alturas registradas, para luego ordenar los resultados. Se utiliza un promedio móvil (`rolling average``) con una ventana de 5 datos para suavizar las curvas y eliminar fluctuaciones indeseadas, obteniéndose así curvas más representativas del comportamiento medio.

Posteriormente, se configura la figura de Matplotlib definiendo título, etiquetas para el eje X (tamaño de la entrada) y para el eje Y (altura) y se activa una cuadrícula para facilitar la interpretación visual. Se establece que la escala del eje Y sea logarítmica (base 10), lo que resulta particularmente útil al comparar valores que pueden variar en órdenes de magnitud. En este gráfico se dibujan tres líneas: la altura del BST (`height_bst`) en línea azul discontinua, la altura del Treap (`height_rt`) en línea naranja continua y, para referencia, la función logarítmica (`log_n`) en línea verde con estilo variado.

Finalmente, la función se invoca dos veces: una primera vez leyendo el CSV correspondiente a la prueba aleatoria, y una segunda vez con los datos de la secuencia ordenada. Así, el código permite comparar visualmente el comportamiento en altura de ambas estructuras bajo diferentes escenarios, facilitando el análisis comparativo de eficiencia y equilibrio en términos de estructuras de datos.

In [None]:
import math
import matplotlib.pyplot as plt
import matplotlib.ticker as ticker
import pandas as pd

def plot_test_case_mean(df: pd.DataFrame):
    # Agrupar por 'n', promediar y ordenar
    df_mean = df.groupby('n', as_index=False).mean().sort_values('n')
    
    # Opcional: Suavizado (rolling average) sin modificar el nombre original
    window_size = 5  # Puedes ajustar la ventana según tus datos
    smooth_height_bst = df_mean['height_bst'].rolling(window_size, center=True).mean()
    smooth_height_rt  = df_mean['height_rt'].rolling(window_size, center=True).mean()
    
    # Verifica que 'log_n' esté definida; si no, la calculamos (por ejemplo, base 2)
    if 'log_n' not in df_mean.columns:
        df_mean['log_n'] = df_mean['n'].apply(lambda x: math.log2(x) if x > 0 else 0)
    
    # Crear figura y eje
    fig, axe = plt.subplots(figsize=(10, 6))
    axe.set_title("Comparación de alturas: BST vs. Treap (random)")
    axe.set_xlabel("n (tamaño de la entrada)")
    axe.set_ylabel("height (altura)")
    axe.grid(True, which='both', linestyle='--', alpha=0.5)
    # Configurar escala logarítmica en el eje Y
    axe.set_yscale('log', base=10)
    axe.yaxis.set_major_formatter(ticker.ScalarFormatter())
    axe.set_yticks([1, 2, 5, 10, 20, 30, 40, 50, 100, 1000])
    
    # Graficar las líneas usando los nombres originales para la leyenda
    axe.plot(df_mean['n'], smooth_height_bst, label="height_bst", color="blue", linestyle="--", linewidth=2)
    axe.plot(df_mean['n'], smooth_height_rt,  label="height_rt",  color="orange", linestyle="-", linewidth=2)
    axe.plot(df_mean['n'], df_mean['log_n'],    label="log_n",      color="green", linestyle="-.", linewidth=2)
    
    axe.legend(loc="upper left")
    plt.show()

# Ejemplo de uso:
df = pd.read_csv("resultados/bst_vs_rt_random_50000.csv")
plot_test_case_mean(df)


**Estadísticas de secuencia ordenadas**

In [None]:
df1 = pd.read_csv(treap_ordered_sequence_stats)

In [None]:
df1['log_n'] = df1['n'].apply(lambda x: math.log(x) / math.log(2))

In [None]:
plot_test_case_mean(df1)

#### **Ejercicios**

1. **Rebalanceo manual con rebuild:**  
   - **Tarea:** Agrega un método `rebuild()` en la implementación de Treap que, al invocarse, recorra todos los nodos en orden (usando un recorrido in-order) y reconstruya el árbol de manera balanceada a partir de la secuencia ordenada.  
   -  Compara la altura del árbol antes y después de llamar a `rebuild()` y verificar la reducción en desbalanceo, especialmente tras múltiples inserciones en orden ascendente.

2. **Actualización global de prioridades:**  
   - **Tarea:** Implementa una funcionalidad (por ejemplo, `updateAllPriorities()`) que asigne nuevas prioridades aleatorias a todos los nodos y reordene el árbol en consecuencia, aplicando los métodos de `bubbleUp()` o `pushDown()` según corresponda.  
   -  Evalua si la reasignación puede ayudar a disminuir la altura del árbol en escenarios donde la secuencia de inserciones es desfavorable.

3. **Soporte de claves duplicadas con orden secundario:**  
   - **Tarea:** Modifica la clase `Treap.Entry` para admitir claves duplicadas, utilizando como desempate un contador o campo adicional, y actualizar los métodos de búsqueda e inserción.  
   -  Prueba la robustez del árbol ante datos con repetición y validar que no se alteren las propiedades de BST y min-heap.

4. **Prueba de inserción y búsqueda aleatoria:**  
   - **Tarea:** Diseña un caso de prueba que inserte 1,000 valores aleatorios en un `RandomizedTreap`, verifique que cada elemento insertado se pueda recuperar mediante `search()` y confirme, al final, que se cumplen las invariantes del Treap.  
   - Valida la integridad de la estructura en condiciones de operación normal.

5. **Prueba de operaciones en secuencia ordenada:**  
   - **Tarea:** Crea un test en el que se inserten elementos en orden decreciente y luego se ejecute la operación `top()` de forma repetida. Verificar que la extracción de la raíz se realice correctamente y que, finalmente, el árbol quede vacío.  
   - Evalua el manejo de casos extremos y la correcta actualización de punteros tras rotaciones.

6. **Prueba de actualización de prioridad:**  
   - **Tarea:** Iniciar un árbol con un conjunto predeterminado (por ejemplo, `{20, 30, 40, 50, 70}`), actualizar la prioridad de un nodo (por ejemplo, cambiar la prioridad de la clave 50) e inspeccionar que la nueva posición del nodo respete las reglas del Treap.  
   - **Objetivo:** Asegurar que los métodos `updatePriority()`, `bubbleUp()` y `pushDown()` funcionen de forma integrada.

7. **Contador de rotaciones:**  
   - **Tarea:** Instrumenta la implementación del Treap para contar las rotaciones realizadas durante inserciones y eliminaciones. Ejecutar pruebas con conjuntos de tamaño 500, 1,000, 5,000 y 10,000, y comparar la cantidad de rotaciones en cada caso.  
   - Determina el costo de mantenimiento del equilibrio y compararlo con el rendimiento del BST iterativo.

8. **Simulación de concurrencia intensiva:**  
   - **Tarea:** Diseña un experimento en el que se ejecuten 5 hilos concurrentes en un `RandomizedTreap`, donde cada hilo realice 1,000 operaciones mixtas (inserciones y búsquedas). Al finalizar, comprobar que el tamaño del árbol coincide con el esperado.  
   - Mide la latencia en operaciones de lectura y escritura, evaluar posibles cuellos de botella y verificar la eficacia del Read/Write Lock en escenarios reales de alta concurrencia.

9. **Balance de lecturas vs. escrituras:**  
   - **Tarea:** Simula un escenario donde 100 hilos realizan exclusivamente búsquedas y 10 hilos realizan solo inserciones en el mismo árbol. Registrar tiempos de respuesta y latencias en las búsquedas durante la actividad de escrituras concurrentes.  
   - Valida que el mecanismo de bloqueo permite una alta concurrencia en lecturas sin perder integridad ni aumentar excesivamente los tiempos de espera.


In [None]:
## Tus respuestas