### **Práctica calificada 1-CC0E5**


#### **Pregunta 1**

 
Un **heater** es un caso especial de árbol de búsqueda con prioridades (a veces llamados *Cartesian trees*).  Cada nodo tiene  

* una **clave de búsqueda** `key` generada de forma i.i.d. continua en el intervalo $[0,1]$;  
* una **prioridad** única elegida por el usuario.  

El árbol simultáneamente satisface :

* la propiedad de **BST** (in-order por `key`), y  
* la propiedad de **heap mínimo** sobre la prioridad.  

Para los problemas (a)-(f) fijamos  

* $n\in\mathbb N$ (tamaño del árbol),  
* prioridades $1,2,\dots ,n$ $\bigl(1=\min \text{-prioridad}\bigr)$.  

Identificamos el nodo con prioridad $p$ como **nodo $p$**; así, el nodo 1 es la raíz de $T$.


**(a) Probabilidad de adyacencia de $i$ y $j$ en una permutación aleatoria**

Sea  
$$
S=\{1,2,\dots ,i,j\}\quad (i<j).
$$  
El número total de permutaciones es $(i+1)!$.

Agrupemos los casos en los que $i$ y $j$ aparecen **adyacentes** (como $\langle i,j\rangle$ o $\langle j,i\rangle$).  
1. Fijemos la pareja $[i,j]$ como un "bloque" indivisible. Entonces contamos:
2. 
$$
i!\quad\text{permutaciones}
$$  
de $i$ bloques (el bloque $[i,j]$ + los $i-1$ elementos restantes).  
3. Análogamente para el bloque $[j,i]$.

Por lo tanto el número de permutaciones "buenas" es $2\cdot i!$. La probabilidad pedida es

$$
\Pr\bigl[\text{$i$ y $j$ adyacentes}\bigr]
=\frac{2\,i!}{(i+1)!}
=\frac{2}{i+1}.
$$


**(b) Probabilidad de que $i$ sea ancestro de $j$**

La construcción de un heater es idéntica a la del "treap canónico" si se invierten los roles de claves y prioridades:  

* el **índice de prioridad** $p$ decide la altura: cuanto más pequeño, más arriba,  
* las **claves** deciden el corte izquierda/derecha.

Considera el sub-conjunto  
$$
A=\{1,2,\dots ,i,j\}.
$$  
El nodo con prioridad mínima en $A$ (es decir, $1$) será la raíz del sub-árbol $T[A]$.  
El nodo $i$ será **ancestro** de $j$ si:  

1. $\min\{1,2,\dots ,i-1\}=1$ o, de manera equivalente, **ningún nodo con prioridad $\le i$ distinto de $i$ cae entre las claves de $i$ y $j$**;  
2. los nodos de prioridad estrictamente menor que $i$ se sitúan **todos** en el mismo lado (izq. o der.) de la clave de $i$.  

Este suceso se modela exactamente con la siguiente observación clásica sobre árboles cartesianas:

> **Lema** Sea $B\subseteq \{1,\dots ,n\}$ y $x,y\in B$ con $\text{prio}(x)<\text{prio}(y)$. $x$ es ancestro de $y$ iff $x,y$ son **adyacentes** en la permutación de prioridades de $B$ ordenada de menor a mayor.  

Aplicando el lema al conjunto $A$ y recordando el apartado (a):

$$
\Pr\bigl[\text{$i$ ancestro de $j$}\bigr]
=\Pr\bigl[\text{$i$ y $j$ adyacentes en una perm. de $A$}\bigr]
=\frac{2}{i+1}.
$$


**(c) Probabilidad de que $i$ sea descendiente de $j$**

El heap mínimo sobre prioridades impone  

$$
\text{prio}(i)=i<j=\text{prio}(j)
\;\Longrightarrow\;
\text{profundidad}(i)<\text{profundidad}(j)
$$  
(i está **por encima** de $j$). Por lo tanto

$$
\Pr\bigl[\text{$i$ descendiente de $j$}\bigr]=0.
$$

Más formalmente, ningún nodo de prioridad baja puede violar la propiedad de heap estando debajo de una prioridad mayor; la distribución de claves no altera esa restricción vertical.


**(d) Profundidad esperada exacta del nodo $j$**

Sea la variable aleatoria

$$
D_j=\bigl|\{\,i\in\{1,\dots ,j-1\}:\text{$i$ ancestro de $j$}\,\}\bigr|.
$$

Usando linealidad de la esperanza:

$$
\mathbb E[D_j]
=\sum_{i=1}^{j-1} \Pr[\text{$i$ ancestro de $j$}]
=\sum_{i=1}^{j-1} \frac{2}{i+1}.
$$

El sumatorio es el número armónico desplazado:

$$
\sum_{i=1}^{j-1}\frac{1}{i+1}
=H_{j}-1, 
\qquad
H_{j}=1+\tfrac12+\tfrac13+\cdots+\tfrac1{j}.
$$

Por tanto

$$
\boxed{\;
\mathbb E[D_j]=2\bigl(H_{j}-1\bigr)=2H_{j}-2\; }.
$$

Asintóticamente $H_j\approx \ln j+\gamma$ ($\gamma$ constante de Euler-Mascheroni), luego

$$
\mathbb E[D_j]=2\ln j+O(1).
$$


**Inserción de un nuevo nodo**

La inserción en un heater se hace en dos fases, igual que en un treap tradicional:

1. **Inserción BST** por la `key` generada al vuelo.  
2. **Burbujeo** (*bubble-up*) mediante **rotaciones** hasta que se restaure la propiedad de heap por prioridad.

La complejidad se controla observando que el número esperado de rotaciones = profundidad esperada del nodo justo antes de la fase 2.

Sea $r$ el **rango** de la prioridad nueva (es decir, cuántas prioridades existentes son menores). Añadamos $p$ tal que $p=r+1$.  

Por (d) con $j=p$:

$$
\mathbb E[\text{rotaciones}]
= \mathbb E[D_{p}]
= 2H_{p}-2
=O(\log r).
$$

La búsqueda BST cuesta la misma cantidad en media. Resultado: tiempo esperado $O(\log r)$.


**(f) Eliminación del mínimo (pop-root)**

Al igual que en **treaps**, se usa la operación *join* de dos sub-árboles $L$ y $R$ sabiendo que  
$\forall x\in L, y\in R: x.\text{key}<y.\text{key}$. La función `join(L,R)` devuelve un heater con todas las claves de $L\cup R$.

**Esquema de `join`**

```text
join(L, R):
    si L == ∅: return R
    si R == ∅: return L
    if L.root.prio < R.root.prio:
        L.right = join(L.right, R)
        L.right.parent = L
        return L
    else:
        R.left = join(L, R.left)
        R.left.parent = R
        return R
```

**Algoritmo `delete_min`**

```python
def delete_min(root):
    L, R = root.left, root.right
    if L: L.parent = None
    if R: R.parent = None
    new_root = join(L, R)
    return new_root
```



El coste de `join` es la profundidad de la raíz con menor prioridad entre `L` y `R`. Sea $k$ la prioridad más pequeña $\ge2$ que queda en el árbol: es el nuevo mínimo que subirá. Por la sección (d) con $j=k$ tenemos

$$
\mathbb E[\text{profundidad}(k)]
=2H_k-2
=O(\log k)
\le O(\log n).
$$

Además, la recursión de `join` baja monótonamente por claves, de modo que el número esperado de llamadas recursivas $\approx\mathbb E[\text{profundidad}(k)]$. Por lo tanto

$$
\boxed{\text{Tiempo esperado de }delete\_min = O(\log n).}
$$

En la práctica la constante es baja: para $k=2$, $E[D_2]=1$ => apenas una rotación media.


**Dibujos**

```
Inserto nodo p=7 (prio 7, key=0.42)

        (1,0.63)
       /        \
  (5,0.20)     (2,0.85)
                /
          (7,0.42)   <- recién creado

Bubble-up paso 1: rotación izquierda sobre (2)

        (1,0.63)
       /        \
  (5,0.20)     (7,0.42)
                      \
                     (2,0.85)
Bubble-up termina: prio(7)=7>1 y <2 ⇒ heap ok
```

> Derivación analítica del *bubble-up* esperado

Sea $r=\text{prio}(x)-1$.  
La probabilidad de que cualquier nodo más pequeño que $x$ sea ancestro es $2/(i+1)$ por (b), de ahí:

$$
\mathbb E[\text{Rotaciones bubble-up}]
=\sum_{i=1}^{r} \frac{2}{i+1}
= 2\bigl(H_{r+1}-1\bigr)
\in \Theta(\log r).
$$

El mismo cálculo vale para la fase de búsqueda previa. Por lo tanto la inserción conserva el "log-esperado" característico de los árboles cartesianos.

**Diagrama resumido del flujo de operaciones**

```
digraph HeaterOps {
  node [shape=box];
  Insert -> {BST_search BubbleUp}
  DeleteMin -> {SplitLeftRight Join}
  BubbleUp -> {RotateLeft|RotateRight}
  Join -> {RecurseLeft RecurseRight}
}
```

Este grafo captura las dependencias de alto nivel entre las rutinas empleadas.

Además


$$
H_n = \sum_{k=1}^{n}\frac1k, \qquad
H_n = \ln n + \gamma + \frac{1}{2n} - O\!\bigl(\tfrac1{12n^2}\bigr).
$$

De aquí se desprenden las cotas asintóticas:  

* Profundidad esperada de cualquier nodo = $\Theta(\log n)$.  
* Inserción / eliminación mínima = $\Theta(\log n)$ en esperanza.  

La "antitesis" respecto a los treaps clásicos (donde tanto claves como prioridades son i.i.d.) es que los heaters conservan rendimiento logarítmico, pero la **varianza** se dispara: la raíz es siempre el mismo nodo, y las trayectorias de búsqueda tienden a ser más desbalanceadas (cola pesada). Aun así, los valores medios dependen del armónico y siguen siendo sub-lineales, como se ha demostrado en los apartados anteriores.

**(g) Invariante del heap.**


Sea $T$ un treap sobre pares $(\mathit{key},\mathit{priority})$. Definimos:

1. **BST (Search-Tree Invariant)**  
   $$
     \forall\,n\in T:\quad
       \bigl(\forall x\in\mathit{left}(n):x.key \le n.key\bigr)
     \;\wedge\;
       \bigl(\forall x\in\mathit{right}(n):x.key > n.key\bigr).
   $$

2. **Min-Heap (Heap Invariant)**  
   $$
     \forall\,n\in T,\;n\neq\mathit{root}:\quad
       n.priority \;\ge\; n.parent.priority.
   $$

Antes de llamar a `update_priority`, suponemos que ambas invariantes se cumplen en todo $T$.


Al invocar `update_priority(new_priority)` en un nodo $u$:

1. **Asignación de prioridad**  
   Se sobreescribe  
   $$
     \mathit{old\_pr} := u.priority
     \quad\longrightarrow\quad
     u.priority := \mathit{new\_pr}.
   $$
   Esto no altera claves, de modo que la **invariante BST** sigue válida inmediatamente tras el cambio de prioridad.

   Sin embargo, tras cambiar la prioridad pueden violarse:
   - Con los **ancestros** (si $\mathit{new\_pr}<\text{pr}\bigl(u.parent\bigr)$).
   - Con los **descendientes** (si algún hijo tiene $\mathit{child.priority}<\mathit{new\_pr}$).

2. **Fase "Bubble-up"**  
   Mientras $u$ tenga padre y $u.priority < u.parent.priority$, rotamos $u$ hacia arriba (rotación derecha o izquierda según sea hijo izquierdo o derecho).  
   - Cada **rotación** local es un reacomodo de subárboles que **preserva** el orden in-order (y por tanto la invariante BST).  
   - Además, tras cada rotación $u$ queda en un nivel más alto, acercándolo a la raíz, y corrige esa violación de heap con sus ancestros.

   Al término de esta fase, **no quedan** violaciones de heap entre $u$ y **ninguno** de sus ancestros.

3. **Fase "Push-down"**  
   Ahora iteramos mientras exista algún hijo $c$ de $u$ con $c.priority < u.priority$:
   - Si $u.left.priority < u.priority$ rotamos a la derecha,  
   - Si $u.right.priority < u.priority$ rotamos a la izquierda.  
   Cada rotación preserva el in-order ( BST ) y reduce las violaciones de heap con los **descendientes**.

   Al acabar, $u$ ya no viola heap ni con sus ancestros (porque no sube más) ni con sus hijos (porque ya no baja más).

Por composición, **tras ambas fases**:

- Las **claves** no se han movido en sentido que rompa el in-order global, luego la invariante BST se mantiene.
- Tanto ancestros como descendientes verifican ahora la propiedad de prioridad, de modo que la invariante de min-heap está restaurada.


**Contra-ejemplo sin la fase bubble-up**

Supongamos que **omitimos** todo el paso de "bubble-up" y solo hacemos "push-down". Consideremos este treap pequeño, inicialmente válido:

```
       (key=2, pr=1)
       /           \
 (key=1, pr=2)  (key=3, pr=3)
```

- **BST**: $1\le2<3$.  
- **Heap**: $1\le2$ y $1\le3$.

Ahora ejecutamos `update_priority` sobre el nodo $\,(key=1)$, cambiando su prioridad de 2 a 0:

1. **Asignación**: el nodo pasa a $(key=1, pr=0)$.  
2. **(Sin bubble-up)** salta directo al "push-down".  
   - Pero $(key=1)$ no tiene hijos, así que no rota.  
3. El resultado **queda**:

```
       (key=2, pr=1)
       /
 (key=1, pr=0)
        \
       (ninguno)
```

Ahora la invariante de heap **se viola**, pues el hijo tiene $\,0<1$, es decir, un nodo con prioridad mayor (0) está **por debajo** de uno con prioridad menor (1).

> **Violación**: el padre $(pr=1)$ ya no es ≤ que el hijo $(pr=0)$.

Este ejemplo muestra que, sin la fase de *bubble-up*, bastaría con rebajar la prioridad de un nodo a un valor menor que su ancestro para romper la propiedad de min-heap.

  
**(h)Concurrencia**

El treap implementado emplea un `threading.RLock` para garantizar que las operaciones públicas (`add`, `remove_key`, etc.) no se interrumpan mutuamente. Sin embargo, si elimináramos ese candado, dos hilos inesperadamente podrían entrelazar sus acciones y dejar la estructura interna del árbol en un estado inconsistente o incluso corrupto.

**Descripción de la sección crítica**

La zona crítica principal es el punto donde un hilo:

1. Desciende recursivamente o por rotaciones y actualiza punteros hijo/padre.  
2. Ajusta la referencia `treap.root` al rotar en la raíz.  

Sin sincronización, dos hilos pueden sobreescribir punteros parciales o mezclar subárboles. El invariant principal que se viola es:  
> **BST**: para cada nodo `x`, todos los de la izquierda < `x.key` y todos los de la derecha > `x.key`.  
> **Heap (min-heap)** en prioridades: cada hijo tiene prioridad ≥ la de su padre.  

**Escenario de carrera propuesto**

Imaginemos un Treap inicialmente con tres nodos:

```
       (10│p=10)
       /       \
   (5│p=5)   (15│p=15)
```

Los números antes de la barra son claves, los de `p=` prioridades (menor -> más "alto" en el heap).  

Queremos correr **concurrentemente**:

- **Hilo A**: inserta `(7│p=7)`  
- **Hilo B**: elimina la clave `5` con prioridad `5`  

Supongamos que la inserción de A provoca una **rotación** a la izquierda en `(5│p=5)` porque el nuevo nodo `(7│p=7)` tiene prioridad menor (7 < 5 no es cierto, pero para el ejemplo supongamos prioridades invertidas o un escenario análogo con rotación derecha). Lo importante es que A invoca:
```pseudocode
# Dentro de _TreapNode.rotate_left(treap)
y = self.right             # y apunta a (7│p=7)
self.right = y.left        # reasigna puntero
y.left = self              # reestructura hijos
...
if self.parent is None:
    treap.root = y
else:
    # ajusta self.parent.left/right
```

Mientras tanto, B hace:
```pseudocode
# Dentro de remove_key(key)
node = root.search(target_key=5)           # localiza (5│p=5)
new_root, deleted = root._remove(5,5,treap)  
treap.root = new_root                      # reasigna raíz
```

**Pseudocódigo simplificado de los hilos**

```pseudocode
// Sin RLock: ambos hilos actúan simultáneamente

// Hilo A: inserta y rota
function hiloA(treap):
    entry = TreapEntry(7, 7)
    treap.root.add(entry.key, entry.priority, treap)
    // Durante add, llega a rotate_left en nodo (5)

// Hilo B: elimina
function hiloB(treap):
    // Podría llegar aquí justo cuando A está reestructurando
    treap.remove_key(5)
```

**Diagrama de tiempo (Time-Line)**

```text
Tiempo ->

T0:   Estado inicial:
        treap.root = (10)
                   /    \
                (5)    (15)

T1:   A: entra en add(7,7) en subárbol izquierdo de (10)
      B: comienza remove_key(5)

// A desciende hasta (5), B llama a search(5) simultáneo
T2:   A: en nodo (5): self.right = None? No, hay subárbol potencial
      A: decide insertar (7) como hijo derecho de (5)
      A: crea nodo y enlace:
           (5).right --> (7)
      A: ahora prioridad(7) < prioridad(5)? (supongamos sí)
T3:   A: llama a rotate_left en (5)
      -- tänner: comienza rotate_left sin terminar --
      A: y = self.right       // y=(7)
      A: self.right = y.left  // y.left=None, bien
      A: y.left = self        // vincula (5) como hijo izquierdo de (7)
T4:   B: en medio de la rotación A, B también entra en remove_key:
      B: find target = search(5) <--encuentra el nodo original (5)
      B: invoca _remove en (5)
      B: detecta self.left o self.right y decide reestructurar
// B modifica punteros de (5) mientras A no ha acabado su rotate_left
T5:   A: retoma rotate_left:
      A: if self.parent is None: treap.root = y
      A: self.parent = y
T6:   B: tras _remove, asigna treap.root = new_subtree
      // pisando la asignación de A a treap.root

T7:   Estado final corrupto:
      - Algunas referencias de padre/hijo apuntan a nodos "fantasma"
      - El subárbol izquierdo de (10) podría quedar a medias
      - check_treap_invariants() falla o recorre en bucle
```

**Explicación**  
1. **T3-T4**: A está en medio de la rotación: ya cambió `self.right`, pero no ha terminado de reasignar `parent` y `treap.root`.  
2. **T4-T6**: B encuentra el mismo nodo en un estado intermedio (clave 5 con hijos parcialmente cambiados) y aplica `_remove`, reconfigurando punteros `parent` y `root`.  
3. Cuando A retoma, sobreescribe `treap.root` sin conocer el trabajo de B, y algunos hijos apuntan a `parent` viejo, generando hiperenlaces o nodos huérfanos.  

:::note
**Clave**: sin `RLock`, las secciones de relectura y escritura de punteros quedan expuestas a interleavings arbitrarios que violan los invariantes BST y heap.
:::


**(i) Pruebas automatizadas con pytest y coste experimental**

Ahora implementamos un test parametrizado que, para cada $k=1,\dots,10^4$:

1. Inserta $k$ claves aleatorias con prioridades estrictamente crecientes (de 1 a $k$).  
2. Verifica que `treap.check_treap_invariants()` devuelve `True`.

**Código de test parametrizado**

```python

import pytest
import random
#from treap_module import Treap, TreapEntry  # asume tu Treap está en treap_module.py

# Fijamos semilla para reproducibilidad
SEED = 12345

@pytest.mark.parametrize("k", range(1, 10_001))
def test_invariants_after_inserts(k):
    """
    Para cada k en [1..10000], 
    inserta k claves aleatorias con prioridades crecientes y
    comprueba que se mantienen los invariantes del Treap.
    """
    random.seed(SEED + k)  # distinta muestra por valor de k
    t = Treap[int, int]()
    # Generamos k claves únicas en un rango amplio
    keys = random.sample(range(1, 10**7), k)
    # Insertamos con prioridades 1..k (estrictamente crecientes)
    for priority, key in enumerate(keys, start=1):
        entry = TreapEntry(key, priority)
        added = t.add(entry)
        assert added, f"Fallo al insertar entrada {entry.key}|{entry.priority}"
    # Tras todas las inserciones, verificamos BST+Heap
    assert t.check_treap_invariants(), f"Invariante Treap violado para k={k}"
```

**Detalles del test**

- **Parametrización**:  
  - `@pytest.mark.parametrize("k", range(1, 10_001))` genera 10 000 ejecuciones independientes.  
- **Reproducibilidad**:  
  - Se usa `random.seed(SEED + k)` para que cada `k` produzca siempre el mismo conjunto de claves, evitando falsos fallos debidos a muestras adversas fortuitas.  
- **Prioridades crecientes**:  
  - Al asignar prioridad $i$ a la $i$-ésima clave insertada, garantizamos que nunca se produzca una "burbujeo" hacia arriba (bubble-up) tras la inserción, simplificando la forma del árbol, pero aún así se pueden formar rotaciones por la combinación clave vs. posición.  
- **Assertions**:  
  - Se comprueba `added == True` (aunque en tu implementación `add` siempre retorna `True`).  
  - Se comprueba finalmente `check_treap_invariants()` y reporta en qué `k` falló, en caso de violación.

**Análisis del coste experimental**

Para entender el tiempo que tardará esta suite:

1. **Costo por un solo k**  
   - **Inserciones**: cada `add` tarda $O(\log n)$ amortizado (altura esperada del Treap $\approx O(\log n)$).  
     - Total de inserciones: $\sum_{i=1}^k O(\log i) \in O(k \log k)$.  
   - **Chequeo de invariantes**: recorre todos los nodos exactamente una vez: $O(k)$.  
   - **Total para un valor k**:  
     $$
       T(k) = O(k \log k) + O(k) \;=\; O(k \log k).
     $$

2. **Costo agregado sobre k = 1..N**  
   $$
     \sum_{k=1}^{N} T(k)
     \;\approx\;\sum_{k=1}^{N} O(k \log k)
     \;=\;O\!\Bigl(\sum_{k=1}^N k \log k\Bigr).
   $$
   Usando aproximación integral:
   $$
     \sum_{k=1}^N k \log k
     \approx \int_1^N x \log x \,dx
     = \left[\tfrac{x^2}{2}\log x - \tfrac{x^2}{4}\right]_1^N
     = \frac{N^2}{2}\log N - \frac{N^2}{4} + O(1).
   $$
   Por lo tanto:
   $$
     \sum_{k=1}^N T(k)
     = O\bigl(N^2 \log N\bigr).
   $$

3. **Estimación numérica**  
   - Con $N = 10^4$:  
     $$
       \frac{N^2}{2}\log_2 N \approx \frac{10^8}{2}\times 13.3 \approx 6.65\times 10^8 
     $$
     operaciones de comparación/rotación.  
   - Suponiendo que cada operación de inserción (un nivel de árbol) consume unos $0.1$ µs en Python puro (optimista):  
     $$
       6.65\times 10^8 \times 0.1\;\mu s
       = 6.65\times 10^7\;\mu s
       = 66.5\;s
     $$
     a lo que hay que añadir la sobrecarga de pytest (creación de fixtures, parametrización, reporting), que fácilmente puede multiplicar por $1.5$–$2$.  
   - **Tiempo total esperado**: entre **1 y 2 minutos** en hardware típico de desarrollo.  

4. **Conclusiones del análisis de coste**  
   - La parametrización **directa** de 10 000 casos individuales es **muy costosa**.  
   - Alternativas para acelerar:  
     - Reducir la muestra de $k$ (por ejemplo, probar sólo potencias de 2 o saltos mayores).  
     - Combinar varios $k$ en una sola ejecución de test (usar bucle interno en vez de `@parametrize`).  
     - Paralelizar con `pytest-xdist` (opción `-n auto`) si se dispone de varios núcleos.  

**(j) Familia de entrada de altura lineal**

Sea  
$$
(\text{key}_i,\ \text{priority}_i)=(i,\;i)\qquad i=1,\dots,n .
$$

* Claves estrictamente crecientes => cada nodo nuevo se inserta como **hijo derecho** del anterior (propiedad BST).
* Prioridades también crecientes => `priority_{i}` nunca es **más alta** (recuerda: "más alta" significa numéricamente **menor**) que la de su padre, por lo que **no se ejecuta ninguna rotación** durante `add`.

El resultado es una cadena:

```text
(1,1)
   \
  (2,2)
     \
    (3,3)
       \
       ...
          \
         (n,n)
```

Altura `h(n)=n`.  
Esta secuencia **elimina la aleatorización** que normalmente balancea al treap porque:

1. El algoritmo espera que las prioridades formen una permutación aleatoria independiente de las claves.  
2. Al elegir prioridades **monótonamente crecientes** y correlacionadas con el orden de inserción, simulamos el peor caso de un BST puro, impidiendo las rotaciones que mezclarían la estructura.

De forma equivalente, suministrar claves crecientes y prioridades decrecientes. Por ejemplo `(i, n−i)` genera un camino lineal por el lado izquierdo.

> En ambos casos la estructura resultante alcanza la complejidad $O(n)$ en altura y degrada las operaciones de búsqueda, inserción y borrado al peor caso $\Theta(n)$.

**(k) Extensión de la API**

Sea una operación de **split**, que dado un Treap `T` y una clave `k`, devuelve dos Treaps:

- `L` con todas las claves ≤ `k`,  
- `R` con todas las claves >  `k`.


La operación `split(T, k)` sobre un treap recursivo se basa en la siguiente intuición:

1. **Caso base**: si `T` está vacío, devolvemos dos treaps vacíos  
2. Si `T.root.key ≤ k`, entonces **todo el subárbol izquierdo** de la raíz cumple $\leq k$, pero en el subárbol derecho hay claves que pueden ser $\leq $ `k` o > `k`.  
   - Recurre sobre el subárbol derecho:  
     $$
       (L', R) \;=\; \mathrm{split}(T.\mathrm{right},\;k)
     $$
   - Después, el nuevo treap de "izquierda" combina la raíz con su subárbol izquierdo **original** y con `L'`.  
   - El treap de "derecha" es simplemente `R`.  
3. Si `T.root.key > k`, entonces **todo el subárbol derecho** de la raíz es > `k`, pero en el subárbol izquierdo hay claves $\leq$ `k` o > `k`.  
   - Recurre sobre el subárbol izquierdo:  
     $$
       (L,\;R') \;=\; \mathrm{split}(T.\mathrm{left},\;k)
     $$
   - El treap "derecha" combina la raíz con su subárbol derecho original y con `R'`.  
   - El treap "izquierda" es `L`.  

**Pseudocódigo**

```pseudocode
function SPLIT(node, k):
    if node is None:
        return (None, None)

    if node.key ≤ k:
        // Particionamos el subárbol derecho
        (L_sub, R) = SPLIT(node.right, k)
        node.right = L_sub
        if L_sub ≠ None:
            L_sub.parent = node
        // El Treap izquierdo es "node" con su parte derecha ajustada
        return (node, R)
    else:
        // node.key > k: particionamos el subárbol izquierdo
        (L, R_sub) = SPLIT(node.left, k)
        node.left = R_sub
        if R_sub ≠ None:
            R_sub.parent = node
        // El Treap derecho es "node" con su parte izquierda ajustada
        return (L, node)
```

Al final, hay que envolver estos nodos raíz resultantes en dos objetos `Treap` independientes, fijando los `parent=None` de las nuevas raíces.


A continuación, integramos `split` como método estático externo (podría también pertenecer a la clase `Treap`) que trabaja directamente con nodos internos y luego construye dos instancias `Treap`.

```python
from typing import Tuple, Optional

def split_treap(t: Treap[T, S], key: T) -> Tuple[Treap[T, S], Treap[T, S]]:
    """
    Separa el Treap t en dos:
      - left_tree: todas las claves ≤ key
      - right_tree: todas las claves > key
    Returns (left_tree, right_tree).
    """

    def _split_node(node: Optional[Treap._TreapNode], key: T
                   ) -> Tuple[Optional[Treap._TreapNode], Optional[Treap._TreapNode]]:
        if node is None:
            return (None, None)

        if node.key <= key:
            # Clave de la raíz va a la parte izquierda
            left_sub, right_sub = _split_node(node.right, key)
            node.right = left_sub
            if left_sub is not None:
                left_sub.parent = node
            # Asegurar que la nueva raíz de la parte derecha ya no apunta a padre
            if right_sub is not None:
                right_sub.parent = None
            node.parent = None
            return (node, right_sub)
        else:
            # Clave de la raíz va a la parte derecha
            left_sub, right_sub = _split_node(node.left, key)
            node.left = right_sub
            if right_sub is not None:
                right_sub.parent = node
            if left_sub is not None:
                left_sub.parent = None
            node.parent = None
            return (left_sub, node)

    # Ejecutar el split recursivo sobre la raíz original
    with t._lock:
        left_root, right_root = _split_node(t.root, key)

    # Construir dos Treaps nuevos
    left_tree = Treap[T, S]()
    right_tree = Treap[T, S]()
    left_tree.root = left_root
    right_tree.root = right_root
    return (left_tree, right_tree)
```

**Notas de implementación**:

- Se hace `with t._lock` para proteger la lectura de `t.root` aunque estemos construyendo dos nuevas estructuras inmutables para `t`.
- Cada subárbol resultante desconecta su `parent` de niveles superiores.
- Las prioridades no se tocan; el split únicamente usa la clave para particionar sin alterar el heap de prioridades.


Durante cada recursión:

- Cuando movemos `node.right = left_sub`, **actualizamos** `left_sub.parent = node`.  
- Cuando retornamos `right_sub` como raíz de la parte derecha, **limpiamos** `right_sub.parent = None` para marcarlo como raíz.
- De igual manera en el caso simétrico al asignar `node.left = right_sub`.

Este cuidadoso manejo de `parent` garantiza que al terminar tengamos dos árboles **válidos** con padres correctamente asignados o nulos en las raíces.


**Invariantes mantenidos tras el split**

1. **Propiedad BST**:  
   - Todas las claves en `left_tree` satisfacen $\leq$ `key`, pues:
     - Si `node.key <= key`, la raíz va en `left_tree`, y las claves de su subárbol izquierdo eran $\leq$ `node.key`.  
     - Al recursar en `node.right`, sólo extraemos de allí nodos $\leq$ `key`.  
   - Simétricamente para `right_tree`.

2. **Propiedad heap**:  
   - No se altera el campo `priority` ni las rotaciones: cada subárbol mantiene las relaciones padre-hijo de heap.  
   - El proceso no rompe el mínimo-heap, pues no se comparan prioridades; únicamente se reencadenan punteros.


**Análisis de complejidad esperada**

Sea $n$ el número de nodos del Treap original. En un Treap aleatorizado:

- La **altura esperada** es $O(\log n)$.  
- Cada llamada recursiva baja un nivel en el camino hacia la clave de split, recorriendo a lo sumo un único camino desde la raíz hasta una hoja.  

Por tanto, el número de llamadas recursivas y reasignaciones de puntero es proporcional a la **profundidad** de la clave de partición, es decir, $O(h)$ donde $h$ es la altura del Treap.

> **Conclusión**: la complejidad esperada de `split` es **$O(\log n)$**.

En el peor caso adversarial (árbol muy desbalanceado), podría degenerar a $O(n)$, pero las propiedades aleatorias de prioridad aseguran que casi seguro no veamos este caso.

**Ejemplo paso a paso**

Supongamos el treap:

```
        (10│p=50)
        /       \
   (5│p=80)    (15│p=30)
     /   \        \
(2│p=90)(7│p=40) (20│p=60)
```

y hacemos `split(T, key=7)`:

1. **Raíz = 10**, 10 > 7 -> entramos en rama izquierda:  
   - Recursión: `_split_node(node=5, key=7)`.
2. **Nodo=5**, 5 ≤ 7 -> rama derecha:  
   - Recursión: `_split_node(node=7, key=7)`.
3. **Nodo=7**, 7 ≤ 7 -> rama derecha:  
   - Recursión: `_split_node(node=None, key=7)` -> devuelve `(None, None)`.
   - Asigna `7.right = None`, retorna `(7, None)`.
4. Volviendo a nodo = 5:  
   - Recibimos `(L′=7, R=None)`.  
   - Asignamos `5.right = 7` (ya estaba así) y `7.parent = 5`.  
   - Retornamos `(5, None?)` pero **ojo**: la parte derecha que retorna es `R = None`.  
   - En realidad, queremos `(node=5, R=None)`.
5. Volviendo a raíz =10:  
   - Recibimos `(L=5, R_sub=None)`.  
   - Asignamos `10.left = None` (se suelta el 5 original), `None.parent = 10` omitido.  
   - Retornamos `(L=5, node=10)`.
6. **Construcción de los treaps**:  
   - `left_tree.root = 5` produce:
     ```
       5
      / \
     2   7
     ```
   - `right_tree.root = 10` produce:
     ```
      10
        \
        15
          \
          20
     ```

Ambos cumplen BST y heap.

**Casos extremos**

- **Splitting en `key` menor que la mínima**:  
  - Todo va a `right_tree`, `left_tree` queda vacío.  
- **Splitting en `key` mayor que la máxima**:  
  - Todo va a `left_tree`, `right_tree` queda vacío.  
- **Duplicados de clave** (si permites duplicados):  
  - Se define si `<= key` va a la izquierda. Puedes adaptar la comparación `node.key <= key` para decidir dónde cae cada igualdad.




#### **Pregunta 2**

**(a) Complejidad $O(k)$ en inserción y consulta**  

Un Bloom filter de tamaño $m$ bits y con $k$ funciones de hash inserta o consulta un elemento ejecutando exactamente $k$ pasos de lectura/escritura de bits, por lo que, en el modelo de costo de operaciones de bits constantes, ambas operaciones tienen complejidad  
$$
T_{\text{insert}}(v)\;=\;\sum_{i=1}^{k}O(1)\;=\;O(k),
\qquad
T_{\text{lookup}}(v)\;=\;\sum_{i=1}^{k}O(1)\;=\;O(k).
$$  

**Modelado matemático** 

1. **Número de hashes, $k$.**  
   - Definido como  
     $$
       k \;=\;\left\lceil -\frac{\ln p}{\ln 2}\right\rceil,
     $$  
     donde $p$ es la probabilidad deseada de falso positivo.  
   - $k$ depende solo de la tolerancia $p$, no de $n$ ni de $m$, y por diseño es constante durante la vida del filtro.

2. **Operaciones por hash**  
   - Cada función _hash_ (en tu implementación, dos hashes base y combinación cuadrática) produce un entero en $[0,m)$, lo cual modelamos como $O(1)$ bit‐ops.  
   - Luego se calcula  
     $$
       \text{pos}_i = (h_1 + i\,h_2 + i^2)\bmod m,
     $$  
     cada una también $O(1)$.  

3. **Acceso a bits**  
   - Leer o escribir un bit en una posición dada requiere:
     - Cálculo de índice de byte y desplazamiento: $O(1)$.
     - Enmascarar y desplazar: $O(1)$.
   - En total, cada bit‐op es $O(1)$, y hacemos $k$ de ellas.

Por tanto, en un modelo ideal donde:
- El tiempo de hash, aritmética modular y acceso a memoria de un byte es constante.
- La longitud de la clave serializada $\|\mathrm{key}\|$ es acotada (o se considera parte de un coste aparte),

la complejidad de inserción y consulta es **lineal en $k$**, es decir, $O(k)$.

**Suposiciones del modelo $O(k)$**

Para que la abstracción $O(k)$ sea válida, asumimos:

- **Hashing de longitud acotada.** Si la clave tiene longitud $\ell$, entonces computar $h_1$ y $h_2$ cuesta $O(\ell)$. Con $\ell=O(1)$ o amortiguado, el coste dominante es $O(k)$.  
- **Acceso a memoria constante.** Suponemos que leer o escribir un byte en la RAM toma tiempo constante, sin penalizaciones por jerarquía de caché.  
- **Operaciones aritméticas en palabra máquina.** Las operaciones (suma, multiplicación módulo $2^{32}$, desplazamientos) son $O(1)$ en arquitecturas comunes.

Bajo estas hipótesis, cada inserción o consulta recorre un bucle de $k$ iteraciones con coste constante, de modo que $T\in\Theta(k)$.

**Límites en implementaciones reales**

En la práctica, varias limitaciones pueden alejar el rendimiento real de la idealización $O(k)$:

1. **Caché y localidad de referencia**  
   - Las posiciones de bit generadas por hashing suelen "saltar" por todo el arreglo de $m$ bits. Si $m\gg\text{tamaño de caché}$, cada acceso puede causar fallo de caché (cache miss), elevando el coste a decenas o cientos de ciclos.  
   - Técnicas como _blocked hashing_ o usar varios sub‐arrays más pequeños pueden mejorar la localidad y reducir el coste real.

2. **Vectorización y prefetching**  
   - En arquitecturas modernas, procesar varios hashes en paralelo (SIMD) o prefetching manual de líneas de caché puede acercar el coste a un factor amortizado cercano a $O(k/|\text{SIMD}|)$.

3. **Compresión del bit‐array**  
   - Si se aplica compresión al arreglo de bits (p. ej. RLE, Roaring bitmaps), cada lectura o escritura puede requerir decodificar un bloque comprimido, costando tiempo variable y no constante.  
   - El coste pasa de $O(1)$ por bit a $O(\log m)$ o peor, dependiendo del esquema de compresión.

4. **Cálculo de hashes para claves largas**  
   - Cuando las claves son objetos complejos (JSON, strings de gran tamaño), la serialización (`consistent_stringify`) y el hashing se vuelven $O(\ell)$, por lo que la complejidad real es $O(\ell + k)$.  
   - En entornos donde $\ell\gg k$, el tiempo de hash domina.

5. **Sincronización en entornos concurrentes**  
   - Bajo accesos concurrentes, si el filtro está protegido por un _lock_ global, el coste de inserción/consulta puede incluir $O(1)$ operaciones de bloqueo/desbloqueo, pero con contención puede crecer a $O(\#\text{hilos})$ en peor caso.

6. **Costes de límite de memoria**  
   - Si $m$ es tan grande que excede la memoria principal y se aloja en memoria virtual, cada acceso puede implicar _page fault_, encareciendo dramáticamente el tiempo por operación.


> **Límites reales**  
> Mientras que teóricamente $T=O(k)$ bajo supuestos ideales, en implementaciones industriales el rendimiento puede verse afectado por jerarquías de caché, compresión de datos, longitud de claves y sincronización concurrente. Una cuidadosa ingeniería (bloqueo de datos, hashing eficiente, estructuras de compresión-friendly y paralelismo) es esencial para acercarse al comportamiento $\Theta(k)$ en sistemas reales.



**(b) Óptimo de $k$ y la fórmula $k = \frac{m}{n}\ln 2$**  

Sea un Bloom filter con  
- $m$ bits en el arreglo,  
- $n$ elementos insertados,  
- $k$ funciones de hash independientes (o su aproximación mediante double-hashing).  

La probabilidad teórica de falso positivo tras $n$ inserciones viene dada por  
$$
P_{\rm fp}
\;=\;\Bigl(1 - e^{-\,\tfrac{k\,n}{m}}\Bigr)^{k}.
$$
El objetivo es encontrar el valor de $k$ que minimiza esta expresión.
 
Definimos  
$$
f(k) = P_{\rm fp} 
         = \bigl(1 - e^{-kn/m}\bigr)^k
\quad\Longrightarrow\quad
\ln f(k) 
= k\;\ln\!\bigl(1 - e^{-kn/m}\bigr).
$$

Tratamos $k$ como variable continua y exigimos  
$$
\frac{d}{dk}\ln f(k) \;=\; 0.
$$
Calculemos la derivada paso a paso:

1.  
$$
\frac{d}{dk}\bigl[\;k\;\ln(1 - e^{-kn/m})\bigr]
= \ln(1 - e^{-kn/m})
  \;+\; k\;\frac{d}{dk}\ln(1 - e^{-kn/m}).
$$

2.  
$$
\frac{d}{dk}\ln\bigl(1 - e^{-kn/m}\bigr)
= \frac{1}{1 - e^{-kn/m}}\;\cdot\;\Bigl(-\frac{d}{dk}e^{-kn/m}\Bigr)
= \frac{1}{1 - e^{-kn/m}}\;\cdot\;\Bigl(-e^{-kn/m}\,\bigl(-\tfrac{n}{m}\bigr)\Bigr)
= \frac{(n/m)\,e^{-kn/m}}{1 - e^{-kn/m}}.
$$

Por lo tanto,
$$
\frac{d}{dk}\ln f(k)
= \ln\bigl(1 - e^{-kn/m}\bigr)
  \;+\;
  k\;\frac{(n/m)\,e^{-kn/m}}{1 - e^{-kn/m}}
  \;\stackrel{!}{=}\;0.
$$
 
Definamos 
$$
x = e^{-kn/m}, 
\quad\text{así que}\quad
1 - x = 1 - e^{-kn/m}.
$$
El término $\ln(1 - e^{-kn/m})$ es $\ln(1 - x)$, y
$$
\frac{(n/m)\,e^{-kn/m}}{1 - e^{-kn/m}}
= \frac{(n/m)\,x}{1 - x}.
$$

La ecuación crítica es

$$
\ln(1 - x) \;+\; k\,\frac{n}{m}\,\frac{x}{1 - x} \;=\; 0.
$$
Pero como $x = e^{-kn/m}$, tenemos también
$$
k\,\frac{n}{m}
= -\ln x.
$$

Reemplazando el segundo término:

$$
\ln(1 - x) \;-\; \bigl(\ln x\bigr)\,\frac{x}{1 - x} \;=\; 0.
$$

Sin resolver esta en general, observamos que **$x = 1/2$** (i.e.\ $\ln x = -\ln2$) satisface exactamente esta igualdad:

- $\ln(1 - x)=\ln(1/2)=-\ln2.$  
- $\displaystyle -(\ln x)\,\frac{x}{1 - x}
  = -(-\ln2)\,\frac{1/2}{1/2}
  = \ln2.$

De modo que
$$
-\ln2 \;+\;\ln2 \;=\;0.
$$
Por lo tanto la solución estacionaria es  
$$
e^{-kn/m} \;=\;\tfrac12
\;\Longrightarrow\;
-\frac{k\,n}{m} \;=\;\ln\tfrac12 \;=\;-\,\ln2
\;\Longrightarrow\;
\boxed{k^* \;=\;\frac{m}{n}\,\ln2.}
$$

**Interpretación: ¿más o menos de $k^*$?**

- **Si $k<k^*$**:  
  - Se usan muy pocas funciones de hash,  
  - Los bits del filtro no se "escogen" de manera suficientemente diversa,  
  - La fracción de bits a 1 tras $n$ inserciones es menor, pero cada consulta lee pocos bits -> **aumenta** la probabilidad de falso positivo global.

- **Si $k>k^*$**:  
  - Se prueban demasiados bits por elemento,  
  - El filtro se llena muy rápido (mucha más densidad de 1s),  
  - Cada inserción/consulta cuesta más trabajo y el balance bits probados vs. densidad de 1s se desequilibra -> también **aumenta** la probabilidad de falso positivo.

En ambos casos nos alejamos del mínimo de  
$\displaystyle P_{\rm fp}=(1-e^{-kn/m})^k$,  
que ocurre precisamente en  
$\displaystyle k^*=\tfrac{m}{n}\ln2$.  


> **Conclusión:** elegir  
> $$
 k \approx \frac{m}{n}\,\ln 2
 $$
> garantiza número de hashes óptimo ni demasiados (llenan el filtro y encarecen la operación), ni muy pocos (pocos bits distintos probados) y minimiza la tasa de falsos positivos.


**(c) Counting Bloom filter y su sobrecosto de memoria**  
  
Un **Counting Bloom filter** (CBF) extiende el Bloom filter clásico reemplazando el arreglo de bits por un arreglo de **contadores** (normalmente pequeños enteros sin signo). Sea  
- $m$ la cantidad de "celdas" (igual que en el filtro bit a bit),  
- $\{c_i\}_{i=0}^{m-1}$ un arreglo de contadores de ancho $w$ bits cada uno,  
- $k$ las funciones de hash (o double hashing) como en tu implementación.  

Las operaciones se implementan así:

1. **Inserción** `add(value)`:  
   ```python
   for pos in key_positions(value):
       c[pos] += 1
   ```  
2. **Eliminación** `remove(value)`:  
   ```python
   for pos in key_positions(value):
       # Se asume que nunca se decrementa por debajo de 0
       if c[pos] > 0:
           c[pos] -= 1
   ```  
3. **Consulta** `contains(value)`:  
   ```python
   return all(c[pos] > 0 for pos in key_positions(value))
   ```  

> **Nota:**  
> - Cada contador $c_i$ debe tener suficiente rango para evitar **desbordamientos**: su valor máximo debe ser al menos el número máximo de inserciones que mapeen a la misma celda.  
> - La eliminación no introduce **falsos negativos** mientras no se produzcan desbordamientos o borrados excesivos.

**Sobrecosto de memoria**

- En el Bloom filter clásico usamos **1 bit** por celda.  
- En el CBF usamos **$w$ bits** por celda para representar contadores de $0$ a $2^w-1$.  

Por tanto, el factor de sobrecosto de memoria es  
$$
\frac{\text{memoria CBF}}{\text{memoria BF}} 
\;=\;\frac{m\cdot w\text{ bits}}{m\cdot 1\text{ bit}}
\;=\;w.
$$  

Más detallado:

- Si elegimos $w = 4$ (contadores de hasta 15), ocupamos 4× más memoria que un bit-array.  
- Para evitar desbordamientos, a menudo se dimensiona  
  $$
    w \ge \lceil \log_2(C_{\max}+1)\rceil,
  $$
  donde $C_{\max}$ es el número máximo esperado de inserciones que pueden colisionar en una misma celda (en el peor caso, $C_{\max}=n$, aunque en promedio es mucho menor).

Además del factor $w$, el CBF puede requerir cierta **sobrecapacidad** extra para bajar la probabilidad de desbordar contadores, lo que implica dimensionar un poco más $m$ en función del perfil de colisiones.


Un CBF resulta crítico cuando la **colección es dinámica** y se requieren **eliminaciones**, por ejemplo:

- **Ventanas deslizantes en streaming**  
  - En sistemas de métricas en tiempo real (logs, eventos de usuario), a menudo se desea mantener sólo los últimos $W$ minutos de datos. Al expirar cada elemento antiguo, hay que quitarlo del filtro; un Bloom filter clásico no permite esto sin reconstruirlo completamente, mientras que un CBF puede decrementar contadores al expirar cada evento.

- **Cachés con invalidación**  
  - En un servidor de caché distribuido, al expulsar (`evict`) una clave, conviene eliminarla del filtro de presencia para evitar falsos positivos posteriores que impidan recargar la clave correcta.

- **Tablas de flujo en redes**  
  - Un router o **firewall** mantiene un Bloom filter de conexiones activas. Al cerrar una sesión TCP, debe eliminar dicha conexión del filtro para no seguir generando falsos positivos de paquetes "viejos".

En todos estos casos, la capacidad de **borrar** (decrementar) sin reconstruir la estructura desde cero y con un coste amortizado $O(k)$ hace al Counting Bloom filter una solución práctica e indispensable.

**(d) Estimación teórica vs. experimento práctico**  

1. **Estimación teórica**  
   Con $n=4000$, $m=48000$ y $k=7$, la probabilidad de falso positivo viene dada por  
   $$
     P_{\rm fp}
     \;=\;\Bigl(1 - e^{-\,\tfrac{k\,n}{m}}\Bigr)^k
     \;=\;\Bigl(1 - e^{-\,\tfrac{7\cdot4000}{48000}}\Bigr)^{7}
     \;=\;\bigl(1 - e^{-0.5833\dots}\bigr)^{7}
     \;=\;(0.4420)^{7}
     \;\approx\;3.3\times10^{-3}\;(\!0.33\%\!)\,.
   $$

2. **Diseño de un experimento para validar $P_{\rm fp}$ con ±1 % de error**  

   > *Objetivo:* medir empíricamente la tasa de falsos positivos $p_{\rm emp}$ de manera que el intervalo de confianza al 95 % tenga un margen de error absoluto <= 0.01 (1 p.p.).

   - **Paso 1. Preparar el filtro**  
     ```python
     from uuid import uuid4
     filtro = BloomFilter(max_size=4000, max_tolerance=0.01, seed=42)
     # Forzar m=48000, k=7:
     filtro._num_bits = 48000
     filtro._num_hashes = 7
     ```
   - **Paso 2. Insertar 4000 elementos únicos**  
     ```python
     inserciones = {str(uuid4()) for _ in range(4000)}
     for x in inserciones:
         filtro.add(x)
     ```
   - **Paso 3. Generar elementos "ausentes"**  
     - Crear un conjunto de prueba `prueba = {str(uuid4()) for _ in range N}` con `N` suficientemente grande y que no intersecte con `inserciones`.  
     - En la práctica, elegir **$N=10\,000$** garantiza un margen de error al 95 % de  
       $$
         \mathrm{ME}
         = z_{0.975}\,\sqrt{\frac{p(1-p)}{N}}
         \;\approx\;1.96\,\sqrt{\frac{0.0033\cdot0.9967}{10\,000}}
         \;\approx\;0.0011\;(0.11\%\!)<1\%.
       $$
   - **Paso 4. Medir falsos positivos**  
     ```python
     falsos = sum(1 for x in prueba if filtro.contains(x))
     p_emp = falsos / N
     ```
   - **Paso 5. Intervalo de confianza**  
     Con distribución binomial aproximada:
     $$
       \hat p \pm z_{0.975}\,\sqrt{\frac{\hat p(1-\hat p)}{N}}
     $$
     donde $\hat p = p_{\rm emp}$.  

   > **Nota:** si en lugar de ±1 p.p. absoluto se quisiera ±1 % relativo, se recalcula $N$ usando  $\mathrm{ME}=0.01\,\hat p$ en la fórmula anterior.


**(e) Impacto de la dispersión de las funciones hash**  

1. **¿Por qué causa más falsos positivos?**  
   - Si dos (o más) de las $k$ funciones hash "apuntan" sistemáticamente a posiciones cercanas o a un mismo subconjunto de bits,  
     - se **reduce la diversidad** de celdas explotadas,  
     - aumenta la **densidad local de 1s**,  
     - disparan las colisiones múltiples,  
     - y el Bloom filter responde "sí" a muchas claves ausentes.  

2. **Propiedades deseables en una función hash**  
   - **Uniformidad**: cada bit-position de $[0,m)$ debe recibir aproximadamente igual número de hashes.  
   - **Avalanche effect**: un sólo bit de la entrada altera aproximadamente la mitad de los bits de la salida.  
   - **Independencia o _k_-independencia**: salidas de las distintas funciones deben comportarse como independientes (o al menos 2-o 4-independientes) para que la teoría del Bloom clásico se aplique.  
   - **Bajas colisiones**: minimizar la probabilidad de que dos claves distintas produzcan el mismo hash.  
   - **Eficiencia**: coste $O(1)$ por hash en tiempo real, con bajo overhead computacional.  

3. **Buenas elecciones prácticas**  
   - Algoritmos probados como MurmurHash3, xxHash, HighwayHash (o variantes de CityHash) que cumplen las propiedades anteriores.  
   - Evitar funciones con sesgos conocidos (p. e. suma sencilla de bytes, CRC sin mezcla) o con patrón de baja entropía en bits altos o bajos.  

