$\newcommand{\O}[1]{\mathcal{O}({#1})}$

# Árboles balanceados y auto-balanceados

**Definición**: Un árbol está balanceado si podemos asegurar que la profundidad con $n$ nodos está acotada por $\O{\log n}$.

**Propiedad deseable**: Fácil de mantener, la operación de rebalanceo no puede tomar más de $\O{\log n}$.

Dos _approach_ para árboles balanceados que estudiaremos son `AVL` y los `árboles 2-3` (no binarios).

# Árboles AVL

**Definición recursiva:**
>Un árbol es AVL si ambos hijos del nodo raíz son AVL y, además, su altura difiere en a lo más 1.

**Propiedad de balance AVL:**

>Para cualquier nodo del árbol, las alturas de los subárboles izquierdo y derecho difieren en a lo más 1.

Se puede demostrar que esto implica que la altura es logarítmica en la cantidad de nodos.

Notar que no se tiene que "ver" balanceado, sino que debe cumplir la propiedad recursiva.

### Find

La ejecución de una operación `find(A,k)` ahora está garantizada para tomar tiempo $\O{\log n}$, en contraste con el $\O{n}$ anterior para los árboles no balanceados.

### Insert y delete

Si la inserción o eliminación provoca que un subárbol arbitrario deje de ser AVL, el árbol original, centrado en su raíz, también deja de serlo.

Como deseamos evitar un costoso $\O{n}$ al chequear todo el árbol para verificar la condición AVL, debemos agregar un atributo a cada estructura `Nodo`, que denominaremos el `balance`. Esta propiedad se configura en -1 si está más cargado a la izquierda, 0 si está balanceado y 1 si está más cargado a la derecha.

El nodo que es insertado entra con balance 0 (sin hijos), y a los antecesores hay que actualizarles el valor de balance hasta llegar, eventualmente, a la raíz.
Sin embargo, si detectamos un desbalance, por ejemplo si un nodo ya estaba desbalanceado hacia la izquierda (-1) y corresponde agregar otro desbalance a la izquierda (lo que sería un -2), ahí detenemos el proceso para comenzar el rebalanceo dependiendo del caso. Notar que esta operación está acotada por la altura del árbol, por lo tanto, pertenece a $\O{\log n}$.

**Nota importante:** en una inserción, solo se afecta el balance de los nodos que están en el camino entre el nodo insertado y la raíz. El resto del árbol no se ve afectado.

En esa ruta, sea $x$ el primer nodo (el más profundo) desbalanceado tal que x.balance < -1 o x.balance > 1. Si balanceamos en torno a este nodo, rebalanceamos **todo el árbol**.

Un desbalance tiene 4 causas posibles:

- desbalance en el subárbol izquierdo del hijo izquierdo de $x \rightarrow$ caso 1
- desbalance en el subárbol derecho del hijo izquierdo de $x \rightarrow$ caso 2
- desbalance en el subárbol izquierdo del hijo derecho de $x \rightarrow$ caso 2 (simétrico)
- desbalance en el subárbol derecho del hijo derecho de $x \rightarrow$ caso 1 (simétrico)

## Operaciones de rebalanceo

### Rotación simple (caso 1 = rama exterior)

Es un $swap$ de cerca de 4 punteros entre el padre y un hijo, por lo que es $\O{1}$. Como un árbol AVL es recursivo, la operación de rebalance es la misma para subárboles y para la raíz. Ojo que la rotación no solo preserva el balance, sino que también la cualidad ABB (árbol binario de búsqueda). 
La rotación intercambia la raíz de un (sub)árbol por alguno de sus hijos. Si el hijo a intercambiar es izquierdo, ahora el padre quedará como su hijo derecho (ya que es mayor), y viceversa. Se debe rotar con el hijo que produce el desbalance.

### Rotación doble (caso 2 = rama interior)

Si aplicamos rotación simple a un desbalance de caso 2, también quedará con la propiedad de ABB, pero no es AVL. Es una rotación simple hacia un sentido, centrada en el hijo desbalanceado, y luego otra en el sentido contrario, centrada en el la misma posición desbalanceada (ahora está con un nodo antes nieto).

## Altura de un árbol AVL

Es $\Theta(\log n)$. 

Lema: Un árbol AVL de altura $h$ tiene al menos $F_{h+3}-1$ (Fibonacci) nodos.
- Definimos $n_h$ como el número de nodos del árbol AVL más pequeño de altura $h$, y como casos base a $n_0=1, n_1=2$. Un nodo raíz se considera "a nivel del suelo", recién con un hijo tiene altura 1.
- Este árbol debe tener subárboles de altura $h-1$ y $h-2$. Es decir, al menos un subárbol tiene altura $h-1$, y el otro debe diferir en a lo más 1, por lo que debe ser $h-2$, ya que el árbol es lo más pequeño posible (en cantidad de nodos).
- Se desprende de lo anterior la recurrencia: $$n_h = n_{h-1} + n_{h-2} + 1 = F_{h+3} - 1$$
Recordar que $$F_0 = 0,\, F_1 = 1,\,  F_2 = 1, \\ F_3 = 2,\, F_4 = 3,\, F_5 = 5,\, \dots$$
Podemos comprobar que $n_2 = n_1 + n_0 + 1 = 2 + 1 + 1 = 4$, que a su vez es igual a $F_5 - 1$.

Demostración:
- Como $F_k = \left[ \dfrac{\phi^k }{\sqrt{5}} \right]$, un árbol AVL de altura $h$ tiene al menos $ \left[ \dfrac{\phi^{h+3} }{\sqrt{5}} \right]$ nodos.
- Luego, la altura de un árbol AVL de $n$ nodos es logarítmica respecto a $n$.