$\newcommand{\O}[1]{\mathcal{O}({#1})}$
## Balance

Ya definimos el balance AVL. Veamos otras nociones.

Tal vez podemos diseñar un árbol más flexible en cuanto al número de hijos por nodo. En lugar de ser estrictamente binario, podemos pensar en árboles cuyos nodos tienen 2 o 3 hijos.

# Árbol 2-3 
Es un árbol de búsqueda que tiene dos tipos de nodos:
- Nodo 2: tiene dos hijos y una clave almacenada
- Nodo 3: tiene 3 hijos y dos claves almacenadas

Tiene la propiedad que todas las hojas están al mismo nivel.

En el nodo 2 se almacenan los menores en el subárbol izquierdo, y los mayores en el derecho.

En el nodo 3 se almacenan los menores a $X$ en el subárbol izquierdo, los valores entre $X$ e $Y $ en el subárbol central y los mayores a $Y$ en el subárbol derecho. Es importante que $X<Y$.
Como es un árbol de búsqueda, encontrar elementos es igualmente rápido que en la búsqueda binaria.

## Altura de un árbol 2-3
- Si todos los nodos son nodos-3, y hay $k$ claves,  $H \approx \log_3 k$
- Si todos son nodos-2, $H \approx \log_2 k$

En general, si hay $k$ claves, $H \in \O{\log k}$

### #Dato
En la práctica se usan poco los árboles 2-3 en memoria RAM, pero en implementación de bases de datos se usa una generalización de estos árboles: **los B-trees**.

## Inserción

Al comienzo, los nodos pueden no tener hijos. Además, las hojas no tienen hijos.

- Introducimos el nodo D, quedando solo un nodo 2 sin hijos
- Introducimos el nodo A. Ahora cambiamos el nodo 2 por 3, quedando A|D.
- Introducimos el nodo C. No podemos tener A|C|D porque no existen los nodos 4.
    - Debemos hacer un _split_, poniendo la clave C como raíz (nodo 2) y a los nodos A y D como hijos izquierdo y derecho, respectivamente. Notemos que las hojas están a igual profundidad, solo que la raíz "subió". Pasamos de un nodo 3 (A|D) a 3 nodos-2.
- Insertamos E. Como es mayor que la raíz (C), se agrega a su subárbol derecho. Acá está el nodo-2 con clave D. Debemos cambiarlo a nodo-3 y agregarlo a la derecha de D.
- Insertamos N. Pasa a la derecha de C, pero el nodo-3 D|E no puede contener a N. Debemos hacer un _split_ y subir a E (está al medio). Tampoco podemos profundizar más, dejando a la E como hijo derecho de C, ya que profundizaría las hojas. Debemos pasar la raíz a un nodo-3, para quedar la raíz C|E, el hijo izquierdo A, el central D y el derecho N, todos nodos-2.
- Insertamos F. Es mayor que E, así que pasa al subárbol derecho, transformándolo en nodo-3 (F|N).
- Insertamos H. Es mayor que E, mayor que H, debería quedar como hijo del medio del nodo (F|N), pero rompería la altura. Movemos H arriba (ya que está al medio, _split_), pero ahora la raíz está como (C|E|H), tenemos el mismo problema y repetimos el _split_, dejando a E como nodo-2 raíz, C, H los hijos izquierdo y derecho.

## Costo de operaciones
Es $\O{h}$ en inserción y búsqueda.

Pero si hay muchas claves en un nodo, hay que hacer $k$ comparaciones por nivel. En ese caso, el costo de buscar o insertar es $\O{k\cdot h} = \O{k \log n}$.

## Desventajas

Los árboles 2-3 son balanceados, pero insertar una clave tiene bastante _overhead_. ¿Se podrá representar como ABB, en que no nos tengamos que preocupar del tipo de nodo, sino que siempre es binario?

Efectivamente. Se puede conservar la propiedad de balance de profundidad de hojas en un ABB.

La traducción de los nodos 2 es directa, ya son parte de un posible ABB.
En contraste, los nodos 3 con claves (X|Y), hijos menores a X, entre X e Y, y mayores a Y, se puede traducir en un ABB a tener el X como nodo raíz, los menores a X a su izquierda, Y como su hijo derecho. Además, los que se encuentran entre X e Y quedan como hijos izquierdos de Y, mientras que los mayores siguen a su derecha.

## Árbol rojo-negro

Se usan más en memoria RAM, todos los nodos son iguales. La propiedad de balance está dada por un bit que caracteriza si el nodo es "rojo" o es "negro". Esencialmente, es un ABB con 4 propiedades:

1. Cada nodo es **rojo** o **negro**
2. La raíz del árbol es **negra**.
3.  Si un nodo es **rojo**, sus hijos son **negros**. De esta forma, a lo más puede haber nodos **rojos** uno por medio, en un camino entre un nodo y la raíz, ya que no puede haber nodos **rojos** consecutivos.
4. La cantidad de nodos **negros** en un camino entre la raíz (o cualquier otro nodo) y una hoja es siempre la misma para todas las hojas. Las hojas nulas se consideran **negras**.

La traducción desde un árbol 2-3 es que los nodos **negros** son los ex nodos-2, mientras que los **rojos** son los ex nodos-3. 

La inserción es idéntica a la de un ABB, pero además debemos definir si el nodo entrante es **rojo** o **negro**.
Es más fácil insertar por defecto en **rojo** y después pedir disculpas. Si el padre es **negro**, no hay problema, pero si rompe alguna regla, debemos cambiarlo. En particular, si es raíz, debemos cambiarlo a **negro**. Si su padre es **rojo**, también debemos cambiarlo a **negro**. 

Recordemos que el objetivo de estas reglas es tener un ABB **balanceado** que garantice $H \in \O{\log n}$.

Puede pasar que una inserción viole las propiedades del árbol rojo-negro, y que no siempre se pueda restaurar con un cambio de color. Para esto usaremos **rotaciones**, tal como en AVL. Eso sí, se necesita hacer esto en ciertas ocasiones, no siempre como en AVL. Si bien veremos que asintóticamente se comportan de igual forma en complejidad temporal, en la práctica resulta menos costoso el poder cambiar de color para dejar todo balanceado, por lo que se prefieren los árboles rojo-negro ante los AVL.