# Introduccion a Arboles (trees)

Los árboles son estructuras de datos fundamentales y no lineales en informática. Simulan una jerarquía de forma invertida, compuesta por nodos conectados, donde uno es la raíz sin padres y los demás tienen un único padre, excepto la raíz. Esta disposición jerárquica permite organizar y almacenar datos eficientemente.

Cada nodo en un árbol puede contener un valor o dato, y referencias (punteros) a otros nodos que son sus hijos directos. Los nodos sin hijos se llaman hojas o nodos terminales. Los nodos que tienen tanto hijos como un padre se denominan nodos intermedios o nodos internos.

<pre>
        (root)
        /    \
      (a)    (b)
      / \      \
    (c) (d)    (e)
        /
      (f)
  
</pre>

A diferencia de las estructuras de datos lineales como listas y colas, los árboles permiten que un nodo tenga más de un hijo directo. Esto los convierte en una opción muy eficiente para organizar datos jerárquicos o anidados.

Una característica fundamental de los árboles es que no tienen ciclos, es decir, no es posible comenzar desde un nodo y recorrer los enlaces para volver al mismo nodo. Esto los diferencia de los grafos, que sí permiten ciclos.

La principal ventaja de los árboles es su eficiencia para operaciones como búsqueda, inserción y eliminación, que en muchos casos se pueden realizar en tiempo logarítmico O(log n). Además, permiten organizar datos jerárquicos de manera intuitiva.

En resumen, los árboles son estructuras de datos fundamentales que organizan elementos en una jerarquía libre de ciclos, permitiendo un acceso y manipulación eficientes de la información a través de diversas operaciones y tipos de árboles especializados.


## Términos fundamentales

- **Raíz (Root):** La raíz es el nodo superior de un árbol, desde donde se derivan todos los demás nodos. No tiene un nodo padre y es el único nodo en el árbol que cumple esta condición.

- **Nodo (Node):** Un nodo es una estructura que puede contener un valor o condición, o representar un punto de separación en la estructura del árbol. Cada nodo puede tener cero o más nodos hijos conectados a él, y exactamente un nodo padre, excepto la raíz que no tiene padre.

- **Nodo Hoja (Leaf Node):** Un nodo hoja es un nodo que no tiene hijos. Representa un punto terminal en el árbol.

- **Nodo Interno (Internal Node):** Un nodo interno es cualquier nodo del árbol que tiene al menos un hijo. No es una hoja.

<pre>
        raiz
       /    \
      /      \
    nodo      nodo
  interno   interno
    /           \
 hoja           hoja

</pre>

- **Subárbol (Subtree):** Un subárbol es cualquier nodo del árbol junto con todos sus descendientes. Cada nodo en un árbol puede ser visto como la raíz de un subárbol que consiste en él mismo y todos los nodos a los que se puede llegar descendiendo desde él.

- **Arista (Edge):** Una arista es la conexión entre dos nodos en el árbol. En un contexto de árboles, las aristas conectan un nodo padre con sus nodos hijos y definen la estructura jerárquica del árbol.

- **Camino (Path):** Un camino en un árbol es una secuencia de nodos y aristas que conecta un nodo con otro. Cada par de nodos en un árbol tiene exactamente un camino único que los conecta.

- Parentesco:
  - **Hermanos (Siblings)**: Los hermanos son un conjunto de nodos en un árbol que comparten el mismo nodo padre. En un árbol binario, puede haber hasta dos hermanos (el nodo izquierdo y el nodo derecho del mismo padre), pero en árboles n-arios o multicamino, puede haber muchos más.

  - **Descendiente (Descendant)**: Un nodo es considerado descendiente de otro si se puede llegar a él mediante una serie de pasos hacia abajo a través del árbol, de padre a hijo. Esto implica que todos los nodos que están en los subárboles de un dado nodo se consideran sus descendientes.

  - **Ancestro (Ancestor)**: Un nodo es considerado ancestro de otro si se puede llegar al segundo nodo descendiendo a través del árbol desde el primero. Esto significa que el nodo raíz es ancestro de todos los demás nodos en el árbol, y cada nodo es considerado como su propio ancestro.

<pre>
        (A)
       /   \
     (B)   (C)
     / \    |
   (D) (E) (F)
        |
       (G)

- (B) y (C) son hermanos.
- (D) y (E) son hermanos; ambos son descendientes de (B).
- (G) es descendiente de (E) y (B).
- (A) es ancestro de todos los demás nodos.
- (F) es descendiente de (C) y hermano de nadie.

</pre>

- Medidas:
  - **Nivel (Level):** El nivel de un nodo se define por su profundidad en el árbol, donde la raíz está en el nivel 0. El nivel de un nodo nos da información sobre su generación o la distancia desde la raíz.

  - **Altura (Height):** La altura de un nodo se define como el número de aristas en el camino más largo desde ese nodo hasta una hoja. La altura de un árbol es la altura de su raíz, que corresponde al número de aristas en el camino más largo desde la raíz hasta la hoja más distante. Se puede pensar en la altura como la "profundidad máxima" del árbol.

<pre>
             ---
              |        raíz
              |         |
   Altura = 2 |     nodo interno  --- 
              |      /      \      |
              |   hoja      hoja   | Altura = 1
             ---                  ---
</pre>

  - **Profundidad (Depth):** La profundidad de un nodo se define como el número de aristas en el camino desde la raíz hasta ese nodo. Por lo tanto, la profundidad de la raíz es 0. La profundidad proporciona una medida de cuán lejos está un nodo en particular de la raíz del árbol.

  - **Grado (Degree):** El grado de un nodo se refiere al número de sus hijos. En el contexto de árboles n-arios, el grado puede variar ampliamente de un nodo a otro. El grado de un árbol es el grado máximo de todos los nodos en el árbol.

- Estructura:
  - **Árbol Binario (Binary Tree):** Un árbol en el que cada nodo tiene como máximo dos hijos, referidos comúnmente como hijo izquierdo y hijo derecho.

<pre>
       (1)
      /   \
    (2)   (3)
   /      /  \
 (4)    (6) (7)
        /
      (5)
</pre>

  - **Árbol Completo (Complete Tree):** Un árbol binario es completo si todos los niveles del árbol están completamente llenos, excepto posiblemente el último nivel, que debe estar lleno desde la izquierda.

<pre>
         (1)
       /     \
    (2)      (3)
   /  \      /
 (4)  (5)  (6)
</pre>

  - **Árbol Lleno (Full Tree):** Un árbol es lleno si cada nodo tiene 0 o el máximo número permitido de hijos. En el contexto de árboles binarios, un árbol lleno es aquel en el que cada nodo tiene exactamente 0 o 2 hijos. De otro modo: no tiene ningún nodo que tenga un solo nodo hijo.

<pre>
      (1)
     /   \
   (2)   (3)
         /  \
       (5)  (6)
</pre>

  - **Árbol Balanceado (Balanced Tree):** Un árbol está balanceado si para cada nodo, la altura de sus subárboles izquierdo y derecho difiere como máximo en uno. Esta definición puede variar ligeramente dependiendo del tipo de árbol balanceado (como AVL o Rojo-Negro).

<pre>
        1
       / \
      4   2
     / \   \
    7   5   3
   / \
  8   9
</pre>

  - **Árbol Perfecto (Perfect Tree):** Un árbol binario es perfecto cuando todos los niveles internos están completamente llenos y todos los nodos hoja están al mismo nivel.

<pre>
              (1)
           /        \
        (2)          (3)
       /   \        /  \
     (4)   (5)     (6)   (7)
    / \   /  \    /  \   /  \
  (8)(9)(10)(11)(12)(13)(14)(15)
</pre> 

Tener en cuenta que las clasificaciones de árboles llenos, completos y balanceados se originan y aplican principalmente en el contexto de árboles binarios. Más adelante veremos que existen árboles con mas de 2 hijos (n-arios).

Estos términos son fundamentales para entender la estructura y las propiedades de los árboles en la informática y son esenciales para el análisis y diseño de algoritmos que trabajan con estas estructuras.

+info
- https://www.baeldung.com/cs/full-vs-complete-vs-perfect-tree
- https://www.programiz.com/dsa/complete-binary-tree

## Consideraciones al implementar un árbol

1. **Representación del Árbol**:
    - Usar clases y objetos: Cada nodo es una instancia de una clase.
    - Estructuras de datos incorporadas: Como listas o diccionarios para una representación más simple.
2. **Operaciones Básicas**:
    - Inserción: Agregar nuevos nodos.
    - Eliminación: Remover nodos existentes.
    - Búsqueda: Encontrar un nodo con un valor específico.
    - Recorrido: Visitar nodos en un orden específico (inorden, preorden, postorden, por niveles).
3. **Eficiencia**:
    - Tiempo de operación: Importancia de la rapidez de inserción, eliminación y búsqueda.
    - Uso de memoria: Cómo el árbol maneja el espacio de almacenamiento.
4. **Recursión**:
    - Implementaciones recursivas: Muchas operaciones en árboles son más sencillas utilizando la recursión.
5. **Aplicaciones Específicas**:
    - Árboles de decisiones para machine learning.
    - Sistemas de archivos.
    - Organizadores de datos jerárquicos: Adaptar la estructura del árbol para necesidades específicas.