# Tries

## Introducción:

En esta clase, nos enfocaremos en los Tries, una estructura de datos esencial para manejar eficientemente conjuntos de cadenas (strings). Los Tries, también conocidos como árboles de prefijos, son particularmente útiles en situaciones donde se necesita buscar, insertar o eliminar cadenas de manera rápida y eficiente.

### Estructuras para la Gestión de Conjuntos de Cadenas:

Los Tries son árboles en los que `cada nodo representa un carácter de una cadena`. Estos árboles son ideales para manejar conjuntos de cadenas, especialmente cuando estas cadenas comparten prefijos comunes. Veamos sus características clave:

- **Almacenamiento Eficiente**: Al compartir nodos comunes para prefijos comunes, los Tries reducen la cantidad de espacio de almacenamiento necesario en comparación con el almacenamiento individual de cada cadena.
- **Búsqueda Rápida**: La búsqueda de una cadena en un Trie es eficiente, con un tiempo de complejidad proporcional a la longitud de la cadena, independientemente del número total de cadenas almacenadas.
- **Inserciones y Eliminaciones Eficaces**: Similar a la búsqueda, las operaciones de inserción y eliminación son rápidas, haciéndolas ideales para aplicaciones donde el conjunto de cadenas cambia frecuentemente.

### Implementación y Casos de Uso en Python:

Implementar un Trie en Python implica crear una clase que represente los nodos del Trie y otra para el Trie en sí. Vamos a ver una implementación básica y algunos casos de uso.

### Implementación Básica de un Trie:

In [1]:
class TrieNode:
    def __init__(self):
        self.children = {}
        self.is_end_of_word = False


class Trie:
    def __init__(self):
        self.root = TrieNode()

    def insert(self, word):
        node = self.root
        for char in word:
            # Usamos 'in' para verificar la existencia del caracter
            if char in node.children:
                node = node.children[char]
            else:
                # Solo creamos un nuevo nodo si el caracter no existe
                node.children[char] = TrieNode()
                node = node.children[char]
        node.is_end_of_word = True

    def search(self, word):
        node = self.root
        for char in word:
            # Similarmente, usamos 'in' para la búsqueda
            if char in node.children:
                node = node.children[char]
            else:
                # Si el caracter no existe, retornamos False directamente
                return False
        return node.is_end_of_word

    def delete(self, word):
        def delete_rec(node, word, depth):
            if node is None:
                return False
            if depth == len(word):
                if not node.is_end_of_word:
                    return False
                node.is_end_of_word = False
                return len(node.children) == 0
            char = word[depth]
            child_deleted = delete_rec(
                node.children.get(char), word, depth + 1)
            if child_deleted:
                del node.children[char]
                return len(node.children) == 0 and not node.is_end_of_word
            return False

        delete_rec(self.root, word, 0)


### Ejemplo de uso

In [2]:
trie = Trie()

# Paso 1: Insertar palabras
trie.insert("hello")
trie.insert("world")

# Paso 2: Verificar la existencia
print("Existe 'hello'? ", trie.search("hello"))  # Debería ser True

# Paso 3: Eliminar la palabra
trie.delete("hello")

# Paso 4: Verificar la existencia después de eliminar
print("Existe 'hello' después de eliminar? ",
      trie.search("hello"))  # Debería ser False

Existe 'hello'?  True
Existe 'hello' después de eliminar?  False





## Pseudocódigos

1. **Clase `TrieNode`**:
   - Inicializa un diccionario `children` para almacenar nodos hijos y una bandera `is_end_of_word` para indicar si el nodo marca el fin de una palabra. Esta estructura es adecuada para representar cada nodo en el trie.

2. **Clase `Trie`**:
   - Inicializa un nodo raíz, que actúa como el punto de partida para todas las operaciones en el trie.

3. **Método `insert`**:
   - Empieza desde el nodo raíz y recorre cada caracter de la palabra a insertar.
   - Para cada caracter, verifica si ya existe en el diccionario `children` del nodo actual:
     - Si el caracter **existe**, avanza al nodo correspondiente.
     - Si el caracter **no existe**, crea un nuevo `TrieNode` y lo asigna al caracter en el diccionario `children`, y luego avanza a este nuevo nodo.
   - Al final del recorrido, marca el último nodo visitado como el fin de una palabra (`is_end_of_word = True`).
   - Este proceso asegura que se construya correctamente el trie, creando nodos según sea necesario para cada caracter único en la palabra.

4. **Método `search`**:
   - Similar al método `insert`, comienza desde el nodo raíz y recorre cada caracter de la palabra buscada.
   - Para cada caracter, verifica si existe en el diccionario `children` del nodo actual:
     - Si el caracter **existe**, avanza al nodo correspondiente.
     - Si el caracter **no existe**, retorna `False` inmediatamente, indicando que la palabra no se encuentra en el trie.
   - Si llega al final de la palabra y el último nodo visitado está marcado como el fin de una palabra (`is_end_of_word = True`), entonces retorna `True`, indicando que la palabra completa existe en el trie.

5. **Método `delete`**:
   -Inicio: Comienza con la llamada inicial a delete_rec, proporcionando el nodo raíz, la palabra a eliminar y la profundidad inicial como 0.
   - Verificación de Condiciones: Se realizan varias comprobaciones para determinar si se debe continuar con la eliminación:
     - Si el nodo actual es None, se retorna Falso.
     - Si se alcanza la profundidad igual a la longitud de la palabra, se verifica si el nodo marca el fin de una palabra. Si no es así, se retorna Falso. Si es el fin de una palabra, se desmarca y se verifica si el nodo ya no tiene hijos, en cuyo caso puede ser elegible para eliminación.
   - Recursión y Eliminación de Nodos: La función se llama recursivamente para el nodo hijo correspondiente al siguiente caracter de la palabra. Si la eliminación del nodo hijo resulta en que el nodo hijo se elimine completamente, se verifica si el nodo actual puede ser eliminado (no tiene hijos y no marca el fin de una palabra).
   - Fin: El proceso concluye una vez que se ha intentado la eliminación a través de todas las llamadas recursivas.

| | | |
|:---:|:---:|:---:|
| ![](../../img/trie-insert.png) | ![](../../img/trie-search.png) | ![](../../img/trie-delete.png) |


## Casos de Uso:

- **Autocompletado**: Utilizado en motores de búsqueda y teclados inteligentes para sugerir completaciones de palabras basándose en los primeros caracteres ingresados.
- **Verificación Ortográfica**: Los Tries permiten buscar rápidamente palabras en un diccionario, haciéndolos útiles en correctores ortográficos.
- **Sistemas de Enrutamiento**: En redes de telecomunicaciones para la búsqueda rápida de rutas.

## Conclusión:

Los Tries son una herramienta poderosa para la gestión eficiente de conjuntos de cadenas, proporcionando un almacenamiento y acceso rápidos. Su implementación y uso en Python demuestran su versatilidad en diversas aplicaciones, desde autocompletado hasta sistemas de enrutamiento. En la próxima clase, exploraremos las aplicaciones avanzadas de los Tries en el procesamiento de texto y su optimización.
