<h1 align="center">Estructura de Datos y Algoritmos II</h1>
<h1 align="center">Programación Dinámica 3</h1>
<h1 align="center">Estructuras de datos para almacenamiento de subresultados</h1>
<h1 align="center">2024</h1>
<h1 align="center">MEDELLÍN - COLOMBIA </h1>

*** 
|[![Outlook](https://img.shields.io/badge/Microsoft_Outlook-0078D4?style=plastic&logo=microsoft-outlook&logoColor=white)](mailto:calvar52@eafit.edu.co)||[![Open In Colab](https://colab.research.google.com/assets/colab-badge.svg)](https://colab.research.google.com/github/carlosalvarezh/EstructuraDatosAlgoritmos2/blob/main/S06_ProgramacionDinamicaSubresultados.ipynb)
|-:|:-|--:|
|[![LinkedIn](https://img.shields.io/badge/linkedin-%230077B5.svg?style=plastic&logo=linkedin&logoColor=white)](https://www.linkedin.com/in/carlosalvarez5/)|[![@alvarezhenao](https://img.shields.io/twitter/url/https/twitter.com/alvarezhenao.svg?style=social&label=Follow%20%40alvarezhenao)](https://twitter.com/alvarezhenao)|[![@carlosalvarezh](https://img.shields.io/badge/github-%23121011.svg?style=plastic&logo=github&logoColor=white)](https://github.com/carlosalvarezh)|

<table>
 <tr align=left><td><img align=left src="https://github.com/carlosalvarezh/Curso_CEC_EAFIT/blob/main/images/CCLogoColorPop1.gif?raw=true" width="25">
 <td>Text provided under a Creative Commons Attribution license, CC-BY. All code is made available under the FSF-approved MIT license.(c) Carlos Alberto Alvarez Henao</td>
</table>

***

## Introducción a las Estructuras de Datos en Programación Dinámica

### Importancia del Almacenamiento de Subresultados

En el ámbito de la programación dinámica, uno de los principios fundamentales es la descomposición de problemas complejos en subproblemas más pequeños y manejables. Esta estrategia no solo simplifica la resolución del problema sino que, al abordar cada subproblema una sola vez y almacenar sus resultados, se evita la necesidad de realizar cálculos redundantes. Aquí es donde entra en juego la importancia del almacenamiento de subresultados.

El almacenamiento eficiente de los resultados de estos subproblemas es crucial por dos razones principales:

- ***Reducción de la Complejidad Temporal:*** Al almacenar los resultados de los subproblemas, se evita la recomputación innecesaria, lo cual es esencial para reducir el tiempo de ejecución del algoritmo.
<p>&nbsp;</p>

- ***Acceso Rápido a las Soluciones de Subproblemas:*** Permite recuperar rápidamente la solución de un subproblema ya resuelto, lo cual es esencial en la resolución de problemas más grandes que dependen de estas soluciones.

### Estructuras de Datos en Programación Dinámica

Las estructuras de datos utilizadas en programación dinámica varían desde arreglos simples hasta tablas de hash y matrices, dependiendo de la naturaleza y requisitos del problema. Por ejemplo, para calcular el $n$-ésimo número en la serie de Fibonacci, un arreglo simple puede ser suficiente para almacenar los números de Fibonacci previamente calculados. En contraste, problemas más complejos como el cálculo de la *subsecuencia común más larga* (*LCS*) entre dos cadenas pueden requerir una matriz bidimensional para almacenar los resultados de los subproblemas.

### Comparación entre Enfoque Recursivo Puro y Programación Dinámica

La principal diferencia entre un enfoque recursivo puro y la programación dinámica radica en cómo se manejan los subproblemas:

- ***Enfoque Recursivo Puro:*** En la recursión, el problema se divide en subproblemas más pequeños. Sin embargo, este enfoque puede llevar a resolver el mismo subproblema múltiples veces, lo que resulta en una mayor complejidad temporal, especialmente en problemas que presentan una gran cantidad de subproblemas superpuestos. Por ejemplo, en el cálculo del $n$-ésimo número de Fibonacci utilizando un enfoque recursivo puro, se recalculan numerosos valores de Fibonacci.
<p>&nbsp;</p>

- ***Programación Dinámica:*** Combina la eficiencia de la recursión con el almacenamiento eficiente de resultados. Al almacenar los resultados de los subproblemas, la programación dinámica elimina la necesidad de recalculaciones, lo que resulta en un algoritmo mucho más eficiente. Por ejemplo, al calcular el $n$-ésimo número de Fibonacci utilizando programación dinámica, cada número de Fibonacci se calcula una sola vez y se almacena para su uso futuro.


### Ejemplos de Uso

- ***Serie de Fibonacci***
   - **Recursivo**: Cálculo directo de cada número con llamadas recursivas, llevando a una complejidad de $\mathcal{O}(2^n)$.
   - **Dinámico**: Almacenamiento de cada número de Fibonacci calculado en un arreglo, reduciendo la complejidad a $\mathcal{O}(n)$.
<p>&nbsp;</p>

- ***Subsecuencia Común Más Larga (LCS)***
   - **Recursivo**: Calcula repetidamente la *LCS* para pares de prefijos de las dos secuencias, sin almacenar los resultados.
   - **Dinámico**: Utiliza una matriz para almacenar la *LCS* de todos los pares de prefijos, eliminando la necesidad de recalculaciones.

La elección adecuada y el uso eficiente de las estructuras de datos son fundamentales en la programación dinámica. Permiten una implementación más eficiente y optimizada de algoritmos que, de otro modo, serían prohibitivamente lentos y complejos. Este enfoque convierte a la programación dinámica en una herramienta poderosa para resolver una amplia gama de problemas computacionales, desde los más simples hasta los más complejos.

## Arreglos y Matrices en Programación Dinámica

### Introducción

En el ámbito de la programación dinámica, las estructuras de datos como los arreglos y matrices juegan un papel crucial en la organización y el almacenamiento eficiente de los resultados de los subproblemas. Estas estructuras permiten a los algoritmos acceder rápidamente a los resultados previamente calculados, lo que es esencial para la eficiencia de la programación dinámica.

### Uso de Arreglos Unidimensionales y Bidimensionales

- ***Arreglos Unidimensionales:*** Son utilizados cuando el problema puede descomponerse en subproblemas que dependen de una sola variable. Un arreglo unidimensional es suficiente para almacenar los resultados de estos subproblemas.
<p>&nbsp;</p>
  
- ***Matrices (Arreglos Bidimensionales):*** Cuando los subproblemas dependen de dos variables, se utilizan matrices. Esto es común en problemas donde se deben tomar decisiones en dos dimensiones, como en problemas de alineación de texto, edición de cadenas, o en ciertos problemas de caminos en grafos.


### Cómo Elegir entre un Arreglo Unidimensional y Multidimensional

La elección entre un arreglo unidimensional y una matriz depende de la naturaleza del problema:

- Si el problema puede ser dividido en subproblemas que dependen de un solo parámetro, un arreglo unidimensional es suficiente.
<p>&nbsp;</p>

- Si el problema involucra dos parámetros interdependientes, una matriz es más adecuada.

### Ejemplos de Problemas Resueltos Utilizando Arreglos/Matrices

- ***Serie de Fibonacci:*** El clásico problema de la serie de Fibonacci puede resolverse mediante programación dinámica utilizando un arreglo unidimensional. Cada elemento del arreglo almacena el n-ésimo número de Fibonacci, y cada número se calcula sumando los dos números anteriores en el arreglo.
<p>&nbsp;</p>

- ***Problema de la Mochila:*** Un ejemplo de un problema que utiliza una matriz es el problema de la mochila 0/1. En este problema, se utiliza una matriz para almacenar los valores máximos que se pueden alcanzar con diferentes pesos y para un subconjunto dado de elementos. Cada celda de la matriz representa el valor máximo que se puede obtener con un peso dado y considerando los elementos hasta cierto punto.
<p>&nbsp;</p>

- ***Camino Mínimo en una Matriz:*** Otro ejemplo es el problema de encontrar el camino mínimo en una matriz, donde cada celda representa un costo y se busca el costo mínimo para llegar de un punto de la matriz a otro. Se utiliza una matriz para almacenar los costos mínimos acumulados para llegar a cada celda.

Estos ejemplos ilustran cómo los arreglos y matrices son herramientas esenciales en la caja de herramientas de la programación dinámica. Facilitan el almacenamiento y la recuperación eficiente de soluciones a subproblemas, lo que permite a los algoritmos de programación dinámica funcionar de manera eficiente y efectiva.

### Problema de la mochila (Knapsack problem)

<p float="center">
  <img src="https://github.com/carlosalvarezh/EstructuraDatosAlgoritmos2/blob/main/images/Knapsack01.webp?raw=true" width="250" />
</p>

<p style="text-align: center;">
    <strong>Tomado de:</strong> <a href="https://blog.stackademic.com/knapsack-problem-dynamic-programming-solution-bdf48365b759">Medium</a>
</p>

El problema de optimización de mochila es un problema clásico en optimización combinatoria. Su nombre deriva del escenario de llenar una mochila con artículos de diferentes pesos y valores, con el objetivo de maximizar el valor total sin exceder la capacidad de peso de la mochila.

Existen varias variaciones de este problema, pero la más común es el *problema de la mochila 0/1*. En esta variación, cada elemento puede *incluirse* o *excluirse*, lo que significa que no podemos tomar una fracción de un elemento ni tomar ningún elemento más de una vez.

Existen varios métodos para resolver este problema. Aquí, utilizaremos el enfoque de programación dinámica: La programación dinámica (DP) es un método para resolver problemas complejos dividiéndolos en subproblemas más simples. Combina la exactitud de la búsqueda completa con la eficiencia de los algoritmos codiciosos al almacenar y reutilizar sistemáticamente las soluciones de subproblemas superpuestos. DP divide el problema de la mochila en partes más pequeñas y almacena sus soluciones en una tabla 2D. La solución al problema completo se construye a partir de estos subproblemas más pequeños.

El primer paso para resolver el problema es el planteamiento del problema:

> *Dados `n` artículos, cada uno con un peso `weight[i]` y un valor `value[i]`, y una mochila de capacidad `W`, encuentre el valor máximo que se puede poner en la mochila sin exceder la capacidad.*







#### Ejemplo 1: Problema simple de la mochila

Imagina que estás preparando una mochila para un viaje de campamento y tienes que elegir entre varios artículos, cada uno con un valor de utilidad y un peso. La capacidad de tu mochila es limitada.

**Artículos Disponibles**:
- A: Una tienda de campaña con un peso de 4 kg y un valor de utilidad de 30.
- B: Una estufa de campamento con un peso de 3 kg y un valor de utilidad de 50.
- C: Una bolsa de dormir con un peso de 1 kg y un valor de utilidad de 15.

**Capacidad de la Mochila**: 5 kg.

***Solución al Ejemplo***

Debes decidir qué artículos llevar para maximizar la utilidad total sin exceder el límite de peso de 5 kg.

- Si eliges la tienda (A) y la bolsa de dormir (C), el peso total es 5 kg y el valor total es 45.
- Si eliges la estufa (B) y la bolsa de dormir (C), el peso total es 4 kg y el valor total es 65.
- No puedes llevar la tienda (A) y la estufa (B) juntas porque excederían el límite de peso.

La mejor opción es llevar la estufa de campamento (B) y la bolsa de dormir (C), lo que te da el máximo valor total de 65 sin sobrepasar el límite de peso

#### Ejemplo 2: Problema de la mochila - Solución con PD

En este ejemplo se tiene una mochila con capacidad de $7 kg$ y $5$ artículos, cada uno con diferentes pesos y valores:

|||||||
|:----|:---:|:---:|:---:|:---:|:---:|
|Index |1|2|3|4|5|
|Weight|4|3|2|1|3|
|Value |5|2|3|2|4|


- Crear una matriz 2D `dp` de tamaño `(n+1) x (W+1)` donde `dp[i][w]`representará el valor máximo que se puede alcanzar con los primeros $i$-artículos y una capacidad de mochila de `w`.

<p float="center">
  <img src="https://github.com/carlosalvarezh/EstructuraDatosAlgoritmos2/blob/main/images/Knapsack02.PNG?raw=true" width="500" />
</p>


- Inicialice la primera fila y la primera columna en $0$, lo que representa el caso con cero elementos o capacidad cero.

<p float="center">
  <img src="https://github.com/carlosalvarezh/EstructuraDatosAlgoritmos2/blob/main/images/Knapsack04.webp?raw=true" width="500" />
</p>

- Repita los elementos `i` del $1$ al $n$ y a través de cada capacidad `w` del `1` al `W`.

Para cada artículo `i` y cada capacidad `w` decide si incluir `i` en la mochila:

- Si el peso del artículo `weight[i]`es mayor que la capacidad actual `w`, no se puede incluir, por lo tanto `dp[i][w] = dp[i-1][w]`. De lo contrario, comprueba qué es más valioso:

  — Sin incluir el artículo: `dp[i][w]`

  — incluido el artículo: `value[i] + dp[i-1][w-weight[i]]`

Tome el máximo de estos dos valores para completar `dp[i][w]`

Para el primer artículo tenemos solo una pieza con un peso de $4 kg$ y un valor de $5$. Rellenaremos la celda correspondiente a $4 kg$ con su valor. El resto permanecerá sin cambios, ya que sólo tenemos este elemento para colocar.

<p float="center">
  <img src="https://github.com/carlosalvarezh/EstructuraDatosAlgoritmos2/blob/main/images/Knapsack05.webp?raw=true" width="550" />
</p>

En el segundo punto, consideramos los dos primeros puntos. Con una capacidad de $3 kg$ podemos colocar el segundo artículo ya que pesa $3 kg$ y le asignamos su valor de $2$ a la celda.

Para la siguiente capacidad ($4 kg$), comparamos el estado anterior del artículo anterior y el estado anterior del artículo actual, y procedemos con el valor de $5$ (máx.).

Además, para utilizar ambos elementos necesitamos una capacidad de $7 kg$, que no supera nuestra capacidad total $W$. Por tanto, asignamos el valor combinado de ambos elementos, que es $7$, a la celda correspondiente a la capacidad de $7 kg$.

<p float="center">
  <img src="https://github.com/carlosalvarezh/EstructuraDatosAlgoritmos2/blob/main/images/Knapsack06.webp?raw=true" width="550" />
</p>

Para el tercer artículo podemos colocarlo en la capacidad de $2 kg$. Luego comparamos el estado anterior y el estado anterior del elemento actual.

Para una capacidad de $5 kg$ colocamos el valor del primer artículo que es el valor mayor.

Con una capacidad de $6 kg$, podemos colocar tanto el primer como el tercer artículo con un valor total de $8$. Tenga en cuenta que no podemos colocar los tres artículos porque su peso combinado de $9 kg$ excede la capacidad máxima de $7 kg$.

<p float="center">
  <img src="https://github.com/carlosalvarezh/EstructuraDatosAlgoritmos2/blob/main/images/Knapsack07.webp?raw=true" width="550" />
</p>

Del mismo modo, podemos completar el resto.

<p float="center">
  <img src="https://github.com/carlosalvarezh/EstructuraDatosAlgoritmos2/blob/main/images/Knapsack08.webp?raw=true" width="550" />
</p>

Podemos decir que el valor máximo que podemos obtener es $10$. Para saber qué artículos incluye la mochila:

- Comience desde `dp[n][W]` y avance hacia atrás: si `dp[i][w]` no es igual a `dp[i-1][w]`, significa que ise incluyó el elemento. Reduzca el peso en consecuencia y continúe hasta llegar al inicio de la mesa.

$10$ está en la fila de arriba, nos movemos una fila arriba para continuar con el proceso. Significa que no incluimos el quinto elemento.

<p float="center">
  <img src="https://github.com/carlosalvarezh/EstructuraDatosAlgoritmos2/blob/main/images/Knapsack09.webp?raw=true" width="550" />
</p>

$10$ y $8$ son diferentes. Incluimos el $4to$ ítem. Restamos $1 kg$ y pasamos a la celda de $6 kg$.

<p float="center">
  <img src="https://github.com/carlosalvarezh/EstructuraDatosAlgoritmos2/blob/main/images/Knapsack10.webp?raw=true" width="550" />
</p>

$8$ y $5$ son diferentes. Incluimos el $3er$ artículo. Restamos $2 kg$ y movemos la celda de $4 kg$.

<p float="center">
  <img src="https://github.com/carlosalvarezh/EstructuraDatosAlgoritmos2/blob/main/images/Knapsack11.webp?raw=true" width="550" />
</p>

La celda de arriba tiene el mismo valor. Avanzamos hacia arriba. $5 \ne 0$, lo que significa que también incluimos el primer elemento.

<p float="center">
  <img src="https://github.com/carlosalvarezh/EstructuraDatosAlgoritmos2/blob/main/images/Knapsack12.webp?raw=true" width="550" />
</p>

In [1]:
def knapsack_max_value(weights, values, W):
    """
    Calculate the maximum value for the knapsack problem and return the DP table.

    :param weights: List of weights of the items
    :param values: List of values of the items
    :param W: Capacity of the knapsack
    :return: Maximum value and the DP table
    """
    n = len(weights)
    dp = [[0 for _ in range(W + 1)] for _ in range(n + 1)]

    # Fill the DP table
    for i in range(1, n + 1):
        for w in range(1, W + 1):
            if weights[i - 1] <= w:
                dp[i][w] = max(dp[i - 1][w], values[i - 1] + dp[i - 1][w - weights[i - 1]])
            else:
                dp[i][w] = dp[i - 1][w]

    max_value = dp[n][W]
    return max_value, dp


def find_included_items(weights, dp):
    """
    Find the items included in the optimal solution based on the DP table.

    :param weights: List of weights of the items
    :param dp: DP table computed by knapsack_max_value
    :return: List of included items (1-based index)
    """
    n = len(weights)
    W = len(dp[0]) - 1
    included_items = []
    i, w = n, W

    while i > 0 and w > 0:
        if dp[i][w] != dp[i - 1][w]:
            included_items.append(i)
            w -= weights[i - 1]
        i -= 1

    included_items.reverse()
    return included_items

# Test the functions with the given weights, values, and capacity
weights = [4, 3, 2, 1, 3]
values = [5, 2, 3, 2, 4]
W = 7

max_value, dp = knapsack_max_value(weights, values, W)
included_items = find_included_items(weights, dp)

max_value, included_items

(10, [1, 3, 4])

## Tablas Hash (diccionarios)

<p float="center">
  <img src="https://github.com/carlosalvarezh/EstructuraDatosAlgoritmos2/blob/main/images/PhoneBook.jpg?raw=true" width="250" />
</p>

### Introducción

En el ámbito de la programación dinámica, las [*tablas hash*](https://en.wikipedia.org/wiki/Hash_table) (o [*matriz asociativa*](https://en.wikipedia.org/wiki/Associative_array)), comúnmente implementadas como *diccionarios* en muchos lenguajes de programación, ofrecen una forma alternativa y eficiente de almacenar los resultados de los subproblemas. A diferencia de los *arreglos* o *matrices*, las *tablas hash* no requieren que los subproblemas estén secuencialmente indexados, lo que las hace ideales para ciertos tipos de problemas.

<p float="center">
  <img src="https://github.com/carlosalvarezh/EstructuraDatosAlgoritmos2/blob/main/images/FichaCatalografica.jpg?raw=true" width="250" />
</p>

Suponga que está en una gran biblioteca buscando un libro específico. En lugar de revisar cada estante y libro secuencialmente, utiliza el sistema de clasificación de la biblioteca, que asigna un número único a cada libro y lo coloca en un estante específico. Este número es como una *'clave'* que le permite encontrar rápidamente el libro deseado. Este proceso se asemeja mucho al concepto de *hashing* en las ciencias de la computación, donde una cantidad de datos se transforma en un valor más pequeño y fijo, llamado *'hash'*, facilitando la búsqueda y recuperación eficientes de la información.

<p float="center">
  <img src="https://github.com/carlosalvarezh/EstructuraDatosAlgoritmos2/blob/main/images/HashingAlgorithm.png?raw=true" width="350" />
</p>

El *hashing* se lleva a cabo mediante una [*función hash*](https://en.wikipedia.org/wiki/Hash_function), que convierte una entrada o *'clave'* (`key`) (como el título de un libro) en un *valor* (`value`) *hash* (equivalente al número único del libro en la biblioteca). Esta función está diseñada para ser rápida y eficiente, permitiendo el acceso casi instantáneo a los datos. En las *tablas hash*, utilizadas ampliamente en programación, los datos se almacenan en pares de *clave-valor*, `{key:value}`, donde la *clave* es una representación única del subproblema y el *valor* es la solución a ese subproblema. Esta metodología de almacenamiento y recuperación se emplea en diversas aplicaciones, desde sistemas de bases de datos hasta la optimización en programación dinámica, proporcionando una manera eficiente y rápida de manejar grandes conjuntos de datos.

<p float="center">
  <img src="https://github.com/carlosalvarezh/EstructuraDatosAlgoritmos2/blob/main/images/HashTable.png?raw=true" width="350" />
</p>


### Ventajas de Usar Tablas Hash sobre Arreglos

Un uso principal del *hash* es comparar la igualdad de dos archivos. Sin abrir dos archivos de documentos para compararlos palabra por palabra, los valores *hash* calculados de estos archivos permitirán al propietario saber inmediatamente si son diferentes. Los tipos de hash más comunes utilizados para las comprobaciones de integridad de archivos son [MD5](https://en.wikipedia.org/wiki/MD5), [SHA-2](https://en.wikipedia.org/wiki/SHA-2) y [CRC32](https://en.wikipedia.org/wiki/Cyclic_redundancy_check).

El *hash* también se utiliza para verificar la integridad de un archivo después de haber sido transferido de un lugar a otro. Para asegurarse de que el archivo transferido no esté alterado (dañado o modificado), un usuario puede comparar el valor *hash* de ambos archivos. Si son iguales, entonces el archivo transferido es una copia idéntica. 

En algunas situaciones, un archivo cifrado puede estar diseñado para no cambiar nunca el tamaño del archivo ni la fecha y hora de la última modificación (por ejemplo, archivos contenedores de unidades virtuales). En tales casos, sería imposible saber de un vistazo si dos archivos similares son diferentes o no, pero los valores hash distinguirían fácilmente estos archivos si son diferentes. 

Otras ventajas del uso del *hash* podrían ser:

- **Acceso Eficiente**: Las *tablas hash* proporcionan acceso de tiempo constante a los valores almacenados, lo que es especialmente útil cuando el número de subproblemas es grande.
<p>&nbsp;</p>

- **Flexibilidad en las Claves**: A diferencia de los arreglos, que se indexan numéricamente, las *tablas hash* permiten el uso de claves no numéricas o compuestas, lo que ofrece mayor flexibilidad en cómo se representan los subproblemas.
<p>&nbsp;</p>

- **Manejo de Subproblemas No Secuenciales**: Son ideales en situaciones donde los subproblemas no pueden ser secuencialmente indexados o cuando el rango de posibles subproblemas es muy amplio y disperso.


### Ejemplos de Programación Dinámica con Tablas Hash

- **Problema de la Subsecuencia Común Más Larga (LCS)**: En este problema, se puede utilizar una *tabla hash* para almacenar los resultados de los subproblemas definidos por diferentes pares de índices en dos secuencias. Las claves podrían ser tuplas que representan estos índices, y los valores serían las longitudes de la LCS para esos índices.
<p>&nbsp;</p>

- **Problema de la Suma de Subconjunto**: En el problema de la suma de subconjunto, se pueden almacenar en una *tabla hash* los resultados de los subproblemas que indican si es posible alcanzar una suma específica con un subconjunto de los números dados. Aquí, las claves serían las sumas objetivo y los índices que representan hasta qué punto se han considerado los números.
<p>&nbsp;</p>

- **Problemas de Optimización de Rutas**: En problemas de optimización de rutas, como el problema del vendedor viajero (TSP), se pueden usar tablas de hash para almacenar los costos mínimos de las rutas, donde las claves representan conjuntos de ciudades visitadas y la ciudad actual.

Las *tablas hash* aportan flexibilidad y eficiencia en el almacenamiento de subresultados en la programación dinámica. Permiten abordar problemas complejos donde las soluciones de los subproblemas no se ajustan naturalmente a una estructura secuencial, facilitando una implementación más intuitiva y eficiente. Su capacidad para manejar claves complejas y proporcionar acceso rápido las convierte en una herramienta valiosa en el arsenal de la programación dinámica.

### Componentes del hash

Hay tres componentes principales del hashing:

<p float="center">
  <img src="https://github.com/carlosalvarezh/EstructuraDatosAlgoritmos2/blob/main/images/HashFunction.PNG?raw=true" width="500" />
</p>

- ***Clave:*** una *clave* puede ser cualquier cadena o número entero que se introduzca como entrada en la *función hash*, la técnica que determina un *índice* o ubicación para el almacenamiento de un elemento en una estructura de datos. 
<p>&nbsp;</p>

- ***Función hash:*** la *función hash* recibe la *clave* de entrada y devuelve el *índice* de un elemento en una matriz llamada *tabla hash*. El *índice* se conoce como *índice hash*.
<p>&nbsp;</p>

- ***Tabla hash:*** la *tabla hash* es una estructura de datos que asigna *claves* a *valores* mediante una función especial llamada *función hash*. *Hash* almacena los datos de forma asociativa en una matriz donde cada valor de datos tiene su propio índice único.


<a id='Seccion_35'></a>
### Funcionamiento del Hash

Supongamos que tenemos un conjunto de cadenas `{"ab", "cd", "efg"}` y nos gustaría almacenarlo en una tabla. 

Nuestro principal objetivo aquí es buscar o actualizar los valores almacenados en la tabla rápidamente en $\mathcal{O}(1)$ tiempo y no nos preocupa el orden de las cadenas en la tabla. Entonces, el conjunto de cadenas dado puede actuar como una clave y la cadena misma actuará como el valor de la cadena, pero ¿cómo almacenar el valor correspondiente a la clave? 

- ***Paso 1:*** Sabemos que las *funciones hash* (que es una fórmula matemática) se utilizan para *calcular el valor hash* que actúa como índice de la estructura de datos donde se almacenará el valor. 
<p>&nbsp;</p>

- ***Paso 2:*** Entonces, asignemos:  
"a" = 1,  
"b"=2,  
"c"=3,  
... etc., a todos los caracteres alfabéticos. 
<p>&nbsp;</p>

- ***Paso 3:*** Por lo tanto, el valor numérico por suma de todos los caracteres de la cadena:  
"ab" = 1 + 2 = 3,   
"cd" = 3 + 4 = 7,  
"efg" = 5 + 6 + 7 = 18  
<p>&nbsp;</p>

- ***Paso 4:*** Ahora supongamos que tenemos una tabla de tamaño $7$ para almacenar estas cadenas. La *función hash* que se utiliza aquí es la suma de los caracteres dados por `clave mod Tamaño_tabla`. Podemos calcular la ubicación de la cadena en la matriz haciendo `sum(cadena) mod 7`.
<p>&nbsp;</p>

- ***Paso 5:*** Entonces almacenaremos   
“ab” en 3 mod 7 = 3,   
“cd” en 7 mod 7 = 0, y   
“efg” en 18 mod 7 = 4.

<p float="center">
  <img src="https://github.com/carlosalvarezh/EstructuraDatosAlgoritmos2/blob/main/images/HashTable01.png?raw=true" width="500" />
</p>

Esta técnica nos permite calcular la ubicación de una cadena determinada mediante el uso de una función hash simple y encontrar rápidamente el valor almacenado en esa ubicación. Por lo tanto, la idea del hash parece una excelente manera de almacenar pares (clave, valor) de datos en una tabla.

### ¿Qué es una función Hash?

La *función hash* crea un [mapeo](https://en.wikipedia.org/wiki/Map_(mathematics)) entre la *clave* y el *valor*, esto se realiza mediante el uso de fórmulas matemáticas conocidas como *funciones hash*. El resultado de la *función hash* se denomina *valor hash* o *hash*. El *valor hash* es una <ins>representación de la cadena de caracteres original, pero normalmente es más pequeña que la original</ins>.

Por ejemplo: considere una matriz como un mapa donde la clave es el índice y el valor es el valor en ese índice. Entonces, para una matriz `A`, si tenemos el índice `i` que será tratado como la *clave*, entonces podemos encontrar el *valor* simplemente mirando el valor en `A[i]`. 

### Tipos de funciones Hash

Hay muchas *funciones hash* que utilizan claves numéricas o alfanuméricas. Veamos algunas de ellas:

#### Método de División


- **Descripción**: Este método consiste en dividir la clave (k) por un número (generalmente un número primo) y usar el residuo como valor hash. La fórmula es: 

$$hash(k) = k \text{ mod} \text{ tamañoTabla}$$

`mod%` hace referencia a la operación [módulo](https://en.wikipedia.org/wiki/Modulo).
<p>&nbsp;</p>

- **Ventajas**:
  - Simple y rápido de calcular.
  - Si el tamaño de la tabla es un número primo, se puede reducir la probabilidad de colisiones.
<p>&nbsp;</p>

- **Desventajas**:
  - La elección del número divisor es crítica; un mal número puede aumentar las colisiones.
  - No es ideal si las claves tienen un patrón común (por ejemplo, si son múltiplos de un cierto número).
<p>&nbsp;</p>

- **Ejemplo**: Si la clave es `12345` y el tamaño de la tabla es `97` (un número primo), el hash sería `12345 % 97 = 53`.


#### Método del Cuadrado Medio

- **Descripción**: Este método toma la clave ($k$), la eleva al cuadrado y luego extrae una porción del resultado (generalmente del medio) como valor hash. La fórmula sería:

$$hash(k) = hash(k \times k)$$

<p>&nbsp;</p>

- **Ventajas**:
  - Reduce las colisiones si las claves están agrupadas o son similares.
  - Útil cuando no hay mucha información sobre la distribución de las claves.
<p>&nbsp;</p>

- **Desventajas**:
  - Más computacionalmente intensivo que otros métodos.
  - La extracción de la porción media debe ser cuidadosamente elegida para evitar patrones.
<p>&nbsp;</p>

- **Ejemplo**: Si la clave es `123`, el cuadrado es `15129`. Tomando los tres dígitos medios, el hash sería `512`.

#### Método de Plegado

- **Descripción**: Este método divide la clave, $k$, en partes iguales ($k1, k2, k3, \ldots, kn$), suma estas partes y luego utiliza el residuo de esta suma como valor hash. A veces se invierte cada otra parte antes de sumarlas.
<p>&nbsp;</p>

- **Ventajas**:
  - Bueno para claves que son largas o tienen muchas cifras.
  - Distribuye de manera más uniforme las claves que tienen patrones.
<p>&nbsp;</p>

- **Desventajas**:
  - Requiere más cálculos que el método de división.
  - Puede ser menos eficiente si las claves no son lo suficientemente grandes.
<p>&nbsp;</p>

- **Ejemplo**: Si la clave es `123456789`, se puede dividir en `[123, 456, 789]`, sumar estos números (`1368`) y luego hacer `1368 % tamañoTabla`.

#### Método de Multiplicación

- **Descripción**: Este método multiplica la clave por una constante fraccional $A$ (generalmente un número irracional, $0 \lt A \lt 1$), extrae la fracción decimal resultante y la multiplica por el tamaño de la tabla para obtener el hash. La fórmula es:

$$hash(k) = floor(M(kA mod 1))$$


<p>&nbsp;</p>

- **Ventajas**:
  - Menos sensible a patrones específicos en las claves que el método de división.
  - Funciona bien en una variedad de situaciones sin necesidad de mucha información previa sobre las claves.
<p>&nbsp;</p>

- **Desventajas**:
  - La elección de la constante fraccional es crucial para la eficiencia del método.
  - Ligeramente más complejo en cálculo que el método de división.
<p>&nbsp;</p>

- **Ejemplo**: Si la clave es `12345` y la constante es `0.618033` ([proporción áurea](https://en.wikipedia.org/wiki/Golden_ratio)), se calcula `12345 * 0.618033`, se toma la fracción decimal del resultado y se multiplica por el tamaño de la tabla.

Cada uno de estos métodos tiene sus propios casos de uso ideales y limitaciones. La elección del método depende de las características de las claves a ser "hasheadas" y de los requisitos específicos del sistema en el que se implementará la función hash.

### Propiedades de una buena función hash

Una buena *función hash* debe cumplir con varias propiedades clave para ser eficiente y efectiva en su uso, especialmente en estructuras de datos como las *tablas hash*. Estas propiedades aseguran que la *función hash* distribuya los datos de manera uniforme y reduzca la probabilidad de colisiones, entre otros aspectos importantes. Las principales propiedades son:

1. **Uniformidad**: La función debe distribuir las claves hash de manera uniforme por todo el espacio de hash. Esto significa que cada valor hash debe tener aproximadamente la misma probabilidad de ser generado, minimizando así las colisiones.
<p>&nbsp;</p>

2. **Determinismo**: La misma entrada siempre debe producir el mismo valor hash. Esto es crucial para la recuperación confiable de datos, ya que las búsquedas, inserciones y eliminaciones dependen de que una clave dada siempre genere el mismo hash.
<p>&nbsp;</p>

3. **Eficiencia**: La función debe ser capaz de calcular el hash de una clave rápidamente. La eficiencia en el cálculo del hash es esencial para mantener un alto rendimiento en operaciones de inserción, búsqueda y eliminación.
<p>&nbsp;</p>

4. **Minimización de Colisiones**: Aunque las colisiones son inevitables en cualquier función hash (debido al principio de los casilleros), una buena función hash debe minimizar la probabilidad de que dos claves diferentes produzcan el mismo hash.
<p>&nbsp;</p>

5. **Dispersión**: Pequeños cambios en la clave deben producir cambios significativos en el valor hash. Esto ayuda a asegurar que claves similares no resulten en valores hash cercanos o idénticos, reduciendo la formación de "clusters" en la tabla hash.
<p>&nbsp;</p>

6. **Seguridad (en contextos específicos)**: Para funciones hash utilizadas en criptografía, la seguridad es una preocupación clave. Esto incluye propiedades como resistencia a colisiones (difícil encontrar dos entradas diferentes con el mismo hash), resistencia a pre-imágenes (difícil encontrar una entrada que tenga un hash dado) y resistencia a la segunda pre-imagen (difícil encontrar otra entrada que tenga el mismo hash que una entrada dada).

Una función hash que posee estas propiedades será efectiva para una amplia gama de aplicaciones, desde estructuras de datos básicas hasta sistemas de seguridad avanzados.

### Complejidad cálculo valor hash

El orden de complejidad algorítmica de calcular el valor hash usando una función hash generalmente se espera que sea $\mathcal{O}(1)$, es decir, un tiempo constante. Esto significa que el tiempo que toma calcular el valor hash de una entrada no debería depender significativamente del tamaño de la entrada, sino que debería ser más o menos el mismo para cualquier entrada.

Hay que tener en cuenta lo siguiente:

1. **Longitud de la Entrada**: Aunque en teoría la complejidad es $\mathcal{O}(1)$, en la práctica, si la entrada es muy larga, el proceso de hashing puede tomar más tiempo. Sin embargo, este tiempo adicional suele ser insignificante en comparación con la longitud de la entrada.
<p>&nbsp;</p>

2. **Diseño de la Función Hash**: La complejidad puede variar dependiendo de la complejidad de la función hash en sí. Algunas funciones hash son más complejas que otras. Por ejemplo, las funciones hash criptográficas son más complejas y pueden no ser estrictamente $\mathcal{O}(1)$ debido a su diseño avanzado para garantizar la seguridad.
<p>&nbsp;</p>

3. **Colisiones**: El manejo de colisiones en la tabla hash no forma parte del cálculo del hash en sí, pero puede afectar la eficiencia general de las operaciones en la tabla hash. La resolución de colisiones (como el encadenamiento o el direccionamiento abierto) puede agregar complejidad adicional.

En resumen, mientras que el cálculo del valor hash en sí mismo es generalmente $\mathcal{O}(1)$, la eficiencia global de una operación que involucra hashing (como la inserción o búsqueda en una tabla hash) puede ser afectada por otros factores, como el manejo de colisiones y la longitud de la entrada.

### Problemas con el Hashing: Colisiones y Estrategias de Manejo

El hashing es una técnica poderosa en computación, pero no está exenta de desafíos. Uno de los problemas más significativos en el hashing es la ["colisión"](https://en.wikipedia.org/wiki/Hash_collision), que ocurre cuando dos claves diferentes producen el mismo valor hash. Dado que el espacio de hash es limitado y las claves pueden ser virtualmente ilimitadas, las colisiones son, en cierta medida, inevitables. Sin embargo, existen varias estrategias para manejarlas eficientemente.

Retomando el ejemplo de la [sección 3.5](#Seccion_35): Funcionamiento del Hash, la función hash que usamos es la suma de las letras, pero si examinamos la función hash de cerca, entonces se puede visualizar fácilmente el problema de que para diferentes cadenas la función hash comienza a generar el mismo valor hash. 

Por ejemplo: {`ab`, `ba`} ambos tienen el mismo valor hash y la cadena {`cd`,`be`} también genera el mismo valor hash, etc. Esto se conoce como colisión y crea problemas en la búsqueda. 

#### Colisión en Hashing

- **Descripción**: Una colisión ocurre cuando dos o más claves distintas son asignadas al mismo valor hash por la función hash. El proceso de hash genera un número pequeño para una clave grande, por lo que existe la posibilidad de que dos claves produzcan el mismo valor. La situación en la que la clave recién insertada se asigna a una ya ocupada y debe manejarse utilizando alguna tecnología de manejo de colisiones.

<p float="center">
  <img src="https://github.com/carlosalvarezh/EstructuraDatosAlgoritmos2/blob/main/images/Collision-in-Hashing.png?raw=true" width="500" />
</p>

- **Problema**: Las colisiones reducen la eficiencia de la tabla hash, ya que más de una clave necesita ser manejada en la misma posición de la tabla.

#### Estrategias para Manejar Colisiones

##### Encadenamiento

- **Descripción**: En esta técnica, cada posición de la tabla hash apunta a una lista de entradas que se han asignado a esa posición. Si se produce una colisión, simplemente se añade la nueva clave a la lista existente.
<p>&nbsp;</p>

- **Ventajas**: Simple de implementar; la tabla hash nunca se "llena", puede manejar más elementos que posiciones hash.
<p>&nbsp;</p>

- **Desventajas**: Las operaciones de búsqueda, inserción y eliminación pueden volverse menos eficientes a medida que las listas crecen.

***Ejemplo:*** Dada una función hash, insertar algunos elementos en la tabla hash utilizando un método de encadenamiento separado para la técnica de resolución de colisiones.

$$\text{Función hash} = clave \% 5$$

para los siguientes elementos: $12$, $15$, $22$, $25$ y $37$.

Para desarrollar el ejercicio de insertar estos elementos en una tabla hash usando la función hash `hash = clave % 5`, procederemos paso a paso. Consideraremos la resolución de colisiones para este ejemplo.

- ***Paso 1:*** Inicializamos una tabla hash con `5` posiciones (índices del `0` al `4`) ya que estamos utilizando `clave % 5` como nuestra función hash.

| Índice | Elemento |
|:------:|:--------:|
| 0      |          |
| 1      |          |
| 2      |          |
| 3      |          |
| 4      |          |

- ***Paso 2:*** Calculamos el hash para $12$: `12 % 5 = 2`. Insertamos $12$ en la posición `2`.

| Índice | Elemento |
|:------:|:--------:|
| 0      |          |
| 1      |          |
| 2      | $$12$$   |
| 3      |          |
| 4      |          |

- ***Paso 3:*** Calculamos el hash para $15$: `15 % 5 = 0`. Insertamos $15$ en la posición `0`.

| Índice | Elemento |
|:------:|:--------:|
| 0      | $$15$$   |
| 1      |          |
| 2      | $$12$$   |
| 3      |          |
| 4      |          |

- ***Paso 4:*** Calculamos el hash para $22$: `22 % 5 = 2`. Pero la posición `2` ya está ocupada por $12$, lo que resulta en una colisión. Para resolver esta colisión, podemos utilizar el método de encadenamiento, añadiendo $22$ en la misma posición que `12`.

| Índice | Elementos |
|:------:|:---------:|
| 0      | 15        |
| 1      |           |
| 2      | $$12 \rightarrow 22$$ |
| 3      |           |
| 4      |           |

- ***Paso 5:*** Calculamos el hash para $25$: `25 % 5 = 0`. Pero la posición `0` ya está ocupada por $15$, otra colisión. Usamos nuevamente el encadenamiento, añadiendo $25$ junto a $15$.

| Índice | Elementos   |
|:------:|:-----------:|
| 0      | $$15 \rightarrow 25$$ |
| 1      |                       |
| 2      | $$12 \rightarrow 22$$ |
| 3      |                       |
| 4      |                       |

- ***Paso 6:*** Calculamos el hash para $37$: `37 % 5 = 2`. La posición `2` ya tiene $12$ y $22$. Se agrega $37$ a la lista en la posición `2`.

| Índice | Elementos       |
|:------:|:--------:|
| 0      | $$15 \rightarrow 25$$        |
| 1      |                 |
| 2      | $$12 \rightarrow 22 \rightarrow 37$$  |
| 3      |                 |
| 4      |                 |

Así queda entonces la tabla hash final después de insertar todos los elementos y resolver las colisiones mediante el encadenamiento.

Este ejemplo demuestra cómo la función hash asigna elementos a posiciones específicas en una tabla hash y cómo el encadenamiento puede ser utilizado eficazmente para resolver colisiones en la inserción de elementos.

***Algoritmo:***

A seguir se plantea un algoritmo para resolver el ejemplo anterior. Este pseudocódigo realiza los siguientes pasos:

- `crearTablaHash`: Inicializa una tabla hash con un tamaño dado, creando una lista vacía en cada posición.
<p>&nbsp;</p>

- `hash`: Define una función hash que calcula el índice para una clave dada en la tabla hash.
<p>&nbsp;</p>

- `insertar`: Para cada elemento, calcula su índice utilizando la función hash y lo inserta en la lista correspondiente en la tabla hash.
<p>&nbsp;</p>

- `mostrarTablaHash`: Recorre la tabla hash y muestra los elementos en cada índice.

***Pseudocódigo:***

```pseudocode
función crearTablaHash(tamaño):
    tablaHash = arreglo de listas de tamaño 'tamaño'
    para cada índice en tablaHash:
        tablaHash[índice] = lista vacía
    retornar tablaHash

función hash(clave, tamañoTabla):
    retornar clave % tamañoTabla

función insertar(tablaHash, clave, tamañoTabla):
    índice = hash(clave, tamañoTabla)
    tablaHash[índice].añadir(clave)

función mostrarTablaHash(tablaHash):
    para cada índice en tablaHash:
        imprimir "Índice", índice, ":", tablaHash[índice]

# Algoritmo principal
tamañoTabla = 5
elementos = [12, 15, 22, 25, 37]
tablaHash = crearTablaHash(tamañoTabla)

para cada elemento en elementos:
    insertar(tablaHash, elemento, tamañoTabla)

mostrarTablaHash(tablaHash)
```
Una implementación en Python para el algoritmo puede ser:

In [None]:
class HashTable:
    def __init__(self, size):
        self.size = size
        self.table = [[] for _ in range(self.size)]

    def hash_function(self, key):
        return key % self.size

    def insert(self, key):
        hash_index = self.hash_function(key)
        self.table[hash_index].append(key)

    def display(self):
        for index, values in enumerate(self.table):
            print(f"Índice {index}: {values}")

# Algoritmo principal
tamaño_tabla = 5
elementos = [12, 15, 22, 25, 37]
tabla_hash = HashTable(tamaño_tabla)

for elemento in elementos:
    tabla_hash.insert(elemento)

tabla_hash.display()


##### Direccionamiento Abierto (Probing)

- **Descripción**: En lugar de almacenar todas las colisiones en una lista, el direccionamiento abierto busca otra posición en la propia tabla hash. Las técnicas incluyen el *sondeo lineal*, el *sondeo cuadrático* y el *doble hashing*.
<p>&nbsp;</p>

- **Ventajas**: No requiere estructuras de datos adicionales; puede ser más eficiente en memoria.
<p>&nbsp;</p>

- **Desventajas**: El clustering (acumulación de muchas claves en áreas específicas de la tabla) puede ser un problema, especialmente en el sondeo lineal.

1. ***Sondeo Lineal***

En el sondeo lineal, la *tabla hash* se busca secuencialmente comenzando desde la ubicación original del *hash*. Si la ubicación que obtenemos ya está ocupada, buscamos la siguiente ubicación.

- ***Algoritmo:***

```pseudocode
Calcule la clave hash: clave = dato % tamaño
Compruebe si hashTable[clave] está vacía. 
    Almacenar el valor directamente mediante hashTable[clave] = dato
Si el índice hash ya tiene algún valor, entonces
    verifique el siguiente índice usando clave = (clave+1) % tamaño
Verifique si el siguiente índice está disponible en hashTable[key] y luego almacene el valor. De lo contrario, intente con el siguiente índice.
Haga el proceso anterior hasta que encontremos el espacio.
```

***Ejemplo:*** Resolviendo el ejemplo anterior, con la función Hash: `hash = clave % 5`, y los elementos: $12$, $15$, $22$, $25$ y $37$, genere la tabla hash mediante el método de Direccionamiento Abierto con Sondeo Lineal para resolver las colisiones presentadas.

- ***Paso 1:*** Inicializamos una tabla hash con $5$ posiciones (índices del `0` al `4`) debido a la función hash `clave % 5`.

| Índice | Elemento |
|:------:|:--------:|
| 0      |          |
| 1      |          |
| 2      |          |
| 3      |          |
| 4      |          |

- ***Paso 2:*** Calculamos el hash para $12$: `12 % 5 = 2`. Insertamos $12$ en la posición `2`.

| Índice | Elemento |
|:------:|:--------:|
| 0      |          |
| 1      |          |
| 2      | 12       |
| 3      |          |
| 4      |          |

- ***Paso 3:*** Calculamos el hash para $15$: `15 % 5 = 0`. Insertamos $15$ en la posición $0$.

| Índice | Elemento |
|:------:|:--------:|
| 0      | 15       |
| 1      |          |
| 2      | 12       |
| 3      |          |
| 4      |          |

- ***Paso 4:*** Calculamos el hash para $22$: `22 % 5 = 2`. Pero la posición `2` ya está ocupada por `12`. Con sondeo lineal, probamos la posición `3`, que está libre.

| Índice | Elemento |
|:------:|:--------:|
| 0      | 15       |
| 1      |          |
| 2      | 12       |
| 3      | 22       |
| 4      |          |

- ***Paso 5:*** Calculamos el hash para $25$: `25 % 5 = 0`. La posición `0` está ocupada, así como la `1` y `2`. Sondeo lineal nos lleva a la posición `3`, pero está ocupada. Finalmente, la posición `4` está libre.

| Índice | Elemento |
|:------:|:--------:|
| 0      | 15       |
| 1      |          |
| 2      | 12       |
| 3      | 22       |
| 4      | 25       |

- ***Paso 6:*** Calculamos el hash para $37$: `37 % 5 = 2`. Las posiciones `2`, `3` y `4` están ocupadas, al igual que la `0`. Sondeo lineal nos lleva a la posición `1`, que está libre.

| Índice | Elemento |
|:------:|:--------:|
| 0      | 15       |
| 1      | 37       |
| 2      | 12       |
| 3      | 22       |
| 4      | 25       |

Este proceso muestra cómo se inserta cada elemento en la tabla hash, teniendo en cuenta las colisiones y resolviéndolas a través del sondeo lineal.

2. ***Sondeo cuadrático***

El sondeo cuadrático es un esquema de direccionamiento abierto para resolver colisiones *hash* en *tablas hash*. El sondeo cuadrático opera tomando el índice hash original y agregando valores sucesivos de un polinomio cuadrático arbitrario hasta que se encuentra una ubicación abierta.

Una secuencia de ejemplo que utiliza sondeo cuadrático es:

$$H + 1^2 , H + 2^2 , H + 3^2 , H + 4^2, \ldots, H + k^2$$

Este método también es conocido como el *método del cuadrado medio*, ya que en este método buscamos la $i^2$-ésima posición (o espacio) en la $i$-ésima iteración, donde $i = 0, 1, ..., n - 1$. Siempre comenzamos desde la ubicación hash original. Si dicha ubicación está ocupada, entonces revisamos las otras posiciones (o espacios).

- ***Algoritmo***  

Sea `hash(x)` el índice del espacio calculado utilizando la función hash y $n$ sea el tamaño de la tabla hash.

```pseudocode
Si el espacio hash(x) % n está lleno, entonces intentamos (hash(x) + 1^2 ) % n.  
Si (hash(x) + 1^2 ) % n también está lleno, entonces intentamos (hash(x) + 2^2 ) % n.
Si (hash(x) + 2^2 ) % n también está lleno, entonces intentamos (hash(x) + 3^2 ) % n.
Este proceso se repetirá para todos los valores de i hasta que se encuentre un espacio vacío.
```

***Ejemplo:*** Resolviendo el ejemplo anterior, con la función Hash: `hash = clave % 5`, y los elementos: $12$, $15$, $22$, $25$ y $37$, genere la tabla hash mediante el método de Direccionamiento Abierto con Sondeo Cuadrático para resolver las colisiones presentadas.

Para resolver el ejemplo con la función hash `hash = clave % 5` y los elementos 12, 15, 22, 25 y 37, utilizando el método de Direccionamiento Abierto con Sondeo Cuadrático, procederemos paso a paso. En el sondeo cuadrático, si hay una colisión, intentamos insertar en la posición `(hash + i^2) % tamaño_tabla`, donde `i` es el número de intento.

- ***Paso 1:*** Inicializamos una tabla hash con $5$ posiciones (índices del `0` al `4`) ya que estamos utilizando `clave % 5` como nuestra función hash.

| Índice | Elemento |
|:------:|:--------:|
| 0      |          |
| 1      |          |
| 2      |          |
| 3      |          |
| 4      |          |

- ***Paso 2:*** Calculamos el hash para $12$: `12 % 5 = 2`. Insertamos $12$ en la posición `2`.

| Índice | Elemento |
|:------:|:--------:|
| 0      |          |
| 1      |          |
| 2      | 12       |
| 3      |          |
| 4      |          |

- ***Paso 3:*** Calculamos el hash para $15$: `15 % 5 = 0`. Insertamos $15$ en la posición `0`.

| Índice | Elemento |
|:------:|:--------:|
| 0      | 15       |
| 1      |          |
| 2      | 12       |
| 3      |          |
| 4      |          |

- ***Paso 4:*** Calculamos el hash para $22$: `22 % 5 = 2`. La posición `2` ya está ocupada, lo que resulta en una colisión. Intentamos con `(2 + 1^2) % 5 = 3`. La posición `3` está libre, por lo que insertamos $22$ ahí.

| Índice | Elemento |
|:------:|:--------:|
| 0      | 15       |
| 1      |          |
| 2      | 12       |
| 3      | 22       |
| 4      |          |

- ***Paso 5:*** Calculamos el hash para $25$: `25 % 5 = 0`. La posición `0` ya está ocupada. Intentamos con `(0 + 1^2) % 5 = 1`. La posición `1` está libre, por lo que insertamos $25$ ahí.

| Índice | Elemento |
|:------:|:--------:|
| 0      | 15       |
| 1      | 25       |
| 2      | 12       |
| 3      | 22       |
| 4      |          |

- ***Paso 6:*** Calculamos el hash para $37$: `37 % 5 = 2`. La posición `2` está ocupada, así como las posiciones `(2 + 1^2) % 5 = 3` y `(2 + 2^2) % 5 = 0`. Probamos con `(2 + 3^2) % 5 = 4`. La posición `4` está libre, por lo que insertamos $37$ ahí.

| Índice | Elemento |
|:------:|:--------:|
| 0      | 15       |
| 1      | 25       |
| 2      | 12       |
| 3      | 22       |
| 4      | 37       |


3. ***Doble Hash***

Se deja al estudiante la revisión de este tema. Plantee el ejemplo que se ha vanido trabajando y resuélvalo.

##### Rehashing

- **Descripción**: Cuando la tabla hash se vuelve demasiado llena, se crea una nueva tabla hash, generalmente más grande, y todos los elementos existentes se reinsertan usando la función hash.
<p>&nbsp;</p>

- **Ventajas**: Reduce la probabilidad de colisiones y el clustering.
<p>&nbsp;</p>

- **Desventajas**: El proceso de rehashing puede ser costoso en términos de tiempo y recursos.

En resumen, aunque las colisiones son un desafío inherente al hashing, existen múltiples estrategias efectivas para manejarlas. La elección de la estrategia adecuada depende de varios factores, como el tamaño de los datos, la frecuencia de las operaciones y las limitaciones de memoria. Manejar correctamente las colisiones es crucial para mantener la eficiencia y la eficacia de las tablas hash en aplicaciones de computación.

### Ejercicios

- Implemente una tabla hash para almacenar nombres de estudiantes y sus ID. Utilice el encadenamiento para manejar colisiones. Pruebe la inserción de dos estudiantes cuyos nombres produzcan el mismo valor hash.

- Cree una tabla hash para almacenar y recuperar contraseñas basadas en nombres de usuario. Implemente el sondeo cuadrático para resolver colisiones y pruebe con varios nombres de usuario que generen colisiones.

- Desarrolle una tabla hash para almacenar códigos de productos y sus precios. Implemente el rehashing para ajustar el tamaño de la tabla cuando el factor de carga (número de elementos/ tamaño de la tabla) supere un umbral predefinido.