# Programación 2 - TUIA
---
## Trabajo Práctico - Tabla Hash




- Comisión: 2
- Alvarez Gustavo
- Adriano Marzol

### Implementación de Tabla Hash para control de stock

**Objetivo:** En este trabajo, debe implementar un programa que ayude a llevar el control de stock de un supermercado.

**Descripción del problema:** Implemente el programa para el control de stock de un supermercado usando una Tabla Hash. La misma se utilizará para almacenar información sobre los productos disponibles en el supermercado y la cantidad de unidades disponibles. Se debe permitir la inserción, eliminación y búsqueda de productos. La Tabla Hash debe resolver sus colisiones con encadenamiento. Además se deben implementar algunas funciones de estadísticas de uso de la tabla.

Tenga en cuenta que el supermercado vende normalmente más de $40000$ productos. Cada producto tiene un código alfanumérico de $10$ caracteres, por ejemplo "AAN1235465", "123ABCDE12".

### Requerimientos
- Escriba una función apropiada para transformar las claves del problema a valores numéricos.
- Implemente una tabla hash para almacenar los productos disponibles. Debera:

  - incluir el método constructor.
  - utilizar una función hash apropiada - puede elegir el método del resto, el método de la multiplicación o bien proponer otro que haya investigado.
  - debe permitir la inserción, eliminación y búsqueda de productos en la tabla hash.
  - la tabla hash debe soportar resolución de colisiones mediante encadamiento, puede utilizar para ello una lista enlazada o una lista de Python, a su preferencia.
  
- Además debe implementar los siguientes métodos:

  - `__len__` Este método sobrecarga la función incluida `len`. Debe devolver la cantidad de elementos insertados en la tabla.
  - `_load_factor`: Este método debe calcular y devolver el factor de carga de la tabla hash.
  - `_longest_list`: Este método debe calcular y devolver el tamaño de la lista más larga.

- **Asegúrese de respetar la interfaz de los tests**, el TP será probado con ese formato.

### Entregables
El ejercicio debe ser resuelto de manera individual y deberá entregarse por medio del CampusV de la materia. Se debe entregar este Colab completo y funcional, con las siguientes preguntas contestadas en una celda de texto:
1. ¿Qué eligió como función de hash? Explique por qué considera que tomó una buena decisión.
2. ¿Qué valor eligió como tamaño? Explique por qué considera que tomó una buena decisión.
3. ¿Puede ser un problema utilizar un tamaño de tabla fijo? Justifique.
4. ¿Cuál es la diferencia entre un diccionario y una tabla hash?
5. ¿Utilizó algún invariante de objeto? ¿Por qué?

### Criterios de evaluación
- Funcionamiento adecuado del programa y cumplimiento de los requisitos establecidos basado en el cumplimiento de tests de caja negra.
- Claridad y organización del código. Recuerde utilizar comentarios.
- Calidad del informe entregado.

In [None]:
from typing import Any

class Clave():
    """
    Almacena la clave real a ser hasheada,
    usando la representación que se desee,
    y encapsula el algoritmo de hash elegido.
    """

    def __init__(self, key: str):
        self.key = key


    def to_int(self) -> int:
        """
        Esta función debe convertir el valor de la key en un número.
         """
        # B es la base del conjunto de caracteres (las 27 letras del abecedario + los dígitos del 0-9)
        B = 37
        k = 0
        codigo = self.key

        for i, char in enumerate(codigo):   # Se recorren los caracteres del código alfanumérico y se guarda su índice
            k += ord(char) * (B**i)     # ord le asigna a cada caracter su código ASCII

        return k    # Se devuelve un número entero que será usado por la función hash para establecer las posiciones en la tabla


    def __eq__(self, other) -> bool:
        """
        Decide si dos claves son iguales
        """
        return self.key == other.key


In [None]:
# No es necesario cambiar nada en esta celda! Esta celda solo define la interfaz
# del TAD Diccionario.
from typing import Any

class Diccionario():
    """
    Interfaz del TAD Diccionario
    - insert(key, value) - Inserta un elemento con clave key y valor value en el diccionario.
        Si la clave ya se encuentra en el diccionario, debe reemplazar el value anterior por el nuevo.
    - search(key) - Devuelve el value asociado con la clave key, o muestra un mensaje de error si la clave no se encuentra.
    - delete(key) - Elimina el elemento con clave key del diccionario.
    """

    def insert(self, key: Clave, data: Any) -> None:
        pass

    def search(self, key: Clave) -> Any:
        pass

    def delete(self, key: Clave) -> None:
        pass


In [None]:
class Node():   # Clase Node para poder armar las listas enlazadas que resuelven las colisiones
    def __init__(self, key = None, data = None, next = None):
        self.key = key
        self.data = data
        self.next = next

class HashTable(Diccionario):
    """
    Implementación de Diccionario con tabla hash
    de tamaño fijo y resolución de colisiones
    por encadenamiento
    """

    def __init__(self, size: int):
        """Inicializa una tabla de tamaño 'size'."""

        self.size = size
        self.h = self.hashFunction
        self.T = [None] * self.size


    def hashFunction(self, key):
        return key.to_int() % self.size     # Se usa el método del resto como función hash


    def insert(self, key: Clave, data: Any) -> None:

        index = self.h(key)     # Se llama a la función hash para asignar una posición al elemento
        nodo = Node (key, data)     # Se instancia un nodo que contiene el código del producto y su stock

        if self.T[index] is None:   # Si la posición de la tabla está vacía
            self.T[index] = nodo    # Entonces el nodo ocupa esa posición
        else:                       # Si no está vacía hay una colisión
            nodo.next = self.T[index]
            self.T[index] = nodo    # Se agrega el nuevo nodo al principio de la lista enlazada


    def search(self, key: Clave) -> Any | None:

        index = self.h(key)     # Se llama a la función hash para saber su posición y buscar el elemento
        nodoActual = self.T[index]  # Se empieza a buscar en el nodo en la posición actual

        while nodoActual is not None:   # Se recorren las listas enlazadas
            if nodoActual.key.key == key.key:   # Si el código coincide con el buscado
                return nodoActual.data  # Se retorna el stock correspondiente
            nodoActual = nodoActual.next    # Sino se pasa al nodo siguiente

        return None  # Si el producto no se encontró en la tabla


    def delete(self, key: Clave) -> None:

        index = self.h(key)     # Se llama a la función hash para saber la posición donde eliminar el elemento
        nodoActual = self.T[index]  # Se empieza a buscar el nodo en la posición actual
        nodoAnt = None  # Se necesita un nodo anterior para hacer la eliminación en la lista enlazada

        while nodoActual is not None:   # Se recorren las listas enlazadas
            if nodoActual.key == key:   # Si encuentra el código, lo elimina quitándole su referencia
                if nodoAnt is None:  # Si nodoAnt es None, el nodo actual es el primero de la lista
                    self.T[index] = nodoActual.next
                else:       # Sino se actualiza el puntero del nodo anterior para saltear el nodo actual
                    nodoAnt.next = nodoActual.next
                return nodoActual.data  # Se sale indicando el elemento eliminado

            nodoAnt = nodoActual    # Si el código no coincide se avanza al siguiente nodo
            nodoActual = nodoActual.next

        return None     # El código del producto no se encontró en la tabla


    def __len__(self) -> int:
        """Devuelve la cantidad de elementos de la tabla."""

        contador = 0    # Inicia un contador en 0
        for index in range(self.size):  # Recorre las posiciones de la tabla
            nodoActual = self.T[index]
            while nodoActual is not None:   # Recorre la lista enlazada de cada índice
                contador += 1       # Incrementa el contador por cada elemento de la lista
                nodoActual = nodoActual.next    # Pasa al siguiente nodo
        return contador     # Devuelve el valor del contador


    def _load_factor(self) -> float:
        """Devuelve el factor de carga de la tabla."""

        total_elementos = len(self)
        return total_elementos / self.size


    def _longest_list(self) -> int:
        """Devuelve la longitud de la lista mas larga de la tabla."""

        max_len = 0     # Inicia una variable para guardar la lista más larga
        for index in range(self.size):  # Recorre las posiciones de la tabla
            nodoActual = self.T[index]
            length = 0      # Inicia otra variable para guardar la longitud de la lista en el índice actual
            while nodoActual is not None:   # Recorre la lista enlazada de cada índice
                length += 1
                nodoActual = nodoActual.next
            max_len = max(max_len, length)  # Actualiza la longitud máxima si la longitud actual es mayor
        return max_len  # Devuelve la máxima longitud


    def __str__(self) -> str:
        """
        Mostrar la cantidad de elementos de la tabla (__len__), el factor de carga (_load_factor)
        y la longitud de la lista mas larga (_longest_list)
        """
        total_elementos = len(self)
        factor_carga = self._load_factor()
        lista_mas_larga = self._longest_list()

        result = f"Cantidad de productos: {total_elementos} || Factor de carga: {factor_carga:.2f} || Longitud de la lista más larga: {lista_mas_larga}"

        return result


## Código de Prueba

La siguiente celda deberia funcionar como un test básico de funcionamiento. Si su implementación tiene sentido, debería poder correr la siguiente celda sin problemas. En caso de que la prueba funcione, ejecutar el siguiente código no imprime nada. En caso de problemas, mostrara un error.

**Nota**: El funcionamiento de este código no quiere decir que la solución sea correcta. La prueba es muy básica ya que solo prueba insertar y eliminar un elemento.

**Nota: La instrucción `assert`**: El uso de assert en Python nos permite realizar comprobaciones. Si la expresión contenida dentro del mismo es False, se lanzará un error, más concretamente un `AssertionError`. Por ejemplo, `assert 1==2` nos daría un `AssertionError`. Puede leer más sobre esta instrucción en [el libro de Python](https://ellibrodepython.com/assert-python).



**ATENCIÓN: NO MODIFIQUE ESTA CELDA** Si desea hacer más pruebas, hagalo en una celda nueva.

In [None]:
from random import choice, randrange

def generar_clave_random() -> Clave:
  """
  Genera una clave alfanumerica de 10 digitos al azar
  """
  chars = "1234567890QWERTYUIOPASDFGHJKLZXCVBNM"
  string = "".join(choice(chars) for _ in range(10))
  return Clave(string)

def generar_valor_random() -> int:
  """
  Devuelve un valor al azar entre 0 y 100 millones
  """
  return randrange(0, 100_000_000)

def prueba_de_funcionamiento(diccionario: Diccionario):
  # assert rompe el programa si la condición es falsa
  # esto es útil para verificar cosas que deberían ser ciertas

  clave = generar_clave_random()
  valor = generar_valor_random()

  diccionario.insert(clave, valor)

  assert len(diccionario) == 1

  assert diccionario.search(clave) == valor

  diccionario.delete(clave)

  assert len(diccionario) == 0

# Para probar esto, primero implemente to_int en Celda y la clase HashTable
prueba_de_funcionamiento(HashTable(100))

# Pruebas adicionales

### Método insert

In [None]:
tabla_hash_1 = HashTable(60037)     # Se crea una tabla hash con 60037 posiciones

for _ in range(40000):      # Se generan e insertan 40000 códigos de productos y sus cantidades de stock
    clave = generar_clave_random()
    valor = generar_valor_random()
    tabla_hash_1.insert(clave, valor)  # Se insertan en la tabla hash

In [None]:
str(tabla_hash_1)   # Estadísticas de la tabla hash

'Cantidad de productos: 40000 || Factor de carga: 0.67 || Longitud de la lista más larga: 6'

In [None]:
len(tabla_hash_1)

40000

In [None]:
tabla_hash_1._load_factor()

0.666255808917834

In [None]:
tabla_hash_1._longest_list()

6

### Método search

In [None]:
"""Se crea otra tabla hash más pequeña con 100 posiciones y 70 productos
para poder ver el contenido de todos sus elementos con sus índices"""

tabla_hash_2 = HashTable(100)

for _ in range(70):
    clave = generar_clave_random()
    valor = generar_valor_random()
    tabla_hash_2.insert(clave, valor)  # Se llama al método 'insert'

In [None]:
"""Esta función muestra todos los elementos de la tabla.
Los índices que se repiten son las posiciones donde hubo colisiones"""

def ver_contenido(tabla_hash_2: Diccionario):
    for index, nodo in enumerate(tabla_hash_2.T):   # Se recorren todas las posiciones de la tabla
        nodoActual = nodo
        while nodoActual is not None:   # Se recorren las listas enlazadas generadas por las colisiones
            print(f"Indice: {index}, Producto: {nodoActual.key.key}, Stock: {nodoActual.data}")
            nodoActual = nodoActual.next

ver_contenido(tabla_hash_2)


Indice: 0, Producto: YTGF6F1RZ1, Stock: 62393236
Indice: 0, Producto: 45L2CKRU5K, Stock: 85737073
Indice: 0, Producto: HU0M5EIV0I, Stock: 28825446
Indice: 1, Producto: 0EKH6I80KS, Stock: 72318905
Indice: 1, Producto: LS8FE4IAQ4, Stock: 73884931
Indice: 4, Producto: F3XMWF4E8X, Stock: 78925393
Indice: 4, Producto: WVZW5CKR8A, Stock: 8227683
Indice: 4, Producto: 9QCQ4GOBSO, Stock: 49454403
Indice: 5, Producto: AT1ZCMJGY3, Stock: 73859836
Indice: 5, Producto: OYWF79ZFKI, Stock: 43491068
Indice: 7, Producto: RQIF1GHC6L, Stock: 25061897
Indice: 8, Producto: KZPBR9H8BL, Stock: 56419517
Indice: 9, Producto: 7ODCO08212, Stock: 3995147
Indice: 14, Producto: JFOTE0WI9E, Stock: 44473489
Indice: 16, Producto: KDOVNB8G81, Stock: 57128307
Indice: 18, Producto: TUVZR6CRDT, Stock: 8416343
Indice: 18, Producto: 40JQRTWTQU, Stock: 37599555
Indice: 19, Producto: OF0VD18U7K, Stock: 48593592
Indice: 25, Producto: RDGSKFBKV9, Stock: 90588001
Indice: 27, Producto: GCZ7TD9HTW, Stock: 11735892
Indice: 27, Prod

In [None]:
"""En la variable 'codigo_buscado' se reemplaza por el código de producto
que se busca, generado por la función 'ver_contenido' en la celda anterior"""

codigo_buscado = '046C99XXKY'
clave = Clave(codigo_buscado)  # Se crea una instancia de Clave con el código buscado
buscado = tabla_hash_2.search(clave) # Se llama al método 'search'

if buscado is not None:   # Se verifica que el código esté en la tabla hash
    print(f"Producto: {codigo_buscado}, Stock: {buscado}")
else:
    print(f"Producto no encontrado: {codigo_buscado}")


Producto: 046C99XXKY, Stock: 86410515


### Método Delete

In [None]:
len(tabla_hash_2)   # Esta es la cantidad de elementos antes de eliminar

70

In [None]:
"""En la variable 'codigo_a_eliminar' se coloca cualquier código de producto
de la tabla generada por la función 'ver_contenido' en una celda anterior"""

codigo_a_eliminar = 'O5LBDVNFAF'
clave = Clave(codigo_a_eliminar)    # Crea una instancia de Clave con el código a eliminar
eliminado = tabla_hash_2.delete(clave)  # Se llama al método 'delete'

if eliminado is not None:   # Se verifica que el código esté en la tabla hash
    print(f"Producto eliminado: {codigo_a_eliminar}")
else:
    print(f"Producto no encontrado: {codigo_a_eliminar}")

Producto eliminado: O5LBDVNFAF


In [None]:
len(tabla_hash_2)   # Cantidad de productos que quedaron después de la eliminación

69

# Preguntas
1. ¿Qué eligió como función de hash? Explique por qué considera que tomó una buena decisión.
2. ¿Qué valor eligió como tamaño? Explique por qué considera que tomó una buena decisión.
3. ¿Puede ser un problema utilizar un tamaño de tabla fijo? Justifique.
4. ¿Cuál es la diferencia entre un diccionario y una tabla hash?
5. ¿Utilizó algún invariante de objeto? ¿Por qué?

1. Se decidió utilizar como función hash el método del resto debido a que calcula el valor hash de manera simple, en poco tiempo y distribuye equitativamente las posiciones en la tabla. Es  especialmente útil cuando se trabaja con valores enteros positivos porque los índices generados siempre están en el rango de la tabla hash.

2. El valor elegido como tamaño de la tabla es 60037 debido a que se espera el ingreso de  más de 40000 productos por lo que el factor de carga se encontrará en el rango de entre 0.6 y 0,75. Además, 60037 es un número primo, eso asegura que tenga menos divisores, por lo que el método del resto podrá distribuir de manera uniforme las posiciones en la tabla.

3. Utilizar un tamaño de tabla fijo puede ser un problema ya que si la cantidad de elementos se acerca al tamaño de la tabla habrá mas probabilidades de colisiones, por lo que habría que hacer un re-hashing

4. Un diccionario es un tipo abstracto de datos, que puede ser implementado de diferentes maneras. La tabla hash es una estructura de datos, es decir, una de las formas de implementar un tad diccionario a través de una función hash que asigna las posiciones correspondientes en la tabla a cada uno de los elementos.

5. Si, se utilizó una invariante de objeto en el método 'to_int' de la clase Clave, donde se define la constante B = 37 como la base de los posibles caracteres que puede tomar el código de producto, formado por las 27 letras del abecedario y los 10 números del 0 al 0.
El hecho de que las claves estén formadas por 10 dígitos alfanuméricos donde las letras son solo mayúsculas también podrían ser invariantes, sin embargo como los códigos de productos y la cantidad de stock se establecen automáticamente con las 2  que se encargan de limitar las opciones sin necesidad de validaciones, se decidió que no son invariantes.