# Diccionarios (HashMap)

**Curso:** Estructuras de Datos (Ingenier√≠a de Sistemas)

**Prop√≥sito:** Comprender y aplicar las ideas clave del tema, analizando complejidad y usos pr√°cticos.

### Objetivos de aprendizaje
- Reconocer el modelo de datos y operaciones fundamentales.
- Analizar la complejidad temporal y espacial de las operaciones clave.
- Implementar y probar funciones en Python con casos de uso reales.
- Comparar ventajas y limitaciones frente a alternativas.


### Teor√≠a esencial

Mapeo clave‚Üívalor basado en tabla hash. 
Operaciones promedio O(1) (peor caso O(n)). Claves deben ser hashables/inmutables.

### Gu√≠a de estudio
- Identifica operaciones fundamentales y su costo asint√≥tico.
- Observa invariante(s) de la estructura (lo que siempre debe cumplirse).
- Relaciona la estructura con patrones de uso en software (colas de trabajo, caches, planificadores, etc.).

### Implementaci√≥n base (desde el archivo `.py`)
El siguiente bloque contiene el c√≥digo original.

In [None]:
print('*** Diccionarios en Python ***')

# Creamos un dict de persona con clave y valor
persona = {
    'nombre': 'Sergio',
    'edad': 30,
    'ciudad': 'M√©xico'
}
print(f'Diccionario de persona: {persona}')

# Acceder a los elementos del diccionario
print(f'Nombre: {persona['nombre']}')
print(f'Edad: {persona.get('edad')}')
print(f'Ciudad: {persona.get('ciudad')}')

### Pruebas r√°pidas
Usa estos ejemplos para verificar comportamientos b√°sicos. Ajusta seg√∫n tus funciones.

In [2]:
# Ejercicio 1: Pruebas unitarias con pytest para operaciones de diccionario
# Las pruebas est√°n organizadas en archivos separados siguiendo las mejores pr√°cticas

import sys
import os

# Agregar el directorio tests al path para importar los m√≥dulos de prueba
tests_path = os.path.abspath('../../tests')
if tests_path not in sys.path:
    sys.path.insert(0, tests_path)

# Importar las clases y ejecutar pruebas r√°pidas sin pytest
try:
    from test_dict_ops import DiccionarioPersona, DiccionarioSeguro
    
    print("=== Ejercicio 1: Pruebas Unitarias ===")
    print("‚úì Archivos de prueba creados en: ppython_sda/tests/")
    print("  - test_dict_ops.py: Pruebas completas con pytest")
    print("  - run_dict_smoke_tests.py: Pruebas r√°pidas sin pytest")
    
    # Ejecutar algunas pruebas de demostraci√≥n
    print("\n--- Demostraciones r√°pidas ---")
    
    # Test 1: Operaciones b√°sicas
    persona = DiccionarioPersona(nombre="Ana", edad=25)
    persona.agregar("ciudad", "Bogot√°")
    print(f"‚úì Test agregar: {persona.obtener('ciudad')} == 'Bogot√°'")
    
    # Test 2: Actualizaci√≥n
    persona.actualizar("edad", 26)
    print(f"‚úì Test actualizar: {persona.obtener('edad')} == 26")
    
    # Test 3: Eliminaci√≥n
    resultado = persona.eliminar("ciudad")
    print(f"‚úì Test eliminar: {resultado} == True, ciudad eliminada")
    
    # Test 4: Existencia
    existe_nombre = persona.existe("nombre")
    existe_telefono = persona.existe("telefono")
    print(f"‚úì Test existe: nombre={existe_nombre}, telefono={existe_telefono}")
    
    # Test 5: Estad√≠sticas de diccionario seguro
    dict_seguro = DiccionarioSeguro(max_size=5)
    dict_seguro.agregar_con_validacion("usuario1", {"id": 1, "activo": True})
    dict_seguro.buscar_con_estadisticas("usuario1")
    stats = dict_seguro.obtener_estadisticas()
    print(f"‚úì Test estad√≠sticas: {stats['operaciones_insercion']} inserci√≥n, {stats['operaciones_busqueda']} b√∫squeda")
    
    print(f"\n‚úì Todas las demostraciones pasaron exitosamente!")
    print(f"‚úì Total de m√©todos probados: 8+")
    print(f"‚úì Clases implementadas: DiccionarioPersona, DiccionarioSeguro")
    
except ImportError as e:
    print(f"Error importando m√≥dulos de prueba: {e}")
    print("Aseg√∫rate de que los archivos test_dict_ops.py est√©n en la carpeta tests/")
except Exception as e:
    print(f"Error ejecutando pruebas: {e}")

print("\n=== Ejecutar pruebas completas ===")
print("Para ejecutar todas las pruebas con pytest:")
print("  cd ppython_sda/")
print("  pytest tests/test_dict_ops.py -v")
print("\nPara ejecutar pruebas r√°pidas sin pytest:")
print("  cd ppython_sda/tests/")
print("  python run_dict_smoke_tests.py")

=== Ejercicio 1: Pruebas Unitarias ===
‚úì Archivos de prueba creados en: ppython_sda/tests/
  - test_dict_ops.py: Pruebas completas con pytest
  - run_dict_smoke_tests.py: Pruebas r√°pidas sin pytest

--- Demostraciones r√°pidas ---
‚úì Test agregar: Bogot√° == 'Bogot√°'
‚úì Test actualizar: 26 == 26
‚úì Test eliminar: True == True, ciudad eliminada
‚úì Test existe: nombre=True, telefono=False
‚úì Test estad√≠sticas: 1 inserci√≥n, 1 b√∫squeda

‚úì Todas las demostraciones pasaron exitosamente!
‚úì Total de m√©todos probados: 8+
‚úì Clases implementadas: DiccionarioPersona, DiccionarioSeguro

=== Ejecutar pruebas completas ===
Para ejecutar todas las pruebas con pytest:
  cd ppython_sda/
  pytest tests/test_dict_ops.py -v

Para ejecutar pruebas r√°pidas sin pytest:
  cd ppython_sda/tests/
  python run_dict_smoke_tests.py


### Complejidad (an√°lisis informal)
Completa esta tabla de forma cr√≠tica, justificando cada costo.

| Operaci√≥n | Mejor caso | Promedio | Peor caso | Nota |
|---|---|---|---|---|
| Inserci√≥n (dict[key] = value) | O(1) | O(1) | O(n) | Peor caso cuando hay muchas colisiones hash |
| B√∫squeda (dict[key] o dict.get(key)) | O(1) | O(1) | O(n) | Peor caso con colisiones hash extremas |
| Eliminaci√≥n (del dict[key]) | O(1) | O(1) | O(n) | Peor caso con colisiones hash extremas |
| Verificar existencia (key in dict) | O(1) | O(1) | O(n) | Basada en funci√≥n hash |
| Obtener claves (dict.keys()) | O(1) | O(1) | O(1) | Retorna vista, no copia |
| Obtener valores (dict.values()) | O(1) | O(1) | O(1) | Retorna vista, no copia |
| Iterar sobre items | O(n) | O(n) | O(n) | Debe visitar todos los elementos |
| Tama√±o (len(dict)) | O(1) | O(1) | O(1) | Python mantiene contador interno |

**Justificaciones:**
- **O(1) promedio**: Las funciones hash de Python est√°n bien dise√±adas para distribuir uniformemente las claves
- **O(n) peor caso**: Cuando todas las claves tienen el mismo hash (colisi√≥n extrema), se comporta como lista enlazada
- **Redimensionamiento**: Python redimensiona autom√°ticamente para mantener factor de carga bajo 2/3

In [None]:
# Ejercicio 2: Medici√≥n emp√≠rica de tiempos con timeit
import timeit
import matplotlib.pyplot as plt
import random
import string

def generar_diccionario(n):
    """Genera un diccionario con n elementos aleatorios"""
    return {f'clave_{i}': random.randint(1, 1000) for i in range(n)}

def generar_clave_aleatoria():
    """Genera una clave aleatoria"""
    return ''.join(random.choices(string.ascii_letters, k=10))

# Tama√±os de diccionarios para probar
tama√±os = [100, 500, 1000, 5000, 10000, 50000]
operaciones = ['insercion', 'busqueda', 'eliminacion']
tiempos = {op: [] for op in operaciones}

print("Midiendo tiempos de operaciones en diccionarios...")
print("Tama√±o\tInserci√≥n(Œºs)\tB√∫squeda(Œºs)\tEliminaci√≥n(Œºs)")
print("-" * 60)

for n in tama√±os:
    # Crear diccionario base
    dict_base = generar_diccionario(n)
    
    # Medir inserci√≥n
    def test_insercion():
        d = dict_base.copy()
        clave = generar_clave_aleatoria()
        d[clave] = random.randint(1, 1000)
    
    tiempo_insercion = timeit.timeit(test_insercion, number=1000) * 1000  # microsegundos
    tiempos['insercion'].append(tiempo_insercion)
    
    # Medir b√∫squeda
    claves_existentes = list(dict_base.keys())
    def test_busqueda():
        clave = random.choice(claves_existentes)
        _ = dict_base.get(clave)
    
    tiempo_busqueda = timeit.timeit(test_busqueda, number=1000) * 1000
    tiempos['busqueda'].append(tiempo_busqueda)
    
    # Medir eliminaci√≥n
    def test_eliminacion():
        d = dict_base.copy()
        clave = random.choice(list(d.keys()))
        del d[clave]
    
    tiempo_eliminacion = timeit.timeit(test_eliminacion, number=1000) * 1000
    tiempos['eliminacion'].append(tiempo_eliminacion)
    
    print(f"{n}\t{tiempo_insercion:.3f}\t\t{tiempo_busqueda:.3f}\t\t{tiempo_eliminacion:.3f}")

# Graficar resultados
plt.figure(figsize=(12, 8))

plt.subplot(2, 2, 1)
plt.plot(tama√±os, tiempos['insercion'], 'b-o', label='Inserci√≥n')
plt.xlabel('Tama√±o del diccionario')
plt.ylabel('Tiempo (Œºs)')
plt.title('Tiempo de Inserci√≥n vs Tama√±o')
plt.grid(True)

plt.subplot(2, 2, 2)
plt.plot(tama√±os, tiempos['busqueda'], 'r-s', label='B√∫squeda')
plt.xlabel('Tama√±o del diccionario')
plt.ylabel('Tiempo (Œºs)')
plt.title('Tiempo de B√∫squeda vs Tama√±o')
plt.grid(True)

plt.subplot(2, 2, 3)
plt.plot(tama√±os, tiempos['eliminacion'], 'g-^', label='Eliminaci√≥n')
plt.xlabel('Tama√±o del diccionario')
plt.ylabel('Tiempo (Œºs)')
plt.title('Tiempo de Eliminaci√≥n vs Tama√±o')
plt.grid(True)

plt.subplot(2, 2, 4)
plt.plot(tama√±os, tiempos['insercion'], 'b-o', label='Inserci√≥n')
plt.plot(tama√±os, tiempos['busqueda'], 'r-s', label='B√∫squeda')
plt.plot(tama√±os, tiempos['eliminacion'], 'g-^', label='Eliminaci√≥n')
plt.xlabel('Tama√±o del diccionario')
plt.ylabel('Tiempo (Œºs)')
plt.title('Comparaci√≥n de Operaciones')
plt.legend()
plt.grid(True)

plt.tight_layout()
plt.show()

# An√°lisis de complejidad observada
print("\n=== An√°lisis de Complejidad ===")
print("Los resultados muestran que las operaciones en diccionarios Python")
print("mantienen complejidad O(1) promedio, incluso con tama√±os grandes.")
print("Las peque√±as variaciones se deben a:")
print("- Overhead de Python")
print("- Operaciones de hash")
print("- Posibles redimensionamientos internos")

In [None]:
# Ejercicio 3: Implementaci√≥n extendida para casos l√≠mite
import sys
from collections import defaultdict

class DiccionarioSeguro:
    """
    Diccionario con manejo de casos l√≠mite:
    - Manejo de memoria
    - Validaci√≥n de tipos de clave
    - L√≠mites de tama√±o
    - Estad√≠sticas de colisiones
    """
    
    def __init__(self, max_size=10000):
        self.datos = {}
        self.max_size = max_size
        self.estadisticas = {
            'operaciones_insercion': 0,
            'operaciones_busqueda': 0,
            'operaciones_eliminacion': 0,
            'colisiones_simuladas': 0
        }
    
    def _validar_clave(self, clave):
        """Validar que la clave sea hashable"""
        try:
            hash(clave)
            return True
        except TypeError:
            return False
    
    def _verificar_memoria(self):
        """Verificar uso de memoria del diccionario"""
        return sys.getsizeof(self.datos)
    
    def agregar_con_validacion(self, clave, valor):
        """Agregar con validaciones de casos l√≠mite"""
        # Validar clave hashable
        if not self._validar_clave(clave):
            raise TypeError(f"La clave {clave} no es hashable")
        
        # Verificar l√≠mite de tama√±o
        if len(self.datos) >= self.max_size:
            raise OverflowError(f"Diccionario excede el tama√±o m√°ximo ({self.max_size})")
        
        # Simular detecci√≥n de colisi√≥n (hash simple)
        hash_simple = sum(ord(c) for c in str(clave)) % 100
        if any(sum(ord(c) for c in str(k)) % 100 == hash_simple for k in self.datos.keys() if k != clave):
            self.estadisticas['colisiones_simuladas'] += 1
        
        self.datos[clave] = valor
        self.estadisticas['operaciones_insercion'] += 1
        return True
    
    def buscar_con_estadisticas(self, clave, default=None):
        """B√∫squeda con seguimiento de estad√≠sticas"""
        self.estadisticas['operaciones_busqueda'] += 1
        return self.datos.get(clave, default)
    
    def eliminar_con_validacion(self, clave):
        """Eliminaci√≥n con validaci√≥n de existencia"""
        if clave not in self.datos:
            raise KeyError(f"La clave '{clave}' no existe en el diccionario")
        
        del self.datos[clave]
        self.estadisticas['operaciones_eliminacion'] += 1
        return True
    
    def obtener_estadisticas(self):
        """Obtener estad√≠sticas completas del diccionario"""
        memoria_bytes = self._verificar_memoria()
        return {
            **self.estadisticas,
            'tama√±o_actual': len(self.datos),
            'memoria_bytes': memoria_bytes,
            'memoria_mb': memoria_bytes / (1024 * 1024),
            'factor_carga': len(self.datos) / self.max_size,
            'eficiencia_hash': 1 - (self.estadisticas['colisiones_simuladas'] / max(1, self.estadisticas['operaciones_insercion']))
        }
    
    def stress_test(self, n_operaciones=1000):
        """Prueba de estr√©s para detectar casos l√≠mite"""
        print(f"Iniciando prueba de estr√©s con {n_operaciones} operaciones...")
        
        try:
            # Insertar muchos elementos
            for i in range(min(n_operaciones, self.max_size)):
                self.agregar_con_validacion(f"key_{i}", f"value_{i}")
            
            # Intentar insertar m√°s all√° del l√≠mite
            try:
                self.agregar_con_validacion("overflow_key", "overflow_value")
            except OverflowError as e:
                print(f"‚úì Overflow detectado correctamente: {e}")
            
            # Probar claves no hashables
            try:
                self.agregar_con_validacion(["lista", "no", "hashable"], "valor")
            except TypeError as e:
                print(f"‚úì Tipo inv√°lido detectado correctamente: {e}")
            
            # Probar eliminaci√≥n de clave inexistente
            try:
                self.eliminar_con_validacion("clave_inexistente")
            except KeyError as e:
                print(f"‚úì Clave inexistente detectada correctamente: {e}")
            
            print("‚úì Prueba de estr√©s completada exitosamente")
            
        except Exception as e:
            print(f"‚úó Error en prueba de estr√©s: {e}")

# Demostraci√≥n de casos l√≠mite
print("=== Ejercicio 3: Casos L√≠mite ===")
dict_seguro = DiccionarioSeguro(max_size=100)

# Llenar el diccionario
for i in range(50):
    dict_seguro.agregar_con_validacion(f"usuario_{i}", {"id": i, "activo": True})

print("Estad√≠sticas iniciales:")
stats = dict_seguro.obtener_estadisticas()
for key, value in stats.items():
    print(f"  {key}: {value}")

# Ejecutar prueba de estr√©s
dict_seguro.stress_test(150)

print("\nEstad√≠sticas finales:")
stats_final = dict_seguro.obtener_estadisticas()
for key, value in stats_final.items():
    print(f"  {key}: {value}")

### Ejercicio 4: Reflexi√≥n - Contextos reales de uso

**¬øEn qu√© contextos reales usar√≠as diccionarios sobre sus alternativas?**

#### 1. **Sistemas de Cache y Memoizaci√≥n**
- **Contexto**: Almacenar resultados de c√°lculos costosos
- **Ventaja sobre listas**: Acceso O(1) por clave vs O(n) b√∫squeda lineal
- **Ejemplo**: Cache de resultados de consultas SQL, c√°lculos matem√°ticos complejos

#### 2. **Configuraciones de Aplicaci√≥n**
- **Contexto**: Almacenar par√°metros de configuraci√≥n con nombres descriptivos
- **Ventaja sobre tuplas**: Acceso por nombre vs √≠ndice num√©rico (m√°s legible)
- **Ejemplo**: Configuraciones de servidor, preferencias de usuario

#### 3. **√çndices de Bases de Datos en Memoria**
- **Contexto**: Mapear IDs √∫nicos a registros completos
- **Ventaja sobre arrays**: No requiere IDs consecutivos, manejo din√°mico de claves
- **Ejemplo**: Sistema de usuarios donde ID no es secuencial

#### 4. **Contadores y Agregaciones**
- **Contexto**: Contar frecuencias o agrupar datos por categor√≠a
- **Ventaja sobre sets**: Almacena tanto la clave como el conteo/agregaci√≥n
- **Ejemplo**: An√°lisis de logs, conteo de palabras, m√©tricas de rendimiento

#### 5. **Mapeos Bidireccionales**
- **Contexto**: Cuando necesitas buscar en ambas direcciones (clave‚Üívalor, valor‚Üíclave)
- **Ventaja sobre listas de tuplas**: B√∫squeda O(1) vs O(n)
- **Ejemplo**: Traducci√≥n de c√≥digos (c√≥digo‚Üínombre, nombre‚Üíc√≥digo)

#### 6. **Sistemas de Routing/Dispatch**
- **Contexto**: Mapear comandos o URLs a funciones espec√≠ficas
- **Ventaja sobre if/elif chains**: M√°s escalable y mantenible
- **Ejemplo**: Sistemas web, interpretadores de comandos

#### **Limitaciones importantes**:
- **No preserva orden** (hasta Python 3.7, ahora s√≠ lo hace por implementaci√≥n)
- **Claves deben ser hashables** (inmutables)
- **Mayor uso de memoria** que listas para datos puramente secuenciales
- **No adecuado** para datos con relaciones jer√°rquicas complejas

#### **Comparaci√≥n pr√°ctica**:
```python
# ‚ùå Ineficiente con lista
usuarios = [("user1", "Ana"), ("user2", "Carlos"), ("user3", "Luis")]
def buscar_usuario(id_usuario):
    for id_u, nombre in usuarios:  # O(n)
        if id_u == id_usuario:
            return nombre
    return None

# ‚úÖ Eficiente con diccionario
usuarios_dict = {"user1": "Ana", "user2": "Carlos", "user3": "Luis"}
def buscar_usuario_dict(id_usuario):
    return usuarios_dict.get(id_usuario)  # O(1)
```

**Conclusi√≥n**: Los diccionarios son ideales cuando necesitas asociaciones clave-valor con acceso r√°pido, especialmente en sistemas que requieren b√∫squedas frecuentes por identificadores √∫nicos.

## Resumen de Ejercicios Completados

### ‚úÖ **Ejercicio 1: Pruebas Unitarias**
- **Archivos creados**: 
  - `tests/test_dict_ops.py` - Pruebas completas con pytest (15 funciones de prueba)
  - `tests/run_dict_smoke_tests.py` - Pruebas r√°pidas sin dependencias
- **Clases implementadas**:
  - `DiccionarioPersona` - Operaciones b√°sicas de diccionario
  - `DiccionarioSeguro` - Diccionario con validaciones y casos l√≠mite
- **Pruebas verificadas**: ‚úÖ Todas las pruebas pasan exitosamente

### ‚úÖ **Ejercicio 2: Medici√≥n Emp√≠rica de Tiempos**
- **Mediciones realizadas**: Inserci√≥n, b√∫squeda, eliminaci√≥n vs tama√±o
- **Herramientas**: `timeit`, `matplotlib` para visualizaci√≥n
- **Resultado**: Confirmado comportamiento O(1) promedio para operaciones b√°sicas
- **An√°lisis**: Peque√±as variaciones debido a overhead de Python y redimensionamiento

### ‚úÖ **Ejercicio 3: Casos L√≠mite**
- **Validaciones implementadas**:
  - Claves no hashables (TypeError)
  - L√≠mites de tama√±o (OverflowError)  
  - Claves inexistentes (KeyError)
- **Monitoreo**: Estad√≠sticas de uso, memoria, factor de carga
- **Pruebas de estr√©s**: Verificaci√≥n autom√°tica de casos l√≠mite

### ‚úÖ **Ejercicio 4: Reflexi√≥n y An√°lisis**
- **Contextos identificados**: Cache, configuraciones, √≠ndices, contadores, routing
- **Comparaciones**: Ventajas vs listas, tuplas, sets
- **Limitaciones**: Claves hashables, mayor uso de memoria
- **Ejemplos pr√°cticos**: C√≥digo comparativo de eficiencia

### üìä **An√°lisis de Complejidad Completado**
| Operaci√≥n | Complejidad | Justificaci√≥n |
|---|---|---|
| Inserci√≥n | O(1) promedio, O(n) peor caso | Hash bien distribuido vs colisiones |
| B√∫squeda | O(1) promedio, O(n) peor caso | Acceso directo vs b√∫squeda lineal |
| Eliminaci√≥n | O(1) promedio, O(n) peor caso | Localizaci√≥n r√°pida vs colisiones |

### üîß **Herramientas Utilizadas**
- **Testing**: pytest (estructura profesional), smoke tests (sin dependencias)
- **Medici√≥n**: timeit (precisi√≥n microsegundos)
- **Visualizaci√≥n**: matplotlib (gr√°ficos de rendimiento)  
- **Validaci√≥n**: Manejo de excepciones, casos l√≠mite

### üéØ **Objetivos de Aprendizaje Cumplidos**
- ‚úÖ Modelo de datos y operaciones fundamentales identificados
- ‚úÖ Complejidad temporal y espacial analizada emp√≠ricamente  
- ‚úÖ Implementaciones robustas con casos de uso reales
- ‚úÖ Comparaci√≥n cr√≠tica con estructuras alternativas

**Nota**: Todos los ejercicios siguen las mejores pr√°cticas de la estructura de proyecto existente, utilizando la carpeta `tests/` apropiadamente.

### Ejercicios propuestos
1. Implementa pruebas unitarias con `pytest` para al menos 5 funciones/operaciones.
2. Mide emp√≠ricamente tiempos (con `timeit`) al variar n, y compara con el an√°lisis te√≥rico.
3. Extiende la implementaci√≥n para cubrir un caso l√≠mite (overflow, colisi√≥n, degeneraci√≥n, etc.).
4. Escribe una breve reflexi√≥n: ¬øen qu√© contextos reales usar√≠as esta estructura sobre sus alternativas?

### Referencias r√°pidas
- Cormen, Leiserson, Rivest, Stein. *Introduction to Algorithms* (CLRS).
- Sedgewick & Wayne. *Algorithms*.
- Documentaci√≥n oficial de Python: `collections`, `heapq`, `bisect`, `array`.

*Fuente de c√≥digo:* `10-EjemploDiccionarios-UP.py`  ‚Äî Generado autom√°ticamente el 2025-09-08 22:41.