# 🧮 Algoritmos y Estructuras de Datos - Módulo 3

## Bienvenido al Módulo de Algoritmos

### 📚 Contenido del Módulo 3:
1. **Introducción a la complejidad algorítmica**
2. **Análisis Big O**
3. **Estructuras de datos lineales**
4. **Estructuras de datos no lineales**
5. **Algoritmos de ordenamiento**
6. **Algoritmos de búsqueda**
7. **Algoritmos en grafos**
8. **Programación dinámica**
9. **Proyecto: Motor de búsqueda básico**

### 🎯 Objetivos de Aprendizaje:
- Comprender la complejidad algorítmica
- Dominar estructuras de datos fundamentales
- Implementar algoritmos de ordenamiento y búsqueda
- Resolver problemas con programación dinámica
- Analizar y optimizar el rendimiento del código

---

## 1. 📊 Complejidad Algorítmica y Notación Big O

La **complejidad algorítmica** nos ayuda a evaluar qué tan eficiente es un algoritmo en términos de tiempo y espacio.

### 🎯 Notación Big O:
- **O(1)**: Tiempo constante
- **O(log n)**: Tiempo logarítmico
- **O(n)**: Tiempo lineal
- **O(n log n)**: Tiempo linearítmico
- **O(n²)**: Tiempo cuadrático
- **O(2ⁿ)**: Tiempo exponencial

### 📈 ¿Por qué es importante?
- Predecir el rendimiento con datos grandes
- Comparar algoritmos objetivamente
- Optimizar código de manera científica

In [None]:
import time
import matplotlib.pyplot as plt
import numpy as np
from memory_profiler import profile

# Ejemplos de diferentes complejidades
def busqueda_lineal(lista, objetivo):
    """O(n) - Busca elemento recorriendo toda la lista"""
    for i, elemento in enumerate(lista):
        if elemento == objetivo:
            return i
    return -1

def busqueda_binaria(lista_ordenada, objetivo):
    """O(log n) - Busca en lista ordenada dividiendo por la mitad"""
    izq, der = 0, len(lista_ordenada) - 1
    
    while izq <= der:
        medio = (izq + der) // 2
        if lista_ordenada[medio] == objetivo:
            return medio
        elif lista_ordenada[medio] < objetivo:
            izq = medio + 1
        else:
            der = medio - 1
    return -1

def algoritmo_cuadratico(n):
    """O(n²) - Ejemplo de complejidad cuadrática"""
    contador = 0
    for i in range(n):
        for j in range(n):
            contador += 1
    return contador

# Medir tiempos de ejecución
tamaños = [100, 500, 1000, 2000, 5000]
tiempos_lineal = []
tiempos_binaria = []
tiempos_cuadratico = []

for n in tamaños:
    # Preparar datos
    lista = list(range(n))
    objetivo = n - 1  # Peor caso: último elemento
    
    # Medir búsqueda lineal
    inicio = time.time()
    busqueda_lineal(lista, objetivo)
    tiempos_lineal.append(time.time() - inicio)
    
    # Medir búsqueda binaria
    inicio = time.time()
    busqueda_binaria(lista, objetivo)
    tiempos_binaria.append(time.time() - inicio)
    
    # Medir algoritmo cuadrático (solo para n pequeño)
    if n <= 1000:
        inicio = time.time()
        algoritmo_cuadratico(n)
        tiempos_cuadratico.append(time.time() - inicio)
    else:
        tiempos_cuadratico.append(None)

print("Análisis de complejidad completado")
print(f"Tamaños: {tamaños}")
print(f"Búsqueda lineal: {[f'{t:.6f}s' for t in tiempos_lineal]}")
print(f"Búsqueda binaria: {[f'{t:.6f}s' for t in tiempos_binaria]}")

In [None]:
# Visualizar las diferencias de complejidad
plt.figure(figsize=(12, 8))

# Gráfico 1: Comparación de búsquedas
plt.subplot(2, 2, 1)
plt.plot(tamaños, tiempos_lineal, 'r-o', label='Búsqueda Lineal O(n)')
plt.plot(tamaños, tiempos_binaria, 'b-s', label='Búsqueda Binaria O(log n)')
plt.xlabel('Tamaño de entrada (n)')
plt.ylabel('Tiempo (segundos)')
plt.title('Comparación de Algoritmos de Búsqueda')
plt.legend()
plt.grid(True, alpha=0.3)

# Gráfico 2: Complejidades teóricas
plt.subplot(2, 2, 2)
n_vals = np.linspace(1, 100, 100)
plt.plot(n_vals, np.ones_like(n_vals), label='O(1)', linewidth=2)
plt.plot(n_vals, np.log2(n_vals), label='O(log n)', linewidth=2)
plt.plot(n_vals, n_vals, label='O(n)', linewidth=2)
plt.plot(n_vals, n_vals * np.log2(n_vals), label='O(n log n)', linewidth=2)
plt.plot(n_vals, n_vals**2, label='O(n²)', linewidth=2)
plt.xlabel('Tamaño de entrada (n)')
plt.ylabel('Operaciones')
plt.title('Comparación de Complejidades Big O')
plt.legend()
plt.grid(True, alpha=0.3)
plt.ylim(0, 500)

# Gráfico 3: Tiempo cuadrático
plt.subplot(2, 2, 3)
tamaños_cuad = [t for t, tiempo in zip(tamaños, tiempos_cuadratico) if tiempo is not None]
tiempos_cuad = [t for t in tiempos_cuadratico if t is not None]
plt.plot(tamaños_cuad, tiempos_cuad, 'g-^', label='Algoritmo O(n²)', linewidth=2)
plt.xlabel('Tamaño de entrada (n)')
plt.ylabel('Tiempo (segundos)')
plt.title('Crecimiento Cuadrático')
plt.legend()
plt.grid(True, alpha=0.3)

# Gráfico 4: Comparación escalada
plt.subplot(2, 2, 4)
n_range = np.array([10, 100, 1000, 10000])
const = np.ones_like(n_range)
linear = n_range
quad = n_range ** 2
exp = 2 ** (n_range / 1000)  # Escalado para visualización

plt.semilogy(n_range, const, 'b-', label='O(1)', linewidth=2)
plt.semilogy(n_range, linear, 'g-', label='O(n)', linewidth=2)
plt.semilogy(n_range, quad, 'r-', label='O(n²)', linewidth=2)
plt.semilogy(n_range, exp, 'm-', label='O(2ⁿ)', linewidth=2)
plt.xlabel('Tamaño de entrada (n)')
plt.ylabel('Operaciones (escala log)')
plt.title('Complejidades en Escala Logarítmica')
plt.legend()
plt.grid(True, alpha=0.3)

plt.tight_layout()
plt.show()

---

## 2. 📚 Estructuras de Datos Fundamentales

### 🔗 Estructuras Lineales:
1. **Listas**: Acceso secuencial y aleatorio
2. **Pilas (Stack)**: LIFO - Last In, First Out
3. **Colas (Queue)**: FIFO - First In, First Out
4. **Listas enlazadas**: Nodos conectados por referencias

### 🌳 Estructuras No Lineales:
1. **Árboles**: Estructura jerárquica
2. **Grafos**: Nodos conectados por aristas
3. **Hash Tables**: Acceso O(1) promedio

In [None]:
# Implementación de Pila (Stack)
class Pila:
    def __init__(self):
        self.items = []
    
    def esta_vacia(self):
        return len(self.items) == 0
    
    def apilar(self, item):
        """Agregar elemento al tope - O(1)"""
        self.items.append(item)
    
    def desapilar(self):
        """Remover elemento del tope - O(1)"""
        if self.esta_vacia():
            raise IndexError("La pila está vacía")
        return self.items.pop()
    
    def tope(self):
        """Ver elemento del tope sin remover - O(1)"""
        if self.esta_vacia():
            raise IndexError("La pila está vacía")
        return self.items[-1]
    
    def tamaño(self):
        return len(self.items)
    
    def __str__(self):
        return f"Pila: {self.items}"

# Implementación de Cola (Queue)
class Cola:
    def __init__(self):
        self.items = []
    
    def esta_vacia(self):
        return len(self.items) == 0
    
    def encolar(self, item):
        """Agregar elemento al final - O(1)"""
        self.items.append(item)
    
    def desencolar(self):
        """Remover elemento del frente - O(n) con lista, O(1) con deque"""
        if self.esta_vacia():
            raise IndexError("La cola está vacía")
        return self.items.pop(0)
    
    def frente(self):
        """Ver elemento del frente - O(1)"""
        if self.esta_vacia():
            raise IndexError("La cola está vacía")
        return self.items[0]
    
    def tamaño(self):
        return len(self.items)
    
    def __str__(self):
        return f"Cola: {self.items}"

# Demostrar uso de Pila
print("=== DEMOSTRACIÓN DE PILA ===")
pila = Pila()

# Simular navegación de páginas web
paginas = ["google.com", "github.com", "stackoverflow.com", "python.org"]

print("Navegando páginas:")
for pagina in paginas:
    pila.apilar(pagina)
    print(f"  Visitando: {pagina}")
    print(f"  {pila}")

print(f"\nPágina actual: {pila.tope()}")

print("\nRetrocediendo:")
while not pila.esta_vacia():
    pagina = pila.desapilar()
    print(f"  Saliendo de: {pagina}")
    if not pila.esta_vacia():
        print(f"  Ahora en: {pila.tope()}")

In [None]:
# Demostrar uso de Cola
print("\n=== DEMOSTRACIÓN DE COLA ===")
cola = Cola()

# Simular sistema de atención al cliente
clientes = ["Ana", "Carlos", "María", "Pedro", "Laura"]

print("Clientes llegando:")
for cliente in clientes:
    cola.encolar(cliente)
    print(f"  {cliente} se une a la cola")
    print(f"  {cola}")

print(f"\nPróximo cliente a atender: {cola.frente()}")

print("\nAtendiendo clientes:")
while not cola.esta_vacia():
    cliente = cola.desencolar()
    print(f"  Atendiendo a: {cliente}")
    if not cola.esta_vacia():
        print(f"  Próximo: {cola.frente()}")
    print(f"  {cola}")

In [None]:
# Implementación de Lista Enlazada
class Nodo:
    def __init__(self, dato):
        self.dato = dato
        self.siguiente = None
    
    def __str__(self):
        return str(self.dato)

class ListaEnlazada:
    def __init__(self):
        self.cabeza = None
        self._tamaño = 0
    
    def esta_vacia(self):
        return self.cabeza is None
    
    def agregar_al_inicio(self, dato):
        """Agregar al inicio - O(1)"""
        nuevo_nodo = Nodo(dato)
        nuevo_nodo.siguiente = self.cabeza
        self.cabeza = nuevo_nodo
        self._tamaño += 1
    
    def agregar_al_final(self, dato):
        """Agregar al final - O(n)"""
        nuevo_nodo = Nodo(dato)
        if self.esta_vacia():
            self.cabeza = nuevo_nodo
        else:
            actual = self.cabeza
            while actual.siguiente:
                actual = actual.siguiente
            actual.siguiente = nuevo_nodo
        self._tamaño += 1
    
    def buscar(self, dato):
        """Buscar elemento - O(n)"""
        actual = self.cabeza
        posicion = 0
        while actual:
            if actual.dato == dato:
                return posicion
            actual = actual.siguiente
            posicion += 1
        return -1
    
    def eliminar(self, dato):
        """Eliminar elemento - O(n)"""
        if self.esta_vacia():
            return False
        
        if self.cabeza.dato == dato:
            self.cabeza = self.cabeza.siguiente
            self._tamaño -= 1
            return True
        
        actual = self.cabeza
        while actual.siguiente:
            if actual.siguiente.dato == dato:
                actual.siguiente = actual.siguiente.siguiente
                self._tamaño -= 1
                return True
            actual = actual.siguiente
        return False
    
    def tamaño(self):
        return self._tamaño
    
    def to_list(self):
        """Convertir a lista de Python para visualización"""
        resultado = []
        actual = self.cabeza
        while actual:
            resultado.append(actual.dato)
            actual = actual.siguiente
        return resultado
    
    def __str__(self):
        return " -> ".join(map(str, self.to_list())) + " -> None"

# Demostrar Lista Enlazada
print("\n=== DEMOSTRACIÓN DE LISTA ENLAZADA ===")
lista = ListaEnlazada()

# Agregar elementos
print("Agregando elementos:")
elementos = [10, 20, 30, 40]
for elem in elementos:
    lista.agregar_al_final(elem)
    print(f"  Agregado {elem}: {lista}")

# Agregar al inicio
lista.agregar_al_inicio(5)
print(f"Agregado 5 al inicio: {lista}")

# Buscar elementos
print(f"\nBuscar 20: posición {lista.buscar(20)}")
print(f"Buscar 100: posición {lista.buscar(100)}")

# Eliminar elemento
print(f"\nEliminar 30: {lista.eliminar(30)}")
print(f"Lista después de eliminar: {lista}")
print(f"Tamaño final: {lista.tamaño()}")

---

## 3. 🔄 Algoritmos de Ordenamiento

Los algoritmos de ordenamiento son fundamentales en ciencias de la computación. Cada uno tiene diferentes características de rendimiento.

### 📊 Comparación de Algoritmos:
| Algoritmo | Mejor Caso | Caso Promedio | Peor Caso | Espacio |
|-----------|------------|---------------|-----------|---------|
| Bubble Sort | O(n) | O(n²) | O(n²) | O(1) |
| Selection Sort | O(n²) | O(n²) | O(n²) | O(1) |
| Insertion Sort | O(n) | O(n²) | O(n²) | O(1) |
| Merge Sort | O(n log n) | O(n log n) | O(n log n) | O(n) |
| Quick Sort | O(n log n) | O(n log n) | O(n²) | O(log n) |

In [None]:
import random
import time
from typing import List

def bubble_sort(arr: List[int]) -> List[int]:
    """
    Bubble Sort - O(n²)
    Compara elementos adyacentes y los intercambia si están en orden incorrecto
    """
    arr = arr.copy()  # No modificar la lista original
    n = len(arr)
    comparaciones = 0
    intercambios = 0
    
    for i in range(n):
        # Flag para optimización (si no hay intercambios, ya está ordenado)
        hubo_intercambio = False
        
        for j in range(0, n - i - 1):
            comparaciones += 1
            if arr[j] > arr[j + 1]:
                arr[j], arr[j + 1] = arr[j + 1], arr[j]
                intercambios += 1
                hubo_intercambio = True
        
        if not hubo_intercambio:
            break
    
    return arr, comparaciones, intercambios

def selection_sort(arr: List[int]) -> List[int]:
    """
    Selection Sort - O(n²)
    Encuentra el mínimo y lo coloca en la posición correcta
    """
    arr = arr.copy()
    n = len(arr)
    comparaciones = 0
    intercambios = 0
    
    for i in range(n):
        min_idx = i
        
        for j in range(i + 1, n):
            comparaciones += 1
            if arr[j] < arr[min_idx]:
                min_idx = j
        
        if min_idx != i:
            arr[i], arr[min_idx] = arr[min_idx], arr[i]
            intercambios += 1
    
    return arr, comparaciones, intercambios

def insertion_sort(arr: List[int]) -> List[int]:
    """
    Insertion Sort - O(n²) peor caso, O(n) mejor caso
    Inserta cada elemento en su posición correcta
    """
    arr = arr.copy()
    comparaciones = 0
    intercambios = 0
    
    for i in range(1, len(arr)):
        key = arr[i]
        j = i - 1
        
        while j >= 0:
            comparaciones += 1
            if arr[j] > key:
                arr[j + 1] = arr[j]
                intercambios += 1
                j -= 1
            else:
                break
        
        arr[j + 1] = key
    
    return arr, comparaciones, intercambios

def merge_sort(arr: List[int]) -> List[int]:
    """
    Merge Sort - O(n log n)
    Divide y vencerás: divide la lista y luego une ordenadamente
    """
    if len(arr) <= 1:
        return arr.copy(), 0, 0
    
    # Dividir
    mid = len(arr) // 2
    left, comp_l, int_l = merge_sort(arr[:mid])
    right, comp_r, int_r = merge_sort(arr[mid:])
    
    # Conquistar (merge)
    result = []
    i = j = 0
    comparaciones = comp_l + comp_r
    intercambios = int_l + int_r
    
    while i < len(left) and j < len(right):
        comparaciones += 1
        if left[i] <= right[j]:
            result.append(left[i])
            i += 1
        else:
            result.append(right[j])
            j += 1
        intercambios += 1
    
    # Agregar elementos restantes
    result.extend(left[i:])
    result.extend(right[j:])
    intercambios += len(left[i:]) + len(right[j:])
    
    return result, comparaciones, intercambios

# Probar algoritmos con diferentes casos
print("=== COMPARACIÓN DE ALGORITMOS DE ORDENAMIENTO ===")

# Casos de prueba
casos = {
    "Aleatorio": [64, 34, 25, 12, 22, 11, 90, 88, 76, 50, 42],
    "Ordenado": [1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11],
    "Inverso": [11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 1],
    "Repetidos": [5, 2, 8, 2, 9, 1, 5, 5, 2, 8, 1]
}

algoritmos = {
    "Bubble Sort": bubble_sort,
    "Selection Sort": selection_sort,
    "Insertion Sort": insertion_sort,
    "Merge Sort": merge_sort
}

for caso_nombre, datos in casos.items():
    print(f"\n--- {caso_nombre}: {datos} ---")
    
    for alg_nombre, alg_func in algoritmos.items():
        inicio = time.time()
        resultado, comparaciones, intercambios = alg_func(datos)
        tiempo = time.time() - inicio
        
        print(f"{alg_nombre:15}: {resultado}")
        print(f"{'':15}  Comparaciones: {comparaciones:4d}, Intercambios: {intercambios:4d}, Tiempo: {tiempo:.6f}s")

In [None]:
# Análisis de rendimiento con listas más grandes
import matplotlib.pyplot as plt

def benchmark_algoritmos(tamaños):
    """Comparar rendimiento de algoritmos con diferentes tamaños"""
    algoritmos_rapidos = {
        "Insertion Sort": insertion_sort,
        "Merge Sort": merge_sort
    }
    
    resultados = {alg: [] for alg in algoritmos_rapidos.keys()}
    
    for n in tamaños:
        print(f"Probando con n = {n}")
        # Generar datos aleatorios
        datos = [random.randint(1, 1000) for _ in range(n)]
        
        for alg_nombre, alg_func in algoritmos_rapidos.items():
            inicio = time.time()
            _, _, _ = alg_func(datos)
            tiempo = time.time() - inicio
            resultados[alg_nombre].append(tiempo)
    
    return resultados

# Probar con diferentes tamaños
tamaños = [50, 100, 200, 500, 1000]
print("=== BENCHMARK DE RENDIMIENTO ===")
resultados = benchmark_algoritmos(tamaños)

# Visualizar resultados
plt.figure(figsize=(12, 5))

plt.subplot(1, 2, 1)
for alg, tiempos in resultados.items():
    plt.plot(tamaños, tiempos, marker='o', label=alg, linewidth=2)

plt.xlabel('Tamaño de la lista')
plt.ylabel('Tiempo (segundos)')
plt.title('Comparación de Rendimiento')
plt.legend()
plt.grid(True, alpha=0.3)

# Gráfico en escala logarítmica
plt.subplot(1, 2, 2)
for alg, tiempos in resultados.items():
    plt.loglog(tamaños, tiempos, marker='o', label=alg, linewidth=2)

plt.xlabel('Tamaño de la lista (log)')
plt.ylabel('Tiempo (log)')
plt.title('Comparación en Escala Logarítmica')
plt.legend()
plt.grid(True, alpha=0.3)

plt.tight_layout()
plt.show()

# Mostrar tabla de resultados
print("\n=== TABLA DE TIEMPOS ===")
print(f"{'Tamaño':<8}", end="")
for alg in resultados.keys():
    print(f"{alg:<15}", end="")
print()

for i, n in enumerate(tamaños):
    print(f"{n:<8}", end="")
    for tiempos in resultados.values():
        print(f"{tiempos[i]:<15.6f}", end="")
    print()

---

## 4. 🔍 Algoritmos de Búsqueda Avanzados

Además de la búsqueda lineal y binaria, existen otros algoritmos especializados para diferentes tipos de datos y estructuras.

### 📋 Tipos de Búsqueda:
1. **Búsqueda en amplitud (BFS)**: Para grafos y árboles
2. **Búsqueda en profundidad (DFS)**: Exploración exhaustiva
3. **Búsqueda A***: Búsqueda heurística optimal
4. **Búsqueda por hash**: Acceso directo O(1)

In [None]:
from collections import deque
import heapq

# Implementación de Grafo para búsquedas
class Grafo:
    def __init__(self):
        self.vertices = {}
    
    def agregar_vertice(self, vertice):
        if vertice not in self.vertices:
            self.vertices[vertice] = []
    
    def agregar_arista(self, desde, hasta, peso=1):
        self.agregar_vertice(desde)
        self.agregar_vertice(hasta)
        self.vertices[desde].append((hasta, peso))
    
    def obtener_vecinos(self, vertice):
        return self.vertices.get(vertice, [])
    
    def obtener_vertices(self):
        return list(self.vertices.keys())

def busqueda_amplitud(grafo, inicio, objetivo):
    """
    Búsqueda en Amplitud (BFS) - O(V + E)
    Explora nivel por nivel desde el nodo inicial
    """
    if inicio == objetivo:
        return [inicio]
    
    visitados = set()
    cola = deque([(inicio, [inicio])])
    visitados.add(inicio)
    
    while cola:
        vertice_actual, camino = cola.popleft()
        
        for vecino, _ in grafo.obtener_vecinos(vertice_actual):
            if vecino not in visitados:
                nuevo_camino = camino + [vecino]
                
                if vecino == objetivo:
                    return nuevo_camino
                
                visitados.add(vecino)
                cola.append((vecino, nuevo_camino))
    
    return None  # No se encontró camino

def busqueda_profundidad(grafo, inicio, objetivo, visitados=None, camino=None):
    """
    Búsqueda en Profundidad (DFS) - O(V + E)
    Explora tan profundo como sea posible antes de retroceder
    """
    if visitados is None:
        visitados = set()
    if camino is None:
        camino = []
    
    visitados.add(inicio)
    camino = camino + [inicio]
    
    if inicio == objetivo:
        return camino
    
    for vecino, _ in grafo.obtener_vecinos(inicio):
        if vecino not in visitados:
            resultado = busqueda_profundidad(grafo, vecino, objetivo, visitados, camino)
            if resultado:
                return resultado
    
    return None

def dijkstra(grafo, inicio):
    """
    Algoritmo de Dijkstra - O((V + E) log V)
    Encuentra el camino más corto desde un nodo a todos los demás
    """
    distancias = {vertice: float('infinity') for vertice in grafo.obtener_vertices()}
    distancias[inicio] = 0
    predecesores = {}
    cola_prioridad = [(0, inicio)]
    visitados = set()
    
    while cola_prioridad:
        distancia_actual, vertice_actual = heapq.heappop(cola_prioridad)
        
        if vertice_actual in visitados:
            continue
        
        visitados.add(vertice_actual)
        
        for vecino, peso in grafo.obtener_vecinos(vertice_actual):
            distancia = distancia_actual + peso
            
            if distancia < distancias[vecino]:
                distancias[vecino] = distancia
                predecesores[vecino] = vertice_actual
                heapq.heappush(cola_prioridad, (distancia, vecino))
    
    return distancias, predecesores

# Crear grafo de ejemplo (ciudades)
print("=== BÚSQUEDAS EN GRAFOS ===")
grafo_ciudades = Grafo()

# Agregar conexiones entre ciudades con distancias
conexiones = [
    ("Madrid", "Barcelona", 620),
    ("Madrid", "Sevilla", 530),
    ("Madrid", "Valencia", 350),
    ("Barcelona", "Valencia", 350),
    ("Barcelona", "Zaragoza", 300),
    ("Valencia", "Alicante", 170),
    ("Sevilla", "Córdoba", 140),
    ("Córdoba", "Granada", 160),
    ("Zaragoza", "Bilbao", 320),
    ("Bilbao", "Santander", 100)
]

for desde, hasta, distancia in conexiones:
    grafo_ciudades.agregar_arista(desde, hasta, distancia)
    grafo_ciudades.agregar_arista(hasta, desde, distancia)  # Bidireccional

print("Grafo de ciudades creado con las siguientes conexiones:")
for desde, hasta, distancia in conexiones:
    print(f"  {desde} ↔ {hasta}: {distancia} km")

In [None]:
# Probar búsquedas
inicio = "Madrid"
objetivo = "Granada"

print(f"\n=== BÚSQUEDA DE CAMINO: {inicio} → {objetivo} ===")

# Búsqueda en amplitud
camino_bfs = busqueda_amplitud(grafo_ciudades, inicio, objetivo)
print(f"BFS - Camino encontrado: {' → '.join(camino_bfs) if camino_bfs else 'No encontrado'}")

# Búsqueda en profundidad
camino_dfs = busqueda_profundidad(grafo_ciudades, inicio, objetivo)
print(f"DFS - Camino encontrado: {' → '.join(camino_dfs) if camino_dfs else 'No encontrado'}")

# Dijkstra para encontrar el camino más corto
distancias, predecesores = dijkstra(grafo_ciudades, inicio)

def reconstruir_camino(predecesores, inicio, objetivo):
    """Reconstruir el camino desde los predecesores"""
    if objetivo not in predecesores:
        return None
    
    camino = []
    actual = objetivo
    while actual != inicio:
        camino.append(actual)
        actual = predecesores[actual]
    camino.append(inicio)
    return camino[::-1]

camino_dijkstra = reconstruir_camino(predecesores, inicio, objetivo)
distancia_total = distancias[objetivo]

print(f"Dijkstra - Camino más corto: {' → '.join(camino_dijkstra) if camino_dijkstra else 'No encontrado'}")
print(f"Distancia total: {distancia_total} km")

# Mostrar todas las distancias mínimas desde Madrid
print(f"\n=== DISTANCIAS MÍNIMAS DESDE {inicio} ===")
for ciudad, distancia in sorted(distancias.items()):
    if distancia != float('infinity'):
        print(f"{ciudad:12}: {distancia:4.0f} km")

In [None]:
# Tabla Hash (Hash Table) para búsqueda O(1)
class TablaHash:
    def __init__(self, tamaño=10):
        self.tamaño = tamaño
        self.tabla = [[] for _ in range(tamaño)]
        self.num_elementos = 0
    
    def _hash(self, clave):
        """Función hash simple"""
        return hash(clave) % self.tamaño
    
    def insertar(self, clave, valor):
        """Insertar par clave-valor - O(1) promedio"""
        indice = self._hash(clave)
        bucket = self.tabla[indice]
        
        # Verificar si la clave ya existe
        for i, (k, v) in enumerate(bucket):
            if k == clave:
                bucket[i] = (clave, valor)  # Actualizar
                return
        
        # Insertar nueva clave
        bucket.append((clave, valor))
        self.num_elementos += 1
        
        # Redimensionar si el factor de carga es alto
        if self.num_elementos > self.tamaño * 0.7:
            self._redimensionar()
    
    def buscar(self, clave):
        """Buscar valor por clave - O(1) promedio"""
        indice = self._hash(clave)
        bucket = self.tabla[indice]
        
        for k, v in bucket:
            if k == clave:
                return v
        
        raise KeyError(f"Clave '{clave}' no encontrada")
    
    def eliminar(self, clave):
        """Eliminar par clave-valor - O(1) promedio"""
        indice = self._hash(clave)
        bucket = self.tabla[indice]
        
        for i, (k, v) in enumerate(bucket):
            if k == clave:
                del bucket[i]
                self.num_elementos -= 1
                return v
        
        raise KeyError(f"Clave '{clave}' no encontrada")
    
    def _redimensionar(self):
        """Redimensionar tabla cuando factor de carga es alto"""
        tabla_vieja = self.tabla
        self.tamaño *= 2
        self.tabla = [[] for _ in range(self.tamaño)]
        self.num_elementos = 0
        
        # Reinsertar todos los elementos
        for bucket in tabla_vieja:
            for clave, valor in bucket:
                self.insertar(clave, valor)
    
    def factor_carga(self):
        return self.num_elementos / self.tamaño
    
    def estadisticas(self):
        """Obtener estadísticas de la tabla"""
        longitudes = [len(bucket) for bucket in self.tabla]
        return {
            'tamaño': self.tamaño,
            'elementos': self.num_elementos,
            'factor_carga': self.factor_carga(),
            'buckets_vacios': longitudes.count(0),
            'longitud_max_bucket': max(longitudes),
            'longitud_promedio': sum(longitudes) / len(longitudes)
        }
    
    def __str__(self):
        resultado = "TablaHash:\n"
        for i, bucket in enumerate(self.tabla):
            if bucket:
                resultado += f"  [{i}]: {bucket}\n"
        return resultado

# Demostrar Tabla Hash
print("\n=== TABLA HASH PARA BÚSQUEDA O(1) ===")
tabla = TablaHash(5)

# Insertar datos de estudiantes
estudiantes = [
    ("12345", "Ana García"),
    ("67890", "Carlos López"),
    ("54321", "María Rodríguez"),
    ("98765", "Pedro Martínez"),
    ("13579", "Laura Fernández"),
    ("24680", "Juan Pérez"),
    ("11111", "Sofia Ruiz")
]

print("Insertando estudiantes:")
for id_estudiante, nombre in estudiantes:
    tabla.insertar(id_estudiante, nombre)
    print(f"  ID {id_estudiante}: {nombre}")

print(f"\n{tabla}")

# Búsquedas
print("=== BÚSQUEDAS EN TABLA HASH ===")
ids_buscar = ["12345", "98765", "00000"]

for id_buscar in ids_buscar:
    try:
        nombre = tabla.buscar(id_buscar)
        print(f"ID {id_buscar}: {nombre} ✓")
    except KeyError as e:
        print(f"ID {id_buscar}: {e} ✗")

# Estadísticas
print(f"\n=== ESTADÍSTICAS ===")
stats = tabla.estadisticas()
for clave, valor in stats.items():
    print(f"{clave.replace('_', ' ').title()}: {valor}")

---

## 5. 🏗️ Proyecto Final: Motor de Búsqueda Básico

Vamos a crear un motor de búsqueda simple que combine múltiples algoritmos y estructuras de datos para indexar y buscar documentos.

### 🎯 Características del Motor:
1. **Indexación de documentos** con tabla hash
2. **Búsqueda por palabras clave** con ranking
3. **Búsqueda difusa** para términos similares
4. **Estadísticas de rendimiento**
5. **Interfaz de consulta** simple

In [None]:
import re
from collections import defaultdict, Counter
import math

class MotorBusqueda:
    def __init__(self):
        # Índice invertido: palabra -> {doc_id: frecuencia}
        self.indice = defaultdict(lambda: defaultdict(int))
        # Documentos: doc_id -> contenido
        self.documentos = {}
        # Metadatos de documentos
        self.metadatos = {}
        # Estadísticas
        self.num_documentos = 0
        self.palabras_totales = 0
    
    def procesar_texto(self, texto):
        """Preprocesar texto: minúsculas, eliminar puntuación, dividir en palabras"""
        # Convertir a minúsculas y eliminar caracteres especiales
        texto = re.sub(r'[^\w\s]', ' ', texto.lower())
        # Dividir en palabras y filtrar palabras vacías
        palabras = [palabra for palabra in texto.split() if len(palabra) > 2]
        return palabras
    
    def agregar_documento(self, doc_id, titulo, contenido):
        """Agregar documento al índice"""
        texto_completo = f"{titulo} {contenido}"
        palabras = self.procesar_texto(texto_completo)
        
        # Almacenar documento
        self.documentos[doc_id] = {
            'titulo': titulo,
            'contenido': contenido,
            'palabras': palabras
        }
        
        # Crear metadatos
        contador_palabras = Counter(palabras)
        self.metadatos[doc_id] = {
            'num_palabras': len(palabras),
            'palabras_unicas': len(contador_palabras),
            'frecuencias': contador_palabras
        }
        
        # Actualizar índice invertido
        for palabra in contador_palabras:
            self.indice[palabra][doc_id] = contador_palabras[palabra]
        
        # Actualizar estadísticas
        self.num_documentos += 1
        self.palabras_totales += len(palabras)
        
        print(f"✓ Documento '{titulo}' indexado (ID: {doc_id})")
    
    def buscar_palabra(self, palabra):
        """Buscar documentos que contengan una palabra específica"""
        palabra = palabra.lower()
        if palabra in self.indice:
            return dict(self.indice[palabra])
        return {}
    
    def calcular_tf_idf(self, palabra, doc_id):
        """Calcular TF-IDF para una palabra en un documento"""
        if palabra not in self.indice or doc_id not in self.indice[palabra]:
            return 0.0
        
        # TF (Term Frequency): frecuencia de la palabra en el documento
        tf = self.indice[palabra][doc_id] / self.metadatos[doc_id]['num_palabras']
        
        # IDF (Inverse Document Frequency): log(total_docs / docs_con_palabra)
        docs_con_palabra = len(self.indice[palabra])
        idf = math.log(self.num_documentos / docs_con_palabra)
        
        return tf * idf
    
    def buscar_avanzada(self, consulta, max_resultados=10):
        """Búsqueda avanzada con ranking TF-IDF"""
        palabras_consulta = self.procesar_texto(consulta)
        if not palabras_consulta:
            return []
        
        # Encontrar documentos candidatos
        candidatos = set()
        for palabra in palabras_consulta:
            candidatos.update(self.buscar_palabra(palabra).keys())
        
        # Calcular puntuación para cada candidato
        puntuaciones = {}
        for doc_id in candidatos:
            puntuacion = 0.0
            for palabra in palabras_consulta:
                puntuacion += self.calcular_tf_idf(palabra, doc_id)
            puntuaciones[doc_id] = puntuacion
        
        # Ordenar por puntuación y retornar top resultados
        resultados_ordenados = sorted(
            puntuaciones.items(), 
            key=lambda x: x[1], 
            reverse=True
        )
        
        return resultados_ordenados[:max_resultados]
    
    def busqueda_difusa(self, palabra, max_distancia=2):
        """Búsqueda difusa usando distancia de Levenshtein"""
        def distancia_levenshtein(s1, s2):
            """Calcular distancia de edición entre dos strings"""
            if len(s1) < len(s2):
                s1, s2 = s2, s1
            
            if len(s2) == 0:
                return len(s1)
            
            fila_anterior = list(range(len(s2) + 1))
            for i, c1 in enumerate(s1):
                fila_actual = [i + 1]
                for j, c2 in enumerate(s2):
                    insercion = fila_anterior[j + 1] + 1
                    eliminacion = fila_actual[j] + 1
                    sustitucion = fila_anterior[j] + (c1 != c2)
                    fila_actual.append(min(insercion, eliminacion, sustitucion))
                fila_anterior = fila_actual
            
            return fila_anterior[-1]
        
        palabra = palabra.lower()
        palabras_similares = []
        
        for palabra_indice in self.indice:
            distancia = distancia_levenshtein(palabra, palabra_indice)
            if distancia <= max_distancia:
                palabras_similares.append((palabra_indice, distancia))
        
        return sorted(palabras_similares, key=lambda x: x[1])
    
    def obtener_estadisticas(self):
        """Obtener estadísticas del motor de búsqueda"""
        if self.num_documentos == 0:
            return "No hay documentos indexados"
        
        return {
            'documentos_indexados': self.num_documentos,
            'palabras_totales': self.palabras_totales,
            'palabras_unicas': len(self.indice),
            'promedio_palabras_por_doc': self.palabras_totales / self.num_documentos,
            'top_palabras': self._obtener_top_palabras(10)
        }
    
    def _obtener_top_palabras(self, n=10):
        """Obtener las n palabras más frecuentes"""
        frecuencias_globales = defaultdict(int)
        for palabra, docs in self.indice.items():
            for doc_id, freq in docs.items():
                frecuencias_globales[palabra] += freq
        
        return sorted(
            frecuencias_globales.items(), 
            key=lambda x: x[1], 
            reverse=True
        )[:n]

# Crear motor de búsqueda y agregar documentos de ejemplo
print("=== MOTOR DE BÚSQUEDA BÁSICO ===")
motor = MotorBusqueda()

# Documentos de ejemplo sobre programación
documentos = [
    {
        'id': 'doc1',
        'titulo': 'Introducción a Python',
        'contenido': 'Python es un lenguaje de programación interpretado de alto nivel. Es conocido por su sintaxis clara y legible. Python se utiliza en desarrollo web, ciencia de datos, inteligencia artificial y automatización.'
    },
    {
        'id': 'doc2',
        'titulo': 'Algoritmos de Ordenamiento',
        'contenido': 'Los algoritmos de ordenamiento son fundamentales en ciencias de la computación. Bubble sort, merge sort y quick sort son ejemplos populares. La complejidad temporal varía entre O(n²) y O(n log n).'
    },
    {
        'id': 'doc3',
        'titulo': 'Estructuras de Datos',
        'contenido': 'Las estructuras de datos organizan y almacenan información de manera eficiente. Listas, pilas, colas, árboles y grafos son estructuras fundamentales. Cada una tiene diferentes casos de uso y complejidades.'
    },
    {
        'id': 'doc4',
        'titulo': 'Machine Learning con Python',
        'contenido': 'El machine learning utiliza algoritmos para encontrar patrones en datos. Python ofrece bibliotecas como scikit-learn, pandas y numpy para análisis de datos y modelado predictivo.'
    },
    {
        'id': 'doc5',
        'titulo': 'Desarrollo Web con Flask',
        'contenido': 'Flask es un framework web minimalista para Python. Permite crear aplicaciones web rápidamente. Flask es ideal para APIs REST y aplicaciones pequeñas a medianas.'
    }
]

print("Indexando documentos:")
for doc in documentos:
    motor.agregar_documento(doc['id'], doc['titulo'], doc['contenido'])

In [None]:
# Probar búsquedas
print("\n=== PRUEBAS DE BÚSQUEDA ===")

# Búsqueda simple
print("1. Búsqueda simple por palabra:")
consultas_simples = ["python", "algoritmos", "datos"]

for consulta in consultas_simples:
    resultados = motor.buscar_palabra(consulta)
    print(f"  '{consulta}': {len(resultados)} documentos encontrados")
    for doc_id, freq in resultados.items():
        titulo = motor.documentos[doc_id]['titulo']
        print(f"    - {titulo} (frecuencia: {freq})")

# Búsqueda avanzada con ranking
print("\n2. Búsqueda avanzada con ranking TF-IDF:")
consultas_avanzadas = [
    "python programación",
    "algoritmos ordenamiento complejidad",
    "estructuras datos listas",
    "machine learning datos"
]

for consulta in consultas_avanzadas:
    print(f"\nConsulta: '{consulta}'")
    resultados = motor.buscar_avanzada(consulta)
    
    if resultados:
        for i, (doc_id, puntuacion) in enumerate(resultados, 1):
            titulo = motor.documentos[doc_id]['titulo']
            print(f"  {i}. {titulo} (puntuación: {puntuacion:.4f})")
    else:
        print("  No se encontraron resultados")

# Búsqueda difusa
print("\n3. Búsqueda difusa (corrección de errores):")
palabras_con_errores = ["pythn", "algoritmo", "datss"]

for palabra_error in palabras_con_errores:
    print(f"\nBuscando: '{palabra_error}'")
    sugerencias = motor.busqueda_difusa(palabra_error)
    
    if sugerencias:
        print("  Sugerencias:")
        for palabra_sugerida, distancia in sugerencias[:3]:
            print(f"    - {palabra_sugerida} (distancia: {distancia})")
    else:
        print("  No se encontraron sugerencias")

In [None]:
# Estadísticas del motor
print("\n=== ESTADÍSTICAS DEL MOTOR ===")
stats = motor.obtener_estadisticas()

for clave, valor in stats.items():
    if clave == 'top_palabras':
        print(f"\nTop 10 palabras más frecuentes:")
        for palabra, freq in valor:
            print(f"  {palabra:15}: {freq} apariciones")
    else:
        print(f"{clave.replace('_', ' ').title()}: {valor}")

# Interfaz simple de consulta
print("\n=== INTERFAZ DE CONSULTA ===")
def interfaz_consulta():
    """Interfaz simple para hacer consultas"""
    print("Motor de búsqueda activo. Comandos disponibles:")
    print("  - buscar <consulta>: Búsqueda normal")
    print("  - difusa <palabra>: Búsqueda difusa")
    print("  - stats: Mostrar estadísticas")
    print("  - salir: Terminar")
    
    comandos_ejemplo = [
        "buscar python web",
        "difusa algortimo",
        "stats"
    ]
    
    print("\nEjemplos de comandos:")
    for cmd in comandos_ejemplo:
        print(f"  {cmd}")
        
        if cmd.startswith("buscar"):
            consulta = cmd.replace("buscar ", "")
            resultados = motor.buscar_avanzada(consulta, max_resultados=3)
            print(f"    Resultados para '{consulta}':")
            if resultados:
                for i, (doc_id, puntuacion) in enumerate(resultados, 1):
                    titulo = motor.documentos[doc_id]['titulo']
                    print(f"      {i}. {titulo}")
            else:
                print("      No se encontraron resultados")
                
        elif cmd.startswith("difusa"):
            palabra = cmd.replace("difusa ", "")
            sugerencias = motor.busqueda_difusa(palabra, max_distancia=2)
            print(f"    Sugerencias para '{palabra}':")
            for palabra_sugerida, distancia in sugerencias[:3]:
                print(f"      - {palabra_sugerida}")
                
        elif cmd == "stats":
            print("    Estadísticas:")
            stats = motor.obtener_estadisticas()
            print(f"      Documentos: {stats['documentos_indexados']}")
            print(f"      Palabras únicas: {stats['palabras_unicas']}")
        
        print()

interfaz_consulta()

print("🎉 ¡Proyecto completado! Has construido un motor de búsqueda funcional.")
print("📚 Este proyecto demuestra:")
print("  ✓ Uso de estructuras de datos (hash tables, diccionarios)")
print("  ✓ Algoritmos de búsqueda y ranking")
print("  ✓ Procesamiento de texto")
print("  ✓ Análisis de complejidad")
print("  ✓ Métricas de relevancia (TF-IDF)")

---

## 🎓 Resumen del Módulo 3

### ✅ Conceptos Dominados:
1. **Complejidad algorítmica**: Notación Big O y análisis de rendimiento
2. **Estructuras de datos**: Listas, pilas, colas, listas enlazadas, grafos
3. **Algoritmos de ordenamiento**: Bubble, Selection, Insertion, Merge Sort
4. **Algoritmos de búsqueda**: Lineal, binaria, BFS, DFS, Dijkstra
5. **Tablas hash**: Búsqueda O(1) y manejo de colisiones
6. **Proyecto integrador**: Motor de búsqueda con múltiples algoritmos

### 🎯 Habilidades Desarrolladas:
- Analizar la eficiencia de algoritmos
- Elegir la estructura de datos apropiada
- Implementar algoritmos fundamentales
- Optimizar código basándose en complejidad
- Resolver problemas complejos combinando algoritmos

### 🚀 Preparación para Módulo 4:
En el siguiente módulo aplicaremos estos conocimientos en:
- Desarrollo de aplicaciones web escalables
- Optimización de consultas a bases de datos  
- Implementación de caches y sistemas distribuidos
- Arquitecturas de alto rendimiento

¡Excelente trabajo completando el Módulo 3! 🎉