# ¿QUÉ ES EL COSTO COMPUTACIONAL EN BIG DATA?

En **entornos de Big Data**, el **costo computacional** hace referencia a la cantidad de **recursos de procesamiento, memoria, almacenamiento y red** necesarios para mover, transformar y analizar grandes volúmenes de información. Este costo no solo impacta el **tiempo de ejecución**, sino también la **escalabilidad**, la **latencia de las aplicaciones** y los **gastos en infraestructura**, especialmente cuando se trabaja en la nube.

## Factores clave

* **Volumen de datos:** mientras más grande sea el dataset (terabytes o petabytes), mayor será el costo en cómputo y almacenamiento.
* **Complejidad de los procesos:** transformaciones pesadas, uniones distribuidas o algoritmos de aprendizaje automático sobre millones de registros demandan muchos recursos.
* **Arquitectura y paralelización:** la elección entre procesamiento en **lotes (batch)** o **tiempo real (streaming)**, y el uso de clústeres distribuidos (Spark, Flink, Hadoop) influyen en el costo.
* **Optimización del pipeline:** índices, particiones, cachés y uso eficiente de memoria ayudan a reducir el consumo.

En este cuaderno, exploraremos:

- El concepto de eficiencia de algoritmos y la notación Big O.
- Cómo medir el tiempo de ejecución en Python.
- Casos de estudio comparando diferentes algoritmos.
- Visualización del tiempo de ejecución versus el tamaño del problema.
- Discusión sobre consideraciones de uso de memoria.

---


## Ejemplos

### Clasificación en clústers

Al entrenar un modelo de **clasificación en un clúster de Big Data**, como un **bosque aleatorio** o una **red neuronal profunda**, el costo computacional aumenta con:

* El **tamaño del conjunto de entrenamiento** (más nodos deben procesar datos en paralelo).
* La **complejidad del modelo** (más árboles, capas o neuronas incrementan el tiempo y los recursos).
* La necesidad de **reentrenar frecuentemente** para datos en streaming, lo que exige mayor disponibilidad y tolerancia a fallos.

En este contexto, gestionar el costo computacional es clave para lograr **pipelines eficientes**, **sistemas escalables** y **analítica en tiempo razonable** sin sobrepasar los presupuestos de infraestructura.

### Búsqueda de patrones en Big Data

La **búsqueda de patrones** es una tarea fundamental en procesos como el **análisis de imágenes, series temporales o textos masivos**.

* **Enfoque de fuerza bruta:** recorrer todos los datos de forma secuencial para identificar patrones puede resultar extremadamente costoso en términos de **tiempo de procesamiento, uso de CPU/GPU y memoria**, sobre todo cuando los volúmenes de información alcanzan terabytes o petabytes.

* **Enfoques avanzados:** técnicas de **aprendizaje profundo (deep learning)** y **modelos distribuidos** permiten **paralelizar el análisis** y **optimizar la búsqueda**. Esto reduce el costo computacional al aprovechar arquitecturas modernas como **GPUs, TPUs** y **clústeres distribuidos** con frameworks (TensorFlow, PyTorch, Spark MLlib).

En un pipeline de Big Data que procesa millones de imágenes médicas, un enfoque de fuerza bruta para detectar anomalías sería inviable. En cambio, un modelo de redes neuronales convolucionales (CNN) desplegado en un clúster distribuido puede **detectar patrones relevantes de manera más rápida, escalable y eficiente en costos**.

## Análisis de grafos

El **análisis de grafos** es clave para problemas como el **estudio de redes sociales**, la **detección de comunidades**, la **identificación de influenciadores**, o el **análisis de relaciones en bases de datos y sistemas de conocimiento**.

* **Alta complejidad:** cuando la cantidad de **nodos** y **aristas** es muy grande (millones o incluso billones), el **costo computacional** crece de manera exponencial, ya que recorrer el grafo completo exige mucho tiempo y memoria.

* **Algoritmos eficientes:** para manejar estas escalas se utilizan **algoritmos distribuidos y optimizados** que permiten realizar operaciones como **PageRank, detección de cliques, caminos más cortos o clustering de grafos** sobre plataformas de Big Data. Frameworks como **Apache Spark GraphX, Neo4j, GraphFrames o Pregel** permiten paralelizar estas tareas.

En una red social global, al aplicar algoritmos distribuidos de grafos sobre un clúster, es posible **procesar billones de relaciones de manera escalable y en tiempos razonables**.

---


## ¿Por qué es clave considerar el costo computacional en Big Data?

### 1. **Toma de decisiones estratégicas**

En proyectos de **transformación digital** y **analítica avanzada**, la dirección debe evaluar el **costo computacional** de cada tecnología (IA, blockchain, big data, IoT) antes de adoptarla:

* **Priorización de proyectos:** ¿vale la pena entrenar un modelo de machine learning complejo que consume semanas de GPUs y millones de dólares?
* **Balance costo/beneficio:** en algunos casos, modelos **livianos (TinyML, MobileNet)** son más sostenibles que arquitecturas pesadas.
* **Infraestructura:** decidir entre **on-premise** (inversión inicial alta) o **cloud computing** (flexibilidad, pero costos variables según uso).

💡 *Ejemplo:* una empresa que implementa **vision por computador** para control de calidad en fábricas debe elegir entre:

* Un algoritmo muy preciso pero caro en GPUs.
* Un modelo más eficiente (ej. **MobileNet en edge devices**) con menor costo.

### 2. **Optimización de recursos**

La ingeniería de datos debe garantizar que el costo computacional no crezca sin control:

* **Escalabilidad:** un pipeline mal optimizado puede generar costos exponenciales con el aumento de usuarios (ej. apps que sobrecargan RAM).
* **Automatización:** **RPA (Robotic Process Automation)** y optimización de queries/ETL reducen costos frente a procesos manuales o ineficientes.
* **Monitorización en la nube:** servicios como **AWS Cost Explorer** o **Google Cloud Billing** permiten auditar en tiempo real.

💡 *Ejemplo:* **Netflix** reduce el costo de transmisión masiva aplicando códecs de compresión más eficientes (**AV1**), que disminuyen el ancho de banda sin perder calidad.

### 3. **Sostenibilidad y ESG**

El costo computacional no solo es económico: también afecta la **huella de carbono**.

* **Centros de datos verdes:** elegir proveedores que usan energías renovables (Google Cloud, AWS con energía solar/eólica).
* **Green IT en IA:** aplicar técnicas de **pruning** y **quantization** para reducir consumo energético.
* **KPIs ambientales:** medir indicadores como **PUE (Power Usage Effectiveness)** en data centers.

📊 *Dato:* Entrenar **GPT-3** generó unas **552 toneladas de CO₂**. Estrategias como **federated learning** reducen el costo energético al procesar datos localmente.

### 4. **Innovación con restricciones**

No todas las empresas tienen el presupuesto de Google o Amazon. Las soluciones deben ser **eficientes y frugales**:

* **Serverless computing (AWS Lambda, GCP Functions):** pagar solo por uso.
* **Arquitecturas edge computing:** menor costo de transmisión y latencia frente a cloud centralizado.
* **Hardware adecuado:** balancear inversión en **GPUs para IA** vs. **CPUs optimizadas** para procesamiento masivo de datos.

💡 *Caso real:* startups de salud usan modelos como **EfficientNet** para diagnóstico de imágenes médicas con bajo costo computacional, evitando infraestructura cara.

### 5. **Riesgos y gobernanza**

El costo computacional también implica riesgos financieros y regulatorios:

* **Ciberseguridad:** ataques DDoS pueden disparar costos de infraestructura por sobrecarga en servidores.
* **Cumplimiento normativo (GDPR, LGPD):** procesamiento local obligatorio incrementa costos frente a soluciones distribuidas en la nube.
* **Baja latencia vs. encriptación:** procesar en tiempo real exige infraestructura costosa; añadir seguridad (encriptación) eleva aún más la carga computacional.

💡 *Ejemplo:* un **banco** que procesa millones de transacciones por segundo debe balancear:

* **Velocidad** con infraestructura de baja latencia (costo alto).
* **Cumplimiento y seguridad**, que agregan cargas de cómputo.

---


## ¿CÓMO SE CALCULA EL COSTO COMPUTACIONAL EN BIG DATA?

El **costo computacional** en proyectos de **ingeniería de datos y analítica en gran escala** puede evaluarse desde diferentes ángulos. No existe una única métrica universal: depende del tipo de tarea, del volumen de datos y de la infraestructura. A continuación, algunos de los enfoques más utilizados:

### 1. **Tiempo de ejecución (performance real)**

* Se mide cuánto tarda un pipeline, query o modelo en procesar un volumen de datos.
* Ejemplo: un job de **Spark** que procesa 1 TB en 3 minutos frente a otro que tarda 15 minutos. El primero es más eficiente en costo temporal y probablemente en uso de recursos.
* En ambientes cloud, el **tiempo de ejecución** está directamente ligado al **costo monetario**, ya que más tiempo significa más horas de cómputo facturadas.

### 2. **Complejidad computacional (análisis teórico)**

* Se mide con **notación Big-O**: O(n), O(n log n), O(n²), etc.
* En Big Data, algoritmos con **O(n²)** se vuelven inviables al crecer los datos (millones de registros).
* Ejemplo: un algoritmo de búsqueda secuencial O(n) sobre un grafo con mil millones de nodos puede ser reemplazado por un enfoque distribuido más eficiente (ej. PageRank optimizado en GraphX).

### 3. **Uso de recursos (medición práctica)**

* Incluye **CPU, GPU, memoria RAM, disco, ancho de banda de red** y **costos de almacenamiento**.
* Ejemplo: un proceso de ETL que carga un dataset completo en memoria puede ser mucho más costoso que uno que procesa en *streaming* por lotes pequeños.
* Herramientas como **Spark UI, Kubernetes Metrics, AWS CloudWatch o GCP Stackdriver** permiten medir este consumo.

### 4. **Escalabilidad (capacidad de crecer con los datos)**

* Evalúa si el sistema mantiene eficiencia al aumentar volumen o usuarios.
* Ejemplo: un pipeline en **batch** que funciona con 10 GB pero falla con 10 TB no es escalable.
* La escalabilidad puede lograrse con **arquitecturas distribuidas** (Hadoop, Spark, Flink, Dask) que permiten dividir la carga entre múltiples nodos.


✅ En **ingeniería de datos y Big Data**, calcular el costo computacional implica combinar estas perspectivas:

* **Teórica (complejidad)** → para estimar crecimiento.
* **Práctica (tiempo y recursos)** → para medir en producción.
* **Estratégica (escalabilidad y costo económico/energético)** → para planificar a largo plazo.

## Complejidad Temporal y Notación Big O

La **complejidad temporal** de un algoritmo es una medida teórica que describe la cantidad de tiempo que un algoritmo tarda en ejecutarse en función del tamaño de la entrada. Es una herramienta fundamental en informática y matemáticas para analizar y comparar la eficiencia de diferentes algoritmos.

La **notación Big O** es una notación matemática utilizada para describir el comportamiento asintótico de funciones. En el contexto de algoritmos, se utiliza para clasificar el tiempo de ejecución o uso de recursos en función del tamaño de la entrada.

---

### **Conceptos Clave**

#### **Comportamiento Asintótico**

El comportamiento asintótico se refiere al análisis del rendimiento de un algoritmo cuando el tamaño de la entrada tiende a infinito. Nos permite enfocarnos en la tendencia general y no en detalles específicos para entradas pequeñas.

#### **Funciones de Complejidad Comunes**

- **O(1) - Tiempo Constante**: El tiempo de ejecución no depende del tamaño de la entrada.
- **O(log n) - Tiempo Logarítmico**: El tiempo de ejecución crece proporcionalmente al logaritmo del tamaño de la entrada.
- **O(n) - Tiempo Lineal**: El tiempo de ejecución crece linealmente con el tamaño de la entrada.
- **O(n log n) - Tiempo Lineal-Logarítmico**: Combinación de lineal y logarítmico, común en algoritmos de ordenamiento eficientes.
- **O(n²) - Tiempo Cuadrático**: El tiempo de ejecución es proporcional al cuadrado del tamaño de la entrada, típico en algoritmos con bucles anidados.
- **O(2ⁿ) - Tiempo Exponencial**: El tiempo de ejecución se duplica con cada incremento en el tamaño de la entrada; ineficiente para grandes n.

---

### **Notación Big O**

La notación Big O formaliza el límite superior del crecimiento de una función. Decimos que una función f(n) es O(g(n)) si existen constantes positivas **c** y **n₀** tales que:

$$
0 \leq f(n) \leq c \cdot g(n) \quad \text{para todo} \ n \geq n₀
$$

Esto implica que, para valores suficientemente grandes de n, f(n) no crece más rápido que g(n), excepto por un factor constante.

---

### **Casos Detallados**

#### **Tiempo Constante - O(1)**

El tiempo de ejecución es independiente del tamaño de la entrada.

**Ejemplo:**

Acceder a un elemento específico en un array.

```python
def obtener_elemento(array, índice):
    return array[índice]
```

**Análisis:**

La operación de acceso directo en un array es constante, sin importar cuántos elementos tenga el array.

---

#### **Tiempo Logarítmico - O(log n)**

El tiempo de ejecución aumenta logarítmicamente con el tamaño de la entrada. Cada paso reduce la cantidad de datos a la mitad.

**Ejemplo:**

Búsqueda binaria en un array ordenado.

```python
def búsqueda_binaria(array, objetivo):
    izquierda = 0
    derecha = len(array) - 1
    while izquierda <= derecha:
        medio = (izquierda + derecha) // 2
        if array[medio] == objetivo:
            return medio
        elif array[medio] < objetivo:
            izquierda = medio + 1
        else:
            derecha = medio - 1
    return -1
```

**Análisis:**

En cada iteración, el espacio de búsqueda se reduce a la mitad, resultando en un máximo de log₂(n) iteraciones.

---

#### **Tiempo Lineal - O(n)**

El tiempo de ejecución es directamente proporcional al tamaño de la entrada.

**Ejemplo:**

Encontrar el elemento máximo en una .

```python
def encontrar_máximo(lista):
    máximo = lista[0]
    for elemento en lista:
        if elemento > máximo:
            máximo = elemento
    return máximo
```

**Análisis:**

Se recorre cada elemento una vez, realizando una comparación por elemento.

---

#### **Tiempo Lineal-Logarítmico - O(n log n)**

Combinación de comportamiento lineal y logarítmico. Común en algoritmos de ordenamiento eficientes.

**Ejemplo:**

Ordenamiento por mezcla (Merge Sort).

<p align="center">
<image src="amerge-sort-algorithm.png.webp" alt="Descripción de la imagen">
</p>

```python
def merge_sort(lista):
    if len(lista) > 1:
        medio = len(lista) // 2
        izquierda = lista[:medio]
        derecha = lista[medio:]
        merge_sort(izquierda)
        merge_sort(derecha)
        i = j = k = 0
        while i < len(izquierda) and j < len(derecha):
            if izquierda[i] < derecha[j]:
                lista[k] = izquierda[i]
                i += 1
            else:
                lista[k] = derecha[j]
                j += 1
            k += 1
            while i < len(izquierda):
                lista[k] = izquierda[i]
                i += 1
                k += 1
            while j < len(derecha):
                lista[k] = derecha[j]
                j += 1
                k += 1
```

**Análisis:**

Divide la lista repetidamente (log n) y combina las sublistas (n), resultando en O(n log n).

---

#### **Tiempo Cuadrático - O(n²)**

El tiempo de ejecución es proporcional al cuadrado del tamaño de la entrada.

**Ejemplo:**

Ordenamiento por burbuja.

```python

def ordenamiento_burbuja(lista):
    n = len(lista)
    for i in range(n):
        for j in range(0, n - i - 1):
            if lista[j] > lista[j + 1]:
                lista[j], lista[j + 1] = lista[j + 1], lista[j]
```

**Análisis:**

Dos bucles anidados que recorren la lista, resultando en n * n = n² iteraciones.

---

#### **Tiempo Exponencial - O(2ⁿ)**

El tiempo de ejecución se duplica con cada incremento en el tamaño de la entrada.

**Ejemplo:**

Resolución de problemas combinatorios, como el cálculo de todos los subconjuntos de un conjunto.

```python
def generar_subconjuntos(conjunto):
    if not conjunto:
        return [[]]
    elemento = conjunto[0]
    sin_elemento = generar_subconjuntos(conjunto[1:])
    con_elemento = [ [elemento] + subconjunto for subconjunto in sin_elemento ]
    return sin_elemento + con_elemento
```

**Análisis:**

El número de subconjuntos de un conjunto de tamaño n es 2ⁿ.

---

### **Reglas para Calcular la Complejidad**

- **Regla de la Suma:** Si un algoritmo realiza una secuencia de pasos, la complejidad total es la suma de las complejidades de cada paso.

  $$
  O(f(n)) + O(g(n)) = O(\max(f(n), g(n)))
  $$

- **Regla del Producto:** Para bucles anidados, la complejidad es el producto de las complejidades de cada bucle.

  $$
  O(n) \times O(n) = O(n^2)
  $$

#### **Ignorar Constantes y Términos de Menor Orden**

En notación Big O, se omiten constantes multiplicativas y términos de menor grado porque el comportamiento asintótico se centra en el crecimiento dominante.

- O(3n) se simplifica a O(n)
- O(n + log n) se simplifica a O(n)
- O(n² + n) se simplifica a O(n²)

---

### Importancia

La complejidad temporal es crucial debido a:

- **Escalabilidad:** Al trabajar con grandes conjuntos de datos o matrices, un aumento en la complejidad puede hacer que un algoritmo sea impracticable.
- **Optimización:** Permite identificar partes del algoritmo que pueden mejorarse.
- **Comparación de Algoritmos:** Facilita la elección del algoritmo más eficiente para un problema dado.

---

### **Cómo Realizar el Análisis de Complejidad**

1. **Identificar las Operaciones Básicas:**
   - Las que más contribuyen al tiempo total.
2. **Contar el Número de Veces que se Ejecutan:**
   - En función del tamaño de la entrada n.
3. **Expresar el Tiempo Total:**
   - Como una función matemática de n.
4. **Simplificar Usando Notación Big O:**
   - Mantener solo el término de mayor grado.

---

### **Limitaciones de la Notación Big O**

- **No Indica el Tiempo Exacto de Ejecución:** Solo proporciona una cota superior.
- **No Considera Constantes Ocultas:** Las constantes pueden ser significativas en la práctica.
- **Asume que Todas las Operaciones Toman el Mismo Tiempo:** Lo cual puede no ser cierto en sistemas reales.

---

## Como Medir el Tiempo de Ejecución en Python

Python proporciona los módulos `time` y `timeit` para medir el tiempo de ejecución de fragmentos de código.

### Ejemplo 1: 
Calcular el promedio de un conjunto de 10 millones de números aleatorios utilizando un enfoque de fuerza bruta (sumando todos los valores y dividiendo entre el número de elementos). Medir el tiempo de ejecución del algoritmo.

In [None]:
import random
import time

# Generar 10 millones de números aleatorios
data = [random.random() for _ in range(1000000000)]

# Calcular el promedio utilizando un enfoque de fuerza bruta
start_time = time.time()
total = sum(data)
average = total / len(data)
end_time = time.time()

# Medir el tiempo de ejecución del algoritmo
execution_time = end_time - start_time

print(f"El promedio es: {average}")
print(f"Tiempo de ejecución: {execution_time} segundos")


## Ejercicio 2: 

Ordenar un conjunto de 100.000 números aleatorios utilizando el algoritmo de ordenamiento de selección. Medir el tiempo de ejecución del algoritmo.

In [1]:
import random
import time

# Generar 100,000 números aleatorios
data = [random.randint(1, 100000) for _ in range(100000)]

# Implementar el algoritmo de ordenamiento de selección
def selection_sort(data):
    n = len(data)
    for i in range(n):
        min_idx = i
        for j in range(i+1, n):
            if data[j] < data[min_idx]:
                min_idx = j
        data[i], data[min_idx] = data[min_idx], data[i]

# Ordenar el conjunto de datos utilizando el algoritmo de selección
start_time = time.time()
selection_sort(data)
end_time = time.time()

# Medir el tiempo de ejecución del algoritmo
execution_time = end_time - start_time

print(f"El conjunto de datos ordenado es: {data}")
print(f"Tiempo de ejecución: {execution_time} segundos")


KeyboardInterrupt: 

### Ejemplo 3: 
Medir el tiempo de ejecucion de un bucle simple usando `timeit`

In [4]:
import timeit

# Definir una función simple
def bucle_simple(n):
    total = 0
    for i in range(n):
        total += i
    return total

# Medir el tiempo de ejecución
n = 10000
tiempo_ejecucion = timeit.timeit(lambda: bucle_simple(n), number=10)
print(f"Tiempo promedio de ejecución en 10 ejecuciones: {tiempo_ejecucion / 10:.6f} segundos")

n = 100000
tiempo_ejecucion = timeit.timeit(lambda: bucle_simple(n), number=10)
print(f"Tiempo promedio de ejecución en 10 ejecuciones: {tiempo_ejecucion / 10:.6f} segundos")

n = 1000000
tiempo_ejecucion = timeit.timeit(lambda: bucle_simple(n), number=10)
print(f"Tiempo promedio de ejecución en 10 ejecuciones: {tiempo_ejecucion / 10:.6f} segundos")

Tiempo promedio de ejecución en 10 ejecuciones: 0.000459 segundos
Tiempo promedio de ejecución en 10 ejecuciones: 0.003394 segundos
Tiempo promedio de ejecución en 10 ejecuciones: 0.036714 segundos


## Analisis de Complejidad Computacional:


Ejemplo 1:  Analizar la complejidad computacional de un algoritmo para calcular el máximo de un conjunto de 10000 números aleatorios utilizando un enfoque de fuerza bruta.


In [None]:
import random

# Generar 100 números aleatorios
data = [random.randint(1, 10000) for _ in range(1000)]

# Calcular el máximo utilizando un enfoque de fuerza bruta
max_num = data[0]
for num in data:
    if num > max_num:
        max_num = num
print(num)


En este caso la complejidad computacional es O(n)


Ejemplo 2: 

Contar el número de elementos duplicados en un conjunto de 1000 números aleatorios. Analizar la complejidad computacional del algoritmo.

In [None]:
import random

# Generar 1000 números aleatorios
data = [random.randint(1, 1000) for _ in range(1000)]

# Contar el número de elementos duplicados utilizando un enfoque de fuerza bruta
duplicates = set()
for i in range(len(data)):
    for j in range(i+1, len(data)):
        if data[i] == data[j]:
            duplicates.add(data[i])

# Contar el número de elementos duplicados
num_duplicates = len(duplicates)
print(num_duplicates)

En este caso la complejidad computacional es O(n^2)

## Como Medir el Uso de Recursos:


### Ejemplo 1:
Ordenar un conjunto de 10.000 números aleatorios en orden ascendente utilizando el algoritmo de ordenamiento por selección. Medir el tiempo de ejecución y la memoria utilizada por el algoritmo.

In [None]:
import random
import time
import sys

# Generar 10,000 números aleatorios
data = [random.randint(1, 10000) for _ in range(10000)]

# Implementar el algoritmo de ordenamiento por selección
start_time = time.time()

for i in range(len(data)):
    min_index = i
    for j in range(i+1, len(data)):
        if data[j] < data[min_index]:
            min_index = j
    data[i], data[min_index] = data[min_index], data[i]

end_time = time.time()
# Medir el tiempo de ejecución y la memoria utilizada
time_elapsed = end_time - start_time
memory_used = sys.getsizeof(data)

print(f"Tiempo de ejecución: {time_elapsed} segundos")
print(f"Memoria utilizada: {memory_used} bytes")

### Ejemplo 2: 

Calcular la suma de dos matrices de 100x100. Medir el tiempo de ejecución y la memoria utilizada por el algoritmo.

In [None]:
import random
import time
import sys

# Generar dos matrices de 100x100 con números aleatorios
matrix1 = [[random.randint(1, 100) for _ in range(100)] for _ in range(100)]
matrix2 = [[random.randint(1, 100) for _ in range(100)] for _ in range(100)]

# Implementar el algoritmo para sumar dos matrices
start_time = time.time()

result = [[0 for _ in range(100)] for _ in range(100)]
for i in range(100):
    for j in range(100):
        result[i][j] = matrix1[i][j] + matrix2[i][j]

end_time = time.time()

# Medir el tiempo de ejecución y la memoria utilizada
time_elapsed = end_time - start_time
memory_used = sys.getsizeof(result)

print(f"Tiempo de ejecución: {time_elapsed} segundos")
print(f"Memoria utilizada: {memory_used} bytes")

---

## Caso de Estudio: Resolviendo Sistemas Lineales

Consideremos resolver el sistema lineal **Ax = b**, donde **A** es una matriz **n x n**, y **b** es un vector de tamaño **n**.

### 3.2 Métodos:

- **Eliminación Gaussiana**: Método directo con complejidad temporal **O(n³)**.
- **Descomposición LU**: Factoriza la matriz **A** en matrices **L** y **U**.
- **Métodos Iterativos**: Como los métodos de Jacobi o Gauss-Seidel, útiles para matrices grandes y dispersas.

### Implementación y Comparación:

In [2]:
import numpy as np
from scipy.linalg import lu_solve, lu_factor
from scipy.sparse import diags
from scipy.sparse.linalg import cg  # Método del Gradiente Conjugado
import time

# Función para resolver usando Eliminación Gaussiana (np.linalg.solve)
def resolver_gaussiana(A, b):
    return np.linalg.solve(A, b)

# Función para resolver usando Descomposición LU
def resolver_lu(A, b):
    lu, piv = lu_factor(A)
    return lu_solve((lu, piv), b)

# Función para resolver usando Método Iterativo (Gradiente Conjugado)
def resolver_iterativo(A, b):
    x, info = cg(A, b)
    return x

---

### 3.2 Grafica del Tiempo de Ejecución vs. Tamaño del Problema

Vamos a medir y graficar el tiempo de ejecución de estos métodos para diferentes tamaños de **n**.

### Código:

In [None]:
import matplotlib.pyplot as plt

# Tamaños del problema
valores_n = [100, 200, 400, 800, 1600, 3200, 6400]

tiempos_gaussiana = []
tiempos_lu = []
tiempos_iterativo = []

for n in valores_n:
    # Crear una matriz y vector aleatorios
    A = np.random.rand(n, n)
    b = np.random.rand(n)

    # Medir tiempo de Eliminación Gaussiana
    inicio = time.time()
    resolver_gaussiana(A, b)
    tiempos_gaussiana.append(time.time() - inicio)

    # Medir tiempo de Descomposición LU
    inicio = time.time()
    resolver_lu(A, b)
    tiempos_lu.append(time.time() - inicio)

    # Medir tiempo del Método Iterativo (usando una matriz dispersa diagonal para eficiencia)
    diagonales = [np.ones(n-1), np.ones(n), np.ones(n-1)]
    A_dispersa = diags(diagonales, offsets=[-1, 0, 1])
    b_dispersa = np.ones(n)

    inicio = time.time()
    resolver_iterativo(A_dispersa, b_dispersa)
    tiempos_iterativo.append(time.time() - inicio)

# Graficando
plt.figure(figsize=(10, 6))
plt.plot(valores_n, tiempos_gaussiana, 'o-', label='Eliminación Gaussiana')
plt.plot(valores_n, tiempos_lu, 's-', label='Descomposición LU')
plt.plot(valores_n, tiempos_iterativo, '^-', label='Método Iterativo')
plt.xlabel('Tamaño de la Matriz (n)')
plt.ylabel('Tiempo de Ejecución (segundos)')
plt.title('Tiempo de Ejecución vs. Tamaño del Problema')
plt.legend()
plt.grid(True)
plt.show()

: 

### Interpretación:

- La **Eliminación Gaussiana** y la **Descomposición LU** tienen tiempos de ejecución que aumentan rápidamente con **n**.
- Los **Métodos Iterativos** escalan mejor para grandes valores de **n**, especialmente al tratar con matrices dispersas.

---

## ANEXO

### Algoritmo de Kahan

El **algoritmo de Kahan**, también conocido como *suma compensada de Kahan*, es un método numérico diseñado para **reducir los errores de redondeo** al sumar una secuencia de números en coma flotante. Fue propuesto por **William Kahan en 1965** y se utiliza ampliamente en **computación científica, estadística y procesamiento numérico**.

#### Idea principal

Cuando se suman números muy grandes con números muy pequeños, los decimales de menor magnitud tienden a perderse debido a los límites de precisión de los números de punto flotante. El algoritmo de Kahan introduce una **variable de compensación** que rastrea y corrige estos errores acumulados.

#### Pasos básicos

1. Inicializar una suma (`s`) y una corrección (`c`) en cero.
2. Para cada número de la secuencia:

   * Ajustar el número a sumar restando la corrección acumulada.
   * Agregarlo a la suma.
   * Actualizar la corrección con el error de redondeo detectado.

De esta manera, se evita que los errores de redondeo se propaguen a lo largo de la suma.

### Implementación en Python

```python
def kahan_sum(numbers):
    """
    Implementación del algoritmo de suma de Kahan.
    
    Args:
        numbers (list[float]): Secuencia de números en coma flotante a sumar.
    
    Returns:
        float: Suma precisa con corrección de errores de redondeo.
    """
    s = 0.0   # Suma acumulada
    c = 0.0   # Corrección acumulada

    for x in numbers:
        y = x - c          # Ajuste con corrección previa
        t = s + y          # Nueva suma
        c = (t - s) - y    # Nuevo error de redondeo
        s = t              # Actualizar suma
    
    return s
```

El algoritmo de Kahan es especialmente útil al **sumar grandes volúmenes de datos con magnitudes muy diferentes** (por ejemplo, `1e10 + 1e-5 + 1e-10`), donde la suma convencional perdería precisión significativa.


In [None]:
def kahan_sum(numbers):
    """
    Implementación del algoritmo de suma de Kahan.
    """
    s = 0.0   # Suma acumulada
    c = 0.0   # Corrección acumulada

    for x in numbers:
        y = x - c          # Ajustar con corrección previa
        t = s + y          # Nueva suma
        c = (t - s) - y    # Nuevo error de redondeo
        s = t              # Actualizar suma
    
    return s


# Ejemplo: números muy grandes con números muy pequeños
data = [1e10, 1.0, 1e-10, -1e10]

# Suma normal en Python
normal_sum = sum(data)

# Suma con algoritmo de Kahan
kahan_result = kahan_sum(data)

print("Suma normal   :", normal_sum)
print("Suma de Kahan :", kahan_result)


El arreglo data contiene un número muy grande (1e10), un número pequeño (1.0), un número diminuto (1e-10) y finalmente -1e10. La suma exacta debería ser aproximadamente 

1.0 + 1e-10 = 1.0000000001.

Con la suma estándar (sum()), Python pierde precisión debido al redondeo. Con la suma de Kahan, se conserva la corrección y el resultado es más preciso.