# Vectorización en NumPy

## ¿Por qué evitar bucles en Python?

Python es un lenguaje interpretado y dinámico, lo que lo hace lento para operaciones numéricas repetitivas. Cuando usamos bucles `for` o `while` en Python:

- Cada iteración tiene **overhead** (verificación de tipos, búsqueda de nombres, etc.)
- No hay optimizaciones a nivel de CPU
- El intérprete debe ejecutar cada línea de código individualmente

## La solución: Vectorización

NumPy utiliza operaciones **vectorizadas** que:
- Se ejecutan en código C/Fortran optimizado
- Procesan múltiples elementos simultáneamente
- Aprovechan la CPU

**Regla de oro**: Si puedes hacerlo con operaciones vectorizadas de NumPy, **¡hazlo!**

In [None]:
import numpy as np
import time
from functools import wraps

def medir_tiempo(func):
    """
    Decorador para medir el tiempo de ejecución de una función.
    
    Returns:
        tuple: (resultado de la función, tiempo en segundos)
    """
    @wraps(func)
    def wrapper(*args, **kwargs):
        start = time.time()
        resultado = func(*args, **kwargs)
        tiempo_ejecucion = time.time() - start
        return resultado, tiempo_ejecucion
    return wrapper

## Ejemplo 1: Suma de elementos en una matriz

Comparación entre usar un bucle anidado y usar operaciones vectorizadas.

In [29]:
matriz = np.random.rand(1000, 1000)

@medir_tiempo
def suma_con_bucle(matriz):
    suma = 0
    for i in range(matriz.shape[0]):
        for j in range(matriz.shape[1]):
            suma += matriz[i, j]
    return suma

@medir_tiempo
def suma_vectorizada(matriz):
    return np.sum(matriz)

suma_bucle, tiempo_bucle = suma_con_bucle(matriz)
suma_vectorizada, tiempo_vectorizado = suma_vectorizada(matriz)

print(f"Shape de la matriz: {matriz.shape}")
print(f"\nTiempo bucle: {tiempo_bucle:.6f} segundos")
print(f"Tiempo vectorizado: {tiempo_vectorizado:.6f} segundos")
print(f"\nVectorizado es {tiempo_bucle/tiempo_vectorizado:.1f}x más rápido")

Shape de la matriz: (1000, 1000)

Tiempo bucle: 0.072147 segundos
Tiempo vectorizado: 0.000361 segundos

Vectorizado es 199.9x más rápido


## Ejemplo 2: Operaciones matemáticas elemento por elemento

Aplicar una función matemática a cada elemento de una matriz.

In [30]:
matriz = np.random.rand(1000, 1000)

@medir_tiempo
def operaciones_matematicas_bucle(matriz):
    resultado = []
    for i in range(matriz.shape[0]):
        fila = []
        for j in range(matriz.shape[1]):
            fila.append(matriz[i, j] ** 2 + np.sin(matriz[i, j]))
        resultado.append(fila)
    return resultado

@medir_tiempo
def operaciones_matematicas_vectorizada(matriz):
    return matriz ** 2 + np.sin(matriz)

resultado_bucle, tiempo_bucle = operaciones_matematicas_bucle(matriz)
resultado_vectorizado, tiempo_vectorizado = operaciones_matematicas_vectorizada(matriz)

print(f"Shape de la matriz: {matriz.shape}")
print(f"Tiempo bucle: {tiempo_bucle:.6f} segundos")
print(f"Tiempo vectorizado: {tiempo_vectorizado:.6f} segundos")

Shape de la matriz: (1000, 1000)
Tiempo bucle: 0.386724 segundos
Tiempo vectorizado: 0.003739 segundos


## Ejemplo 3: Operaciones condicionales

Aplicar condiciones a elementos de una matriz (por ejemplo, reemplazar valores).

In [31]:
matriz = np.random.randn(1000, 1000)  # Valores con distribución normal

# Método 1: Bucle anidado con condición (LENTO)
@medir_tiempo
def condicional_bucle(matriz):
    resultado = []
    for i in range(matriz.shape[0]):
        fila = []
        for j in range(matriz.shape[1]):
            if matriz[i, j] > 0:
                fila.append(matriz[i, j] ** 2)
            else:
                fila.append(0)
        resultado.append(fila)
    return resultado

# Método 2: Vectorizado con np.where (RÁPIDO)
@medir_tiempo
def condicional_vectorizada(matriz):
    return np.where(matriz > 0, matriz ** 2, 0)

resultado_bucle, tiempo_bucle = condicional_bucle(matriz)
resultado_vectorizado, tiempo_vectorizado = condicional_vectorizada(matriz)

print(f"Shape de la matriz: {matriz.shape}")
print(f"Tiempo bucle: {tiempo_bucle:.6f} segundos")
print(f"Tiempo vectorizado: {tiempo_vectorizado:.6f} segundos")
print(f"\nVectorizado es {tiempo_bucle/tiempo_vectorizado:.1f}x más rápido")

Shape de la matriz: (1000, 1000)
Tiempo bucle: 0.109157 segundos
Tiempo vectorizado: 0.001174 segundos

Vectorizado es 93.0x más rápido


## Ejemplo 4: Operaciones entre matrices

Sumar, multiplicar o combinar múltiples matrices.

In [32]:
matriz1 = np.random.rand(1000, 1000)
matriz2 = np.random.rand(1000, 1000)

@medir_tiempo
def operaciones_entre_matrices_bucle(matriz1, matriz2):
    resultado = []
    for i in range(matriz1.shape[0]):
        fila = []
        for j in range(matriz1.shape[1]):
            fila.append(matriz1[i, j] * matriz2[i, j] + matriz1[i, j])
        resultado.append(fila)
    return resultado

@medir_tiempo
def operaciones_entre_matrices_vectorizada(matriz1, matriz2):
    return matriz1 * matriz2 + matriz1

resultado_bucle, tiempo_bucle = operaciones_entre_matrices_bucle(matriz1, matriz2)
resultado_vectorizado, tiempo_vectorizado = operaciones_entre_matrices_vectorizada(matriz1, matriz2)

print(f"Shape de las matrices: {matriz1.shape}")
print(f"Tiempo bucle: {tiempo_bucle:.6f} segundos")
print(f"Tiempo vectorizado: {tiempo_vectorizado:.6f} segundos")
print(f"\nVectorizado es {tiempo_bucle/tiempo_vectorizado:.1f}x más rápido")

Shape de las matrices: (1000, 1000)
Tiempo bucle: 0.166391 segundos
Tiempo vectorizado: 0.001730 segundos

Vectorizado es 96.2x más rápido


## Ejemplo 5: Operaciones con matrices 2D

Trabajar con matrices bidimensionales.

In [33]:
matriz = np.random.rand(1000, 1000)

@medir_tiempo
def cuadrado_bucle(matriz):
    resultado = []
    for i in range(matriz.shape[0]):
        fila = []
        for j in range(matriz.shape[1]):
            fila.append(matriz[i, j] ** 2)
        resultado.append(fila)
    return resultado

@medir_tiempo
def cuadrado_vectorizado(matriz):
    return matriz ** 2

resultado_bucle, tiempo_bucle = cuadrado_bucle(matriz)
resultado_vectorizado, tiempo_vectorizado = cuadrado_vectorizado(matriz)

print(f"Tiempo bucle anidado: {tiempo_bucle:.6f} segundos")
print(f"Tiempo vectorizado: {tiempo_vectorizado:.6f} segundos")
print(f"\nVectorizado es {tiempo_bucle/tiempo_vectorizado:.1f}x más rápido")

Tiempo bucle anidado: 0.103746 segundos
Tiempo vectorizado: 0.000159 segundos

Vectorizado es 653.4x más rápido


## Resumen: Principios de Vectorización

### Consejos
1. **Piensa en términos de operaciones sobre matrices completas**, no elementos individuales
2. **Usa funciones universales (ufuncs)** de NumPy: `np.sin`, `np.cos`, `np.exp`, etc. (funcionan en matrices)
3. **Aprovecha el broadcasting** para operaciones entre matrices y vectores de diferentes formas
4. **Operaciones por fila/columna**: usa `axis` en funciones como `np.sum(matriz, axis=0)` en lugar de bucles