<a href="https://colab.research.google.com/github/EJYEPEZM/PPIA/blob/main/unidad_1_fundamentos_vectorizacion/2_Vectorizacion_NumPy.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# üíä C√°psula 2: La Carrera de Velocidad (Vectorizaci√≥n)
**Tema:** NumPy vs Bucles `for`, Rendimiento y Arrays.

## 1. ¬øPor qu√© Python es lento? (Y c√≥mo arreglarlo)

Python es un lenguaje interpretado y din√°mico. Cada vez que haces un bucle `for`, Python tiene que verificar el tipo de dato, gestionar memoria, etc., **en cada vuelta**.

### La Soluci√≥n: NumPy y Vectorizaci√≥n
**NumPy** (Numerical Python) es una librer√≠a escrita en **C**.
Cuando usas un Array de NumPy, los datos se guardan en bloques contiguos de memoria (como en C).

**Vectorizaci√≥n:** En lugar de procesar dato por dato (escalar), aplicas la operaci√≥n a todo el array de golpe. NumPy empuja esa operaci√≥n al nivel bajo (C), donde es incre√≠blemente r√°pida.

> **Regla de Oro:** Si est√°s usando un bucle `for` para matem√°ticas en Data Science, lo est√°s haciendo mal.

In [1]:
import numpy as np
import time

# --- PREPARACI√ìN DEL ESTADIO ---
# Vamos a crear una lista gigante de 10 millones de n√∫meros
TAMA√ëO = 10_000_000

# Datos en formato Lista de Python (Lento)
datos_lista = list(range(TAMA√ëO))

# Datos en formato Array de NumPy (R√°pido)
datos_array = np.array(datos_lista)

print(f"üèéÔ∏è Iniciando carrera con {TAMA√ëO:,} datos...")

# --- CARRIL 1: Bucle FOR de Python ---
start = time.time()
resultado_lista = []
for numero in datos_lista:
    resultado_lista.append(numero * 2) # Operaci√≥n simple: Multiplicar por 2
end = time.time()
tiempo_python = end - start
print(f"üê¢ Python (Bucle For): {tiempo_python:.4f} segundos")

# --- CARRIL 2: Vectorizaci√≥n NumPy ---
start = time.time()
resultado_array = datos_array * 2 # ¬°Mira qu√© sintaxis tan limpia!
end = time.time()
tiempo_numpy = end - start
print(f"üöÄ NumPy (Vectorizado): {tiempo_numpy:.4f} segundos")

# --- VEREDICTO ---
velocidad = tiempo_python / tiempo_numpy
print(f"\nüèÜ CONCLUSI√ìN: NumPy es {velocidad:.0f} VECES m√°s r√°pido que Python puro.")

üèéÔ∏è Iniciando carrera con 10,000,000 datos...
üê¢ Python (Bucle For): 0.9966 segundos
üöÄ NumPy (Vectorizado): 0.0226 segundos

üèÜ CONCLUSI√ìN: NumPy es 44 VECES m√°s r√°pido que Python puro.


## üî• Micro-Desaf√≠o: El Descuento Masivo

Eres el Data Scientist de un E-commerce. Es Black Friday y tienes que aplicar un **descuento del 15%** a todos los precios de tu cat√°logo (1 mill√≥n de productos).

El desarrollador anterior dej√≥ un c√≥digo con un bucle `for` que est√° bloqueando el servidor.

**Tu Misi√≥n:**
1.  Convierte la lista de precios a un **NumPy Array**.
2.  Aplica el descuento (multiplicar por 0.85) usando **Vectorizaci√≥n** (sin bucles).
3.  Calcula el precio promedio final usando el m√©todo vectorizado `.mean()`.

In [None]:
# Generamos precios aleatorios para 1 mill√≥n de productos
# (Simulaci√≥n de datos)
import random
precios_raw = [random.uniform(10, 100) for _ in range(1_000_000)]

print("Datos cargados. Optimizando...")

# 1. Convierte a NumPy Array
# TODO: precios_np = ...
precios_np = None

# 2. Aplica el descuento del 15% (multiplicar por 0.85) VECTORIZADO
# NO USES BUCLES FOR. Opera directamente sobre 'precios_np'
# TODO: precios_con_descuento = ...
precios_con_descuento = None

# 3. Calcula el promedio
# TODO: promedio = ...
promedio = 0

# --- VALIDACI√ìN ---
if isinstance(precios_con_descuento, np.ndarray):
    print(f"‚úÖ ¬°Correcto! Usaste un Array de NumPy.")
    print(f"Precio promedio final: ${promedio:.2f}")

    # Check de velocidad (truco interno)
    if len(precios_con_descuento) == 1_000_000:
        print("üöÄ Procesamiento completado instant√°neamente.")
else:
    print("‚ùå Error: No est√°s usando un NumPy Array.")