<a href="https://colab.research.google.com/github/culiacanai/Aprende_Python_con_GoogleColab/blob/main/notebooks/11_Intro_a_NumPy.ipynb" target="_parent">
  <img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/>
</a>

# üî¢ Intro a NumPy

### Aprende Python con Google Colab ‚Äî por [Culiacan.AI](https://culiacan.ai)

**Nivel:** üü° Intermedio  
**Duraci√≥n estimada:** 60 minutos  
**Requisitos:** Haber completado el [Notebook 07 ‚Äî Pandas B√°sico](07_Pandas_Basico.ipynb)

---

En este notebook vas a:
- Entender qu√© es NumPy y por qu√© es la base de toda la ciencia de datos en Python
- Crear y manipular arrays (vectores y matrices)
- Hacer operaciones vectorizadas (sin loops, mucho m√°s r√°pido)
- Indexar, filtrar y transformar arrays
- Usar funciones estad√≠sticas y matem√°ticas
- Entender broadcasting y √°lgebra lineal b√°sica

> üí° **NumPy** es el cimiento sobre el que est√°n construidos Pandas, Matplotlib, Scikit-learn, TensorFlow y pr√°cticamente todo el ecosistema de IA en Python. Sin NumPy, no hay machine learning.


---

## 0. Preparaci√≥n


In [None]:
import numpy as np  # np es la convenci√≥n universal

print(f"NumPy versi√≥n: {np.__version__}")

---

## 1. ¬øPor qu√© NumPy?

Las listas de Python son flexibles pero **lentas** para operaciones num√©ricas. NumPy usa arrays optimizados en C que son hasta **100x m√°s r√°pidos**.


In [None]:
# Comparaci√≥n de velocidad: lista vs array
import time

n = 1_000_000

# Con lista de Python
lista = list(range(n))
inicio = time.time()
resultado_lista = [x * 2 for x in lista]
tiempo_lista = time.time() - inicio

# Con NumPy
array = np.arange(n)
inicio = time.time()
resultado_numpy = array * 2
tiempo_numpy = time.time() - inicio

print(f"Lista Python: {tiempo_lista:.4f} segundos")
print(f"NumPy array:  {tiempo_numpy:.4f} segundos")
print(f"NumPy es {tiempo_lista / tiempo_numpy:.0f}x m√°s r√°pido üöÄ")

In [None]:
# Otra diferencia: operaciones elemento por elemento
# Con listas ‚Äî necesitas un loop
lista_a = [1, 2, 3, 4, 5]
lista_b = [10, 20, 30, 40, 50]
# lista_a + lista_b ‚Üí [1, 2, 3, 4, 5, 10, 20, 30, 40, 50]  ‚Üê concatena, no suma!

# Con NumPy ‚Äî funciona como esperar√≠as
a = np.array([1, 2, 3, 4, 5])
b = np.array([10, 20, 30, 40, 50])
print(f"a + b = {a + b}")      # Suma elemento por elemento
print(f"a * b = {a * b}")      # Multiplicaci√≥n elemento por elemento
print(f"a ** 2 = {a ** 2}")    # Cada elemento al cuadrado

---

## 2. Crear arrays

### 2.1 Desde listas


In [None]:
# Array 1D (vector)
ventas = np.array([15000, 22000, 18500, 25000, 19000])
print(f"Ventas: {ventas}")
print(f"Tipo: {type(ventas)}")
print(f"Dtype: {ventas.dtype}")  # Tipo de dato de los elementos
print(f"Shape: {ventas.shape}")  # Dimensiones
print(f"Ndim: {ventas.ndim}")    # N√∫mero de dimensiones

In [None]:
# Array 2D (matriz)
ventas_sucursales = np.array([
    [15000, 22000, 18500],  # Sucursal 1: Ene, Feb, Mar
    [18000, 21000, 19500],  # Sucursal 2
    [12000, 16000, 14000],  # Sucursal 3
    [25000, 28000, 30000],  # Sucursal 4
])

print(f"Matriz de ventas:")
print(ventas_sucursales)
print(f"\nShape: {ventas_sucursales.shape}")  # (4 filas, 3 columnas)
print(f"Ndim: {ventas_sucursales.ndim}")
print(f"Total elementos: {ventas_sucursales.size}")

### 2.2 Funciones para crear arrays


In [None]:
# Secuencias
print("arange(0, 10):", np.arange(0, 10))           # Como range()
print("arange(0, 1, 0.2):", np.arange(0, 1, 0.2))   # Con paso decimal
print("linspace(0, 1, 5):", np.linspace(0, 1, 5))    # 5 puntos entre 0 y 1

# Llenos de un valor
print("\nzeros(5):", np.zeros(5))
print("ones(5):", np.ones(5))
print("full(5, 42):", np.full(5, 42))

# Matrices
print("\nzeros(2x3):")
print(np.zeros((2, 3)))
print("\nIdentidad 3x3:")
print(np.eye(3))

In [None]:
# Arrays aleatorios ‚Äî muy usados en machine learning
rng = np.random.default_rng(42)  # Generador con semilla para reproducibilidad

print("Enteros aleatorios (0-100):", rng.integers(0, 100, size=5))
print("Decimales aleatorios (0-1):", rng.random(5).round(3))
print("Normal (media=0, std=1):", rng.standard_normal(5).round(3))

# Simular ventas diarias (media $15,000, desv. $5,000)
ventas_simuladas = rng.normal(loc=15000, scale=5000, size=30).astype(int)
print(f"\nVentas simuladas (30 d√≠as): {ventas_simuladas[:10]}...")
print(f"Promedio: ${ventas_simuladas.mean():,.0f}")

---

## 3. Indexaci√≥n y slicing

### 3.1 Arrays 1D


In [None]:
ventas = np.array([15000, 22000, 18500, 25000, 19000, 28000, 12000])
dias = np.array(["Lun", "Mar", "Mi√©", "Jue", "Vie", "S√°b", "Dom"])

# Indexaci√≥n simple
print(f"Lunes: ${ventas[0]:,}")
print(f"S√°bado: ${ventas[5]:,}")
print(f"Domingo: ${ventas[-1]:,}")

# Slicing
print(f"\nLun-Vie: {ventas[:5]}")
print(f"Fin de semana: {ventas[5:]}")
print(f"Mar, Jue, S√°b: {ventas[1::2]}")  # Cada 2, empezando en 1

In [None]:
# Indexaci√≥n con array de √≠ndices (fancy indexing)
indices = np.array([0, 3, 5])  # Lun, Jue, S√°b
print(f"D√≠as seleccionados: {dias[indices]}")
print(f"Ventas: {ventas[indices]}")

# Indexaci√≥n con booleanos (filtrado)
filtro = ventas > 20000
print(f"\nFiltro (> $20,000): {filtro}")
print(f"D√≠as con ventas > $20,000: {dias[filtro]}")
print(f"Ventas > $20,000: {ventas[filtro]}")

### 3.2 Arrays 2D (matrices)


In [None]:
# Ventas: 4 sucursales √ó 3 meses
ventas = np.array([
    [15000, 22000, 18500],  # Centro
    [18000, 21000, 19500],  # Tres R√≠os
    [12000, 16000, 14000],  # Los Mochis
    [25000, 28000, 30000],  # Plaza Fiesta
])
sucursales = ["Centro", "Tres R√≠os", "Los Mochis", "Plaza Fiesta"]
meses = ["Enero", "Febrero", "Marzo"]

# Acceder a elementos
print(f"Centro, Enero: ${ventas[0, 0]:,}")
print(f"Plaza Fiesta, Marzo: ${ventas[3, 2]:,}")

# Filas completas (una sucursal)
print(f"\nCentro (todos los meses): {ventas[0]}")

# Columnas completas (un mes)
print(f"Febrero (todas las sucursales): {ventas[:, 1]}")

# Submatriz
print(f"\nPrimeras 2 sucursales, Feb-Mar:")
print(ventas[:2, 1:])

---

## 4. Operaciones vectorizadas

La magia de NumPy: operaciones que se aplican a **todos los elementos** sin loops.

### 4.1 Operaciones aritm√©ticas


In [None]:
precios = np.array([890, 1490, 2490, 350, 890, 120, 80])
productos = ["Monofocal", "Bifocal", "Progresivo", "Armaz√≥n b√°sico",
             "Armaz√≥n premium", "Soluci√≥n", "Estuche"]

# Operaciones con escalares
con_iva = precios * 1.16
con_descuento_10 = precios * 0.90
en_dolares = precios / 17.50  # Tipo de cambio aproximado

print("Producto          | Precio | +IVA    | -10%    | USD")
print("-" * 65)
for i in range(len(productos)):
    print(f"{productos[i]:<18} | ${precios[i]:>5,} | ${con_iva[i]:>7,.0f} | ${con_descuento_10[i]:>7,.0f} | ${en_dolares[i]:>6,.2f}")

In [None]:
# Operaciones entre arrays
ventas_ene = np.array([185000, 143000, 98000, 220000])
ventas_feb = np.array([192000, 155000, 105000, 215000])

# Diferencia
diferencia = ventas_feb - ventas_ene
print(f"Diferencia Feb vs Ene: {diferencia}")

# Crecimiento porcentual
crecimiento = ((ventas_feb - ventas_ene) / ventas_ene * 100).round(1)
sucursales = ["Centro", "Tres R√≠os", "Los Mochis", "Plaza Fiesta"]

print(f"\nCrecimiento mensual:")
for suc, crec in zip(sucursales, crecimiento):
    emoji = "üìà" if crec > 0 else "üìâ"
    print(f"  {emoji} {suc}: {crec:+.1f}%")

### 4.2 Funciones matem√°ticas universales (ufuncs)


In [None]:
x = np.array([1, 4, 9, 16, 25, 36])

print(f"Original: {x}")
print(f"Ra√≠z cuadrada: {np.sqrt(x)}")
print(f"Logaritmo (base 10): {np.log10(x).round(2)}")
print(f"Exponencial: {np.exp(x[:3])}")  # Solo primeros 3 (los dem√°s son enormes)

# Redondeo
precios = np.array([89.5, 149.3, 248.7, 35.2])
print(f"\nOriginal: {precios}")
print(f"Redondear: {np.round(precios)}")
print(f"Piso (floor): {np.floor(precios)}")
print(f"Techo (ceil): {np.ceil(precios)}")

# Trigonometr√≠a (√∫til en gr√°ficas y se√±ales)
angulos = np.linspace(0, 2 * np.pi, 8)
print(f"\nSeno: {np.sin(angulos).round(2)}")

---

## 5. Estad√≠sticas con NumPy


In [None]:
# Ventas diarias del mes (simuladas)
rng = np.random.default_rng(42)
ventas_dia = rng.normal(loc=18000, scale=5000, size=30).astype(int)

print(f"Ventas diarias (30 d√≠as): {ventas_dia[:10]}...")
print(f"\nüìä Estad√≠sticas:")
print(f"  Suma:            ${np.sum(ventas_dia):>10,}")
print(f"  Promedio:        ${np.mean(ventas_dia):>10,.0f}")
print(f"  Mediana:         ${np.median(ventas_dia):>10,.0f}")
print(f"  Desv. est√°ndar:  ${np.std(ventas_dia):>10,.0f}")
print(f"  Varianza:        ${np.var(ventas_dia):>10,.0f}")
print(f"  M√≠nimo:          ${np.min(ventas_dia):>10,}")
print(f"  M√°ximo:          ${np.max(ventas_dia):>10,}")
print(f"  Rango:           ${np.ptp(ventas_dia):>10,}")  # max - min

# Percentiles
print(f"\nüìà Percentiles:")
for p in [25, 50, 75, 90]:
    print(f"  P{p}: ${np.percentile(ventas_dia, p):>10,.0f}")

In [None]:
# Estad√≠sticas por eje en matrices
ventas = np.array([
    [15000, 22000, 18500],  # Centro
    [18000, 21000, 19500],  # Tres R√≠os
    [12000, 16000, 14000],  # Los Mochis
    [25000, 28000, 30000],  # Plaza Fiesta
])
sucursales = ["Centro", "Tres R√≠os", "Los Mochis", "Plaza Fiesta"]
meses = ["Enero", "Febrero", "Marzo"]

# axis=0 ‚Üí opera sobre filas (resultado por columna/mes)
print("Total por mes:", np.sum(ventas, axis=0))
print(f"  {meses[0]}: ${np.sum(ventas, axis=0)[0]:,}")

# axis=1 ‚Üí opera sobre columnas (resultado por fila/sucursal)
print(f"\nTotal por sucursal:", np.sum(ventas, axis=1))
for suc, total in zip(sucursales, np.sum(ventas, axis=1)):
    print(f"  {suc}: ${total:,}")

# Promedio por sucursal
print(f"\nPromedio por sucursal:", np.mean(ventas, axis=1).astype(int))

---

## 6. Reshape y manipulaci√≥n de forma

### 6.1 Cambiar la forma (reshape)


In [None]:
# Reshape: cambiar la forma sin cambiar los datos
datos = np.arange(12)
print(f"Original (1D): {datos}")
print(f"Shape: {datos.shape}")

# Convertir a matriz 3x4
matriz_3x4 = datos.reshape(3, 4)
print(f"\n3x4:")
print(matriz_3x4)

# Convertir a matriz 4x3
matriz_4x3 = datos.reshape(4, 3)
print(f"\n4x3:")
print(matriz_4x3)

# Usar -1 para que NumPy calcule una dimensi√≥n
matriz_auto = datos.reshape(2, -1)  # 2 filas, NumPy calcula las columnas
print(f"\n2x?: {matriz_auto.shape}")
print(matriz_auto)

### 6.2 Apilar y concatenar arrays


In [None]:
# Datos de dos trimestres
q1 = np.array([15000, 22000, 18500])
q2 = np.array([19000, 25000, 21000])

# Concatenar (unir)
semestre = np.concatenate([q1, q2])
print(f"Semestre: {semestre}")

# Apilar verticalmente (como filas)
tabla = np.vstack([q1, q2])
print(f"\nApilado vertical:")
print(tabla)

# Apilar horizontalmente
fila = np.hstack([q1, q2])
print(f"\nApilado horizontal: {fila}")

# Agregar una fila a una matriz
q3 = np.array([21000, 27000, 23000])
tres_trimestres = np.vstack([tabla, q3])
print(f"\nTres trimestres:")
print(tres_trimestres)

---

## 7. Broadcasting

Broadcasting es la capacidad de NumPy de operar entre arrays de **diferente forma** de manera inteligente.


In [None]:
# Ejemplo 1: Escalar + Array (lo m√°s simple)
precios = np.array([890, 1490, 2490])
con_iva = precios * 1.16  # El 1.16 se "expande" a [1.16, 1.16, 1.16]
print(f"Precios: {precios}")
print(f"Con IVA: {con_iva.astype(int)}")

# Ejemplo 2: Matriz + Vector
ventas = np.array([
    [15000, 22000, 18500],  # Centro
    [18000, 21000, 19500],  # Tres R√≠os
    [25000, 28000, 30000],  # Plaza Fiesta
])

# Meta mensual diferente para cada mes
metas = np.array([20000, 25000, 22000])  # Ene, Feb, Mar

# Broadcasting: la meta se aplica a cada fila autom√°ticamente
cumplimiento = (ventas / metas * 100).round(1)
print(f"\nMetas: {metas}")
print(f"\nCumplimiento (%):")
print(cumplimiento)

sucursales = ["Centro", "Tres R√≠os", "Plaza Fiesta"]
meses = ["Ene", "Feb", "Mar"]
print(f"\n{'':>12} {meses[0]:>8} {meses[1]:>8} {meses[2]:>8}")
for suc, fila in zip(sucursales, cumplimiento):
    emojis = ["‚úÖ" if v >= 100 else "‚ùå" for v in fila]
    print(f"{suc:>12} {fila[0]:>6.1f}%{emojis[0]} {fila[1]:>5.1f}%{emojis[1]} {fila[2]:>5.1f}%{emojis[2]}")

---

## 8. √Ålgebra lineal b√°sica

Fundamental para machine learning: multiplicaci√≥n de matrices, transpuestas, determinantes.


In [None]:
# Transpuesta (intercambiar filas y columnas)
ventas = np.array([
    [15000, 22000, 18500],
    [18000, 21000, 19500],
    [25000, 28000, 30000],
])
print("Original (3 sucursales √ó 3 meses):")
print(ventas)
print(f"Shape: {ventas.shape}")

print("\nTranspuesta (3 meses √ó 3 sucursales):")
print(ventas.T)
print(f"Shape: {ventas.T.shape}")

In [None]:
# Producto punto (dot product) ‚Äî base de redes neuronales
# Ejemplo: calcular ingresos totales
# cantidades vendidas √ó precios
cantidades = np.array([45, 30, 20])  # Monofocal, Bifocal, Progresivo
precios = np.array([890, 1490, 2490])

# Producto punto = (45√ó890) + (30√ó1490) + (20√ó2490)
ingreso_total = np.dot(cantidades, precios)
print(f"Cantidades: {cantidades}")
print(f"Precios: {precios}")
print(f"Ingreso total: ${ingreso_total:,}")

# Equivalente manual
manual = sum(c * p for c, p in zip(cantidades, precios))
print(f"Verificaci√≥n: ${manual:,}")

In [None]:
# Multiplicaci√≥n de matrices
# Ventas (3 sucursales √ó 3 productos) √ó Precios (3 productos √ó 1)
ventas_unidades = np.array([
    [45, 30, 20],  # Centro
    [38, 25, 15],  # Tres R√≠os
    [55, 40, 25],  # Plaza Fiesta
])
precios = np.array([[890], [1490], [2490]])  # Columna

# Multiplicaci√≥n de matrices: (3√ó3) @ (3√ó1) = (3√ó1)
ingresos = ventas_unidades @ precios
sucursales = ["Centro", "Tres R√≠os", "Plaza Fiesta"]

print("Ingresos por sucursal:")
for suc, ing in zip(sucursales, ingresos):
    print(f"  {suc}: ${ing[0]:,}")

---

## 9. NumPy en Machine Learning: ejemplo pr√°ctico

Vamos a implementar una **normalizaci√≥n de datos** y un **c√°lculo de distancias** ‚Äî operaciones fundamentales en ML.


In [None]:
# Normalizaci√≥n Min-Max: escalar datos entre 0 y 1
# F√≥rmula: x_norm = (x - min) / (max - min)

# Datos de sucursales: [ventas, empleados, √°rea_m2]
datos = np.array([
    [185000, 5, 80],   # Centro
    [143000, 4, 65],   # Tres R√≠os
    [220000, 6, 95],   # Plaza Fiesta
    [98000, 3, 50],    # Los Mochis
    [162000, 4, 75],   # Mazatl√°n
])

sucursales = ["Centro", "Tres R√≠os", "Plaza Fiesta", "Los Mochis", "Mazatl√°n"]
columnas = ["Ventas", "Empleados", "√Årea m¬≤"]

# Normalizaci√≥n (broadcasting hace todo el trabajo)
datos_min = datos.min(axis=0)
datos_max = datos.max(axis=0)
datos_norm = (datos - datos_min) / (datos_max - datos_min)

print("Datos originales:")
print(f"{'Sucursal':<14} {'Ventas':>10} {'Empleados':>10} {'√Årea':>8}")
for suc, fila in zip(sucursales, datos):
    print(f"{suc:<14} ${fila[0]:>9,} {fila[1]:>10} {fila[2]:>7}")

print(f"\nDatos normalizados (0-1):")
print(f"{'Sucursal':<14} {'Ventas':>10} {'Empleados':>10} {'√Årea':>8}")
for suc, fila in zip(sucursales, datos_norm):
    print(f"{suc:<14} {fila[0]:>10.3f} {fila[1]:>10.3f} {fila[2]:>8.3f}")

In [None]:
# Distancia euclidiana ‚Äî ¬øqu√© tan "similares" son dos sucursales?
# F√≥rmula: d = sqrt(sum((a - b)¬≤))

def distancia_euclidiana(a, b):
    return np.sqrt(np.sum((a - b) ** 2))

# Calcular distancia entre todas las sucursales (usando datos normalizados)
n = len(sucursales)
matriz_dist = np.zeros((n, n))

for i in range(n):
    for j in range(n):
        matriz_dist[i, j] = distancia_euclidiana(datos_norm[i], datos_norm[j])

print("Matriz de distancias (m√°s cerca = m√°s similar):")
print(f"{'':>14}", end="")
for suc in sucursales:
    print(f"{suc[:8]:>10}", end="")
print()

for i, suc in enumerate(sucursales):
    print(f"{suc:<14}", end="")
    for j in range(n):
        print(f"{matriz_dist[i,j]:>10.3f}", end="")
    print()

# ¬øCu√°les son m√°s similares?
# Encontrar la distancia m√≠nima (excluyendo la diagonal)
np.fill_diagonal(matriz_dist, np.inf)
min_idx = np.unravel_index(np.argmin(matriz_dist), matriz_dist.shape)
print(f"\nü§ù Sucursales m√°s similares: {sucursales[min_idx[0]]} y {sucursales[min_idx[1]]}")
print(f"   Distancia: {matriz_dist[min_idx]:.3f}")

In [None]:
# Visualizar con Matplotlib
import matplotlib.pyplot as plt

fig, axes = plt.subplots(1, 3, figsize=(15, 4))

# 1. Datos originales vs normalizados
ax1 = axes[0]
x = np.arange(len(sucursales))
ax1.bar(x - 0.2, datos[:, 0] / datos[:, 0].max(), 0.4, label="Ventas", color="#2E86AB")
ax1.bar(x + 0.2, datos[:, 2] / datos[:, 2].max(), 0.4, label="√Årea", color="#F18F01")
ax1.set_xticks(x)
ax1.set_xticklabels([s[:8] for s in sucursales], rotation=45, ha="right")
ax1.set_title("Datos Normalizados", fontweight="bold")
ax1.legend(fontsize=9)
ax1.spines["top"].set_visible(False)
ax1.spines["right"].set_visible(False)

# 2. Heatmap de distancias
ax2 = axes[1]
np.fill_diagonal(matriz_dist, 0)  # Restaurar diagonal
im = ax2.imshow(matriz_dist, cmap="YlOrRd_r", aspect="auto")
ax2.set_xticks(range(n))
ax2.set_yticks(range(n))
ax2.set_xticklabels([s[:8] for s in sucursales], rotation=45, ha="right")
ax2.set_yticklabels([s[:8] for s in sucursales])
ax2.set_title("Mapa de Distancias", fontweight="bold")
plt.colorbar(im, ax=ax2, shrink=0.8)

# Agregar valores en el heatmap
for i in range(n):
    for j in range(n):
        ax2.text(j, i, f"{matriz_dist[i,j]:.2f}", ha="center", va="center", fontsize=8)

# 3. Distribuci√≥n de ventas simuladas
ax3 = axes[2]
rng = np.random.default_rng(42)
ventas_sim = rng.normal(18000, 5000, 1000)
ax3.hist(ventas_sim, bins=30, color="#2E86AB", edgecolor="white", alpha=0.8)
ax3.axvline(np.mean(ventas_sim), color="#C73E1D", linestyle="--", linewidth=2,
            label=f"Œº = ${np.mean(ventas_sim):,.0f}")
ax3.axvline(np.mean(ventas_sim) + np.std(ventas_sim), color="#F18F01", linestyle=":",
            label=f"Œº+œÉ = ${np.mean(ventas_sim)+np.std(ventas_sim):,.0f}")
ax3.axvline(np.mean(ventas_sim) - np.std(ventas_sim), color="#F18F01", linestyle=":")
ax3.set_title("Distribuci√≥n Normal", fontweight="bold")
ax3.legend(fontsize=9)
ax3.spines["top"].set_visible(False)
ax3.spines["right"].set_visible(False)

plt.suptitle("NumPy en Acci√≥n", fontsize=14, fontweight="bold")
plt.tight_layout()
plt.show()

---

## 11. üèÜ Mini Proyecto: Simulador de rendimiento de inversi√≥n

Vamos a usar NumPy para simular el rendimiento de una inversi√≥n usando el m√©todo Monte Carlo:


In [None]:
# üèÜ Simulaci√≥n Monte Carlo de inversi√≥n
import matplotlib.pyplot as plt

rng = np.random.default_rng(42)

# Par√°metros
inversion_inicial = 100000  # $100,000 MXN
rendimiento_anual_medio = 0.10  # 10% anual promedio
volatilidad_anual = 0.20  # 20% de volatilidad
anos = 10
simulaciones = 1000

# Simular rendimientos mensuales
meses = anos * 12
rendimiento_mensual = rendimiento_anual_medio / 12
volatilidad_mensual = volatilidad_anual / np.sqrt(12)

# Generar rendimientos aleatorios: (simulaciones √ó meses)
rendimientos = rng.normal(rendimiento_mensual, volatilidad_mensual, (simulaciones, meses))

# Calcular valor acumulado
valores = np.zeros((simulaciones, meses + 1))
valores[:, 0] = inversion_inicial

for mes in range(meses):
    valores[:, mes + 1] = valores[:, mes] * (1 + rendimientos[:, mes])

# Estad√≠sticas del resultado final
valor_final = valores[:, -1]

print(f"üí∞ Simulaci√≥n Monte Carlo ‚Äî {simulaciones:,} escenarios")
print(f"{'=' * 50}")
print(f"Inversi√≥n inicial: ${inversion_inicial:,}")
print(f"Rendimiento medio: {rendimiento_anual_medio:.0%} anual")
print(f"Volatilidad: {volatilidad_anual:.0%} anual")
print(f"Horizonte: {anos} a√±os")
print(f"{'=' * 50}")
print(f"\nüìä Resultados despu√©s de {anos} a√±os:")
print(f"  Promedio:     ${np.mean(valor_final):>12,.0f}")
print(f"  Mediana:      ${np.median(valor_final):>12,.0f}")
print(f"  Mejor caso:   ${np.max(valor_final):>12,.0f}")
print(f"  Peor caso:    ${np.min(valor_final):>12,.0f}")
print(f"  P10 (pesim.): ${np.percentile(valor_final, 10):>12,.0f}")
print(f"  P90 (optim.): ${np.percentile(valor_final, 90):>12,.0f}")

ganaron = np.sum(valor_final > inversion_inicial) / simulaciones * 100
print(f"\n  Probabilidad de ganar: {ganaron:.1f}%")
print(f"  Probabilidad de duplicar: {np.sum(valor_final > inversion_inicial * 2) / simulaciones * 100:.1f}%")

# --- Visualizaci√≥n ---
fig, axes = plt.subplots(1, 2, figsize=(14, 6))

# 1. Trayectorias
ax1 = axes[0]
timeline = np.arange(meses + 1) / 12  # Convertir a a√±os

# Mostrar 100 trayectorias aleatorias
for i in rng.choice(simulaciones, 100, replace=False):
    color = "#2E86AB" if valor_final[i] >= inversion_inicial else "#C73E1D"
    ax1.plot(timeline, valores[i], alpha=0.1, color=color, linewidth=0.5)

# Percentiles
ax1.plot(timeline, np.percentile(valores, 50, axis=0), color="#2E86AB", linewidth=2.5, label="Mediana")
ax1.fill_between(timeline, np.percentile(valores, 10, axis=0),
                 np.percentile(valores, 90, axis=0), alpha=0.2, color="#2E86AB", label="P10-P90")
ax1.axhline(inversion_inicial, color="gray", linestyle="--", alpha=0.5, label="Inversi√≥n inicial")

ax1.set_title("Trayectorias de Inversi√≥n", fontweight="bold")
ax1.set_xlabel("A√±os")
ax1.set_ylabel("Valor ($)")
ax1.legend(fontsize=9)
ax1.yaxis.set_major_formatter(plt.FuncFormatter(lambda x, p: f"${x/1000:.0f}K"))
ax1.spines["top"].set_visible(False)
ax1.spines["right"].set_visible(False)

# 2. Distribuci√≥n del valor final
ax2 = axes[1]
ax2.hist(valor_final, bins=50, color="#2E86AB", edgecolor="white", alpha=0.8)
ax2.axvline(np.median(valor_final), color="#F18F01", linestyle="--", linewidth=2,
            label=f"Mediana: ${np.median(valor_final):,.0f}")
ax2.axvline(inversion_inicial, color="#C73E1D", linestyle="--", linewidth=2,
            label=f"Inversi√≥n: ${inversion_inicial:,}")
ax2.set_title(f"Distribuci√≥n del Valor Final ({anos} a√±os)", fontweight="bold")
ax2.set_xlabel("Valor ($)")
ax2.legend(fontsize=9)
ax2.spines["top"].set_visible(False)
ax2.spines["right"].set_visible(False)
ax2.xaxis.set_major_formatter(plt.FuncFormatter(lambda x, p: f"${x/1000:.0f}K"))

plt.suptitle(f"Simulaci√≥n Monte Carlo ‚Äî {simulaciones:,} escenarios", fontsize=14, fontweight="bold")
plt.tight_layout()
plt.show()

---

## üî• Retos

1. **An√°lisis de ventas con NumPy:** Crea una matriz de 9 sucursales √ó 12 meses con ventas simuladas. Calcula: mejor mes por sucursal, mejor sucursal por mes, crecimiento mes a mes, y qu√© sucursales superaron su media.

2. **K-Nearest Neighbors manual:** Usando la matriz de distancias del ejemplo, implementa un KNN simplificado. Dado un nuevo punto (ventas=170000, empleados=5, √°rea=70), encuentra las 3 sucursales m√°s similares.

3. **Regresi√≥n lineal con NumPy:** Dados datos de precio vs demanda, calcula la l√≠nea de mejor ajuste usando la f√≥rmula de m√≠nimos cuadrados: `m = (n¬∑Œ£xy - Œ£x¬∑Œ£y) / (n¬∑Œ£x¬≤ - (Œ£x)¬≤)` y `b = (Œ£y - m¬∑Œ£x) / n`. Grafica los datos y la l√≠nea.


In [None]:
# Reto 1: An√°lisis de ventas
# Tu c√≥digo aqu√≠ üëá


In [None]:
# Reto 2: KNN manual
# Tu c√≥digo aqu√≠ üëá


In [None]:
# Reto 3: Regresi√≥n lineal
# Tu c√≥digo aqu√≠ üëá


---

## üìã Resumen

### Crear arrays
| Funci√≥n | Ejemplo |
|---------|---------|
| Desde lista | `np.array([1, 2, 3])` |
| Secuencia | `np.arange(0, 10, 2)` |
| Espaciado | `np.linspace(0, 1, 5)` |
| Ceros/unos | `np.zeros((3, 4))`, `np.ones(5)` |
| Aleatorios | `rng.normal(0, 1, size=100)` |

### Operaciones
| Operaci√≥n | C√≥digo |
|-----------|--------|
| Aritm√©ticas | `a + b`, `a * 2`, `a ** 2` |
| Estad√≠sticas | `np.mean()`, `np.std()`, `np.sum()` |
| Por eje | `np.sum(m, axis=0)` (columnas), `axis=1` (filas) |
| Matem√°ticas | `np.sqrt()`, `np.log()`, `np.exp()` |
| √Ålgebra lineal | `np.dot(a, b)`, `a @ b`, `a.T` |

### Indexaci√≥n
| Operaci√≥n | C√≥digo |
|-----------|--------|
| Elemento | `a[0]`, `m[1, 2]` |
| Slicing | `a[1:5]`, `m[:, 0]` |
| Booleano | `a[a > 10]` |
| Fancy | `a[[0, 3, 5]]` |

### Forma
| Operaci√≥n | C√≥digo |
|-----------|--------|
| Reshape | `a.reshape(3, 4)` |
| Transpuesta | `a.T` |
| Apilar | `np.vstack()`, `np.hstack()` |
| Concatenar | `np.concatenate()` |

---

## ‚è≠Ô∏è ¬øQu√© sigue?

En el siguiente notebook haremos un **An√°lisis de Datos Real** usando un dataset de M√©xico con todo lo que hemos aprendido.

üëâ [12 ‚Äî An√°lisis de Datos Real](12_Analisis_de_Datos_Real.ipynb)

---

<p align="center">
  Hecho con ‚ù§Ô∏è por <a href="https://culiacan.ai">Culiacan.AI</a> ‚Äî Culiac√°n reconocida en el mundo por su talento y emprendimiento en Inteligencia Artificial
</p>
