<a target="_blank" href="https://colab.research.google.com/github/sonder-art/fdd_p25/blob/main/professor/numpy/notebooks/tarea_tiempos_numpy.ipynb">
  <img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/>
</a>


### El proyecto se entrega en un pull-request en este documento directamente, que no sea del main branch sino de un branch llamado `proyecto_python`, y el titulo de pull reques `Proyecto Python`, se entrega antes del 6 de noviembre.

# Tarea/Proyecto ‚Äî Tiempos con distintas estrategias (Python vs NumPy)

Objetivo: practicar varias formas de programar en Python y comparar su rendimiento con NumPy.

Qu√© har√°s:
- Implementar 3 problemas (P1 sencillo, P2 intermedio, P3 un poco m√°s complejo).
- Para cada problema, crear 4 versiones: for, list comprehension, generator (yield/generador), y NumPy vectorizado.
- Medir tiempos con `timeit` de forma justa y compararlos.

Reglas m√≠nimas:
- Verifica primero que todas las versiones producen el mismo resultado l√≥gico (mismo tama√±o/forma, mismos valores o valores equivalentes).
- S√© consistente: no mezcles listas y arreglos sin aclarar el formato final esperado.
- Para medir generadores, materializa con `list(...)` en el cron√≥metro para compararlo con las otras estrategias.
- No copies soluciones externas; escribe tu implementaci√≥n.

Referencia: `07_Vectorizacion_vs_For_vs_Comprehensions.ipynb`.



In [1]:
# Instalaci√≥n r√°pida (si la necesitas)

import numpy as np
import timeit


## Problema 1 ‚Äî Escalar un vector por una constante

Descripci√≥n: dado un arreglo 1D `a` y una constante escalar `c`, produce una salida equivalente a `a * c`.

Requisitos:
- Entrada: `a` (1D), `c` (float/int).
- Salida: misma longitud que `a`, valores escalados por `c`.
- Mant√©n el tipo de salida consistente entre versiones (lista vs ndarray), o documenta la diferencia.

Implementa 4 versiones:
- for loop (acumula resultados con append)
- list comprehension
- generator (yield o expresi√≥n generadora)
- NumPy vectorizado

Datos sugeridos: `a = np.arange(n, dtype=float)`, `c = 2.0`.


In [2]:
# P1 ‚Äî Stubs (completa las funciones)

def p1_for(a: np.ndarray, c: float):
    """Devuelve a*c usando for y append."""
    raise NotImplementedError


def p1_comp(a: np.ndarray, c: float):
    """Devuelve a*c usando list comprehension."""
    raise NotImplementedError


def p1_gen(a: np.ndarray, c: float):
    """Devuelve (como generador) a*c usando yield o gen expr."""
    raise NotImplementedError


def p1_np(a: np.ndarray, c: float):
    """Devuelve a*c usando NumPy vectorizado."""
    raise NotImplementedError


In [3]:
# P1 ‚Äî Harness de tiempos (ajusta n y number)

def time_p1(n=100_000, number=5):
    a = np.arange(n, dtype=float)
    c = 2.0
    return (
        timeit.timeit(lambda: p1_for(a, c), number=number),
        timeit.timeit(lambda: p1_comp(a, c), number=number),
        timeit.timeit(lambda: list(p1_gen(a, c)), number=number),
        timeit.timeit(lambda: p1_np(a, c), number=number),
    )

# time_p1()  # descomenta para probar


## Problema 2 ‚Äî Suma de vecinos 1D (ventana)

Descripci√≥n: dado `a` (1D) y una ventana `k` impar (p. ej. 3), calcular `b[i]` como la suma de los `k` vecinos centrados en `i`.

Requisitos:
- Entrada: `a` (1D), `k` impar ‚â• 3.
- Borde: puedes ignorar √≠ndices fuera de rango, recortar el resultado o replicar/extender bordes; explica tu elecci√≥n.
- Salida: 1D; documenta si su longitud cambia por tu manejo de bordes.

Implementa 4 versiones: for, list comprehension, generator, NumPy vectorizado (pistas: slicing con desplazamientos, `np.roll`, o una convoluci√≥n simple).

Datos sugeridos: `a = np.arange(n, dtype=float)`, `k = 3`. 


In [4]:
# P2 ‚Äî Stubs (completa las funciones)

def p2_for(a: np.ndarray, k: int = 3):
    """Devuelve suma de vecinos (1D) con for. Manejo de bordes a tu elecci√≥n."""
    raise NotImplementedError


def p2_comp(a: np.ndarray, k: int = 3):
    """List comprehension."""
    raise NotImplementedError


def p2_gen(a: np.ndarray, k: int = 3):
    """Generator (yield o gen expr)."""
    raise NotImplementedError


def p2_np(a: np.ndarray, k: int = 3):
    """NumPy vectorizado (slicing/roll/convoluci√≥n simple)."""
    raise NotImplementedError


In [5]:
# P2 ‚Äî Harness de tiempos

def time_p2(n=100_000, number=3):
    a = np.arange(n, dtype=float)
    k = 3
    return (
        timeit.timeit(lambda: p2_for(a, k), number=number),
        timeit.timeit(lambda: p2_comp(a, k), number=number),
        timeit.timeit(lambda: list(p2_gen(a, k)), number=number),
        timeit.timeit(lambda: p2_np(a, k), number=number),
    )

# time_p2()  # descomenta para probar


## Problema 3 ‚Äî Transformaci√≥n no lineal y filtrado

Descripci√≥n: dado `a` (1D float), aplica una transformaci√≥n no lineal y filtra con un umbral.

Requisitos:
- Transformaci√≥n propuesta (de ejemplo): `np.sin(a) + a**2`.
- Entrada: `a` (1D float), `umbral` (float).
- Salida: colecci√≥n con los elementos resultantes que superan `umbral`.
- Mant√©n clara la diferencia entre devolver lista vs ndarray.

Implementa 4 versiones: for, list comprehension, generator, NumPy vectorizado (ufuncs + m√°scara booleana).

Datos sugeridos: `a = np.linspace(0, 1000, n)`, `umbral = 10.0`. 


In [6]:
# P3 ‚Äî Stubs (completa las funciones)

def p3_for(a: np.ndarray, umbral: float):
    """Filtra tras transformaci√≥n no lineal con for."""
    raise NotImplementedError


def p3_comp(a: np.ndarray, umbral: float):
    """List comprehension."""
    raise NotImplementedError


def p3_gen(a: np.ndarray, umbral: float):
    """Generator (yield o gen expr)."""
    raise NotImplementedError


def p3_np(a: np.ndarray, umbral: float):
    """NumPy vectorizado (ufuncs + m√°scara booleana)."""
    raise NotImplementedError


In [7]:
# P3 ‚Äî Harness de tiempos

def time_p3(n=200_000, number=3):
    a = np.linspace(0, 1000, n, dtype=float)
    umbral = 10.0
    return (
        timeit.timeit(lambda: p3_for(a, umbral), number=number),
        timeit.timeit(lambda: p3_comp(a, umbral), number=number),
        timeit.timeit(lambda: list(p3_gen(a, umbral)), number=number),
        timeit.timeit(lambda: p3_np(a, umbral), number=number),
    )

# time_p3()  # descomenta para probar


## Guardar resultados de tiempos en JSON (gu√≠a)

Motivaci√≥n: conservar resultados de experimentos para compararlos m√°s tarde (en otra sesi√≥n/equipo), graficarlos o compartirlos. JSON es legible, portable y f√°cil de procesar.

### Esquema sugerido de datos

- Nivel 1: metadatos del experimento (fecha/hora, versi√≥n de Python/NumPy, host, par√°metros globales como `n` y `number`).
- Nivel 2: problemas y variantes (p1/p2/p3 y estrategias: for/comp/gen/numpy) con sus tiempos agregados.
- Recomendaci√≥n: guardar mediana y desviaci√≥n o percentiles; tambi√©n puedes guardar el vector de repeticiones si lo necesitas.

```json
{
  "metadata": {
    "timestamp": "2025-10-23T12:34:56Z",
    "python_version": "3.10.12",
    "numpy_version": "2.1.1",
    "machine": "x86_64",
    "params": { "n": 100000, "number": 5 }
  },
  "results": {
    "p1": {
      "for":    { "s_per_call_median": 0.0281, "repetitions": 5 },
      "comp":   { "s_per_call_median": 0.0250, "repetitions": 5 },
      "gen":    { "s_per_call_median": 0.0312, "repetitions": 5 },
      "numpy":  { "s_per_call_median": 0.0004, "repetitions": 5 }
    },
    "p2": { "for": { "s_per_call_median": 0.041 } },
    "p3": { "numpy": { "s_per_call_median": 0.003 } }
  }
}
```

Notas:
- Usa claves en min√∫sculas y sin espacios para facilitar procesamiento.
- Si guardas vectores de tiempos por repetici√≥n, usa una clave adicional (por ejemplo `raw_times: [ ... ]`).
- Si diferencias por tama√±o `n`, crea m√∫ltiples entradas o anida por `n` (p. ej. `results_by_n: {"1e4": {...}, "1e5": {...}}`).

### Organizaci√≥n de archivos

- Carpeta: `results/tiempos/` dentro del mismo directorio del notebook.
- Nombre de archivo: incluir fecha, problema o tama√±o (p. ej., `tiempos_p123_n1e5_2025-10-23.json`).
- Evita sobreescribir: si vuelves a correr, genera un nuevo archivo con timestamp.

### Buenas pr√°cticas al medir y guardar

- Medir varias repeticiones por variante; guardar la mediana (y opcionalmente percentiles como p10/p90) para robustez.
- Registrar par√°metros que afectan el resultado: `n`, `number`, dtype, pol√≠tica de bordes en P2, etc.
- Guardar seeds o condiciones de entorno si hay aleatoriedad.
- Validar que los resultados l√≥gicos son equivalentes antes de medir (mismo output).
- No mezclar E/S dentro de la secci√≥n medida; la E/S sesga los tiempos.

### Uso posterior

- Leer los JSON y comparar versiones/estrategias; graficar con `matplotlib`/`seaborn`.
- Automatizar reportes que lean todos los archivos de `results/tiempos/` y generen tablas comparativas.
- Mantener un historial temporal para ver regresiones o mejoras de rendimiento.



## Gu√≠a de medici√≥n y reporte

- Usa `timeit.timeit` con el mismo `number` de repeticiones para todas las versiones.
- Antes de medir, ejecuta cada funci√≥n una vez (warm‚Äëup) si tu entorno lo requiere.
- Reporta tiempos en una tabla simple o tupla por problema: `(for, comp, gen, numpy)`.
- Interpreta resultados: ¬øqu√© versi√≥n gana?, ¬øpor cu√°nto?, ¬øcambia con `n`?
- Evita medir al mismo tiempo c√≥digo que imprime o muestra gr√°ficos.

Sugerencia: prueba varios tama√±os `n` (por ejemplo: 10^4, 10^5, 10^6) y observa tendencias.


Aqu√≠ tienes una versi√≥n mejorada ‚Äîm√°s clara, profesional y fluida‚Äî de tu descripci√≥n, manteniendo todo el contenido t√©cnico pero con mejor redacci√≥n, estructura y tono did√°ctico:

---

## Gu√≠a de visualizaci√≥n con Seaborn y Matplotlib 

**Objetivo:**
Utilizar los tiempos almacenados en formato JSON para **visualizar y analizar el rendimiento de distintas estrategias**, aprendiendo por tu cuenta a usar **Seaborn** y **Matplotlib**.
Esta gu√≠a explica **qu√© graficar**, **c√≥mo interpretar los resultados** y **qu√© investigar** en la documentaci√≥n oficial. *(No se proporciona c√≥digo.)*

---

### 1Ô∏è‚É£ Preparaci√≥n conceptual de los datos (formato ‚Äúlargo‚Äù o *tidy data*)

Antes de graficar, imagina tu tabla en formato largo, ideal para Seaborn.
Cada fila debe representar una observaci√≥n o una agregaci√≥n (por ejemplo, la mediana por problema, estrategia y tama√±o `n`).

**Columnas sugeridas:**
`problema` (p1/p2/p3), `estrategia` (for/comp/gen/numpy), `n`, `repeticion`,
`s_por_llamada` (o `ns_por_elemento`), `mediana`, `p25`, `p75`, `host`, `python_version`, `numpy_version`.

**Investiga:** c√≥mo transformar datos a formato largo en Seaborn, y c√≥mo asignar columnas a ejes, color (`hue`), y paneles (`facet`).

---

### 2Ô∏è‚É£ Gr√°fico de barras agrupadas (comparaci√≥n por problema)

**Qu√© mostrar:**
Barras agrupadas por `estrategia` dentro de cada `problema`, donde la altura sea la mediana de `s_por_llamada`.
A√±ade **barras de error** (p25‚Äìp75 o intervalos de confianza) para reflejar la variabilidad.

**Interpretaci√≥n esperada:**
Identifica la estrategia m√°s r√°pida en cada problema y comenta las diferencias relativas
(p. ej. *‚ÄúNumPy es aproximadamente 60√ó m√°s r√°pido que el bucle for en P1‚Äù*).

**Variaciones:**
Si tienes varios tama√±os `n`, crea paneles por `n` o por `problema`.

---

### 3Ô∏è‚É£ Boxplots o Violinplots (variabilidad y outliers)

**Qu√© mostrar:**
Para un `problema` y `n` fijos, representa la distribuci√≥n de `s_por_llamada` por `estrategia` mediante boxplots o violinplots.

**Interpretaci√≥n:**
Compara la dispersi√≥n entre estrategias, detecta outliers y analiza cu√°l es m√°s estable o consistente.
**Sugerencia:** agrega los puntos individuales de las repeticiones (usa *swarmplot* o *stripplot* superpuestos).

---

### 4Ô∏è‚É£ Curvas de escalamiento (tiempo vs tama√±o `n`)

**Qu√© mostrar:**
Gr√°fico de l√≠neas con `x = n`, `y = s_por_llamada` (o `ns_por_elemento`), y una l√≠nea por `estrategia`.
Usa escala log‚Äìlog si hay grandes diferencias de magnitud.

**Interpretaci√≥n:**
Compara las pendientes para ver c√≥mo crece el tiempo con `n`.
Detecta cruces donde una estrategia empieza a superar a otra seg√∫n el tama√±o.

**Sugerencia:**
Usa *facets* por `problema` para comparar patrones entre P1, P2 y P3.

---

### 5Ô∏è‚É£ Eficiencia por elemento (`ns_por_elemento`)

**Qu√© mostrar:**
Gr√°fico de dispersi√≥n o l√≠neas de `ns_por_elemento` frente a `n`, diferenciando por `estrategia`.

**Interpretaci√≥n:**
Busca trayectorias planas (eficiencia estable).
Comenta desviaciones que puedan indicar efectos de cach√©, memoria o *overhead*.

---

### 6Ô∏è‚É£ Heatmap de razones (comparaci√≥n con NumPy)

**Qu√© mostrar:**
Matriz donde cada celda es la raz√≥n `tiempo_estrategia / tiempo_numpy`, organizada por `problema` y `n`.

**Interpretaci√≥n:**
Colorea las celdas: >1 significa m√°s lento que NumPy; <1, m√°s r√°pido.
Permite ver de un vistazo cu√°nto m√°s lenta es cada alternativa y si esa relaci√≥n cambia con `n`.

---

### 7Ô∏è‚É£ ECDF o histogramas (robustez de medici√≥n)

**Qu√© mostrar:**
Para un `problema` y `n` determinados, traza la **ECDF** o un **histograma** de `s_por_llamada` por `estrategia`.

**Interpretaci√≥n:**
Compara la probabilidad de obtener tiempos inferiores a un umbral.
Analiza el solapamiento entre estrategias y comenta su robustez.

---

### 8Ô∏è‚É£ Dise√±o y buenas pr√°cticas de visualizaci√≥n

* **Ejes y unidades:** etiqueta claramente (segundos por llamada, nanosegundos por elemento). Usa escalas logar√≠tmicas si hay diferencias grandes.
* **T√≠tulos y leyendas:** incluye el `problema`, `n`, entorno y fecha si es relevante. Mant√©n leyendas claras.
* **Paletas:** usa siempre los mismos colores por `estrategia` (orden: for ‚Üí comp ‚Üí gen ‚Üí numpy).
* **Barras de error:** representa p25‚Äìp75 o intervalos por *bootstrap*.
* **Anotaciones:** agrega etiquetas informativas (p. ej. ‚Äú√ó60 m√°s r√°pido‚Äù).
* **Exportaci√≥n:** guarda en PNG o SVG con resoluci√≥n suficiente (DPI alto).

---

### 9Ô∏è‚É£ Interpretaci√≥n (qu√© incluir en el reporte)

Para cada figura, redacta **4‚Äì6 frases** que respondan:

* ¬øQu√© estrategia es m√°s r√°pida y por cu√°nto? ¬øCambia con `n`?
* ¬øCu√°l muestra menor dispersi√≥n? ¬øExisten *outliers*?
* ¬øQu√© patrones de escalamiento aparecen? ¬øSe observan efectos de memoria o cach√©?
* ¬øQu√© recomendaci√≥n pr√°ctica har√≠as seg√∫n el problema?

---

### üîü Pistas de investigaci√≥n (sin c√≥digo)

Explora en la documentaci√≥n de Seaborn/Matplotlib c√≥mo:

* Crear gr√°ficos de barras con barras de error.
* Generar boxplots o violinplots con puntos superpuestos.
* Dibujar l√≠neas m√∫ltiples (una por `estrategia`) y facetas por `problema`.
* Aplicar escalas logar√≠tmicas y personalizar ejes, leyendas y estilos.
* Construir heatmaps con normalizaci√≥n de colores para ratios.

---

### ‚úÖ Entregables m√≠nimos

1. **Gr√°fico de barras agrupadas** por `problema` (con barras de error) y su interpretaci√≥n.
2. **Boxplot o violinplot** por `problema` y `n` (uno representativo) con interpretaci√≥n.
3. **Curva de escalamiento** (`y` vs `n`) con facetas por `problema` e interpretaci√≥n.
4. **Heatmap de razones** respecto a NumPy e interpretaci√≥n.

---

**Recordatorio:**
El objetivo no es reproducir un estilo exacto, sino **demostrar criterio al elegir la visualizaci√≥n adecuada**, **etiquetar correctamente** e **interpretar con rigor** los resultados.

---

¬øQuieres que te prepare tambi√©n una versi√≥n m√°s resumida y visual (por ejemplo, como gu√≠a para estudiantes o plantilla de trabajo)? Podr√≠a incluir √≠conos, ejemplos de figuras y estructura de reporte.
