## Sesión 1 (parte 2) · NumPy (vectorización & broadcasting) + pandas + clases
Cuaderno **interactivo**: completa los bloques `# TODO` y ejecuta los tests.

### Flujo de trabajo
1) Abre el cuaderno en Colab y **Archivo → Guardar una copia en Drive**.  
2) Ejecuta la celda **Setup** (importa `tests2.py`).  
3) Resuelve cada ejercicio y ejecuta su celda de **Tests**.

> Nota: si reinicias el entorno, vuelve a ejecutar **Setup**.

### Setup (ejecuta una vez)
Descarga el repositorio del curso y hace importable `tests2.py`.

In [None]:
# @title Setup (ejecuta 1 vez)
import os, sys

REPO_URL = "https://github.com/Javier-upm/Titulo-propio-IA"
REPO_DIR = "/content/Titulo-propio-IA"
SESSION_DIR = "sesion_1"  # carpeta donde estarán este cuaderno y tests2.py

if not os.path.exists(REPO_DIR):
    !git clone --depth 1 "{REPO_URL}" "{REPO_DIR}"
else:
    print("Repo ya presente:", REPO_DIR)

session_path = os.path.join(REPO_DIR, SESSION_DIR)
if session_path not in sys.path:
    sys.path.insert(0, session_path)

print("Ruta de sesión:", session_path)
print("Contenido:", os.listdir(session_path))

import test2
print("✅ test2.py importado correctamente")

---
## 1) NumPy · Vectorización
La idea: eliminar bucles `for` usando operaciones con arrays (broadcasting, indexado, etc.).

### Ejercicio 1 · Vectoriza este código
El siguiente código suma a cada columna de `A` un valor de `B`:

```python
A = np.random.rand(2,3)
B = np.random.rand(3,1)
C = np.zeros_like(A)

for i in range(2):
    for j in range(3):
        C[i,j] = A[i,j] + B[j,0]
```

**Tarea:** crea `C_vec` sin bucles.
- Debe tener la misma `shape` que `A`.
- Debe coincidir con el resultado del bucle.

In [None]:
import numpy as np

rng = np.random.default_rng(0)
A = rng.random((2, 3))
B = rng.random((3, 1))

# Resultado "lento" (referencia)
C_loop = np.zeros_like(A)
for i in range(2):
    for j in range(3):
        C_loop[i, j] = A[i, j] + B[j, 0]

# TODO: vectoriza (sin bucles)
C_vec = None

print("A\n", A)
print("B\n", B)
print("C_vec\n", C_vec)

In [None]:
# @title Tests Ejercicio 1 (no modificar)
from test2 import check_ej1_vectoriza
try:
    check_ej1_vectoriza(A, B, C_loop, C_vec)
    print("✅ Ejercicio 1 correcto")
except Exception as e:
    print("❌", e)

---
## 2) NumPy · Broadcasting
Broadcasting permite operar arrays con shapes compatibles sin copiar datos explícitamente.

### Ejercicio 2 · Crea un array 3D con broadcasting

Crea un array `A3` de tamaño `(2, 3, 4)` (2 matrices de 3×4) tal que:

$$
A3(i,j,k) = 100\cdot(i+1) + 10\cdot(j+1) + (k+1)
$$

donde \(i=0,1\), \(j=0,1,2\), \(k=0,1,2,3\).

**Pistas permitidas:** `np.arange`, `reshape`, `None`/`np.newaxis`.

In [None]:
import numpy as np

# TODO: construye A3 con broadcasting
A3 = None

print("A3 shape:", None if A3 is None else A3.shape)
print("A3[0, :, :]\n", None if A3 is None else A3[0])
print("A3[1, :, :]\n", None if A3 is None else A3[1])

In [None]:
# @title Tests Ejercicio 2a (no modificar)
from test2 import check_ej2a_A3
try:
    check_ej2a_A3(A3)
    print("✅ Ejercicio 2a correcto")
except Exception as e:
    print("❌", e)

### Ejercicio 2b · Máscaras con broadcasting

Define la matriz:

\[
X = \begin{pmatrix}
1 & 0 & 0 & 0  \\
0 & 1 & 0 & 0  \\
0 & 0 & 1 & 0  
\end{pmatrix}
\]

Multiplica **elemento a elemento** cada una de las dos matrices 3×4 dentro de `A3` por `X` de forma que la salida tenga la misma estructura `(2,3,4)` y conserve solo los elementos donde **fila = columna** (para las columnas 0..2).

Guarda el resultado en `A_masked`.

In [None]:
import numpy as np

X = np.array([[1, 0, 0, 0],
              [0, 1, 0, 0],
              [0, 0, 1, 0]])

# TODO: usa broadcasting para aplicar la máscara
A_masked = None

print("X\n", X)
print("A_masked shape:", None if A_masked is None else A_masked.shape)

In [None]:
# @title Tests Ejercicio 2b (no modificar)
from test2 import check_ej2b_mask
try:
    check_ej2b_mask(A3, X, A_masked)
    print("✅ Ejercicio 2b correcto")
except Exception as e:
    print("❌", e)

---
## 3) pandas · Operaciones básicas y limpieza mínima
Trabajaremos con `DataFrame`: selección, filtros, `NaN` y `groupby`.

### Ejercicio 3 · Rellenar NaN con la media de su columna
Rellena los `NaN` de las columnas numéricas usando la media de **cada columna**. Guarda el resultado en `df_filled`.

In [None]:
import numpy as np
import pandas as pd

df = pd.DataFrame({
    "nombre": ["Ana", "Luis", "Marta", "Pablo", "Sofía"],
    "edad": [22, 25, 21, 23, 24],
    "nota": [8.5, 6.0, 9.2, 4.9, 7.5],
    "grupo": ["A", "A", "B", "B", "A"]
})

df2 = df.copy()
df2.loc[2, "nota"] = np.nan
df2.loc[1, "edad"] = np.nan

# TODO: rellena NaN con la media de su columna (solo numéricas)
df_filled = None

df2, df_filled

In [None]:
# @title Tests Ejercicio 3 (no modificar)
from test2 import check_ej3_fillna_mean
try:
    check_ej3_fillna_mean(df2, df_filled)
    print("✅ Ejercicio 3 correcto")
except Exception as e:
    print("❌", e)

---
## 4) Clases · un escalador mínimo (estilo scikit-learn)
Implementa una clase con estado (`mean_`, `std_`) y métodos `fit`, `transform`, `fit_transform`.

### Ejercicio 4 · Implementa `MiniScaler`
Requisitos:
- `fit(X)`: calcula `mean_` y `std_` por columna (axis=0) usando NumPy.
- `transform(X)`: devuelve `(X - mean_) / std_`.
- Si alguna `std_` vale 0, sustitúyela por 1 para evitar división por cero.
- `fit_transform(X)`: llama a `fit` y luego a `transform`.

In [None]:
import numpy as np

# TODO
class MiniScaler:
    def __init__(self):
        self.mean_ = None
        self.std_ = None

    def fit(self, X):
        pass

    def transform(self, X):
        pass

    def fit_transform(self, X):
        pass


# Demo rápida (no es test)
X_demo = np.array([[1.0, 10.0],
                   [2.0, 20.0],
                   [3.0, 30.0]])
sc = MiniScaler()
print(sc.fit_transform(X_demo))

In [None]:
# @title Tests Ejercicio 4 (no modificar)
from test2 import check_ej4_miniscaler
try:
    check_ej4_miniscaler(MiniScaler)
    print("✅ Ejercicio 4 correcto")
except Exception as e:
    print("❌", e)

---
## Cierre
Si has completado todo:
- revisa *shape* y *axis* en NumPy
- revisa alineamiento por columnas en pandas (`fillna` con Series de medias)
- entiende el patrón de clases tipo `fit/transform`