# Broadcasting and Advanced NumPy Manipulation
Programación II — Semana 2

*Fecha de generación: 2025-05-20*

## Objetivos de aprendizaje
Al finalizar este notebook podrás:
1. Explicar la **regla de broadcasting** y aplicarla a operaciones vectorizadas.
2. Utilizar `reshape`, `concatenate`, `split` y vistas para reorganizar datos sin copiar memoria.
3. Medir el impacto de **vistas** vs **copias** en rendimiento y uso de memoria.
4. Resolver problemas prácticos de procesamiento NumPy sin bucles explícitos.


## 1 · Broadcasting en NumPy  
Cuando operamos con arrays de distinta forma, NumPy **estira** las dimensiones de tamaño `1` para hacerlas compatibles.  
**Regla:** se comparan shapes de **derecha a izquierda**.

![](https://numpy.org/doc/stable/_images/broadcast.svg)



In [None]:
import numpy as np

A = np.arange(6).reshape(3,2)        # (3,2)
B = np.array([10, 100])              # (2,)
print("A =\n", A)
print("B =", B)
print("A + B =\n", A + B)           # B se transmite sobre la primera dimensión


### 📝 Ejercicio 1  
Convierte un vector `temp_f` de temperaturas en °F a °C usando broadcasting y la fórmula  

\[
T_C = (T_F - 32) \times \frac{5}{9}
\]

*Sin usar bucles ni comprensiones de listas.*

In [None]:
# 👉 Tu código aquí
import numpy as np

temp_f = np.array([32, 68, 95, 104])  # ejemplo
# tu solución:
temp_c = ...
print(temp_c)

### 📝 Ejercicio 2  
Dado un conjunto `P` de `n` puntos 2‑D y otro `Q` de `m` puntos 2‑D, calcula la matriz de distancias euclidianas \(D\in\mathbb{R}^{n\times m}\) **sin usar bucles** (pista: broadcasting y sumas sobre ejes).

In [None]:
# 👉 Tu código aquí
P = np.random.rand(5,2)
Q = np.random.rand(3,2)
# tu solución:
D = ...
print(D.shape)  # debería ser (5,3)

## 2 · Manipulación avanzada de arrays

In [None]:
vec = np.arange(24)
tensor = vec.reshape(2,3,4)   # O(1), sin copiar
print("tensor shape:", tensor.shape)
flat = tensor.ravel()         # vista
print("¿Comparte memoria?", flat.base is tensor)


### 📝 Ejercicio 3  
Reestructura `tensor` para que sus ejes queden con forma `(3,2,4)` **sin copiar** datos. Comprueba que la vista comparte memoria con el original.

In [None]:
# 👉 Tu código aquí
# tensor ya está en memoria
tensor_swapped = ...
print(tensor_swapped.shape)
print("¿Comparte memoria?", tensor_swapped.base is tensor)

### 📝 Ejercicio 4  
Carga el dataset *Iris* disponible en NumPy (`np.loadtxt` o `sklearn.datasets.load_iris`) y  
divide las 150 observaciones en un **80 % train / 20 % test** usando `np.split` (sin librerías externas).

In [None]:
# 👉 Tu código aquí
# pista:
# data = np.loadtxt("iris.csv", delimiter=",")
# n_train = int(...)
# train, test = np.split(...)


## 3 · Vistas, copias y `strides`

In [None]:
big = np.arange(1e7)          # ~80 MB
view = big[::10]               # slicing, vista
copy = big[::10].copy()        # copia
print("Memoria view:", view.nbytes/1e6, "MB")
print("Memoria copy:", copy.nbytes/1e6, "MB")

### 📝 Ejercicio 5  
Usa `%timeit` para comparar la velocidad de `big.ravel()` versus `big.flatten()`.  
Explica por qué una es más rápida que la otra.

In [None]:
# 👉 Tu código aquí
# %timeit big.ravel()
# %timeit big.flatten()


## 4 · Conclusiones  
* El **broadcasting** permite operaciones vectorizadas sin expandir datos explícitamente.  
* Funciones como `reshape` y `split` reordenan vistas con costo O(1).  
* Verificar siempre si una operación produce **vista** o **copia** (`a.base is None`).  

### Lecturas recomendadas
* Johansson, *Numerical Python* (2024) — Cap. 2 y 3  
* Lott & Phillips, *Python OOP* — Apéndice sobre NumPy  
* Documentación oficial: https://numpy.org/doc/stable
