# Exercises01.ipynb - Ejercicios Avanzados NumPy + Funciones/Clases + Archivos + Plots

**Nivel: Alto** (algoritmos O(n log n), clases con herencia, broadcasting avanzado, I/O robusto).

**Dataset:** Temperaturas Helsinki 2017 (https://raw.githubusercontent.com/csmastersUH/data_analysis_with_python_2020/master/kumpula-weather-2017.csv) [web:71][web:2]

Integra:
- NumPy: slicing, máscaras, polyfit, FFT.
- Funciones/Clases: herencia, decoradores, métodos vectorizados.
- Archivos: genfromtxt con dtype estructurado, savetxt procesado.
- Plots: subplots, contourf, errorbars.

In [None]:
import numpy as np
import matplotlib.pyplot as plt
from numpy.polynomial import Polynomial
plt.style.use('seaborn-v0_8')

## Ejercicio 1: Carga Datos + Preprocesamiento NumPy (Medio-Alto)

Carga temps de URL. Convierte mmm-dd a días desde inicio (dias = monthday_to_days).
- Filtra NaNs/máscaras.
- Calcula anomalías (temp - media móvil 30 días).
- Detecta outliers (IQR método, Q1-1.5*IQR).
**Output esperado:** `temps_clean` (N x 2), `dias` (N,).

In [None]:
url = 'https://raw.githubusercontent.com/csmastersUH/data_analysis_with_python_2020/master/kumpula-weather-2017.csv'
# Tu código: np.genfromtxt(url, skip_header=1, usecols=(0,1), names=['mdate','temp'], dtype=None, delimiter=',', encoding='utf-8')
# Parsing mdate 'MMM DD' -> días cumulativos (ej. ene1=1, feb1=32)
# month_days = {'Jan':31, 'Feb':28, ...}; cumul_days
# mask = ~np.isnan(temp)
# rolling_mean = np.convolve(temp[mask], np.ones(30)/30, mode='same')
# anomalies = temp[mask] - rolling_mean
# Q1, Q3 = np.percentile(anomalies, [25,75]); iqr = Q3-Q1; outliers = np.abs(anomalies) > 1.5*iqr

## Ejercicio 2: Clase Avanzada con Herencia/Decoradores (Alto)

Crea **base class TimeSeriesAnalyzer**:
- `smooth(self, window=7)`: media móvil.
- Decorator `@vectorize` para aplicar funcs a columnas.

**Clase hija WeatherAnalyzer** hereda + agrega:
- `seasonal_decompose(self)`: trend (polyfit deg=2), seasonal (FFT top 4 freq), residual.
- `forecast(self, days_ahead=30)`: ARIMA-like simple (últ 30 días polyfit deg=3) + ruido.
**Usa:** `analyzer = WeatherAnalyzer(dias, temps_clean[:,1])` [web:3]

In [None]:
def vectorize(method):
    def wrapper(self, *args, **kwargs):
        return np.array([method(self, col, *args, **kwargs) for col in self.data.T]).T
    return wrapper

class TimeSeriesAnalyzer:
    def __init__(self, t, data):
        self.t, self.data = t, data
    
    @vectorize
    def smooth(self, col, window=7):
        return np.convolve(col, np.ones(window)/window, mode='same')
    
# Herencia + seasonal_decompose (np.fft.fft, top freqs), forecast (np.polyfit)
# analyzer = WeatherAnalyzer(dias, temps_clean)
# smoothed = analyzer.smooth()
# trend, seasonal, residual = analyzer.seasonal_decompose()

## Ejercicio 3: I/O Robusto + Procesado (Medio-Alto)

- Guarda `temps_clean` + `anomalies` a 'processed_weather.npz' (np.savez).
- Escribe subset (primeros 100 días, columnas: dias, temp_smooth, anomaly) a 'subset.csv' (savetxt, fmt='%.2f', header).
- Función `load_and_validate(filename)`: carga npz/csv, chequea shape/inf/NaNs, retorna dict.

In [None]:
# np.savez('processed_weather.npz', temps=temps_clean, anomalies=anomalies)
# subset = np.column_stack([dias[:100], smoothed[0,:100], anomalies[:100]])
# np.savetxt('subset.csv', subset, delimiter=',', header='day,temp_smooth,anomaly', fmt='%.3f')

def load_and_validate(filename):
    # Maneja .npz (load), .csv (genfromtxt); chequea np.isfinite.all(), shape==(?,3)
    pass

## Ejercicio 4: Visualizaciones Avanzadas (Alto)

Fig 14x10 con 4 subplots:
- (2,2)[0,0]: temp vs dias + smooth + polyfit deg=1 errorbars.
- [0,1]: Anomalías hist + KDE (np.histogram).
- [1,0]: Heatmap anomalías (plt.pcolormesh, meses bins).
- [1,1]: Forecast 30 días + seasonal components.
- Guarda 'advanced_analysis.png'.

In [None]:
fig, axs = plt.subplots(2, 2, figsize=(14,10))
# p0: plt.errorbar(dias, temp, yerr=std_smooth); pfit = np.polyfit(dias, temp,1); plt.plot(dias, np.polyval(pfit,dias))
# p1: hist, kde = np.histogram(anoms, bins=50, density=True); axs[0,1].plot(np.linspace(min,max,50), kde_smooth)
# p2: mesh = axs[1,0].pcolormesh(months_bins, temp_bins, anomalies_2d)
# p3: forecast_line + seasonal sin/cos waves
plt.savefig('advanced_analysis.png', dpi=200, bbox_inches='tight')
plt.show()

## Ejercicio 5: Desafío Final - Algoritmo Custom (Muy Alto)

Implementa **cambio climático detector**:
1. Divide en ventanas 90 días deslizantes.
2. Polyfit deg=1 cada ventana → pendiente.
3. Media móvil pendientes → trend_strength.
4. Si >0.01°C/día y significativo (bootstrap 1000 resamples p<0.05), alerta.
**Output:** dict{'trend':slope, 'pvalue':p, 'alerta':bool}.

In [None]:
def climate_detector(t, temp, window=90, n_bootstrap=1000):
    # Ventanas: np.lib.stride_tricks.sliding_window_view
    # Para cada: polyfit(t_win, temp_win,1)[0] → slopes
    # Bootstrap: resample con replacement, calc slope dist
    # p = (n_pos_slopes / n_bootstrap) si trend>0
    pass

# result = climate_detector(dias, temps_clean[:,1])
# print(result)