# Weather Data – Régression linéaire simple

Ce notebook illustre une **première exploitation IA** des données produites par le pipeline
**AWS Weather Data Pipeline**.

Les données utilisées proviennent de la vue métier Athena :
`weather_daily_metrics_by_city`.

Objectif :
- démontrer la continuité entre un pipeline Data Cloud et une exploitation IA,
- implémenter une **régression linéaire simple** à des fins pédagogiques,
- interpréter les résultats sans recherche de performance prédictive avancée.

In [None]:
import pandas as pd
import numpy as np

from sklearn.linear_model import LinearRegression
from sklearn.metrics import r2_score, mean_squared_error

In [None]:
df = pd.read_csv("../weather_daily_metrics_by_city.csv")

df.head()

In [None]:
df.info()
df.describe()

In [None]:
df = df.dropna()

df.isnull().sum()

In [None]:
features = [
    "avg_temperature_c",
    "avg_humidity",
    "avg_wind_kmh"
]

target = "total_precipitation_mm"

X = df[features]
y = df[target]

In [None]:
model = LinearRegression()
model.fit(X, y)

In [None]:
coefficients = pd.DataFrame({
    "feature": features,
    "coefficient": model.coef_
})

coefficients

In [None]:
y_pred = model.predict(X)

r2 = r2_score(y, y_pred)
mse = mean_squared_error(y, y_pred)

r2, mse

## Interprétation des résultats

- Les coefficients indiquent l’influence relative de chaque variable
  sur les précipitations totales.
- Le modèle reste volontairement simple :
  - pas de validation croisée,
  - pas d’optimisation,
  - pas de feature engineering avancé.

L’objectif n’est **pas** la performance prédictive,
mais la démonstration d’une **chaîne complète Data → IA**.

## Limites et conclusion

Ce modèle de régression linéaire a une portée pédagogique.
Il montre comment des données issues d’un pipeline Data Cloud
peuvent être directement exploitées dans un contexte IA.

Dans un contexte industriel, plusieurs améliorations seraient nécessaires :
- enrichissement des features,
- plus grand volume de données,
- validation croisée,
- modèles plus robustes.

Néanmoins, ce notebook démontre la **continuité fonctionnelle**
entre ingestion, transformation, exposition analytique et IA appliquée.