# Régression linéaire, Ridge, LASSO, Elastic et SVM

## Climate Change: Earth Surface Temperature Data

Le but de ce projet est de **"fitter" des modèles linéaires et non-lineaires** sur des données climatiques.

Pour plus de précision sur les data, voir le lien suivant:<br>
https://www.kaggle.com/datasets/berkeleyearth/climate-change-earth-surface-temperature-data

## Exercice


### Load Data
1. Loadez et examinez les data.<br>
   ```
   df = pd.read_csv("./data/GlobalTemperatures.csv")
   ```


### Data Analysis
2. Supprimer la saisonalité des data en calculant les températures moyennes par année.<br>
    ```
    yearly_temp = df.LandAverageTemperature.resample("Y").mean()
    ```
3. Faites les graphes de ces températures annuelles. Essayez d'y ajouter un intervalle de confiance en vous basant sur la variable `LandAverageTemperatureUncertainty`.
    ```
    https://stackoverflow.com/questions/59747313/how-can-i-plot-a-confidence-interval-in-python
    ```


### Models
4. Fittez les modèles suivants sur les data. Consultez la documentation de ces modèles si besoin.
    - **Régression linéaire** `LinearRegression`.<br>
    - **Régression Ridge** `Ridge`.<br>
    - **Régression LASSO** `LASSO`.<br>
    - **Régression Elastic** `Elastic`.<br>
    - **Support Vector Machine Regressor** `SVR`.


5. Faites le graphe de vos data et des prédictions que vous avez obtenues.


### Grid Search
6. Effectuez une **optimisation des paramètres** de vos modèles oar **grid search**, grâce à la fonction `GridSearchCV`.<br>
    https://scikit-learn.org/stable/modules/generated/sklearn.model_selection.GridSearchCV.html
    - `LinearRegression`: pas de paramètres
    - `Ridge`: paramètre `alpha`
    - `LASSO`: paramètre `alpha`
    - `Elastic`: paramètre `alpha`
    - `SVR`: paramètre `degree`
    
   Fittez les modèles avec leurs paramètres optimaux sur les data.<br>
   Refaites le graphe de vos data et des prédictions que vous avez obtenues.

## Librairies

In [1]:
import pandas as pd
import numpy as np
from scipy import stats

from scipy.signal import savgol_filter

# !pip install mlinsights
# from mlinsights.mlmodel import PiecewiseRegressor

from sklearn.linear_model import LinearRegression, Ridge, Lasso, ElasticNet
from sklearn.svm import SVR
from sklearn.model_selection import GridSearchCV
from sklearn.metrics import r2_score

import matplotlib.pyplot as plt
import matplotlib.dates as mdates

## Load data

In [2]:
df = pd.read_csv("./data/GlobalTemperatures.csv")

In [3]:
df.head()

Unnamed: 0,dt,LandAverageTemperature,LandAverageTemperatureUncertainty,LandMaxTemperature,LandMaxTemperatureUncertainty,LandMinTemperature,LandMinTemperatureUncertainty,LandAndOceanAverageTemperature,LandAndOceanAverageTemperatureUncertainty
0,1750-01-01,3.034,3.574,,,,,,
1,1750-02-01,3.083,3.702,,,,,,
2,1750-03-01,5.626,3.076,,,,,,
3,1750-04-01,8.49,2.451,,,,,,
4,1750-05-01,11.573,2.072,,,,,,


In [4]:
df = df.set_index(["dt"])
df.index = pd.DatetimeIndex(df.index, freq="infer")

## Data Analysis

## Model

In [None]:
X_train = np.arange(len(yearly_temp)).reshape(-1, 1) # need this format
y_train = yearly_temp

### Grid Search