### Es 1
Hai a disposizione un file `data.csv` contenente dati mensili di passeggeri con due colonne:

- `date`: data in formato `YYYY-MM` (mese/anno)
- `passengers`: numero di passeggeri per quel mese


Costruisci un modello di **regressione polinomiale** che approssima l’andamento del numero di passeggeri nel tempo.

1. Carica il dataset.
2. Convertilo in un formato numerico utilizzando una colonna `mese_numerico` che conti i mesi a partire da gennaio 1949.
3. Applica una regressione polinomiale (grado a tua scelta).
4. Calcola l’RMSE tra i valori reali e quelli predetti.
5. Visualizza i dati reali e la curva stimata con Plotly.

In [87]:
import pandas as pd
import numpy as np
from sklearn.preprocessing import PolynomialFeatures
from sklearn.linear_model import LinearRegression
from sklearn.metrics import mean_squared_error
import plotly.graph_objects as go

In [88]:
df = pd.read_csv("data.csv")

df['date'] = pd.to_datetime(df['date'])
df['mese_numerico'] = (df['date'].dt.year - 1949) * 12 + (df['date'].dt.month - 1)

In [89]:
X = df[['mese_numerico']].values
y = df['passengers'].values

grado = 5
poly = PolynomialFeatures(degree = grado)
X_poly = poly.fit_transform(X)

model = LinearRegression()
model.fit(X_poly, y)

In [90]:
y_pred = model.predict(X_poly)
rmse = np.sqrt(mean_squared_error(y, y_pred))
print("RMSE: ", rmse)

RMSE:  6.585445079827193e-10


In [91]:
fig = go.Figure()

fig.add_trace(go.Scatter(x = df['date'], y = y, mode = 'markers', name = 'Dati reali'))
fig.add_trace(go.Scatter(x = df['date'], y = y_pred, mode = 'lines', name = f'Regressione polinomiale (grado {grado})'))

fig.update_layout(title = 'Regressione polinomiale sul numero di passeggeri',
                  xaxis_title = 'Data',
                  yaxis_title = 'Numero di passeggeri',
                  template = 'plotly_white')

fig.show()

### Es2. 
Costruisci una web app con Dash che permette all’utente di scegliere il grado del polinomio per adattare un modello di regressione ai dati non lineari e vedere il risultato aggiornarsi dinamicamente.


1. Genera 100 punti x tra -3 e 3.

2. Calcola ad esempio y = x³ - x + rumore.

3. Costruisci un'interfaccia Dash con:
    - uno slider per scegliere il grado del polinomio (1–10),
    - un grafico Plotly che mostra i dati e la curva stimata.

4. Usa PolynomialFeatures + LinearRegression da scikit-learn per stimare la curva

In [92]:
import numpy as np
import pandas as pd
import plotly.graph_objs as go
from dash import Dash, dcc, html, Input, Output
from sklearn.linear_model import LinearRegression
from sklearn.preprocessing import PolynomialFeatures

In [93]:
np.random.seed(42)
x = np.linspace(-3, 3, 100)

In [94]:
y = x**3 - x + np.random.normal(0, 2, 100)

In [95]:
x_reshaped = x.reshape(-1, 1)

In [96]:
app = Dash(__name__)
app.title = "Regressione Polinomiale Interattiva"

app.layout = html.Div([
    html.H1("Regressione Polinomiale Interattiva"),

    html.Label("Scegli il grado del polinomio:"),
    dcc.Slider(
        id='grado-slider',
        min=1,
        max=10,
        step=1,
        value=3,
        marks={i: str(i) for i in range(1, 11)}
    ),

    dcc.Graph(id='grafico-regressione')
])

In [97]:
app = Dash(__name__)
app.title = "Regressione Polinomiale Interattiva"

app.layout = html.Div([
    html.H1("Regressione Polinomiale Interattiva"),

    html.Label("Scegli il grado del polinomio:"),
    dcc.Slider(
        id='grado-slider',
        min=1,
        max=10,
        step=1,
        value=3,
        marks={i: str(i) for i in range(1, 11)}
    ),

    dcc.Graph(id='grafico-regressione')
])

In [98]:
if __name__ == '__main__':
    app.run_server(debug=True)