In [3]:
import pandas as pd
import numpy as np
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.linear_model import Ridge, Lasso, ElasticNet
from sklearn.metrics import mean_squared_error

# 1. Preparazione del Dataset:

###    - Caricamento e preprocessamento dei dati sui prezzi immobiliari.


In [None]:
# import direttamente dall'url
url = 'https://proai-datasets.s3.eu-west-3.amazonaws.com/housing.csv'
df_house = pd.read_csv(url)
print(df_house.head())

In [None]:
# ricerca di eventuali colonne con dati mancanti
nan_counts = df_house.isna().sum()
print(nan_counts)

##### *non ci sono colonne con dati mancanti*

# 2. Implementazione dei Modelli di Regressione

In [None]:
X = df.drop(columns=['target'])
y = df['target']

# Standardizzazione 
scaler = StandardScaler()
X_train_scaled = scaler.fit_transform(X_train)
X_test_scaled = scaler.transform(X_test)

modelli = dict()
# Modello Ridge
modelli["Ridge"] = dict()
modelli["Ridge"]["modello"] = Ridge()
modelli["Ridge"]["iperparametri"] = {"alpha": np.logspace(-3, 1, 20)}

# Modello Lasso
modelli["Lasso"] = dict()
modelli["Lasso"]["modello"] = Lasso()
modelli["Lasso"]["iperparametri"] = {"alpha": np.logspace(-3, 1, 20)}

# Modello ElasticNet
modelli["ElasticNet"] = dict()
modelli["ElasticNet"]["modello"] = Lasso()
modelli["ElasticNet"]["iperparametri"] = {"alpha": np.logspace(-3, 1, 20), 'l1_ratio': np.linspace(0, 1, 10)}


In [None]:
ridge_predictions = ridge_model.predict(X_test_scaled)
ridge_mse = mean_squared_error(y_test, ridge_predictions)
print(f'Ridge MSE: {ridge_mse}')

In [7]:
def ottimizza_modello(modello, iperparametri):
    grid_search = GridSearchCV(estimator=modello, param_grid=iperparametri, 
                           scoring='neg_mean_squared_error', cv=5, n_jobs=-1)

    grid_search.fit(X_train_scaled, y_train)
    
    best_params = grid_search.best_params_
    print(best_params)
    best_score = -grid_search.best_score_
    print(best_score)
    best_model = grid_search.best_estimator_

    return best_model
 

[1.00000000e-03 1.26485522e-03 1.59985872e-03 2.02358965e-03
 2.55954792e-03 3.23745754e-03 4.09491506e-03 5.17947468e-03
 6.55128557e-03 8.28642773e-03 1.04811313e-02 1.32571137e-02
 1.67683294e-02 2.12095089e-02 2.68269580e-02 3.39322177e-02
 4.29193426e-02 5.42867544e-02 6.86648845e-02 8.68511374e-02
 1.09854114e-01 1.38949549e-01 1.75751062e-01 2.22299648e-01
 2.81176870e-01 3.55648031e-01 4.49843267e-01 5.68986603e-01
 7.19685673e-01 9.10298178e-01 1.15139540e+00 1.45634848e+00
 1.84206997e+00 2.32995181e+00 2.94705170e+00 3.72759372e+00
 4.71486636e+00 5.96362332e+00 7.54312006e+00 9.54095476e+00
 1.20679264e+01 1.52641797e+01 1.93069773e+01 2.44205309e+01
 3.08884360e+01 3.90693994e+01 4.94171336e+01 6.25055193e+01
 7.90604321e+01 1.00000000e+02]


In [None]:
## coefficienti non nulli, scrivere bene questo codice...scrivere bene anche i print della funzione sopra

import numpy as np
from sklearn.linear_model import Lasso, ElasticNet
from sklearn.preprocessing import StandardScaler
from sklearn.model_selection import train_test_split

# Supponiamo che 'df' sia il tuo DataFrame e che 'target' sia la colonna target
# df = pd.read_csv('your_data.csv')  # Carica il tuo DataFrame
X = df.drop(columns=['target'])
y = df['target']

# Suddivisione del dataset in train e test
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# Standardizzare le caratteristiche
scaler = StandardScaler()
X_train_scaled = scaler.fit_transform(X_train)
X_test_scaled = scaler.transform(X_test)

# Modello Lasso con un esempio di alpha
lasso = Lasso(alpha=0.1)
lasso.fit(X_train_scaled, y_train)
lasso_coefs = lasso.coef_
lasso_non_zero_coefs = np.sum(lasso_coefs != 0)

# Modello ElasticNet con esempi di alpha e l1_ratio
elasticnet = ElasticNet(alpha=0.1, l1_ratio=0.5)
elasticnet.fit(X_train_scaled, y_train)
elasticnet_coefs = elasticnet.coef_
elasticnet_non_zero_coefs = np.sum(elasticnet_coefs != 0)

print(f'Lasso - Numero di coefficienti non nulli: {lasso_non_zero_coefs}')
print(f'ElasticNet - Numero di coefficienti non nulli: {elasticnet_non_zero_coefs}')