Abbiamo parlato nel corso base di underfitting e overfitting (fai vedere schema)
- underfitting vuol dire che il modello non apprende a sufficienza (basso train, basso test)
- overfitting vuol dire che il modello apprende troppo senza generalizzare (alto train, basso test)

La regolarizzazione è un'insieme di tecniche che permette di prevenire l'overfitting

Vediamo come farlo in particolare per 2 tecniche che sono potentissime ma tendono all'overfitting: alberi e reti neurali.

In [1]:
import numpy as np
import matplotlib.pyplot as plt
from sklearn.datasets import fetch_olivetti_faces
from sklearn.model_selection import train_test_split
from sklearn.tree import DecisionTreeClassifier
from sklearn.ensemble import RandomForestClassifier
from sklearn.neural_network import MLPClassifier

In [2]:
X, y = fetch_olivetti_faces(return_X_y=True)

In [3]:
X_train, X_test, y_train, y_test = train_test_split(X, y)

# Tree

### Profondità dell'albero
Approfondiremo questo aspetto nei video successivi, nel frattempo una demo veloce

In [4]:
model_overfitted = DecisionTreeClassifier(max_depth=1000)
model_overfitted.fit(X_train, y_train)

train_acc = model_overfitted.score(X_train, y_train)
test_acc = model_overfitted.score(X_test, y_test)

train_acc, test_acc

(1.0, 0.55)

In [5]:
for depth in range(1, 50, 2):
    model = DecisionTreeClassifier(max_depth=depth)
    model.fit(X_train, y_train)

    train_acc = model.score(X_train, y_train)
    test_acc = model.score(X_test, y_test)

    print(f'Depth {depth}: {train_acc}, {test_acc}')

Depth 1: 0.06333333333333334, 0.0
Depth 3: 0.12333333333333334, 0.01
Depth 5: 0.20333333333333334, 0.05
Depth 7: 0.29333333333333333, 0.1
Depth 9: 0.37, 0.19
Depth 11: 0.42, 0.19
Depth 13: 0.4766666666666667, 0.22
Depth 15: 0.55, 0.28
Depth 17: 0.6033333333333334, 0.32
Depth 19: 0.6433333333333333, 0.35
Depth 21: 0.69, 0.4
Depth 23: 0.74, 0.43
Depth 25: 0.79, 0.45
Depth 27: 0.84, 0.52
Depth 29: 0.9033333333333333, 0.47
Depth 31: 0.9533333333333334, 0.48
Depth 33: 0.9833333333333333, 0.52
Depth 35: 0.9966666666666667, 0.52
Depth 37: 1.0, 0.47
Depth 39: 1.0, 0.55
Depth 41: 1.0, 0.58
Depth 43: 1.0, 0.58
Depth 45: 1.0, 0.55
Depth 47: 1.0, 0.55
Depth 49: 1.0, 0.5


### Ensembling

In [6]:
forest = RandomForestClassifier(n_estimators=100, max_depth=15)
forest.fit(X_train, y_train)

acc_train = forest.score(X_train, y_train)
acc_test = forest.score(X_test, y_test)

acc_train, acc_test

(1.0, 0.88)

# Neural Net

- **Early stopping**
    Fermiamo l'apprendimento prima che la rete possa overfittare
- **L1 e L2**
    Facciamo in modo che i pesi della rete rimangano bassi, penalizzando pesi alti
-  **dropout** Spegniamo a caso dei neuroni durante la fase di apprendimento per fare in modo che nessuno si specializzi su un certo record

In [8]:
architecture = [20]

for architecture in [ [30, 30], [50,50], [60, 60], [70, 70], [80,80]  ]:
    models = {
        'default'    : MLPClassifier(hidden_layer_sizes=architecture, max_iter=10000),
        'early_stop' : MLPClassifier(hidden_layer_sizes=architecture, max_iter=1000),
        #'L2'         : MLPRegressor(hidden_layer_sizes=[100, 100], alpha=0.03),
        #'dropout'    : NON C'E' in SCIKIT
    }
    
    print(f'Architecture {architecture}')
    for name, net in models.items():
        net.fit(X_train, y_train)
        acc_train = net.score(X_train, y_train)
        acc_test  = net.score(X_test, y_test)
        print(f'   {name}: {acc_train}, {acc_test}')

Architecture [30, 30]
   default: 0.11666666666666667, 0.03
   early_stop: 0.5733333333333334, 0.22
Architecture [50, 50]
   default: 0.5566666666666666, 0.41
   early_stop: 0.49333333333333335, 0.23
Architecture [60, 60]
   default: 1.0, 0.91
   early_stop: 0.84, 0.43
Architecture [70, 70]
   default: 1.0, 0.93
   early_stop: 1.0, 0.93
Architecture [80, 80]
   default: 1.0, 0.88
   early_stop: 1.0, 0.89
