REGRESSIONE LOGISTICA MULTINOMIALE

La regressione logistica multinomiale è una regressione logistica in cui la variabile dipendente ha più di due categorie ordinate o non ordinate. È un'estensione della regressione logistica binaria (o un'estensione della regressione logistica ordinale) quando la variabile dipendente non è binaria (o ordinale).

Regressione logistica multinomiale: versione modificata della regressione logistica che prevede una probabilità multinomiale (ovvero più di due classi) per ogni esempio di input.

TEORIA

 - https://machinelearningmastery.com/multinomial-logistic-regression-with-python/

In [1]:
# creiamo un dataset di classificazione con 3 classi e 10 features
# importiamo il modulo Counter per contare le istanze per classe nel dataset
# importiamo il modulo make_classification per creare il dataset casuale
from collections import Counter
from sklearn.datasets import make_classification

# definiamo il dataset
X, y = make_classification(n_samples=1000, n_features=10, n_informative=5, n_redundant=5, n_classes=3, random_state=1)

# stampiamo le dimensioni del dataset e il conteggio delle istanze per classe
print(X.shape, y.shape)
print(Counter(y))

(1000, 10) (1000,)
Counter({1: 334, 2: 334, 0: 332})


La classe LogisticRegression può essere configurata per la regressione logistica multinomiale impostando l'argomento "multi_class" su "multinomial" e l'argomento "solver" su un risolutore che supporta la regressione logistica multinomiale, ad esempio "lbfgs".

In [4]:
# importiamo il modulo LogisticRegression per creare il modello di regressione logistica
from sklearn.linear_model import LogisticRegression

# creiamo il modello di regressione logistica
model = LogisticRegression(multi_class='multinomial', solver='lbfgs')

È buona norma valutare i modelli di classificazione utilizzando la validazione incrociata stratificata ripetuta k-fold. La stratificazione garantisce che ogni piega di convalida incrociata abbia approssimativamente la stessa distribuzione di esempi in ogni classe dell'intero set di dati di addestramento.

In [2]:
from sklearn.model_selection import cross_val_score
from sklearn.model_selection import RepeatedStratifiedKFold

In [5]:
# definiamo il modello di cross-validation
# impostiamo il numero di ripetizioni a 3 e il numero di fold a 10
cv = RepeatedStratifiedKFold(n_splits=10, n_repeats=3, random_state=1)

# valutiamo il modello con la cross-validation
n_scores = cross_val_score(model, X, y, scoring='accuracy', cv=cv, n_jobs=-1)

# stampiamo la media e la deviazione standard delle accuratezze
from numpy import mean
from numpy import std
print('Mean Accuracy: %.3f (%.3f)' % (mean(n_scores), std(n_scores)))

Mean Accuracy: 0.681 (0.042)


Potremmo decidere di utilizzare il modello di regressione logistica multinomiale come modello finale e fare previsioni su nuovi dati.

Ciò può essere ottenuto adattando prima il modello a tutti i dati disponibili, quindi chiamando la funzione predict() per fare una previsione per i nuovi dati.

L'esempio seguente mostra come effettuare una previsione per i nuovi dati utilizzando il modello di regressione logistica multinomiale.

In [6]:
# dividiamo il dataset in training e test set
from sklearn.model_selection import train_test_split

# dividiamo il dataset in training e test set
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3)

# standardizzazione delle features (per avere una migliore convergenza dell'algoritmo)
# importiamo la classe StandardScaler dalla libreria preprocessing di sklearn
from sklearn.preprocessing import StandardScaler

# creiamo l'oggetto StandardScaler
scaler = StandardScaler()

# addestriamo lo scaler sui dati di training
scaler.fit(X_train)

# addestriamo il modello sul training set
X_std = scaler.transform(X)
X_train_std = scaler.transform(X_train)
X_test_std = scaler.transform(X_test)

# addestriamo il modello sul training set
model.fit(X_train_std, y_train)

# effettuiamo la predizione sul test set
y_pred = model.predict(X_test_std)


In [9]:
# calcoliamo l'accuratezza del modello
from sklearn.metrics import accuracy_score

# calcoliamo l'accuratezza del modello
accuracy = accuracy_score(y_test, y_pred)

# stampiamo l'accuratezza del modello
print('Accuracy: %.2f' % (accuracy))

Accuracy: 0.70


EFFETTUARE PREVISIONI SULLA BASE DI UNA NUOVA RIGA DI DATI

In [16]:
# definiamo una nuova istanza
row = [1.89149379, -0.39847585, 1.63856893, 0.01647165, 1.51892395, -3.52651223, 1.80998823, 0.58810926, -0.02542177, -0.52835426]

# scaliamo la nuova istanza
row_std = scaler.transform([row])

# effettuiamo la predizione della nuova istanza
yhat = model.predict(row_std)

# calcoliamo la probabilità della nuova istanza
yhat_prob = model.predict_proba(row_std)

# stampiamo la classe predetta e la probabilità per ogni classe
print('Predicted Class: %d' % yhat[0])
print('Predicted Class Probabilities: %s' % yhat_prob[0])

# stampiamo i coefficienti del modello
print('Coefficienti:')
print(model.coef_)
# stampiamo l'intercetta del modello
print('Intercetta:')
print(model.intercept_)

Predicted Class: 1
Predicted Class Probabilities: [0.15464418 0.51606951 0.32928631]
Coefficienti:
[[ 0.06108643 -0.02716396  0.30506217  0.22870533 -0.3684234   0.01293474
  -0.39349242 -0.4149007  -0.10973186  0.49810787]
 [ 0.31084787  0.106779   -0.54855968 -0.1944694  -0.01466812 -0.08855953
   0.35027277  0.7981892  -0.24563816 -0.353176  ]
 [-0.37193429 -0.07961504  0.24349751 -0.03423593  0.38309152  0.0756248
   0.04321965 -0.3832885   0.35537001 -0.14493187]]
Intercetta:
[-0.08599053  0.06038627  0.02560425]
