# Classification (Wine dataset)

This is a copy of UCI ML Wine recognition datasets. https://archive.ics.uci.edu/ml/machine-learning-databases/wine/wine.data

The data is the results of a chemical analysis of wines grown in the same region in Italy by three different cultivators. There are thirteen different measurements taken for different constituents found in the three types of wine.

Features:
* Alcohol
* Malic acid
* Ash
* Alcalinity of ash
* Magnesium
* Total phenols
* Flavanoids
* Nonflavanoid phenols
* Proanthocyanins
* Color intensity
* Hue
* OD280/OD315 of diluted wines
* Proline

In [None]:
import pandas as pd
import numpy as np
from sklearn.neural_network import MLPClassifier
from sklearn.model_selection import train_test_split
from sklearn.datasets import load_wine
from sklearn.preprocessing import StandardScaler
from sklearn.metrics import classification_report

In [None]:
wine_dataset = load_wine()
X = pd.DataFrame(wine_dataset.data, columns=wine_dataset.feature_names)
y = wine_dataset.target

In [None]:
X.head()

Unnamed: 0,alcohol,malic_acid,ash,alcalinity_of_ash,magnesium,total_phenols,flavanoids,nonflavanoid_phenols,proanthocyanins,color_intensity,hue,od280/od315_of_diluted_wines,proline
0,14.23,1.71,2.43,15.6,127.0,2.8,3.06,0.28,2.29,5.64,1.04,3.92,1065.0
1,13.2,1.78,2.14,11.2,100.0,2.65,2.76,0.26,1.28,4.38,1.05,3.4,1050.0
2,13.16,2.36,2.67,18.6,101.0,2.8,3.24,0.3,2.81,5.68,1.03,3.17,1185.0
3,14.37,1.95,2.5,16.8,113.0,3.85,3.49,0.24,2.18,7.8,0.86,3.45,1480.0
4,13.24,2.59,2.87,21.0,118.0,2.8,2.69,0.39,1.82,4.32,1.04,2.93,735.0


In [None]:
y

array([0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
       0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
       0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 1, 1, 1, 1, 1, 1,
       1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1,
       1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1,
       1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 2, 2,
       2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2,
       2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2,
       2, 2])

<div class="alert alert-block alert-info">
📝 <b>Zadanie 1.1</b><br>
Przeskaluj dane korzystając ze StandardScalera.</div>

In [None]:
scaler = StandardScaler()
X_scaled = scaler.fit_transform(X)
X_scaled = pd.DataFrame(X_scaled, index = X.index, columns=X.columns)
X_scaled.head()

Unnamed: 0,alcohol,malic_acid,ash,alcalinity_of_ash,magnesium,total_phenols,flavanoids,nonflavanoid_phenols,proanthocyanins,color_intensity,hue,od280/od315_of_diluted_wines,proline
0,1.518613,-0.56225,0.232053,-1.169593,1.913905,0.808997,1.034819,-0.659563,1.224884,0.251717,0.362177,1.84792,1.013009
1,0.24629,-0.499413,-0.827996,-2.490847,0.018145,0.568648,0.733629,-0.820719,-0.544721,-0.293321,0.406051,1.113449,0.965242
2,0.196879,0.021231,1.109334,-0.268738,0.088358,0.808997,1.215533,-0.498407,2.135968,0.26902,0.318304,0.788587,1.395148
3,1.69155,-0.346811,0.487926,-0.809251,0.930918,2.491446,1.466525,-0.981875,1.032155,1.186068,-0.427544,1.184071,2.334574
4,0.2957,0.227694,1.840403,0.451946,1.281985,0.808997,0.663351,0.226796,0.401404,-0.319276,0.362177,0.449601,-0.037874


<div class="alert alert-block alert-info">
📝 <b>Zadanie 1.2</b><br>
Dokonaj podziału zbioru danych na zbiór treningowy i testowy <u>ze stratyfikacją</u>, odkładając 20% obserwacji do zbioru testowego.</div>

In [None]:
X_train, X_test, y_train, y_test = train_test_split(X_scaled, y, test_size=0.2, stratify=y, random_state=42)

Architektura perceptrona

<div class="alert alert-block alert-info">
📝 <b>Zadanie 2.1</b><br>
Przygotuj klasyfikator modelu perceptrona wielowarstwowego o poniższych cechach:
<ul>
<li>architektura składająca się z 2 warstw ukrytych:</li>
    <ul>
    <li>pierwsza warstwa ukryta o 8 neuronach</li>
    <li>druga warstwa ukryta o 4 neuronach</li>
    </ul>
<li>funkcja aktywacji dla warstw ukrytych: relu</li>
<li>optymalizator wag neuronów (solver): adam</li>
<li>maksymalna liczba iteracji: 1000</li>
<li>rozmiar wsadu (batch size): 32</li>
<li>ziarno losowości (random_state): 42</li>
</ul>
Wytrenuj model na wystandaryzowanych danych treningowych.
</div>

In [None]:
clf_model = MLPClassifier(
    hidden_layer_sizes=(8, 4),
    activation='relu',
    solver='adam',
    max_iter=1000,
    batch_size=32,
    random_state=42
)

In [None]:
clf_model.fit(X_train, y_train)

<div class="alert alert-block alert-info">
📝 <b>Zadanie 2.2</b><br>
Dokonaj prognozy zbioru testowego. <br>
Zweryfikuj metryki klasyfikacji trafności, czułości, precyzji itp (np. korzystając z funkcji <code>classification_report</code>).</div>

In [None]:
y_pred = clf_model.predict(X_test)

In [None]:
print(classification_report(y_true=y_test, y_pred=y_pred))

              precision    recall  f1-score   support

           0       1.00      1.00      1.00        12
           1       0.93      1.00      0.97        14
           2       1.00      0.90      0.95        10

    accuracy                           0.97        36
   macro avg       0.98      0.97      0.97        36
weighted avg       0.97      0.97      0.97        36



<div class="alert alert-block alert-info">
📝 <b>Zadanie 3.1</b><br>
Przygotuj klasyfikator modelu perceptrona wielowarstwowego o poniższych cechach:
<ul>
<li>architektura składająca się z 1 warstwy ukrytej:</li>
    <ul>
    <li>warstwa ukryta o 8 neuronach</li>
    </ul>
<li>funkcja aktywacji dla warstw ukrytych: relu</li>
<li>optymalizator wag neuronów (solver): adam</li>
<li>maksymalna liczba iteracji: 1000</li>
<li>rozmiar wsadu (batch size): 64</li>
<li>ziarno losowości (random_state): 42</li>
</ul>
Wytrenuj model na wystandaryzowanych danych treningowych.
</div>

In [None]:
clf_model_2 = MLPClassifier(
    hidden_layer_sizes=(8),
    activation='relu',
    solver='adam',
    max_iter=1000,
    batch_size=64,
    random_state=42
)

In [None]:
clf_model_2.fit(X_train, y_train)

<div class="alert alert-block alert-info">
📝 <b>Zadanie 3.2</b><br>
Dokonaj prognozy zbioru testowego. <br>
Zweryfikuj metryki klasyfikacji trafności, czułości, precyzji itp (np. korzystając z funkcji <code>classification_report</code>).</div>

In [None]:
y_pred_2 = clf_model_2.predict(X_test)

In [None]:
print(classification_report(y_true=y_test, y_pred=y_pred))

              precision    recall  f1-score   support

           0       1.00      1.00      1.00        12
           1       0.93      1.00      0.97        14
           2       1.00      0.90      0.95        10

    accuracy                           0.97        36
   macro avg       0.98      0.97      0.97        36
weighted avg       0.97      0.97      0.97        36



<div class="alert alert-block alert-info">
📝 <b>Zadanie 4.1</b><br>
Korzystając z biblioteki tensorflow, przygotuj architekturę sieci neuronowej o poniższych cechach:
<ul>
<li>2 warstwy ukryte:</li>
    <ul>
    <li>pierwsza warstwa ukryta o 16 neuronach</li>
    <li>druga warstwa ukryta o 8 neuronach</li>
    </ul>
<li>funkcja aktywacji dla warstw ukrytych: relu</li>
<li>funkcja aktywacji dla warstwy wyjściowej: softmax</li>
</ul>

❗<b>Ważne:</b> Przed przystąpieniem do modelowania, musimy dodatkowo zakodować etykiety za pomocą kategorii. Wykorzystaj funkcję <code>to_categorical</code> z biblioteki tensorflow.keras.utils
</div>

In [None]:
from tensorflow.keras.utils import to_categorical

In [None]:
from tensorflow.keras import models
from tensorflow.keras.layers import Dense

In [None]:
y_train_cat = to_categorical(y_train)
y_test_cat = to_categorical(y_test)

In [None]:
X_train.shape[1]

13

In [None]:
Dense(16, activation='relu', input_shape=(X_train.shape[1]))

In [None]:
model = models.Sequential()
model.add(Dense(16, activation='relu', input_shape=(X_train.shape[1], )))   #Pierwsza warstwa ukryta
model.add(Dense(8, activation='relu'))   #Druga warstwa ukryta
model.add(Dense(3, activation='softmax'))   #Warstwa wyjściowa

Warstwa wejściowa ma tyle neuronów, ile mamy atrybutów (liczba zmiennych objaśniających), warstwa wyjściowa ma tyle neuronów, ile mamy klas (w klasyfikacji wielowarstwowej)

In [None]:
model.summary()

Model: "sequential_2"
_________________________________________________________________
 Layer (type)                Output Shape              Param #   
 dense_4 (Dense)             (None, 16)                224       
                                                                 
 dense_5 (Dense)             (None, 8)                 136       
                                                                 
 dense_6 (Dense)             (None, 3)                 27        
                                                                 
Total params: 387
Trainable params: 387
Non-trainable params: 0
_________________________________________________________________


<div class="alert alert-block alert-info">
📝 <b>Zadanie 4.2</b><br>
Skompiluj model, wykorzystując:<br>
<ul>
    <li>optimizer (optymalizator wag neuronów, solver): <i>adam</i></li>
<li>funkcję straty: <i>categorical_crossentropy</i></li>
<li>metrykę monitorującą: <i>accuracy</i></li>
</ul>
</div>

In [None]:
model.compile(
    optimizer='adam',
    loss='categorical_crossentropy',
    metrics=['accuracy']
)

<div class="alert alert-block alert-info">
📝 <b>Zadanie 4.3</b><br>
Wytrenujmy powyższy model. Liczba epok równa 1000 i rozmiar batcha równy 32.
</div>

In [None]:
model.fit(X_train, y_train_cat, batch_size=32, epochs=1000)

Epoch 1/1000
Epoch 2/1000
Epoch 3/1000
Epoch 4/1000
Epoch 5/1000
Epoch 6/1000
Epoch 7/1000
Epoch 8/1000
Epoch 9/1000
Epoch 10/1000
Epoch 11/1000
Epoch 12/1000
Epoch 13/1000
Epoch 14/1000
Epoch 15/1000
Epoch 16/1000
Epoch 17/1000
Epoch 18/1000
Epoch 19/1000
Epoch 20/1000
Epoch 21/1000
Epoch 22/1000
Epoch 23/1000
Epoch 24/1000
Epoch 25/1000
Epoch 26/1000
Epoch 27/1000
Epoch 28/1000
Epoch 29/1000
Epoch 30/1000
Epoch 31/1000
Epoch 32/1000
Epoch 33/1000
Epoch 34/1000
Epoch 35/1000
Epoch 36/1000
Epoch 37/1000
Epoch 38/1000
Epoch 39/1000
Epoch 40/1000
Epoch 41/1000
Epoch 42/1000
Epoch 43/1000
Epoch 44/1000
Epoch 45/1000
Epoch 46/1000
Epoch 47/1000
Epoch 48/1000
Epoch 49/1000
Epoch 50/1000
Epoch 51/1000
Epoch 52/1000
Epoch 53/1000
Epoch 54/1000
Epoch 55/1000
Epoch 56/1000
Epoch 57/1000
Epoch 58/1000
Epoch 59/1000
Epoch 60/1000
Epoch 61/1000
Epoch 62/1000
Epoch 63/1000
Epoch 64/1000
Epoch 65/1000
Epoch 66/1000
Epoch 67/1000
Epoch 68/1000
Epoch 69/1000
Epoch 70/1000
Epoch 71/1000
Epoch 72/1000
E

<keras.callbacks.History at 0x7f5ac80bdba0>

<div class="alert alert-block alert-info">
📝 <b>Zadanie 4.4</b><br>
Dokonaj prognozy zbioru testowego. <br>
Zweryfikuj metryki klasyfikacji trafności, czułości, precyzji itp (np. korzystając z funkcji <code>classification_report</code>).</div>

In [None]:
preds = model.predict(X_test)



In [None]:
preds.shape

(36, 3)

In [None]:
preds

array([[9.9999994e-01, 6.4003852e-10, 3.0503838e-10],
       [7.7312277e-04, 8.9837945e-01, 1.0084750e-01],
       [9.9999958e-01, 2.2288097e-07, 7.3864165e-08],
       [7.9624242e-01, 2.0375079e-01, 6.8466638e-06],
       [8.5756647e-06, 9.9998754e-01, 3.8078779e-06],
       [9.9999994e-01, 1.4917468e-08, 4.4066524e-09],
       [9.9999994e-01, 4.9258690e-09, 4.6215773e-09],
       [6.9828357e-06, 9.9999291e-01, 4.3587400e-09],
       [4.6242056e-07, 9.9999899e-01, 5.3153877e-07],
       [4.0423663e-07, 4.1650825e-08, 9.9999946e-01],
       [1.5632681e-05, 9.9998373e-01, 5.9133436e-07],
       [1.4670327e-04, 9.9393893e-03, 9.8991388e-01],
       [9.9999994e-01, 5.7804245e-10, 1.8609847e-10],
       [1.3166951e-03, 1.3765399e-01, 8.6102927e-01],
       [9.9999994e-01, 3.8304152e-12, 6.1502197e-12],
       [2.7017635e-10, 9.9999994e-01, 1.3631118e-12],
       [5.6354419e-09, 9.9999994e-01, 2.7184077e-10],
       [9.9999982e-01, 6.1173218e-08, 6.8241146e-09],
       [1.2313163e-08, 9.999

In [None]:
preds_classes = np.argmax(preds, axis=1)

In [None]:
preds_classes

array([0, 1, 0, 0, 1, 0, 0, 1, 1, 2, 1, 2, 0, 2, 0, 1, 1, 0, 1, 0, 1, 1,
       0, 0, 1, 1, 0, 2, 1, 2, 0, 2, 1, 2, 2, 2])

In [None]:
print(classification_report(y_pred=preds_classes, y_true=y_test))

              precision    recall  f1-score   support

           0       0.92      1.00      0.96        12
           1       0.93      0.93      0.93        14
           2       1.00      0.90      0.95        10

    accuracy                           0.94        36
   macro avg       0.95      0.94      0.95        36
weighted avg       0.95      0.94      0.94        36



<div class="alert alert-block alert-info">
📝 <b>Zadanie 5.1</b><br>
Korzystając z biblioteki tensorflow, przygotuj architekturę sieci neuronowej o poniższych cechach:
<ul>
<li>1 warstwa ukryta:</li>
    <ul>
    <li>pierwsza warstwa ukryta o 8 neuronach</li>
    </ul>
<li>funkcja aktywacji dla warstw ukrytych: relu</li>
<li>funkcja aktywacji dla warstwy wyjściowej: softmax</li>
</ul>

In [None]:
y_train_cat = to_categorical(y_train)
y_test_cat = to_categorical(y_test)

In [None]:
model = models.Sequential()
model.add(Dense(units =8, activation = 'relu', input_shape =(X_train.shape[1], ))) #pierwsza warstwa ukryta
model.add(Dense(units =3, activation = 'softmax')) # warstwa wyjsciowa

In [None]:
set(y)   #3 klasy więc 3 jako warstwa wyjściowa

{0, 1, 2}

In [None]:
model.summary()

Model: "sequential_4"
_________________________________________________________________
 Layer (type)                Output Shape              Param #   
 dense_9 (Dense)             (None, 8)                 112       
                                                                 
 dense_10 (Dense)            (None, 3)                 27        
                                                                 
Total params: 139
Trainable params: 139
Non-trainable params: 0
_________________________________________________________________


In [None]:
model.compile(
    optimizer='adam',
    loss='categorical_crossentropy',
    metrics=['accuracy']
)

In [None]:
model.fit(X_train, y_train_cat, batch_size=32, epochs=1000, verbose=0)

<keras.callbacks.History at 0x7f5ac8065390>

In [None]:
preds = model.predict(X_test)
preds_classes = np.argmax(preds, axis=1)
print(classification_report(y_pred=preds_classes, y_true=y_test))

              precision    recall  f1-score   support

           0       1.00      1.00      1.00        12
           1       1.00      1.00      1.00        14
           2       1.00      1.00      1.00        10

    accuracy                           1.00        36
   macro avg       1.00      1.00      1.00        36
weighted avg       1.00      1.00      1.00        36

