#Zadanie 1
*Implementacja i trenowanie sieci neuronowej* \

Zaimplementuj sieć neuronową o w pełni połączonych warstwach (MLP – Multi-Layer
Perceptron) do klasyfikacji zbioru danych Iris. Wykorzystaj bibliotekę TensorFlow/Keras lub
PyTorch. Twoim zadaniem jest:
1. Wczytanie zbioru danych Iris.
2. Podział danych na zbiór treningowy i testowy.
3. Zbudowanie i wytrenowanie sieci neuronowej z co najmniej jedną warstwą ukrytą.
4. Ocena skuteczności modelu na zbiorze testowym

Wczytanie danych Iris:

In [1]:
import tensorflow as tf
from tensorflow import keras
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler, OneHotEncoder
import numpy as np

data = load_iris()
X = data.data
y = data.target.reshape(-1, 1)

Podział danych na zbiór treningowy i testowy:

In [2]:
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

Standaryzacja cech:

In [3]:
scaler = StandardScaler()
X_train = scaler.fit_transform(X_train)
X_test = scaler.transform(X_test)

One-hot encoding dla etykiet:

In [4]:
encoder = OneHotEncoder(sparse_output=False)
y_train = encoder.fit_transform(y_train)
y_test = encoder.transform(y_test)

Zbudowanie i wytrenowanie sieci neuronowej z co najmniej jedną warstwą ukrytą:

In [5]:
model = keras.Sequential([
    keras.layers.Dense(10, activation='relu', input_shape=(X_train.shape[1],)),
    keras.layers.Dense(10, activation='relu'),
    keras.layers.Dense(3, activation='softmax')  # 3 klasy wyjściowe
])

model.compile(optimizer='adam', loss='categorical_crossentropy', metrics=['accuracy'])

model.fit(X_train, y_train, epochs=50, batch_size=5, verbose=1)

  super().__init__(activity_regularizer=activity_regularizer, **kwargs)


Epoch 1/50
[1m24/24[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m3s[0m 3ms/step - accuracy: 0.1167 - loss: 1.2211     
Epoch 2/50
[1m24/24[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 3ms/step - accuracy: 0.4171 - loss: 1.0229
Epoch 3/50
[1m24/24[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 3ms/step - accuracy: 0.6051 - loss: 0.9351 
Epoch 4/50
[1m24/24[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 2ms/step - accuracy: 0.7157 - loss: 0.8215 
Epoch 5/50
[1m24/24[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 2ms/step - accuracy: 0.8204 - loss: 0.7409 
Epoch 6/50
[1m24/24[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 2ms/step - accuracy: 0.7641 - loss: 0.7104 
Epoch 7/50
[1m24/24[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 3ms/step - accuracy: 0.7276 - loss: 0.6441 
Epoch 8/50
[1m24/24[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 2ms/step - accuracy: 0.7383 - loss: 0.6273 
Epoch 9/50
[1m24/24[0m [32m━━━━━━━━━━━━━━━

<keras.src.callbacks.history.History at 0x7ba71c2e4690>

Ocena skuteczności modelu na zbiorze testowym:

In [7]:
loss, accuracy = model.evaluate(X_test, y_test, verbose=1)
print(f'Skuteczność modelu: {accuracy * 100:.2f}%')

[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 70ms/step - accuracy: 1.0000 - loss: 0.0433
Skuteczność modelu: 100.00%


#Zadanie 2
*Optymalizacja hiperparametrów* \

Eksperymentuj z różnymi hiperparametrami sieci neuronowej do klasyfikacji obrazów z zestawu MNIST (ręcznie pisane cyfry 0–9). Porównaj wyniki dla różnych wartości:
* liczby warstw ukrytych,
* liczby neuronów w warstwach,
* funkcji aktywacji,
* współczynnika uczenia.

Wczytanie danych MNIST:

In [8]:
import tensorflow as tf
from tensorflow import keras
from tensorflow.keras.layers import Dense, Flatten
from tensorflow.keras.optimizers import Adam
from sklearn.model_selection import ParameterGrid
import numpy as np

mnist = keras.datasets.mnist
(X_train, y_train), (X_test, y_test) = mnist.load_data()

Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/mnist.npz
[1m11490434/11490434[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 0us/step


Normalizacja danych:

In [9]:
X_train, X_test = X_train / 255.0, X_test / 255.0

Siatka hiperparametrów do przetestowania:

In [10]:
param_grid = {
    'hidden_layers': [[128], [128, 64], [256, 128]],
    'activation': ['relu', 'tanh'],
    'learning_rate': [0.001, 0.01],
}

best_acc = 0
best_params = None

Budowa, kompilacja i trening modelu (dodatkowo, ocena modelu i sprawdzenie najlepszego modelu):

In [11]:
for params in ParameterGrid(param_grid):
    print(f'Testowanie parametrów: {params}')

    # Budowa modelu
    model = keras.Sequential()
    model.add(Flatten(input_shape=(28, 28)))

    for units in params['hidden_layers']:
        model.add(Dense(units, activation=params['activation']))

    model.add(Dense(10, activation='softmax'))

    # Kompilacja modelu
    model.compile(optimizer=Adam(learning_rate=params['learning_rate']),
                  loss='sparse_categorical_crossentropy',
                  metrics=['accuracy'])

    # Trening modelu
    model.fit(X_train, y_train, epochs=5, batch_size=32, verbose=0)

    # Ocena modelu
    _, acc = model.evaluate(X_test, y_test, verbose=0)
    print(f'Skuteczność modelu: {acc:.4f}')

    # Sprawdzenie najlepszego modelu
    if acc > best_acc:
        best_acc = acc
        best_params = params

print(f'Najlepsze paranetry: {best_params}, Najwyższa skuteczność: {best_acc:.4f}')

Testowanie parametrów: {'activation': 'relu', 'hidden_layers': [128], 'learning_rate': 0.001}


  super().__init__(**kwargs)


Skuteczność modelu: 0.9772
Testowanie parametrów: {'activation': 'relu', 'hidden_layers': [128], 'learning_rate': 0.01}
Skuteczność modelu: 0.9635
Testowanie parametrów: {'activation': 'relu', 'hidden_layers': [128, 64], 'learning_rate': 0.001}
Skuteczność modelu: 0.9776
Testowanie parametrów: {'activation': 'relu', 'hidden_layers': [128, 64], 'learning_rate': 0.01}
Skuteczność modelu: 0.9626
Testowanie parametrów: {'activation': 'relu', 'hidden_layers': [256, 128], 'learning_rate': 0.001}
Skuteczność modelu: 0.9809
Testowanie parametrów: {'activation': 'relu', 'hidden_layers': [256, 128], 'learning_rate': 0.01}
Skuteczność modelu: 0.9617
Testowanie parametrów: {'activation': 'tanh', 'hidden_layers': [128], 'learning_rate': 0.001}
Skuteczność modelu: 0.9731
Testowanie parametrów: {'activation': 'tanh', 'hidden_layers': [128], 'learning_rate': 0.01}
Skuteczność modelu: 0.9462
Testowanie parametrów: {'activation': 'tanh', 'hidden_layers': [128, 64], 'learning_rate': 0.001}
Skuteczność mo

#Zadanie 3
*Regularyzacja i unikanie przeuczenia* \

Zaimplementuj sieć neuronową do klasyfikacji danych Fashion-MNIST. Aby zapobiec przeuczeniu, zastosuj:
* Dropout,
* L2 regularyzację (regularyzację wag),
* Augmentację danych.

Wczytanie zbioru Fashion-MNIST:

In [12]:
import tensorflow as tf
from tensorflow import keras
from tensorflow.keras.layers import Dense, Flatten, Dropout
from tensorflow.keras.regularizers import l2
from tensorflow.keras.preprocessing.image import ImageDataGenerator

fashion_mnist = keras.datasets.fashion_mnist
(X_train, y_train), (X_test, y_test) = fashion_mnist.load_data()

Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/train-labels-idx1-ubyte.gz
[1m29515/29515[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 0us/step
Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/train-images-idx3-ubyte.gz
[1m26421880/26421880[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 0us/step
Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/t10k-labels-idx1-ubyte.gz
[1m5148/5148[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 1us/step
Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/t10k-images-idx3-ubyte.gz
[1m4422102/4422102[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 0us/step


Normalizacja danych:

In [13]:
X_train, X_test = X_train / 255.0, X_test / 255.0

Augmentacja danych:

In [14]:
datagen = ImageDataGenerator(
    rotation_range=10,
    width_shift_range=0.1,
    height_shift_range=0.1,
    horizontal_flip=True
)
datagen.fit(X_train.reshape(-1, 28, 28, 1))

Budowa modelu z Dropout i regularyzacją L2:

In [15]:
model = keras.Sequential([
    Flatten(input_shape=(28, 28)),
    Dense(256, activation='relu', kernel_regularizer=l2(0.001)),
    Dropout(0.3),
    Dense(128, activation='relu', kernel_regularizer=l2(0.001)),
    Dropout(0.3),
    Dense(10, activation='softmax')
])

Kompilacja i trening modelu z augmentacją danych:

In [16]:
model.compile(optimizer='adam', loss='sparse_categorical_crossentropy', metrics=['accuracy'])

# Trening modelu z augmentacją danych
model.fit(datagen.flow(X_train.reshape(-1, 28, 28, 1), y_train, batch_size=32),
          epochs=20,
          validation_data=(X_test, y_test),
          verbose=1)

Epoch 1/20


  self._warn_if_super_not_called()


[1m1875/1875[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m36s[0m 19ms/step - accuracy: 0.5942 - loss: 1.4328 - val_accuracy: 0.7569 - val_loss: 0.8129
Epoch 2/20
[1m1875/1875[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m39s[0m 21ms/step - accuracy: 0.7088 - loss: 0.9373 - val_accuracy: 0.7694 - val_loss: 0.7615
Epoch 3/20
[1m1875/1875[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m37s[0m 18ms/step - accuracy: 0.7233 - loss: 0.8759 - val_accuracy: 0.7709 - val_loss: 0.7532
Epoch 4/20
[1m1875/1875[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m34s[0m 18ms/step - accuracy: 0.7196 - loss: 0.8768 - val_accuracy: 0.7830 - val_loss: 0.7288
Epoch 5/20
[1m1875/1875[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m34s[0m 18ms/step - accuracy: 0.7275 - loss: 0.8586 - val_accuracy: 0.7835 - val_loss: 0.7127
Epoch 6/20
[1m1875/1875[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m34s[0m 18ms/step - accuracy: 0.7280 - loss: 0.8578 - val_accuracy: 0.7849 - val_loss: 0.7126
Epoch 7/20
[1m

<keras.src.callbacks.history.History at 0x7ba66148fb90>

Ocena modelu:

In [18]:
loss, accuracy = model.evaluate(X_test, y_test, verbose=1)
print(f'Skuteczność modelu: {accuracy * 100:.2f}%')

[1m313/313[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 2ms/step - accuracy: 0.7996 - loss: 0.6772
Skuteczność modelu: 79.45%
