# Praca z modelem.

In [1]:
import numpy as np
import plotly.express as px

import tensorflow as tf
from tensorflow.keras.datasets.mnist import load_data # zbudujemy model rozpoznający cyfry
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Flatten, Dense, Dropout, Input, Activation

In [2]:
# ładujemy dane

(X_train, y_train), (X_test, y_test) = load_data()
print(f'X_train shape: {X_train.shape}')
print(f'y_train shape: {y_train.shape}')
print(f'X_test shape: {X_test.shape}')
print(f'y_test shape: {y_test.shape}')

X_train shape: (60000, 28, 28)
y_train shape: (60000,)
X_test shape: (10000, 28, 28)
y_test shape: (10000,)


In [3]:
# normalizacja obrazów

X_train = X_train / 255.
X_test = X_test / 255.

In [4]:
# budowa modelu

model = Sequential()
model.add(Input(shape=(28, 28)))
model.add(Flatten()) # warstwa Flatten ma zadanie "wypłaszczyć input"
model.add(Dense(128, activation='relu'))
model.add(Dropout(0.2)) # warstwa Dropout służy regularyzacji modelu - pomija określony % neuronów w warstwie
model.add(Dense(10, activation='softmax'))

model.compile(optimizer='adam',
              loss='categorical_crossentropy',
              metrics=['accuracy'])

model.summary()

In [5]:
# konwersja zmiennej docelowej

from tensorflow.keras.utils import to_categorical

y_train = to_categorical(y_train)
y_test = to_categorical(y_test)

In [6]:
model.fit(X_train, y_train, epochs=10, validation_split=0.2, batch_size=32)

Epoch 1/10
[1m1500/1500[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m9s[0m 5ms/step - accuracy: 0.8427 - loss: 0.5353 - val_accuracy: 0.9539 - val_loss: 0.1591
Epoch 2/10
[1m1500/1500[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m8s[0m 5ms/step - accuracy: 0.9520 - loss: 0.1641 - val_accuracy: 0.9655 - val_loss: 0.1181
Epoch 3/10
[1m1500/1500[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m7s[0m 5ms/step - accuracy: 0.9648 - loss: 0.1187 - val_accuracy: 0.9687 - val_loss: 0.1034
Epoch 4/10
[1m1500/1500[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m8s[0m 5ms/step - accuracy: 0.9692 - loss: 0.0978 - val_accuracy: 0.9715 - val_loss: 0.0937
Epoch 5/10
[1m1500/1500[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m9s[0m 5ms/step - accuracy: 0.9753 - loss: 0.0806 - val_accuracy: 0.9734 - val_loss: 0.0886
Epoch 6/10
[1m1500/1500[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m10s[0m 5ms/step - accuracy: 0.9793 - loss: 0.0671 - val_accuracy: 0.9730 - val_loss: 0.0916
Epoch 7/10
[1m

<keras.src.callbacks.history.History at 0x7ff35597ac50>

In [7]:
# lista warstw modelu

model.layers

[<Flatten name=flatten, built=True>,
 <Dense name=dense, built=True>,
 <Dropout name=dropout, built=True>,
 <Dense name=dense_1, built=True>]

In [8]:
# lista tensorów wejściowych modelu

model.inputs
# pierwszy parametr kształtu zawsze jest wyświetlany jako None

[<KerasTensor shape=(None, 28, 28), dtype=float32, sparse=False, name=keras_tensor>]

In [9]:
# lista tensorów wyjściowych modelu

model.outputs

[<KerasTensor shape=(None, 10), dtype=float32, sparse=False, name=keras_tensor_10>]

In [10]:
# słownik zawierający konfigurację modelu

model.get_config()

{'name': 'sequential',
 'trainable': True,
 'dtype': {'module': 'keras',
  'class_name': 'DTypePolicy',
  'config': {'name': 'float32'},
  'registered_name': None},
 'layers': [{'module': 'keras.layers',
   'class_name': 'InputLayer',
   'config': {'batch_shape': (None, 28, 28),
    'dtype': 'float32',
    'sparse': False,
    'name': 'input_layer'},
   'registered_name': None},
  {'module': 'keras.layers',
   'class_name': 'Flatten',
   'config': {'name': 'flatten',
    'trainable': True,
    'dtype': {'module': 'keras',
     'class_name': 'DTypePolicy',
     'config': {'name': 'float32'},
     'registered_name': None},
    'data_format': 'channels_last'},
   'registered_name': None,
   'build_config': {'input_shape': (None, 28, 28)}},
  {'module': 'keras.layers',
   'class_name': 'Dense',
   'config': {'name': 'dense',
    'trainable': True,
    'dtype': {'module': 'keras',
     'class_name': 'DTypePolicy',
     'config': {'name': 'float32'},
     'registered_name': None},
    'units

In [11]:
# tablica wag modelu

model.get_weights()

[array([[ 0.0643056 ,  0.05629603,  0.02218101, ..., -0.00342586,
          0.04372887, -0.04529567],
        [-0.02433048,  0.01136354, -0.03174291, ...,  0.05639911,
          0.07781086,  0.00208759],
        [ 0.06924132, -0.05594914, -0.07148464, ...,  0.03363217,
          0.01789475, -0.07157983],
        ...,
        [-0.00616613,  0.06568003,  0.05761629, ..., -0.07269729,
         -0.01522496, -0.05590314],
        [-0.07794157, -0.06884761,  0.02332944, ..., -0.02492593,
          0.04529374,  0.07000642],
        [ 0.03382176, -0.01837446, -0.03585263, ...,  0.06425654,
          0.00658581, -0.0765916 ]], dtype=float32),
 array([ 0.13567549,  0.09643455, -0.04228031,  0.18861493,  0.09822429,
         0.21392179, -0.15822797,  0.12564613, -0.06914776,  0.11925772,
        -0.23738082, -0.27258778, -0.0042233 ,  0.05328408, -0.18974862,
         0.03438743, -0.02292107,  0.00373933, -0.03322421, -0.07831463,
        -0.0045072 , -0.11354828, -0.0164149 , -0.14078233, -0.136

In [12]:
model.get_weights()[0].shape
# rozmiar macierzy wag pierwszej warstwy:
# (rozmiar danych wejściowych, liczba neuronów pierwszej warstwy ukrytej)

(784, 128)

In [13]:
model.get_weights()[1].shape
# macierz wag warstwy Dropout - drugi wymiar pusty

(128,)

In [14]:
model.get_weights()[2].shape
# rozmiar macierzy wag drugiej warstwy Dense:
# (rozmiar danych wejściowych do warstwy, liczba neuronów wyjściowych)

(128, 10)

In [15]:
model.get_weights()[3].shape
# macierz wag wyjściowych - drugi wymiar pusty, tylko liczba neuronów wyjścia

(10,)

In [16]:
# zapis modelu do pliku JSON

model_json = model.to_json()

import json
parsed = json.loads(model_json)
print(json.dumps(parsed, indent=4))

{
    "module": "keras",
    "class_name": "Sequential",
    "config": {
        "name": "sequential",
        "trainable": true,
        "dtype": {
            "module": "keras",
            "class_name": "DTypePolicy",
            "config": {
                "name": "float32"
            },
            "registered_name": null
        },
        "layers": [
            {
                "module": "keras.layers",
                "class_name": "InputLayer",
                "config": {
                    "batch_shape": [
                        null,
                        28,
                        28
                    ],
                    "dtype": "float32",
                    "sparse": false,
                    "name": "input_layer"
                },
                "registered_name": null
            },
            {
                "module": "keras.layers",
                "class_name": "Flatten",
                "config": {
                    "name": "flatten",
         

In [17]:
# wczytanie modelu z pliku JSON

from tensorflow.keras.models import model_from_json

model2 = model_from_json(model_json)
model2.summary()

In [18]:
# model.to_yaml() - funkcja wyłączona w nowszych wersjach Keras

# Rodzaje warstw.

In [19]:
dense_layer = model.layers[1]
dense_layer

<Dense name=dense, built=True>

In [20]:
# tensor wejściowy do warstwy

dense_layer.input

<KerasTensor shape=(None, 784), dtype=float32, sparse=False, name=keras_tensor_2>

In [21]:
# wymiar danych wejściowych do warstwy

# dense_layer.input_shape - wycofany sposób
dense_layer.input.shape

(None, 784)

In [22]:
# tensor wychodzący z warstwy

dense_layer.output

<KerasTensor shape=(None, 128), dtype=float32, sparse=False, name=keras_tensor_3>

In [23]:
# wymiar - analogicznie do danych wejściowych

dense_layer.output.shape

(None, 128)

In [24]:
# atrybut wskazujący, czy warstwa jest używana do trenowania
# istotne przy transfer learningu - w bardziej złożonych modelach niektóre warstwy mogą być zamrażane

dense_layer.trainable

True

Podstawowe rodzaje warstw:
* **Dense** - warstwa gęsto połączona, wynik operacji $output = activation(dot(input, weights) + bias)$
* **Activation** - stosuje funkcję aktywacji
* **Dropout** - porzuca wskazaną część neuronów w warstwie
* **Flatten** - wypłaszcza dane wejściowe
* **Input** - warstwa wejściowa, parametr *shape* określa rozmiar danych wejściowych

In [25]:
dense = Dense(units=10, activation='relu')
# jeżeli podajemy parametr activation, nie musimy tworzyć warstwy Activation
dense

<Dense name=dense_2, built=False>

In [26]:
activation = Activation('relu')
activation

<Activation name=activation, built=True>

In [27]:
dropout = Dropout(rate=0.3)
# parametr rate określa odsetek porzucanych neuronów
dropout

<Dropout name=dropout_1, built=True>

In [28]:
flatten = Flatten() # nie przyjmuje żadnego parametru
flatten

<Flatten name=flatten_1, built=False>

In [29]:
input = Input(shape=(28, 28)) # przyjmuje jako parametr rozmiar danych wejściowych
input

<KerasTensor shape=(None, 28, 28), dtype=float32, sparse=False, name=keras_tensor_21>