# Введение в нейронные сети. Урок 3. Домашнее задание

1. Попробуйте улучшить работу нейронной сети (разобранную на уроке), обучавшейся на датасет Fashion-MNIST. Напишите в комментариях к уроку, какого результата вы добились от нейросети и что помогло улучшить её точность

In [2]:
import tensorflow as tf
from tensorflow import keras

import numpy as np
import matplotlib.pyplot as plt

In [3]:
fashion_mnist = keras.datasets.fashion_mnist

(train_images, train_labels), (test_images, test_labels) = fashion_mnist.load_data()

Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/train-labels-idx1-ubyte.gz
Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/train-images-idx3-ubyte.gz
Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/t10k-labels-idx1-ubyte.gz
Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/t10k-images-idx3-ubyte.gz


In [4]:
train_images = train_images / 255.0
test_images = test_images / 255.0

Эталонная модель

In [14]:
model_0 = keras.Sequential([
    keras.layers.Flatten(input_shape=(28, 28)),
    keras.layers.Dense(128, activation='relu'),
    keras.layers.Dense(10)
])

model_0.compile(optimizer='adam',
              loss=tf.keras.losses.SparseCategoricalCrossentropy(from_logits=True),
              metrics=['accuracy'])

model_0.fit(train_images, train_labels, epochs=3)

test_loss, test_acc = model_0.evaluate(test_images,  test_labels, verbose=2)

print('\nTest accuracy:', test_acc)

Epoch 1/3
Epoch 2/3
Epoch 3/3
313/313 - 1s - loss: 0.3933 - accuracy: 0.8589 - 1s/epoch - 3ms/step

Test accuracy: 0.8589000105857849


Модель 1
Изменение конфигурации сети: 5 слоёв, увеличение нейронов, 10 эпох

Результат: улучшение точности до 0.91

In [18]:
model_1 = keras.Sequential([
    keras.layers.Flatten(input_shape=(28, 28)),
    keras.layers.Dense(256, activation='relu'),
    keras.layers.Dense(128, activation='relu'),
    keras.layers.Dense(64, activation='relu'),
    keras.layers.Dense(64, activation='relu'),
    keras.layers.Dense(10)
])

model_1.compile(optimizer='adam',
              loss=tf.keras.losses.SparseCategoricalCrossentropy(from_logits=True),
              metrics=['accuracy'])

model_1.fit(train_images, train_labels, epochs=10)

test_loss, test_acc = model_1.evaluate(test_images,  test_labels, verbose=2)

print('\nTest accuracy:', test_acc)

Epoch 1/10
Epoch 2/10
Epoch 3/10
Epoch 4/10
Epoch 5/10
Epoch 6/10
Epoch 7/10
Epoch 8/10
Epoch 9/10
Epoch 10/10
313/313 - 1s - loss: 0.3541 - accuracy: 0.8812 - 932ms/epoch - 3ms/step

Test accuracy: 0.8812000155448914


2. GradientType

Применяется для автоматического дифференцирования.  
Заносит все промежуточные вычисления функции вокруг заданной точки в объект tape.  
Далее проходит в обратном порядке результаты вычисления функции и находит дифференциал.  
Эффективен для больших размеров данных.

Вывод: применяется для реализации собственных алгоритмов машинного обучения

In [22]:
# Пример 1: Вычислить производную функции y = x ^ 2 в точке x = 3

x = tf.Variable(3.0)
with tf.GradientTape() as tape:
  y = x ** 2

df = tape.gradient(y, x)
print(df)

tf.Tensor(6.0, shape=(), dtype=float32)


In [26]:
# Пример 2: Для нейронной сети
# Y = X * W + B,
# где векторы:
# Y - выходные значения
# X, W - входные значения и веса
# Вычислить производную функции потерь
# loss = sum(Y ^ 2) / N
# для заданных входных значений X при изменении параметров W, B

w = tf.Variable(tf.random.normal((3, 2)))       # w - веса      матрица размером 3х2
                                                #     случайные значения
b = tf.Variable(tf.zeros(2, dtype=tf.float32))  # b - смещения  вектор  размером 2
                                                #     нули
x = tf.Variable([[-2.0, 1.0, 3.0]])

with tf.GradientTape() as tape: # Запись в tape промежуточных вычислений функции потерь на прямом проходе
  y = x @ w + b                 # Y = X * W + B (@ - умножение матриц)
  loss = tf.reduce_mean(y ** 2) # loss = sum(Y ^ 2) / N

df = tape.gradient(loss, [w, b])  # Вычислить производные для каждого из заданных параметров w, b
print(df[0])                    # df[0] - множество значений производных функции потерь при изменении параметра w
                                #         матрица размером 3х2
print(df[1])                    # df[1] - множество значений производных функции потерь при изменении параметра b
                                #         вектор  размером 2

# Выбор минимальных значений функции потерь определяет оптимальный вес и смещение





tf.Tensor(
[[ 4.6766562 -7.585261 ]
 [-2.3383281  3.7926304]
 [-7.014984  11.377892 ]], shape=(3, 2), dtype=float32)
tf.Tensor([-2.3383281  3.7926304], shape=(2,), dtype=float32)
