# Введение в искусственные нейронные сети
# Урок 3. TensorFlow

## Содержание методического пособия:


<ol>
<li>Что такое TensorFlow</li>
<li>Основы синтаксиса TensorFlow</li>
<li>Пример нейросети на TensorFlow</li>
</ol>

## Что такое TensorFlow

TensorFlow - это фреймворк для создания ML моделей. TensorFlow предназначен в первую очередь для Deep Learning, т.е. создания современных нейросетей. Однако в TensorFlow также есть поддержка некоторых классических ML алгоритмов: K-means clustering, Random Forests, Support Vector Machines, Gaussian Mixture Model clustering, Linear/logistic regression.

TensorFlow выпустила компания Google в 2015. TensorFlow - это opensource проект. На данный момент это один из основных инструментов для создания нейросетей в рабочих целях. TensorFlow позволяет создавать нейронные сети как для кластеров из большого количества вычислительных устройств, так и для устройств с относительно небольшой вычислитей мощностью, таких как смартфоны и одноплатные компьютеры.

TensorFlow применяется самой компанией Google для ее поиска, почты, переводчика, распознования голоса, внутренних нужд наподобие мониторинга оборудования. TensorFlow используется различными компаниями для различных проектов связанных с компьютерным зрением, решением задач ранжирования и т.д.


## Основы синтаксиса TensorFlow

Процесс создания нейросети на TensorFlow схож с разобранным нами процессом обучения нейросети на Keras. Отличее здесь в том, что здесь нам нужно прописать больше деталей в коде. 

Название TensorFlow означает поток тензоров. Тензоры - это массивы. Данные в компьютере предствлены часто в виде массивах и работа с этими массивами подразумевает их преобразования. Преобразования осуществляются через, к примеру, математические операции. Работа TensorFlow складывается из цепочки преобразований тензоров, т.е. данных. Сами операции осуществляющие преобразование данных представлены в TensorFlow в виде графов. Особенностью TensorFlow версии 1 является то, что сначала необходимо декларировать переменные и вычисления, которые будут совершенны над ними, а потом уже непосредственно запускать работу над данными. 

Давайте рассмотрим базовые вещи в синтаксисе Tensorflow 2.

Выведем строку Hello world, а также версию tensorflow

In [1]:
!pip install --upgrade pip
!pip install tensorflow
!pip install tf-nightly

Requirement already up-to-date: pip in ./env/lib/python3.6/site-packages (20.0.2)
Collecting setuptools>=41.0.0
  Downloading setuptools-46.0.0-py3-none-any.whl (582 kB)
[K     |████████████████████████████████| 582 kB 622 kB/s eta 0:00:01
Installing collected packages: setuptools
  Attempting uninstall: setuptools
    Found existing installation: setuptools 39.0.1
    Uninstalling setuptools-39.0.1:
      Successfully uninstalled setuptools-39.0.1
Successfully installed setuptools-46.0.0
Collecting tf-nightly
  Downloading tf_nightly-2.2.0.dev20200318-cp36-cp36m-manylinux2010_x86_64.whl (533.0 MB)
[K     |████████████████████████████████| 533.0 MB 26 kB/s  eta 0:00:012    |█                               | 16.5 MB 12.2 MB/s eta 0:00:43     |█████▋                          | 93.3 MB 5.8 MB/s eta 0:01:17     |█████████▌                      | 158.2 MB 5.9 MB/s eta 0:01:04     |█████████▋                      | 159.9 MB 5.9 MB/s eta 0:01:04     |████████████▉                   | 214.2 

Collecting tensorboard-plugin-wit>=1.6.0
  Downloading tensorboard_plugin_wit-1.6.0.post2-py3-none-any.whl (775 kB)
[K     |████████████████████████████████| 775 kB 13.2 MB/s eta 0:00:01
[31mERROR: tensorflow 2.1.0 has requirement gast==0.2.2, but you'll have gast 0.3.3 which is incompatible.[0m
Installing collected packages: gast, astunparse, tensorboard-plugin-wit, tb-nightly, tf-estimator-nightly, tf-nightly
  Attempting uninstall: gast
    Found existing installation: gast 0.2.2
    Uninstalling gast-0.2.2:
      Successfully uninstalled gast-0.2.2
[31mERROR: Could not install packages due to an EnvironmentError: [Errno 28] No space left on device
[0m


In [3]:
# %tensorflow_version 2.x

In [5]:
import tensorflow as tf
# print(tf.__version__)
# msg = tf.constant('TensorFlow 2.0 Hello World')
# tf.print(msg)

ModuleNotFoundError: No module named 'tensorflow.python.tools'

Пример создания тензора - 

In [None]:
A = tf.constant([[3, 2], 
                 [5, 2]])

print(A)

Приме сложения тензеров - 

In [None]:
B = tf.constant([[9, 5], 
                 [1, 3]])

AB = tf.concat(values=[A, B], axis=1)
print(AB.numpy())

Пример изменения размерности тензора - 

In [None]:
tensor = tf.constant([[3, 2], 
                      [5, 2], 
                      [9, 5], 
                      [1, 3]])

resh_tensor = tf.reshape(tensor = tensor, shape = [1, 8]) 

print(f'BEFORE {tensor.numpy()}')
print(f'AFTER {resh_tensor.numpy()}')

Пример умножения матриц, одной из самых частых операций в машинном обучении - 

In [None]:
A = tf.constant([[3, 7], 
                 [1, 9]])


B = tf.constant([[10, 10],
                 [1000, 1000]])

AB = tf.multiply(A, B)
print(AB)


Функции tensorflow призваны ускорить вычисления, давайте посмотрим на следующий пример - 

# Классификация изображений одежды

Давайте разберем использование tensorflow 2 на примере датасета с одеждой. В это датасете будут находиться маленькие изображения на белом фоне, такие как кросовки, футболки и прочее.

В данном случае мы будем использовать High API от TensorFlow

In [None]:
from __future__ import absolute_import, division, print_function, unicode_literals

# TensorFlow and tf.keras
import tensorflow as tf
from tensorflow import keras

# Helper libraries
import numpy as np
import matplotlib.pyplot as plt

print(tf.__version__)

## Импортируем Fashion MNIST датасет

Мы будет использовать следующий датасет -  [Fashion MNIST](https://github.com/zalandoresearch/fashion-mnist) Этот датасет содержит 70,000 черно-белых изображений в 10 категориях. Изображения имеют разрешение 28x28 пикселей.

<table>
  <tr><td>
    <img src="https://tensorflow.org/images/fashion-mnist-sprite.png"
         alt="Fashion MNIST sprite"  width="600">
  </td></tr>
  <tr><td align="center">
    <b>Figure 1.</b> <a href="https://github.com/zalandoresearch/fashion-mnist">Fashion-MNIST samples</a> (by Zalando, MIT License).<br/>&nbsp;
  </td></tr>
</table>

Долгое время в машинном обучение для программ Hello world использовался датасет MNIST с рукописными цифрами. Данный датасет призван несколько усложнить задачу распознования но также подходит в качестве программы Hello world.

В этом датасете 60 000 тренировочных изображений и 10 000 тестовых.

In [None]:
fashion_mnist = keras.datasets.fashion_mnist

(train_images, train_labels), (test_images, test_labels) = fashion_mnist.load_data()

Датасет содержит следующие классы:

<table>
  <tr>
    <th>Label</th>
    <th>Class</th>
  </tr>
  <tr>
    <td>0</td>
    <td>T-shirt/top</td>
  </tr>
  <tr>
    <td>1</td>
    <td>Trouser</td>
  </tr>
    <tr>
    <td>2</td>
    <td>Pullover</td>
  </tr>
    <tr>
    <td>3</td>
    <td>Dress</td>
  </tr>
    <tr>
    <td>4</td>
    <td>Coat</td>
  </tr>
    <tr>
    <td>5</td>
    <td>Sandal</td>
  </tr>
    <tr>
    <td>6</td>
    <td>Shirt</td>
  </tr>
    <tr>
    <td>7</td>
    <td>Sneaker</td>
  </tr>
    <tr>
    <td>8</td>
    <td>Bag</td>
  </tr>
    <tr>
    <td>9</td>
    <td>Ankle boot</td>
  </tr>
</table>

Каждому классу обозначенному цифрой мы можем присвоить текстовое значение -

In [None]:
class_names = ['T-shirt/top', 'Trouser', 'Pullover', 'Dress', 'Coat',
               'Sandal', 'Shirt', 'Sneaker', 'Bag', 'Ankle boot']

## Анализ датасета 

Давайте посмотрим структуры полученного массива данных:

In [None]:
train_images.shape

In [None]:
len(train_labels)

In [None]:
train_labels

Проанализируем тестовую выборку:

In [None]:
test_images.shape

In [None]:
len(test_labels)

## Preprocess the data

Давайте взглянем на конкретный пример изображений с помощью matplotlib:

In [None]:
plt.figure()
plt.imshow(train_images[0])
plt.colorbar()
plt.grid(False)
plt.show()

Для процесса обучения нейронной сети нам важно перевести данные из диапазона от 0 до 255 в диапазон от 0 до 1:

In [None]:
train_images = train_images / 255.0

test_images = test_images / 255.0

Посмотрим первые 25 изображений:

In [None]:
plt.figure(figsize=(10,10))
for i in range(25):
    plt.subplot(5,5,i+1)
    plt.xticks([])
    plt.yticks([])
    plt.grid(False)
    plt.imshow(train_images[i], cmap=plt.cm.binary)
    plt.xlabel(class_names[train_labels[i]])
plt.show()

## Построение модели

Построение нейронной сети подразумевает конфигурацию ее слоев и последующую компиляцию.

### Определение слоев

Давайте создадим 3 слоя нейронной сети с помощью функционала Keras.layers

In [None]:
model = keras.Sequential([
    keras.layers.Flatten(input_shape=(28, 28)),
    keras.layers.Dense(128, activation='relu'),
    keras.layers.Dense(10)
])

Первый слой, `tf.keras.layers.Flatten`, трасформирует двумерный массив на входе в одномерный массив.

Получившиеся 784(28 x 28) входных нейрона присоединяем к полносвязному слою из 128 нейронов , которые будут использовать функцию активации relu. В выходном слое будет 10 нейронов, по числу классов, которые он должен предсказывать. В нем будет использоваться функция активации softmax и он будет давать предсказание от 0 до 1, где 1 это стопроцентная вероятность.

### Компиляция модели

Давайте вспомним ключевые понятия, которые нам понадобяться при компиляции:

* *Loss function* — меряет как точно работает нейросеть.
* *Optimizer* — определяет способ корректировки весов.
* *Metrics* — определяет за какие характеристики будут отражаться в процессе обучения.

In [None]:
model.compile(optimizer='adam',
              loss=tf.keras.losses.SparseCategoricalCrossentropy(from_logits=True),
              metrics=['accuracy'])

## Тренировка модели

Здесь все стандартно - данные передаются в нейросеть и сопоставляются изображения и лейблы.



### Передача данных в модель

Команда непосредственно запускающая процесс обучения называется - `model.fit`:

In [None]:
model.fit(train_images, train_labels, epochs=3)

In [None]:
test_loss, test_acc = model.evaluate(test_images,  test_labels, verbose=2)

print('\nTest accuracy:', test_acc)

В выводе выше мы следим за точностью в процессе обучения, проверяем точность на тестовых даыннх и меняем параметры нейросети если точность на тестовых данных нас не устраивает.

### Предсказания нейросети

Команды ниже позволяют проверить работу натренированной ранее нейросети - 

In [None]:
probability_model = tf.keras.Sequential([model, 
                                         tf.keras.layers.Softmax()])

In [None]:
predictions = probability_model.predict(test_images)

In [None]:
predictions[0]

In [None]:
np.argmax(predictions[0])

In [None]:
test_labels[0]

In [None]:
def plot_image(i, predictions_array, true_label, img):
  predictions_array, true_label, img = predictions_array, true_label[i], img[i]
  plt.grid(False)
  plt.xticks([])
  plt.yticks([])

  plt.imshow(img, cmap=plt.cm.binary)

  predicted_label = np.argmax(predictions_array)
  if predicted_label == true_label:
    color = 'blue'
  else:
    color = 'red'

  plt.xlabel("{} {:2.0f}% ({})".format(class_names[predicted_label],
                                100*np.max(predictions_array),
                                class_names[true_label]),
                                color=color)

def plot_value_array(i, predictions_array, true_label):
  predictions_array, true_label = predictions_array, true_label[i]
  plt.grid(False)
  plt.xticks(range(10))
  plt.yticks([])
  thisplot = plt.bar(range(10), predictions_array, color="#777777")
  plt.ylim([0, 1])
  predicted_label = np.argmax(predictions_array)

  thisplot[predicted_label].set_color('red')
  thisplot[true_label].set_color('blue')

### Проверка предсказаний

Matplotlib нам дает возможность посмотреть наше предсказание графически:

In [None]:
i = 0
plt.figure(figsize=(6,3))
plt.subplot(1,2,1)
plot_image(i, predictions[i], test_labels, test_images)
plt.subplot(1,2,2)
plot_value_array(i, predictions[i],  test_labels)
plt.show()

In [None]:
i = 12
plt.figure(figsize=(6,3))
plt.subplot(1,2,1)
plot_image(i, predictions[i], test_labels, test_images)
plt.subplot(1,2,2)
plot_value_array(i, predictions[i],  test_labels)
plt.show()

Давайте сделаем еще несколько предсказаний - 

In [None]:

num_rows = 5
num_cols = 3
num_images = num_rows*num_cols
plt.figure(figsize=(2*2*num_cols, 2*num_rows))
for i in range(num_images):
  plt.subplot(num_rows, 2*num_cols, 2*i+1)
  plot_image(i, predictions[i], test_labels, test_images)
  plt.subplot(num_rows, 2*num_cols, 2*i+2)
  plot_value_array(i, predictions[i], test_labels)
plt.tight_layout()
plt.show()

## Использование полученной модели

Давайте возьмем одно изображение из тестовой выборке и посмотрим предсказание нейронной сети - 

In [None]:

img1 = test_images[1]

print(img1.shape)

In [None]:
# Add the image to a batch where it's the only member.
img = (np.expand_dims(img1,0))

print(img.shape)

In [None]:
predictions_single = probability_model.predict(img)

print(predictions_single)

In [None]:
plot_value_array(1, predictions_single[0], test_labels)
_ = plt.xticks(range(10), class_names, rotation=45)

`keras.Model.predict` возвращает список списков — по одному списку для каждого предсказания в батче. Нам нужны предсказания только для одного изображения:

In [None]:
np.argmax(predictions_single[0])

Нейросеть при хорошо подобранных параметрах должна была выдать корректное предсказание

In [None]:
model1 = keras.Sequential([
    keras.layers.Flatten(input_shape=(28, 28)),
    keras.layers.Dense(128, activation='relu'),
    keras.layers.Dense(10)
])

model2 = keras.Sequential([
    keras.layers.Flatten(input_shape=(28, 28)),
    keras.layers.Dense(256, activation='relu'),
    keras.layers.Dense(10)
])

model3 = keras.Sequential([
    keras.layers.Flatten(input_shape=(28, 28)),
    keras.layers.Dense(256, activation='relu'),
    keras.layers.Dense(10)
])

model1.compile(optimizer='adam',
              loss=tf.keras.losses.SparseCategoricalCrossentropy(from_logits=True),
              metrics=['accuracy'])
model2.compile(optimizer='adam',
              loss=tf.keras.losses.SparseCategoricalCrossentropy(from_logits=True),
              metrics=['accuracy'])
model3.compile(optimizer='adam',
              loss=tf.keras.losses.SparseCategoricalCrossentropy(from_logits=True),
              metrics=['accuracy'])

hist1=model1.fit(train_images, train_labels, epochs=30)
hist2=model2.fit(train_images, train_labels, epochs=30)
hist3=model3.fit(train_images, train_labels, epochs=30)



In [None]:
plt.plot(hist1.history['accuracy'],label='model1 acc')
plt.plot(hist2.history['accuracy'],label='model2 acc')
plt.plot(hist3.history['accuracy'],label ='model3 acc')
plt.legend()
plt.show()

In [None]:
# Save the model to disk.
model1.save_weights('model1.h5')
model2.save_weights('model2.h5')
model3.save_weights('model3.h5')
# Load the model from disk later using:
# model.load_weights('model.h5')

In [None]:
input1 = keras.layers.Input(shape=(28, 28))
x1= keras.layers.Flatten()(input1)
x1 = keras.layers.Dense(128, activation='relu')(x1)
x1 =keras.layers.Dense(10)(x1)

model11 =keras.models.Model(inputs=input1,outputs=x1)


x2= keras.layers.Flatten()(input1)
x2 = keras.layers.Dense(256, activation='relu')(x2)
x2=keras.layers.Dense(10)(x2)

model22 =keras.models.Model(inputs=input1,outputs=x2)

x3= keras.layers.Flatten()(input1)
x3 = keras.layers.Dense(256, activation='relu')(x3)
x3=keras.layers.Dense(10)(x3)


model33 =keras.models.Model(inputs=input1,outputs=x3)
model11.load_weights('model1.h5')
model22.load_weights('model2.h5')
model33.load_weights('model3.h5')

out_all = keras.layers.Average()([model11.output,model22.output,model33.output])
out_all = keras.layers.Softmax()(out_all)
model_all=keras.models.Model(inputs =[input1],outputs =out_all)

In [None]:
model_all.summary()

In [None]:
model_all.compile(optimizer='adam',
              loss=tf.keras.losses.SparseCategoricalCrossentropy(from_logits=True),
              metrics=['accuracy'])

In [None]:
predictions_single=model_all.predict(img)

print(predictions_single)

In [None]:
plot_value_array(1, predictions_single[0], test_labels)
_ = plt.xticks(range(10), class_names, rotation=45)

In [None]:
test_loss, test_acc = model_all.evaluate(test_images,  test_labels, verbose=2)

In [None]:
from tensorflow.keras.utils import plot_model

In [None]:
plot_model(model_all,to_file='new_model-all.png')

## стек сетей

In [None]:
from sklearn.metrics import confusion_matrix 

In [None]:
# стек сетей#
y_pred = model_all.predict(test_images)

y_pred_arg = np.argmax(y_pred, axis=1)




In [None]:
test_labels[0]

In [None]:
y_pred_arg.shape

In [None]:
y_pred_arg[0]

In [None]:
confusion_matrix(test_labels,  y_pred_arg)

Слои для объединения

In [None]:
first_input = keras.layers.Input(shape=(28,28 ))
x11= keras.layers.Flatten()(first_input)
first_dense = keras.layers.Dense(1, )(x11)

second_input = keras.layers.Input(shape=(28,28 ))
x22= keras.layers.Flatten()(second_input)
second_dense = keras.layers.Dense(1, )(x22)

merge_one = keras.layers.concatenate([first_dense, second_dense])

third_input = keras.layers.Input(shape=(28,28 ))
x33= keras.layers.Flatten()(third_input)
merge_two = keras.layers.concatenate([merge_one, x33])
merge_two=keras.layers.Dense(10)(merge_two)
merge_two = keras.layers.Softmax()(merge_two)

model_stek = keras.models.Model(inputs=[first_input, second_input, third_input], outputs=merge_two)
ada_grad = keras.optimizers.Adagrad(lr=0.1, epsilon=1e-08, decay=0.0)
model_stek .compile(optimizer=ada_grad, loss=tf.keras.losses.SparseCategoricalCrossentropy(from_logits=True),
              metrics=['accuracy'])

In [None]:
plot_model(model_stek ,to_file='new_model_stek .png')

In [None]:
# merge samples, two input must be same shape
inp1 =  keras.layers.Input(shape=(10,32))
inp2 =  keras.layers.Input(shape=(10,32))
cc1 =  keras.layers.concatenate([inp1, inp2],axis=0) # Merge data must same row column
output =  keras.layers.Dense(30, activation='relu')(cc1)
model_3 =  keras.models.Model(inputs=[inp1, inp2], outputs=output)
model_3.summary()



In [None]:
# merge row must same column size
inp1 =  keras.layers.Input(shape=(20,10))
inp2 =  keras.layers.Input(shape=(32,10))
cc1 =  keras.layers.concatenate([inp1, inp2],axis=1)
output =  keras.layers.Dense(30, activation='relu')(cc1)
model_4 =  keras.models.Model(inputs=[inp1, inp2], outputs=output)
model_4.summary()



In [None]:
# merge column must same row size
inp1 =  keras.layers.Input(shape=(10,20))
inp2 =  keras.layers.Input(shape=(10,32))
cc1 =  keras.layers.concatenate([inp1, inp2],axis=2)
output =  keras.layers.Dense(30, activation='relu')(cc1)
model_5 =  keras.models.Model(inputs=[inp1, inp2], outputs=output)
model.summary()

In [None]:
inp1 =  keras.layers.Input(shape=(10,32))
inp2 =  keras.layers.Input(shape=(10,32))
cc1 =  keras.layers.Add()([inp1, inp2]) # Merge data must same row column
output =  keras.layers.Dense(30, activation='relu')(cc1)
model_31 =  keras.models.Model(inputs=[inp1, inp2], outputs=output)
model_31.summary()


In [None]:
inp1 =  keras.layers.Input(shape=(10,32))
inp2 =  keras.layers.Input(shape=(10,32))
cc1 =  keras.layers.Multiply()([inp1, inp2]) # Merge data must same row column
output =  keras.layers.Dense(30, activation='relu')(cc1)
model_32 =  keras.models.Model(inputs=[inp1, inp2], outputs=output)
model_32.summary()


In [None]:
inp1 =  keras.layers.Input(shape=(10,32))
inp2 =  keras.layers.Input(shape=(10,32))
cc1 =  keras.layers.Subtract()([inp1, inp2]) # Merge data must same row column
output =  keras.layers.Dense(30, activation='relu')(cc1)
model_3 =  keras.models.Model(inputs=[inp1, inp2], outputs=output)
model_3.summary()


In [None]:
def myFunc(C):
  
  return C[0]*C[1]

In [None]:

inp1 =  keras.layers.Input(shape=(10,32))
inp2 =  keras.layers.Input(shape=(10,32))
cc1 =  keras.layers.Subtract()([inp1, inp2]) 
cross2 = keras.layers.Lambda(myFunc)([cc1,cc1])
output =  keras.layers.Dense(30, activation='relu')(cross2)
model_35 =  keras.models.Model(inputs=[inp1, inp2], outputs=output)
model_35.summary()

## Практическое задание

<ol>
    <li>Попробуйте обучить нейронную сеть на TensorFlow 2 на любом датасете imdb_reviews. 
        Опишите в комментарии к уроку - какой результата вы добились от нейросети? Что помогло вам улучшить ее точность?<br><br>
    </li>
    <li>*2. Поработайте с документацией TensorFlow 2. Найдите полезные команды не разобранные на уроке.</li>
    
    
</ol>

## Дополнительные материалы

<ol>
    <li>www.tensorflow.org/api_docs</li>
</ol>

## Используемая литература 

Для подготовки данного методического пособия были использованы следующие ресурсы:
<ol>
    <li>https://www.tensorflow.org/</li>
    <li>https://www.tensorflow.org/tutorials/keras/classification</li>
    <li>Singh P., Manure A. - Learn TensorFlow 2.0 - 2020</li>
    <li>Шакла Н. — Машинное обучение и TensorFlow 2019</li>
    <li>Википедия</li>
    
</ol>