# Введение в искусственные нейронные сети
# Урок 4. TensorFlow

## Содержание методического пособия:


<ol>
<li>Что такое TensorFlow</li>
<li>Основы синтаксиса TensorFlow</li>
<li>Пример нейросети на TensorFlow</li>
</ol>

## Что такое TensorFlow

TensorFlow - это фреймворк для создания ML моделей. TensorFlow предназначен в первую очередь для Deep Learning, т.е. создания современных нейросетей. Однако в TensorFlow также есть поддержка некоторых классических ML алгоритмов: K-means clustering, Random Forests, Support Vector Machines, Gaussian Mixture Model clustering, Linear/logistic regression.

TensorFlow выпустила компания Google в 2015. TensorFlow - это opensource проект. На данный момент это один из основных инструментов для создания нейросетей в рабочих целях. TensorFlow позволяет создавать нейронные сети как для кластеров из большого количества вычислительных устройств, так и для устройств с относительно небольшой вычислитей мощностью, таких как смартфоны и одноплатные компьютеры.

TensorFlow применяется самой компанией Google для ее поиска, почты, переводчика, распознования голоса, внутренних нужд наподобие мониторинга оборудования. TensorFlow используется различными компаниями для различных проектов связанных с компьютерным зрением, решением задач ранжирования и т.д.



## Основы синтаксиса TensorFlow

Процесс создания нейросети на TensorFlow схож с разобранным нами процессом обучения нейросети на Keras. Отличее здесь в том, что здесь нам нужно прописать больше деталей в коде. 

Название TensorFlow означает поток тензоров. Тензоры - это массивы. Данные в компьютере предствлены часто в виде массивах и работа с этими массивами подразумевает их преобразования. Преобразования осуществляются через, к примеру, математические операции. Работа TensorFlow складывается из цепочки преобразований тензоров, т.е. данных. Сами операции осуществляющие преобразование данных представлены в TensorFlow в виде графов. Особенностью TensorFlow версии 1 является то, что сначала необходимо декларировать переменные и вычисления, которые будут совершенны над ними, а потом уже непосредственно запускать работу над данными. Связано это с тем, что TensorFlow таким образом может сделать предварительные оптимизации для работы. Взглянем на пример создания вычислительного графа и его запуска через запуск сессии:
```python
    import tensorflow as tf

    a = 10
    b = 5 
    c = tf.add(a, b, name='Sustruct') # декларирование графа

    with tf.Session() as sess:
        print(sess.run(c)) # запуск сессии
```

Для упрощения протипирования нюансы связанные с созданием сессии опускаются в случае использования TensorFlow в режиме Eager Execution. Также сложности работы с сессиями ликвидированы в TensorFlow 2.0. Однако TensorFlow 2.0 вышла совсем недавно, 1 октября 2019 года, поэтому в данном методическом пособии мы рассматриваем синтаксис TensorFlow 1.x.
<br>

  Теперь, давайте также как и в прошлом уроке разберем синтаксис TensorFlow позволяющий создать нейросеть, начиная от получения данных и заканчивания получением предсказания нейросети на новых данных.

Процесс получения данных для обучения на TensorFlow, а также создания переменных для параметров нейросети аналогичны Keras. 
<br><br>
**Переменные**

Для пустых переменных нам понадобиться такая сущность TensorFlow как placeholder. Пример:
```python
    import tensorflow as tf

    x = tf.placeholder("float", None)
    y = x * 2
```

Placeholder'ы можно использовать для резирвирования памяти для входных данных нейросети.
<br>
Для инициализации переменных, которые будут хранить состояние нейросети нам понадобяться специальная команда TensorFlow - 

```python
    b = tf.Variable([.5],dtype=tf.float32)
```

<br>

**Слои**

Для создания слоя на TensorFlow нам понадобиться комбинация следующих команд - 

```python
    l1 = tf.add(tf.matmul(x, W['h1']), b['1'])
```    
    
Команды add и matmul позволяют складывать и умножать соотвественно, что позволяет реализовать формулу - Y = X * W(weight) + B(bias)

Для активации нейронов выходного слоя можно использовать следующую команду - 

```python
     pred = tf.nn.softmax(data)
    
```
Функция активации softmax, хороша в случаях когда выход нейрона нужно преобразовать либо в 1 либо в 0.
<br><br>
**Loss функция и Optimizer**

Для того, чтобы выбрать loss функцию можно использовать следующую команду
```python
    loss_op = tf.reduce_mean(tf.nn.softmax_cross_entropy_with_logits(
                             logits=logits, labels=Y))
```                          

logits - это значения, которые используются как input для softmax

cross entropy function - это функция, которая позволяет сравнить результаты выходного нейрона с лейблами. Например: на выходе нейрона выходного слоя мы должны получить либо 0 либо 1. Но в реальности мы будем получать значения вроде 0.9 или 0.1. Данная функция позволяет превести в соответсвие эти данные.
<br>
Для того, чтобы выбрать optimizer мы можем воспользоваться следующей функцией -

```python

    optimizer = tf.train.AdamOptimizer(learning_rate=0.3)

    train_op = optimizer.minimize(loss_op) 
```

Стоит напомнить, что optimizer позволяет находить минимальное значение функции и является частью нахождения нужных весов в процессе тренировки нейронной сети. Optimizer Adam это продвинутая версия классического алгоритма градиентного спуска. Adam самый быстрый алгоритм для нахождения минимального значения функции поэтому используется обычно он. 

learning rate позволяет определить размер шага итерации при нахождении минимума
minimize - запускает optimizer и принимает в качестве параметра функцию, которую нужно оптимизировать.

***Оценка работы модели***

Оценку работы нейросети можно осуществить следующей строчкой кода -

```python
    correct_pred = tf.equal(tf.argmax(prediction, 1), tf.argmax(Y, 1))
```

argmax - возвращает самое большое значение tensor

equal - сравнение векторов, позволяет сравнить предсказание нейросети и правильные ответы

accuracy = tf.reduce_mean(tf.cast(correct_pred, tf.float32))

reduce_mean позволяет вычислить средние значения в тензоре

cast позволяет конверитировать один тип в другой

***Запуск обучения нейронной сети***

Перед запуском обучение в TensorFlow требуется присвоить значения переменным, которые были задекларированы. Осущевляется это следующей командой - 

```python

    init = tf.global_variables_initializer()
```

За запуск самой сессии вместе с вышеприведенным инициализатором отвечают следующее строчки кода - 

```python
    with tf.Session() as sess:
    
        sess.run(init)
```
        
Получение порций данных для каждой итерации обучения, в качетсве аргумента количество экзмепляров данных для обучения -

```python
     mnist.train.next_batch(10)
```
     
Запуск оптимайзера на данных -  
```python
     sess.run(train_op, feed_dict={X: batch_x, Y: batch_y})
```
     
Вычисление ошибки в предсказнии и проверка точности - 
```python
     loss, acc = sess.run([loss_op, accuracy], feed_dict={X: batch_x,
                                                                 Y: batch_y}) 
```    
    
Тестирование точности нейросети - 
```python
     sess.run(accuracy, feed_dict={X: mnist.test.images,
                                      Y: mnist.test.labels}))
```

Мы рассмотрели основные команды TensorFlow, которые могут понадобиться для обучения нейросети на нем. Полный список команд и возможностей TensorFlow отражает его документация - https://www.tensorflow.org/tutorials.

## Пример нейросети на TensorFlow

Давайте попрубуем сделать нейросеть на Keras использую полученные выше знания. Попробуем обучить нейросеть различать рукописные цифры.

In [1]:
from __future__ import print_function

# получение датасета mnist
from tensorflow.examples.tutorials.mnist import input_data
mnist = input_data.read_data_sets("/tmp/data/", one_hot=True)

import tensorflow as tf

# параметры обучения нейросети
learning_rate = 0.1
num_steps = 500
batch_size = 128
display_step = 100

# конфигурация нейросети
n_hidden_1 = 256 # кол-во нейронов в первом слое
n_hidden_2 = 256 # кол-во нейронов во втором слое
num_input = 784 # MNIST датасет (размер изображения: 28*28)
num_classes = 10 # MNIST количество классов (0-9 цифр)

# входная часть графа
X = tf.placeholder("float", [None, num_input])
Y = tf.placeholder("float", [None, num_classes])

# определение весов и отклонений(bias)
weights = {
    'h1': tf.Variable(tf.random_normal([num_input, n_hidden_1])),
    'h2': tf.Variable(tf.random_normal([n_hidden_1, n_hidden_2])),
    'out': tf.Variable(tf.random_normal([n_hidden_2, num_classes]))
}
biases = {
    'b1': tf.Variable(tf.random_normal([n_hidden_1])),
    'b2': tf.Variable(tf.random_normal([n_hidden_2])),
    'out': tf.Variable(tf.random_normal([num_classes]))
}

# создание модели
def neural_net(x):
    # первый внутренний полносвязный слой состоящий из 256 нейронов
    layer_1 = tf.add(tf.matmul(x, weights['h1']), biases['b1'])
    # второй внутренний полносвязный слой состоящий из 256 нейронов
    layer_2 = tf.add(tf.matmul(layer_1, weights['h2']), biases['b2'])
    # Output fully connected layer with a neuron for each class
    # выход полносвязного слоя с нейроном на каждый класс
    out_layer = tf.matmul(layer_2, weights['out']) + biases['out']
    return out_layer

# конструирование модели
logits = neural_net(X)
prediction = tf.nn.softmax(logits)

# выбор loss функции и optimizer
loss_op = tf.reduce_mean(tf.nn.softmax_cross_entropy_with_logits(
    logits=logits, labels=Y))
optimizer = tf.train.AdamOptimizer(learning_rate=learning_rate)
train_op = optimizer.minimize(loss_op)

# оценка работы модели
correct_pred = tf.equal(tf.argmax(prediction, 1), tf.argmax(Y, 1))
accuracy = tf.reduce_mean(tf.cast(correct_pred, tf.float32))

# инициализация переменных(назначение им значений по умолчанию)
init = tf.global_variables_initializer()

# старт процесса тренировки нейронной сети
with tf.Session() as sess:

    # запуск инициализатора
    sess.run(init)
    print('')
    for step in range(1, num_steps+1):
        batch_x, batch_y = mnist.train.next_batch(batch_size)
        # запуск оптимизации весов (backpropagation)
        sess.run(train_op, feed_dict={X: batch_x, Y: batch_y})
        if step % display_step == 0 or step == 1:
            # вычисление батч ошибки и точности
            loss, acc = sess.run([loss_op, accuracy], feed_dict={X: batch_x,
                                                                 Y: batch_y})
            print("Step " + str(step) + ", минибатч loss= " + \
                  "{:.4f}".format(loss) + ", тренировочная точность = " + \
                  "{:.3f}".format(acc))

    print("Оптимизация завершена")

    # вычисление точности на изображениях датасета MNIST
    print("Тестовая точность:", \
        sess.run(accuracy, feed_dict={X: mnist.test.images,
                                      Y: mnist.test.labels}))

ModuleNotFoundError: No module named 'tensorflow.examples'

## Практическое задание

<ol>
    <li>Попробуйте обучить нейронную сеть на TensorFlow на любом другом датасете. 
        Опишите в комментарии к уроку - какой результата вы добились от нейросети? Что помогло вам улучшить ее точность?<br><br>
        Примечание: Пользоваться модулем Keras в TensorFlow запрещено в этом практическом задании.
    </li>
</ol>

## Дополнительные материалы

<ol>
    <li>https://www.tensorflow.org/versions/r1.15/api_docs/python/tf</li>
</ol>

## Используемая литература 

Для подготовки данного методического пособия были использованы следующие ресурсы:
<ol>
    <li>https://www.tensorflow.org/</li>
    <li>Шакла Н. — Машинное обучение и TensorFlow 2019</li>
    <li>Википедия</li>
    
</ol>