# Что такое TensorFlow и где его используют?

**TensorFlow - это библиотека машинного обучения, позволяющая обучать приозвольные модели глубокого обучения**: 
свёрточные нейронные сети, рекуррентные нейронные сети и прочие модели (вообще говоря, любые модели глубокого обучения). 
Однако **TensorFlow не ограничен только обучением нейронных сетей и может быть использован для решения любых математических 
задач**, где полезно утилизировать мощности GPU или же есть необходимость в автоматическом дифференцировании (вычисление 
производной).

**TensorFlow имеет очень широкое сообщество.** Для TensorFlow уже написано туториалов, большое множество ML проектов используют именно TensorFlow, собраны целые библиотеки предобученных моделей. 

**TensorFlow отлично подходит как для научной деятельности, так и для бизнеса.** TensorFlow имеет целую экосистему инструментов:
- [TensorFlow Lite](https://www.tensorflow.org/lite) - полезен при разработке и оптимизации моделей, что будут запускаться на мобильных девайсах.
- [TensorFlow.js](https://www.tensorflow.org/js) - разработка моделей, запускаемых прямо в браузере.
- [TensorFlow Extended](https://www.tensorflow.org/tfx) - набор инструментов для деплоинга моделей в виде бизнес решений.
- [TensorFlow Hub](https://www.tensorflow.org/hub) - библиотека предобученных моделей (детекторы объектов, классификаторы и т.д.).

Дабы не пугать новоприбывших, все вышеозвученные вещи знать необязательно. Чтобы эффективно использовать TensorFlow, достаточно лишь уметь пользоваться исходной библиотекой, это покроет 99% случаев. Остальное - вишенка на торте, упрощающая жизнь в сложных проектах.

# Установка TensorFlow

**Готовый Docker образ:**
```
docker pull tensorflow/tensorflow:latest-gpu-jupyter
docker run --rm -it --gpus all -p 8888:8888 tensorflow/tensorflow:latest-gpu-jupyter
```
Для корректного запуска данного контейнера на Windows необходима установка [NVIDIA Container Toolkit](https://github.com/NVIDIA/nvidia-docker).

**Установка через pip:**

TensorFlow 2.x требует Python версии 3.7 и выше.
```
pip install --upgrade pip
pip install tensorflow
```


Официальная инструкция: 
https://www.tensorflow.org/install

Дабы начать работу с TensorFlow прямо сейчас, можно воспользоваться Google Colab (он имеет предустановленный TF): 
https://colab.research.google.com/notebooks/welcome.ipynb

In [1]:
import tensorflow as tf
import numpy as np
tf.__version__

'2.8.0'

In [2]:
tf.config.list_physical_devices()

[PhysicalDevice(name='/physical_device:CPU:0', device_type='CPU'),
 PhysicalDevice(name='/physical_device:GPU:0', device_type='GPU')]

## 1. Основы работы с тензорами

### 1.1 Создание tf.Tensor

Подобно тензорам (np.ndarray) в Numpy, TensorFlow имеет собственные тензоры tf.Tensor для манипуляции над численными данными. Их можно создать целым рядом функций:
- [tf.zeros](https://www.tensorflow.org/api_docs/python/tf/zeros)
- [tf.ones](https://www.tensorflow.org/api_docs/python/tf/ones)
- [tf.range](https://www.tensorflow.org/api_docs/python/tf/range)
- [tf.linspace](https://www.tensorflow.org/api_docs/python/tf/linspace)
- [tf.eye](https://www.tensorflow.org/api_docs/python/tf/eye)
- [tf.random.normal](https://www.tensorflow.org/api_docs/python/tf/random/normal)
- [tf.random.uniform](https://www.tensorflow.org/api_docs/python/tf/random/uniform)
- [tf.random.poisson](https://www.tensorflow.org/api_docs/python/tf/random/poisson)

Возможно некоторые функции звучат знакомо, поскольку все они доступны также и в Numpy. 

Чтобы конвертировать существующий np.ndarray в tf.Tensor используется функция [tf.convert_to_tensor](https://www.tensorflow.org/api_docs/python/tf/convert_to_tensor)

In [None]:
x_np = np.random.normal(size=(3, 3)).astype('float32')
x_tf = tf.convert_to_tensor(x_np)

In [None]:
x_np

In [None]:
x_tf

In [None]:
type(x_np), type(x_tf), x_np.dtype, x_tf.dtype

In [None]:
# Можно получить значение tf.Tensor в виде np.ndarray
x_tf.numpy()

In [None]:
type(x_tf.numpy())

### 1.2 Арифметика tf.Tensor

Во много tf.Tensor аналогичен np.ndarray: 
- над ним можно производить все базовые арифметические операции;
- индексация и слайсинг;
- broadcasting; 
- манипуляция размерностью, а также конкатенация, транспонирование, решейп и т.д.

Если вы уже знакомы с Numpy, вы можете пропустить эту секцию.

In [None]:
# Умножение на константу

In [None]:
x_tf * 3

In [None]:
# Прибавление константы

In [None]:
x_tf + 3

In [None]:
# Сложение с тензором

In [None]:
x_tf + x_tf

In [None]:
# Умножение на тензор

In [None]:
x_tf * x_tf

TensorFlow позволяет "перемешивать" разные тензоры (np.ndarray, list) в арифметических операциях
при условии совместимости типов данных и размерностей тензоров.

In [None]:
# Сложение с np.ndarray
x_tf + x_np

In [None]:
# Сложение с list
x_tf + [[ 1.3889265, -4.353553 ,  3.0287025],
       [-0.5747313,  3.4388134,  2.3083975],
       [ 1.8629724,  1.3481708, -1.8846952]]

### 1.3 Индексация tf.Tensor

tf.Tensor можно индексировать аналогично тому, как это можно делать с тензорами в Numpy.

In [None]:
# Простая индексация
x_tf[0]

In [None]:
x_tf[0, 0]

In [None]:
# Взятие последнего элемента в первой строчке матрицы
x_tf[0, -1]

In [None]:
# Слайсинг
x_tf[1:2]

In [None]:
x_tf[1:]

In [None]:
x_tf[:, 1:]

### 1.4 Broadcasting

Broadcasting позволяет производить арифметические операции над тензорами разных размерностей. В TensorFlow broadcasting работает подобно broadcasting в Numpy.

In [None]:
print(x_tf)

In [None]:
x2_tf = tf.random.normal(dtype='float32', shape=(3,))
print(x2_tf)

In [None]:
# Прибавление значений 3-мерного вектора к колонкам матрицы
x_tf + tf.reshape(x2_tf, [3, 1])

In [None]:
# Прибавление значений 3-мерного вектора к строкам матрицы
x_tf + tf.reshape(x2_tf, [1, 3])

Broadcasting является очень мощным, но в то же время непростым инструментом при первом использовании. 
Больше о broadcasting можно почитать в [мануале Numpy](https://numpy.org/doc/stable/user/basics.broadcasting.html).

### 1.5 Манипуляция размерностью, конкатенация тензоров и т.д.

Для манипуляции размерностью тензоров в TensorFlow имеются следующие функции:
- [tf.reshape](https://www.tensorflow.org/api_docs/python/tf/reshape)
- [tf.transpose](https://www.tensorflow.org/api_docs/python/tf/transpose)
- [tf.expand_dims](https://www.tensorflow.org/api_docs/python/tf/expand_dims)
- [tf.squeeze](https://www.tensorflow.org/api_docs/python/tf/squeeze)

Выше перечисленные функции, опять-таки, могут показаться знакомыми, поскольку все они присутствуют также и в Numpy.

Функции по манипуляции над несколькими тензорами:
- [tf.concat](https://www.tensorflow.org/api_docs/python/tf/concat) - аналог np.concatenate
- [tf.stack](https://www.tensorflow.org/api_docs/python/tf/stack)
- [tf.split](https://www.tensorflow.org/api_docs/python/tf/split)

За редким исключением названия функций в TensorFlow отличаются от их аналогов в Numpy (np.concatenate -> tf.concat).

In [None]:
tf.reshape(x_tf, 9)

In [None]:
tf.reshape(x_tf, -1)

In [None]:
tf.reshape(x_tf, [1, 1, 9])

In [None]:
# Изменение порядка осей
tf.transpose(x_tf, [1, 0])

In [None]:
tf.concat([x_tf, x_tf], axis=0)

In [None]:
tf.concat([x_tf, x_tf], axis=1)

# 2. Математика в TensorFlow

TensorFlow в своей сути является математическим движком, соответственно и математических инструментов в нём более чем достаточно.
В данном отношении API TensorFlow во многом следует Numpy:
- из корневого пакеты доступны функции "первой необходимости":
    - унарные функции (`tf.sin`, `tf.exp`, `tf.sqrt` и тд);
    - операции редукции (`tf.reduce_sum`, `tf.reduce_mean`; они являются аналогами `np.sum` и `np.mean` соответственно)
    - матричное умножение `tf.matmul`

In [None]:
tf.exp(x_tf)

In [None]:
tf.reduce_sum(x_tf, axis=1)

In [None]:
tf.matmul(x_tf, x_tf)

Более продвинутые функции можно найти в соответствующих пакета:
- [tf.linalg](https://www.tensorflow.org/api_docs/python/tf/linalg) - пакет линейной алгебры;
- [tf.math](https://www.tensorflow.org/api_docs/python/tf/math) - пакет с базовыми (логарифм, тригонометрия), булевыми и специальными мат. функциями;
- [tf.signal](https://www.tensorflow.org/api_docs/python/tf/signal) - пакет с инструментами обработки сигналов (преобразование Фурье).

In [None]:
# Вычисление обратной матрицы
tf.linalg.inv(x_tf)

In [None]:
tf.math.reduce_std(x_tf, axis=1)

In [None]:
# Говоря о статистике, по историческим причинам чаще используют такой вариант
mean, var = tf.nn.moments(x_tf, axes=1)
mean, var

# 3. Автоматическое дифференцирование в TensorFlow

TensorFlow может автоматически дифференцировать выражения, эффективно вычисляя градиенты. 
Однако работает это непохоже на Matlab, поскольку приспособлено в основном для приложений глубого обучения.

Градиенты (производные) в TensorFlow считаются посредством [Reverse-Mode Differentiation](https://en.wikipedia.org/wiki/Automatic_differentiation).
Описывая в двух словах, данный подход к дифференцированию выражений использует 
[цепное правило дифференцирования сложной функции](https://ru.wikipedia.org/wiki/%D0%94%D0%B8%D1%84%D1%84%D0%B5%D1%80%D0%B5%D0%BD%D1%86%D0%B8%D1%80%D0%BE%D0%B2%D0%B0%D0%BD%D0%B8%D0%B5_%D1%81%D0%BB%D0%BE%D0%B6%D0%BD%D0%BE%D0%B9_%D1%84%D1%83%D0%BD%D0%BA%D1%86%D0%B8%D0%B8)
(chain rule), в котором целевая производная вычисляется как произведение производных
промежуточных выражений.

Однако понимать математику процесса не нужно, чтобы использовать функции TensorFlow. Всё, что нужно знать: для произвольной скалярной функции f(x) Tensorflow позволяет вычесть градиент df(x)/dx.

In [None]:
# Пример вычисления производной функции y = x^2

def f(x):
    return x ** 2

x = tf.Variable(3.0)
x2 = tf.Variable(3.0, trainable=False)

# Посчитаем градиент для "обучаемой переменной"
with tf.GradientTape() as tape:
    y = f(x)
    grad = tape.gradient(y, x)

print("Градиент обучаемой переменной:", grad)

# Посчитаем градиент для "необучаемой переменной"
with tf.GradientTape() as tape:
    y = f(x2)
    grad = tape.gradient(y, x2)

print("Градиент необучаемой переменной:", grad)

Выше можно увидеть два нововведения: **tf.Variable** (переменная) и **tf.GradientTape**.

tf.Variable по сути является тензором, значение которого можно модифицировать 
(как обычный np.ndarray). Именно переменные используется для хранения весов нейронной сети.

tf.GradientTape является контекстным менеджером, внутри контекста которого TensorFlow "записывает" все вычисления на ленту (tape), 
а далее использует записанную информацию для вычисления производных посредством алгоритма обратного распространения.
Важно: **tf.GradientTape не может вычислять градиенты выражений, что были посчитаны вне его контекста!**

In [None]:
x = tf.constant(3.0)
y = f(x)
with tf.GradientTape() as tape:
    # y было вычислено вне контекста tape,
    # поэтому tape не может посчитать какой-либо градиент для y
    grad = tape.gradient(y, x)

print(grad)

In [None]:
# GradientTape по умолчанию не считает градиенты для обычных тензоров
x = tf.constant(3.0)

with tf.GradientTape() as tape:
    y = f(x)
    grad = tape.gradient(y, x)

print(grad)

In [None]:
# Но его можно заставить
x = tf.constant(3.0)

with tf.GradientTape() as tape:
    # Указывает tape "следить" за тензором 
    tape.watch(x)
    y = f(x)
    grad = tape.gradient(y, x)

print(grad)

Более сложный пример: вычисление градиента весов логистической регрессии

In [None]:
N_INPUT_FEATURES = 128
N_CLASSES = 10

# Веса логистической регресии
w = tf.Variable(tf.random.normal((N_INPUT_FEATURES, N_CLASSES)))
b = tf.Variable(tf.zeros((N_CLASSES)))


def logistic_regression(x, w, b):
    x = tf.matmul(x, w) + b[None, :]  # аналогично tf.expand_dims(b, axis=0)
    return tf.nn.softmax(x)


def loss(out, i):
    # out - выходное значение логистической регрессии
    # i - номер класса, которому принадлежит экземпляр
    l = tf.math.log(out)[:, i]
    return -tf.reduce_mean(l)


x = tf.random.normal((1, N_INPUT_FEATURES))  # условный экземпляр данных из датасета
# x.shape - [batch_size, n_features]
i = 8  # номер класса, которому принадлежит экземпляр

with tf.GradientTape() as tape:
    out = logistic_regression(x, w, b)
    print('Out:', out.numpy())
    loss_val = loss(out, i)
    print('Loss before gradient update:', loss_val.numpy())
    # grads = [grad_w, grad_b]
    grads = tape.gradient(loss_val, [w, b])

print('Grad W:', grads[0].numpy())
print('Grad b:', grads[1].numpy())

# Модифицируем значение весов и посчитает значение функции ошибки

w.assign_sub(grads[0] * 0.1)
b.assign_sub(grads[1] * 0.1)

y = logistic_regression(x, w, b)
l = loss(y, i)

# Обратите внимание, что значение ошибки уменьшилось. Именно так и работает машинное обучение
print('Loss after gradient update:', l.numpy())

Больше информации об автоматическом дифференцировании можно найти на [официальном сайте TensorFlow](https://www.tensorflow.org/guide/autodiff).