# Что такое TensorFlow и где его используют?

**TensorFlow - это библиотека машинного обучения, позволяющая обучать приозвольные модели глубокого обучения**: 
свёрточные нейронные сети, рекуррентные нейронные сети и прочие модели (вообще говоря, любые модели глубокого обучения). 
Однако **TensorFlow не ограничен только обучением нейронных сетей и может быть использован для решения любых математических 
задач**, где полезно утилизировать мощности GPU или же есть необходимость в автоматическом дифференцировании (вычисление 
производной).

**TensorFlow имеет очень широкое сообщество.** Для TensorFlow существует большое множество туториалов, собраны целые библиотеки
предобученных моделей. 

**TensorFlow отлично подходит как для научной деятельности, так и для бизнеса.** TensorFlow имеет целую экосистему инструментов:
- TensorFlow Lite - полезен при разработке и оптимизации моделей, что будут запускаться на мобильных девайсах.
- TensorFlow.js - разработка моделей, запускаемых прямо в браузере.
- TensorFlow Extended - набор инструментов для деплоинга моделей в виде бизнес решений.
- TensorFlow Hub - библиотека предобученных моделей (детекторы объектов, классификаторы и т.д.).

Дабы не пугать новоприбывших, все вышеозвученные вещи знать необязательно. Чтобы эффективно использовать TensorFlow, достаточно лишь уметь пользоваться исходной библиотекой, это покроет 99% случаев. Остальное - вишенка на торте, упрощающая жизнь в сложных проектах.

# Установка TensorFlow

**Готовый Docker образ:**
```
docker pull tensorflow/tensorflow:latest-gpu-jupyter
docker run --rm -it --gpus all -p 8888:8888 tensorflow/tensorflow:latest-gpu-jupyter
```
Для корректного запуска данного контейнера на Windows необходима установка [NVIDIA Container Toolkit](https://github.com/NVIDIA/nvidia-docker).

**Установка через pip:**

TensorFlow 2.x требует Python версии 3.7 и выше.
```
pip install --upgrade pip
pip install tensorflow
```


Официальная инструкция: 
https://www.tensorflow.org/install

TensorFlow предустановлен в Google Colab: 
https://colab.research.google.com/notebooks/welcome.ipynb

In [1]:
import tensorflow as tf
import numpy as np
tf.__version__

'2.8.0'

In [2]:
tf.config.list_physical_devices()

[PhysicalDevice(name='/physical_device:CPU:0', device_type='CPU'),
 PhysicalDevice(name='/physical_device:GPU:0', device_type='GPU')]

## 1. Основы работы с тензорами

### 1.1 Создание tf.Tensor

Подобно тензорам (np.ndarray) в Numpy, TensorFlow имеет собственные тензоры tf.Tensor для манипуляции над численными данными. Их можно создать целым рядом функций:
- [tf.zeros](https://www.tensorflow.org/api_docs/python/tf/zeros)
- [tf.ones](https://www.tensorflow.org/api_docs/python/tf/ones)
- [tf.range](https://www.tensorflow.org/api_docs/python/tf/range)
- [tf.linspace](https://www.tensorflow.org/api_docs/python/tf/linspace)
- [tf.eye](https://www.tensorflow.org/api_docs/python/tf/eye)
- [tf.random.normal](https://www.tensorflow.org/api_docs/python/tf/random/normal)
- [tf.random.uniform](https://www.tensorflow.org/api_docs/python/tf/random/uniform)
- [tf.random.poisson](https://www.tensorflow.org/api_docs/python/tf/random/poisson)

Возможно некоторые функции звучат знакомо, поскольку все они доступны также и в Numpy. 

Чтобы конвертировать существующий np.ndarray в tf.Tensor используется функция [tf.convert_to_tensor](https://www.tensorflow.org/api_docs/python/tf/convert_to_tensor)

In [3]:
x_np = np.random.normal(size=(3, 3)).astype('float32')
x_tf = tf.convert_to_tensor(x_np)

In [4]:
x_np

array([[-0.30182257, -1.8361502 , -0.9878811 ],
       [-0.8844696 ,  0.8323417 , -0.19583394],
       [-0.31822467,  0.9908128 ,  0.9789114 ]], dtype=float32)

In [5]:
x_tf

<tf.Tensor: shape=(3, 3), dtype=float32, numpy=
array([[-0.30182257, -1.8361502 , -0.9878811 ],
       [-0.8844696 ,  0.8323417 , -0.19583394],
       [-0.31822467,  0.9908128 ,  0.9789114 ]], dtype=float32)>

In [6]:
type(x_np), type(x_tf), x_np.dtype, x_tf.dtype

(numpy.ndarray,
 tensorflow.python.framework.ops.EagerTensor,
 dtype('float32'),
 tf.float32)

### 1.2 Арифметика tf.Tensor

Во много tf.Tensor аналогичен np.ndarray: 
- над ним можно производить все базовые арифметические операции;
- индексация и слайсинг;
- broadcasting; 
- манипуляция размерностью, а также конкатенация, транспонирование, решейп и т.д.

Если вы уже знакомы с Numpy, вы можете пропустить эту секцию.

In [7]:
# Умножение на константу

In [8]:
x_tf * 3

<tf.Tensor: shape=(3, 3), dtype=float32, numpy=
array([[-0.90546775, -5.5084505 , -2.9636433 ],
       [-2.653409  ,  2.497025  , -0.5875018 ],
       [-0.954674  ,  2.9724383 ,  2.9367342 ]], dtype=float32)>

In [9]:
# Прибавление константы

In [10]:
x_tf + 3

<tf.Tensor: shape=(3, 3), dtype=float32, numpy=
array([[2.6981773, 1.1638498, 2.0121188],
       [2.1155305, 3.8323417, 2.804166 ],
       [2.6817753, 3.9908128, 3.9789114]], dtype=float32)>

In [11]:
# Сложение с тензором

In [12]:
x_tf + x_tf

<tf.Tensor: shape=(3, 3), dtype=float32, numpy=
array([[-0.60364515, -3.6723003 , -1.9757622 ],
       [-1.7689393 ,  1.6646833 , -0.39166787],
       [-0.63644934,  1.9816256 ,  1.9578228 ]], dtype=float32)>

In [13]:
# Умножение на тензор

In [14]:
x_tf * x_tf

<tf.Tensor: shape=(3, 3), dtype=float32, numpy=
array([[0.09109686, 3.3714476 , 0.9759091 ],
       [0.7822865 , 0.69279265, 0.03835093],
       [0.10126694, 0.98170996, 0.9582675 ]], dtype=float32)>

TensorFlow позволяет "перемешивать" разные тензоры (np.ndarray, list) в арифметических операциях
при условии совместимости типов данных и размерностей тензоров.

In [15]:
# Сложение с np.ndarray
x_tf + x_np

<tf.Tensor: shape=(3, 3), dtype=float32, numpy=
array([[-0.60364515, -3.6723003 , -1.9757622 ],
       [-1.7689393 ,  1.6646833 , -0.39166787],
       [-0.63644934,  1.9816256 ,  1.9578228 ]], dtype=float32)>

In [16]:
# Сложение с list
x_tf + [[ 1.3889265, -4.353553 ,  3.0287025],
       [-0.5747313,  3.4388134,  2.3083975],
       [ 1.8629724,  1.3481708, -1.8846952]]

<tf.Tensor: shape=(3, 3), dtype=float32, numpy=
array([[ 1.087104 , -6.189703 ,  2.0408213],
       [-1.4592009,  4.2711554,  2.1125636],
       [ 1.5447477,  2.3389835, -0.9057838]], dtype=float32)>

### 1.3 Индексация tf.Tensor

tf.Tensor можно индексировать аналогично тому, как это можно делать с тензорами в Numpy.

In [17]:
# Простая индексация
x_tf[0]

<tf.Tensor: shape=(3,), dtype=float32, numpy=array([-0.30182257, -1.8361502 , -0.9878811 ], dtype=float32)>

In [18]:
x_tf[0, 0]

<tf.Tensor: shape=(), dtype=float32, numpy=-0.30182257>

In [19]:
# Взятие последнего элемента в первой строчке матрицы
x_tf[0, -1]

<tf.Tensor: shape=(), dtype=float32, numpy=-0.9878811>

In [20]:
# Слайсинг
x_tf[1:2]

<tf.Tensor: shape=(1, 3), dtype=float32, numpy=array([[-0.8844696 ,  0.8323417 , -0.19583394]], dtype=float32)>

In [21]:
x_tf[1:]

<tf.Tensor: shape=(2, 3), dtype=float32, numpy=
array([[-0.8844696 ,  0.8323417 , -0.19583394],
       [-0.31822467,  0.9908128 ,  0.9789114 ]], dtype=float32)>

In [22]:
x_tf[:, 1:]

<tf.Tensor: shape=(3, 2), dtype=float32, numpy=
array([[-1.8361502 , -0.9878811 ],
       [ 0.8323417 , -0.19583394],
       [ 0.9908128 ,  0.9789114 ]], dtype=float32)>

### 1.4 Broadcasting

Broadcasting позволяет производить арифметические операции над тензорами разных размерностей. В TensorFlow broadcasting работает подобно broadcasting в Numpy.

In [23]:
print(x_tf)

tf.Tensor(
[[-0.30182257 -1.8361502  -0.9878811 ]
 [-0.8844696   0.8323417  -0.19583394]
 [-0.31822467  0.9908128   0.9789114 ]], shape=(3, 3), dtype=float32)


In [24]:
x2_tf = tf.random.normal(dtype='float32', shape=(3,))
print(x2_tf)

tf.Tensor([1.4298956 1.1610811 1.3918436], shape=(3,), dtype=float32)


In [25]:
# Прибавление значений 3-мерного вектора к колонкам матрицы
x_tf + tf.reshape(x2_tf, [3, 1])

<tf.Tensor: shape=(3, 3), dtype=float32, numpy=
array([[ 1.1280731 , -0.40625453,  0.44201452],
       [ 0.27661145,  1.9934227 ,  0.96524715],
       [ 1.0736189 ,  2.3826563 ,  2.370755  ]], dtype=float32)>

In [26]:
# Прибавление значений 3-мерного вектора к строкам матрицы
x_tf + tf.reshape(x2_tf, [1, 3])

<tf.Tensor: shape=(3, 3), dtype=float32, numpy=
array([[ 1.1280731 , -0.6750691 ,  0.40396243],
       [ 0.545426  ,  1.9934227 ,  1.1960096 ],
       [ 1.111671  ,  2.1518939 ,  2.370755  ]], dtype=float32)>

Broadcasting является очень мощным, но в то же время непростым инструментом при первом использовании. 
Больше о broadcasting можно почитать в [мануале Numpy](https://numpy.org/doc/stable/user/basics.broadcasting.html).

### 1.5 Манипуляция размерностью, конкатенация тензоров и т.д.

Для манипуляции размерностью тензоров в TensorFlow имеются следующие функции:
- [tf.reshape](https://www.tensorflow.org/api_docs/python/tf/reshape)
- [tf.transpose](https://www.tensorflow.org/api_docs/python/tf/transpose)
- [tf.expand_dims](https://www.tensorflow.org/api_docs/python/tf/expand_dims)
- [tf.squeeze](https://www.tensorflow.org/api_docs/python/tf/squeeze)

Выше перечисленные функции, опять-таки, могут показаться знакомыми, поскольку все они присутствуют также и в Numpy.

Функции по манипуляции над несколькими тензорами:
- [tf.concat](https://www.tensorflow.org/api_docs/python/tf/concat) - аналог np.concatenate
- [tf.stack](https://www.tensorflow.org/api_docs/python/tf/stack)
- [tf.split](https://www.tensorflow.org/api_docs/python/tf/split)

За редким исключением названия функций в TensorFlow отличаются от их аналогов в Numpy (np.concatenate -> tf.concat).

In [27]:
tf.reshape(x_tf, 9)

<tf.Tensor: shape=(9,), dtype=float32, numpy=
array([-0.30182257, -1.8361502 , -0.9878811 , -0.8844696 ,  0.8323417 ,
       -0.19583394, -0.31822467,  0.9908128 ,  0.9789114 ], dtype=float32)>

In [28]:
tf.reshape(x_tf, -1)

<tf.Tensor: shape=(9,), dtype=float32, numpy=
array([-0.30182257, -1.8361502 , -0.9878811 , -0.8844696 ,  0.8323417 ,
       -0.19583394, -0.31822467,  0.9908128 ,  0.9789114 ], dtype=float32)>

In [29]:
tf.reshape(x_tf, [1, 1, 9])

<tf.Tensor: shape=(1, 1, 9), dtype=float32, numpy=
array([[[-0.30182257, -1.8361502 , -0.9878811 , -0.8844696 ,
          0.8323417 , -0.19583394, -0.31822467,  0.9908128 ,
          0.9789114 ]]], dtype=float32)>

In [30]:
# Изменение порядка осей
tf.transpose(x_tf, [1, 0])

<tf.Tensor: shape=(3, 3), dtype=float32, numpy=
array([[-0.30182257, -0.8844696 , -0.31822467],
       [-1.8361502 ,  0.8323417 ,  0.9908128 ],
       [-0.9878811 , -0.19583394,  0.9789114 ]], dtype=float32)>

In [31]:
tf.concat([x_tf, x_tf], axis=0)

<tf.Tensor: shape=(6, 3), dtype=float32, numpy=
array([[-0.30182257, -1.8361502 , -0.9878811 ],
       [-0.8844696 ,  0.8323417 , -0.19583394],
       [-0.31822467,  0.9908128 ,  0.9789114 ],
       [-0.30182257, -1.8361502 , -0.9878811 ],
       [-0.8844696 ,  0.8323417 , -0.19583394],
       [-0.31822467,  0.9908128 ,  0.9789114 ]], dtype=float32)>

In [32]:
tf.concat([x_tf, x_tf], axis=1)

<tf.Tensor: shape=(3, 6), dtype=float32, numpy=
array([[-0.30182257, -1.8361502 , -0.9878811 , -0.30182257, -1.8361502 ,
        -0.9878811 ],
       [-0.8844696 ,  0.8323417 , -0.19583394, -0.8844696 ,  0.8323417 ,
        -0.19583394],
       [-0.31822467,  0.9908128 ,  0.9789114 , -0.31822467,  0.9908128 ,
         0.9789114 ]], dtype=float32)>

# 2. Математика в TensorFlow

TensorFlow в своей сути является математическим движком, соответственно и инструментов для работы в нём более чем достаточно.
В данном отношении API TensorFlow во многом следует Numpy:
- из корневого пакеты доступны функции "первой необходимости":
    - унарные функции (`tf.sin`, `tf.log`, `tf.exp`, `tf.sqrt` и тд);
    - операции редукции (`tf.reduce_sum`, `tf.reduce_mean`; они являются аналогами `np.sum` и `np.mean` соответственно)
    - матричное умножение `tf.matmul`

In [33]:
tf.exp(x_tf)

<tf.Tensor: shape=(3, 3), dtype=float32, numpy=
array([[0.7394693 , 0.15943003, 0.37236488],
       [0.41293314, 2.2986953 , 0.8221488 ],
       [0.72743934, 2.6934228 , 2.6615572 ]], dtype=float32)>

In [36]:
tf.reduce_sum(x_tf, axis=1)

<tf.Tensor: shape=(3,), dtype=float32, numpy=array([-3.125854 , -0.2479619,  1.6514995], dtype=float32)>

In [37]:
tf.matmul(x_tf, x_tf)

<tf.Tensor: shape=(3, 3), dtype=float32, numpy=
array([[ 2.029484  , -1.952918  , -0.30930275],
       [-0.4069088 ,  2.1227767 ,  0.519046  ],
       [-1.0918101 ,  2.378921  ,  1.0786009 ]], dtype=float32)>

Более продвинутые функции можно найти в соответствующих пакета:
- [tf.linalg](https://www.tensorflow.org/api_docs/python/tf/linalg) - пакет линейной алгебры;
- [tf.math](https://www.tensorflow.org/api_docs/python/tf/math) - пакет с базовыми (логарифм, тригонометрия), булевыми и специальными мат. функциями;
- [tf.signal](https://www.tensorflow.org/api_docs/python/tf/signal) - пакет с инструментами обработки сигналов (преобразование Фурье).

In [47]:
# Вычисление обратной матрицы
tf.linalg.inv(x_tf)

<tf.Tensor: shape=(3, 3), dtype=float32, numpy=
array([[-0.71821713, -0.5828066 , -0.8413902 ],
       [-0.6607732 ,  0.43415648, -0.5799737 ],
       [ 0.43532863, -0.62889373,  1.3350486 ]], dtype=float32)>

In [40]:
tf.math.reduce_std(x_tf, axis=1)

<tf.Tensor: shape=(3,), dtype=float32, numpy=array([0.6275524, 0.7054396, 0.6143002], dtype=float32)>

In [45]:
# Говоря о статистике, по историческим причинам чаще используют такой вариант
mean, var = tf.nn.moments(x_tf, axes=1)
mean, var

(<tf.Tensor: shape=(3,), dtype=float32, numpy=array([-1.0419513 , -0.08265396,  0.55049986], dtype=float32)>,
 <tf.Tensor: shape=(3,), dtype=float32, numpy=array([0.39382198, 0.49764505, 0.37736475], dtype=float32)>)

# 3. Автоматическое дифференцирование в TensorFlow

TensorFlow может автоматически дифференцировать выражения, эффективно вычисляя градиенты. 
Однако работает это непохоже на Matlab, поскольку приспособлено в основном для приложений глубого обучения.

Градиенты (производные) в TensorFlow считаются посредством [Reverse-Mode Differentiation](https://en.wikipedia.org/wiki/Automatic_differentiation).
Описывая в двух словах, данный подход к дифференцированию выражений использует 
[цепное правило дифференцирования сложной функции](https://ru.wikipedia.org/wiki/%D0%94%D0%B8%D1%84%D1%84%D0%B5%D1%80%D0%B5%D0%BD%D1%86%D0%B8%D1%80%D0%BE%D0%B2%D0%B0%D0%BD%D0%B8%D0%B5_%D1%81%D0%BB%D0%BE%D0%B6%D0%BD%D0%BE%D0%B9_%D1%84%D1%83%D0%BD%D0%BA%D1%86%D0%B8%D0%B8)
(chain rule), в котором целевая производная вычисляется как произведение производных
промежуточных выражений.

Однако понимать математику процесса не нужно, чтобы использовать функции TensorFlow. Всё, что нужно знать: для произвольной скалярной функции f(x) Tensorflow позволяет вычесть градиент df(x)/dx.

In [58]:
# Пример вычисления производной функции y = x^2

def f(x):
    return x ** 2

x = tf.Variable(3.0)
x2 = tf.Variable(3.0, trainable=False)

# Посчитаем градиент для "обучаемой переменной"
with tf.GradientTape() as tape:
    y = f(x)
    grad = tape.gradient(y, x)

print("Градиент обучаемой переменной:", grad)

# Посчитаем градиент для "необучаемой переменной"
with tf.GradientTape() as tape:
    y = f(x2)
    grad = tape.gradient(y, x2)

print("Градиент необучаемой переменной:", grad)

Градиент обучаемой переменной: tf.Tensor(6.0, shape=(), dtype=float32)
Градиент необучаемой переменной: None


Выше можно увидеть новый объект - **tf.Variable** (переменная). Переменные по сути является тензором, значение которого можно модифицировать 
(как обычный np.ndarray). Именно переменные используется для хранения весов нейронной сети.

In [51]:
# GradientTape по умолчанию не считает градиенты для обычных тензоров
x = tf.constant(3.0)

with tf.GradientTape() as tape:
    y = f(x)
    grad = tape.gradient(y, x)

print(grad)

None


In [53]:
# Но его можно заставить
x = tf.constant(3.0)

with tf.GradientTape() as tape:
    # Указывает tape "следить" за тензором 
    tape.watch(x)
    y = f(x)
    grad = tape.gradient(y, x)

print(grad)

tf.Tensor(6.0, shape=(), dtype=float32)


In [63]:
# Более сложный пример: вычисление градиента весов логистической регрессии

N_INPUT_FEATURES = 128
N_CLASSES = 10

w = tf.Variable(tf.random.normal((N_INPUT_FEATURES, N_CLASSES)))
b = tf.Variable(tf.zeros((N_CLASSES)))

def logistic_regression(x, w, b):
    x = tf.matmul(x, w) + b[None, :] # аналогично tf.expand_dims(b, axis=0)
    return tf.nn.softmax(x)

def loss(out, i):
    # out - выходное значение логистической регрессии
    # i - номер класса, которому принадлежит экземпляр
    l = tf.math.log(out)[:, i]
    return -tf.reduce_mean(l)

x = tf.random.normal((1, N_INPUT_FEATURES))
# x.shape - [batch_size, n_features]
i = 8

with tf.GradientTape() as tape:
    out = logistic_regression(x, w, b)
    print('Out:', out)
    loss_val = loss(out, i)
    print('Loss:', loss_val)
    # grads = [grad_w, grad_b]
    grads = tape.gradient(loss_val, [w, b])

print('Grad W:', grads[0])
print('Grad b:', grads[1])

Out: tf.Tensor(
[[3.64476705e-06 7.54156204e-09 1.67738126e-05 1.12760285e-13
  9.99979615e-01 3.87019973e-12 6.76361632e-17 2.35801406e-10
  3.09270491e-15 2.10132510e-14]], shape=(1, 10), dtype=float32)
Loss: tf.Tensor(33.40973, shape=(), dtype=float32)
Grad W: tf.Tensor(
[[ 2.5778745e-06  5.3340035e-09  1.1863799e-05 ...  1.6677786e-10
  -7.0728099e-01  1.4862272e-14]
 [-6.2113500e-06 -1.2852202e-08 -2.8585646e-05 ... -4.0184875e-10
   1.7041830e+00 -3.5810425e-14]
 [ 1.1007196e-06  2.2775517e-09  5.0656913e-06 ...  7.1212022e-11
  -3.0199999e-01  6.3460013e-15]
 ...
 [ 2.8787065e-06  5.9564695e-09  1.3248277e-05 ...  1.8624044e-10
  -7.8981906e-01  1.6596665e-14]
 [-1.1475131e-06 -2.3743743e-09 -5.2810424e-06 ... -7.4239365e-11
   3.1483853e-01 -6.6157809e-15]
 [ 5.3177237e-06  1.1003157e-08  2.4473033e-05 ...  3.4403480e-10
  -1.4590024e+00  3.0658385e-14]], shape=(128, 10), dtype=float32)
Grad b: tf.Tensor(
[ 3.64476705e-06  7.54156204e-09  1.67738126e-05  1.12760285e-13
  9.9997

Больше информации об автоматическом дифференцировании можно найти на [официальном сайте TensorFlow](https://www.tensorflow.org/guide/autodiff).