In [None]:
%matplotlib inline

import tensorflow as tf
import numpy as np
from sklearn import datasets, metrics, preprocessing
import matplotlib.pyplot as plt
tf.__version__


# Вычислительные графы

В TensorFlow (как и во многих других фреймворках) вершины графа представляют собой операции, применяемые к её входам (если у вершины есть входы). Операции генерируют некоторое выходное значение, передаваемое последущюим вершинам графа.

# Примеры графов

Операции, содержащиеся в графе, могут включать в себя самые различные функции, начиная с отдельных арифметических действий (сложение, умножение, ...) до сложных и составных операций, состоящих из многих действий. Операции могут быть и более специфическими, например, создание констант или генерация случайных чисел.

Создание операции устроено просто:
~~~python 
tf.<node does what> 
~~~

# Числа Фибоначчи
# $$F_n=F_{n-1}+ F_{n-2}$$
## $$F_0 = 0, F_1 = 1 $$

<img src="./img/fibonacci.png" width="800">

In [None]:
import tensorflow as tf # На этом шаге инициализируется граф по умолчанию!

# Добавляем в граф наши вершины
a = tf.constant(0) # Первый член: 0
b = tf.constant(1) # Второй член: 1
c = tf.add(a,b) # 1
d = tf.add(b,c) # 2
e = tf.add(c,d) # 3
f = tf.add(d,e) # 5

sess = tf.Session()
outs = sess.run(f)
sess.close()

print('Результат равен {}'.format(outs))

# Взвешенная сумма
# $$y=w_0x_0+w_1x_1+w_2x_2$$

<img src="./img/1d_filter.png" width="600">

In [None]:
x_0 = tf.constant(2) 
x_1 = tf.constant(-3) 
x_2 = tf.constant(2) 

w_0 = tf.constant(4) 
w_1 = tf.constant(7) 
w_2 = tf.constant(-5) 

wx_0 = tf.multiply(x_0,w_0) # x_0*w_0
wx_1 = tf.multiply(x_1,w_1) # x_1*w_1
wx_2 = tf.multiply(x_2,w_2) # x_2*w_2

wx_0_1 = tf.add(wx_0,wx_1) # -wx_0 + wx_1
wx_0_1_2 = tf.add(wx_0_1,wx_2) # wx_0_1 + wx_2


sess = tf.Session()
outs = sess.run(wx_0_1_2)
sess.close()

print('Сумма равна {}'.format(outs))

# Можно несколько проще...

In [None]:
x_0 = tf.constant(2) 
x_1 = tf.constant(-3) 
x_2 = tf.constant(2) 

w_0 = tf.constant(4) 
w_1 = tf.constant(7) 
w_2 = tf.constant(-5) 

wx_0_1_2 = (x_0*w_0) + (x_1*w_1) + (x_2*w_2)

sess = tf.Session()
outs = sess.run(wx_0_1_2)
sess.close()

print('Сумма равна {}'.format(outs))

Программа на TensorFlow работает в два этапа:
 * создание графа;
 * вычисление операций, определяемых графом.

# Сессии

Сессия - это специальный объект в API TensorFlow, который отвечает за взаимодействие между объектами языка Python и/или данными, вводимыми в систему с одной стороны, и системой, отвечающей за вычисления, выделение памяти, размещение переменных и т.п.

In [None]:
# Создаем граф
a = tf.constant(0) # Первый член: 0
b = tf.constant(1) # Второй член: 1
c = tf.add(a,b) # 1
d = tf.add(b,c) # 2
e = tf.add(c,d) # 3
f = tf.add(d,e) # 5

### Вариант 1:

~~~python 
tf.Session()
~~~

Нужно 
 * сначала открыть сессию, 
 * выполнить вычисления, 
 * затем закрыть ее.

In [None]:
# Создание сессии и запуск
# option 1

sess = tf.Session()
outs = sess.run(f)
sess.close()

print('Результат равен {}'.format(outs))

### Вариант 2:

~~~python 
with tf.Session()
~~~
Чуть меньше явно указываемых действий - открытие и закрытие сессии происходит прозрачно для программиста.

In [None]:
# option 2

with tf.Session() as sess:
    outs = sess.run(f)

print('Результат равен {}'.format(outs))

### Вариант 3:

~~~python 
tf.InteractiveSession()
~~~

В предыдущих вариантах для того, чтобы выполнить какое-либо действие, мы должны были писать `sess.run(...)`, т.е. мы указывали в рамках какой сессии работаем. InteractiveSession создается как сессия по умолчанию, т.е. можно просто вызывать `run()` или `eval()` без явного указания сессии.

In [None]:
# option 3

sess = tf.InteractiveSession()
outs = f.eval()
sess.close()

print('Результат равен {}'.format(outs))

Но можно работать и с явным указанием сессии:

In [None]:
# option 3

sess = tf.InteractiveSession()
outs = sess.run(f)
sess.close()

print('Результат равен {}'.format(outs))

# NumPy

NumPy - пакет Python для выполнения численных операций. При этом TensorFlow и NumPy очень тесно связаны, например `sess.run()` возвращает результаты в виде массивов NumPy.

In [None]:
a = np.array([[1,2],
              [3,4],
              [5,6]])
print('array a:\n{}'.format(a))
print('==============================')

print('shape of a:\n{}'.format(a.shape))


In [None]:
with tf.Session() as sess:
    outs = sess.run(f)
    
print(outs.__class__)
print(outs.shape)

# Получение результатов вычислений

Можно передать команде `sess.run()` список запрашиваемых узлов графа. Тогда команда вернет также список с элементами, соответствующими запросу.

In [None]:
# Graph architecture
a = tf.constant(0) # input of 0
b = tf.constant(1) # input of 1
c = tf.add(a,b) # 1
d = tf.add(b,c) # 2
e = tf.add(c,d) # 3
f = tf.add(d,e) # 5

sess = tf.Session()
fetches = [a,b,c,d,e,f]
outs = sess.run(fetches)
sess.close()

print('Результат равен {}'.format(outs))
print(type(outs))
print(type(outs[0]))

# Пример .1

<img src="./img/hands_on_1.png" width="6000">

In [None]:
# %load solutions/solution1.py



<img src="./img/data_flow.png" width="800">

# Тензоры

При работе часто приходится иметь дело с многомерными данными. Например, вход нейронной сети может быть:
 * одномерным массивом (вектором);
 * двумерным массивом (матрицей), например, черно-белые изображения;
 * трехмерным массивом, например цветные (RGB) изображения;
 * четырехмерным массивом, например, цветные видеоданные
 * ...
 
Такие массивы называют тензорами.

In [None]:
# 3d array
a = np.array([ 
            [[1,2,3],\
             [1,2,3],\
             [1,2,3]],\
        
              [[3,2,1],\
               [3,2,1],\
               [3,2,1]] 
             ])
print(a.shape)

# shape, dtype и названия

In [None]:
a = [[1,2],[3,4]]
# Назначим атрибуты в явном виде
x = tf.constant(a, name='a', dtype=tf.float32) 

In [None]:
print(x.get_shape())

Названия тензоров генерируются на основе названия операции, которая создает эти тензоры (в данном случае операция `Variable`), и индекса, которому этот тензор соответствует.

In [None]:
print(x.name)

In [None]:
a = [[1,2],[3,4]]
# Назначим атрибуты в явном виде
x = tf.constant(a, name='a', dtype=tf.float32) 

print(x.name)

In [None]:
# sess.graph.get_operations()

In [None]:
# for operation in sess.graph.get_operations():
#     print(operation.name)

In [None]:
# sess = tf.Session()
# op = sess.graph.get_operations()
# [(m.name, m.values()) for m in op][1]

Очень важно убедиться, что все типы переменных, которые вы пропускаете через граф совместимы между собой: попытка выполнить операцию с неподдерживаемым типом данных вызовет исключительную ситуацию.

In [None]:
print(x.dtype)

## Приведение типов
Часто требуется модифицировать тензор одного типа так, чтобы его тип стал другим.

In [None]:
print(x.dtype)
x = tf.cast(x,np.int64)
print(x.dtype)

# Области видимости имен
Иногда приходится иметь дело с большими и сложными вычислительными графами, поэтому существует инструмент, который позволяет группировать узлы графа вместе. Такая группировка облегчает в дальнейшем модификации графа и работу с ним.

In [None]:
with tf.Graph().as_default():
    c1 = tf.constant(4,dtype=tf.float64,name='c') 
    with tf.name_scope("prefix_name"):
        c2 = tf.constant(4,dtype=tf.int32,name='c') 
        c3 = tf.constant(4,dtype=tf.float64,name='c')

print(c1.name)
print(c2.name)
print(c3.name)

*Замечание про выражение `with tf.Graph().as_default()`*

У нас всегда есть какой-то активный граф или граф по умолчанию, в который добавляются все операции. Но мы можем создавть сразу несколько графов. Выражение `with tf.Graph().as_default()` создает новый граф и устанавливает его графом по умолчанию. После этого все операции, которые вы добавляете, оказываются в данном графе. Если у вас только один граф в системе, то это выражение по сути лишнее. Но тем не менее считается хорошей практикой все добавляемые операции оборачивать в него, поскольку:
 * это не трудно;
 * если вы вдруг решите использовать несколько графов, то использование явного указания графа позволит вам избежать путаницы при рефакторинге.

# Инициализация

# Константы и случайные числа

In [None]:

sess = tf.InteractiveSession()

a = np.array([[1,2],[3,4],[5,6]])

x = tf.constant(a)
print('constant initializer:\n {}'.format(x.eval()))

In [None]:
x = tf.fill(a.shape,1)
print('fill initializer:\n {}'.format(x.eval()))

In [None]:
x = tf.zeros(a.shape)
print('fill initializer:\n {}'.format(x.eval()))


In [None]:
# === Normal / Truncated normal  ===

mean = 0
std = 1
x_normal = tf.random_normal((1,5000),mean,std).eval()
x_truncated = tf.truncated_normal((1,5000),mean,std).eval()

# === Uniform distribution
minval = -2 
maxval = 2
x_uniform = tf.random_uniform((1,50000),minval,maxval).eval()

sess.close()

In [None]:
f,axarr = plt.subplots(1,3,figsize=[15,4])
titles = ['Normal','Truncated Normal','Uniform']

print(x_normal.shape)
for i,x in enumerate([x_normal, x_truncated, x_uniform]):
    ax = axarr[i]
    ax.hist(x[0],bins=100,color='b',alpha=0.4)
    ax.set_title(titles[i],fontsize=20)
    ax.set_xlabel('Значения',fontsize=20)
    ax.set_ylabel('Частота',fontsize=20)
    ax.set_xlim([-5,5])
plt.suptitle('Значения инициализированных тензоров',fontsize=30, y=1.15)
plt.tight_layout()
plt.show()

# Часто используемые операции

## Аггрегирование

Математические операции, которые производят аггренирование по какому-либо измерению тензора:
~~~python 
tf.reduce_mean()
tf.reduce_sum()
tf.reduce_min()
tf.reduce_max()
tf.reduce_prod()

~~~


In [None]:
sess = tf.InteractiveSession()

a = tf.constant([ [1,2,3],
              [4,5,6] ])

x = tf.reduce_max(a)
print('maximum value:\n {}'.format(x.eval()))

Есть очень важный параметр:
~~~python 
reduction_indices
~~~
Он отвечает за то, по какому измерению будем производить аггрегацию. Если параметр не указан, т.е. `reduction_indices=None` (по умолчанию), то обрабатываются сразу все измерения.

In [None]:
x = tf.reduce_max(a,reduction_indices=0)
print('максимальное значение в колонках:\n {}'.format(x.eval()))

In [None]:
x = tf.reduce_max(a,reduction_indices=1)
print('максимальное значение в строках:\n {}'.format(x.eval()))

## matmul, expand_dims, transpose

In [None]:
a = tf.constant([ [1,2,3],
              [4,5,6] ])

b = tf.constant([1,0,1])

In [None]:
print(a.get_shape())
print(b.get_shape())

In [None]:
b = tf.expand_dims(b,0)
print(b.get_shape())

In [None]:
x = tf.matmul(a, tf.transpose(b))
print('matmul result:\n {}'.format(x.eval()))

# Пример .2

<img src="./img/hands_on_2_a.png" width="500">

In [None]:
# %load solutions/solution2.py

# Переменные

Переменные -- это тензоры, в которых хранятся и обновляются параметры модели.

In [None]:
x = tf.Variable(0, name='x')
init = tf.global_variables_initializer()
print('pre-run переменная:\n{}'.format(x))
print('===============================')

with tf.Session() as sess:
    sess.run(init)
    val = sess.run(x)
    print('post-run переменная:\n{}'.format(val))

Мы должны выполнять процедуру инициализации переменных в явном виде, используя метод `tf.global_variables_initializer`. Этот метод выделяет память для переменных и устанавливает их начальное значение.

# Placeholders (заполнители?) и передача значений
Часто мы не знаем, заранее какие именно входные значения будут обрабатываться графом вычислений: входные данные становятся известны после того, как их ввел пользователь.

В TensorFlow существуют специальные структуры (Placeholders) для загрузки входных данных в графы вычислений. Мы можем рассматривать их как некие пустые переменные, которые должны быть заплнены данными на этапе вычислений. Т.е. сначала на этапе создания графа мы выделяем для них место, а на этапе вычислений при необходимости помещаем в них входные значения.

Таким образом мы можем "скармливать" данные непосредственно из кода на Python графу, построенному на TensorFlow. Входные даные должны быть оформлены в виде словаря, где каждый ключ соответствует названию переменной. Значения, которые мы передаем в TensorFlow, должны быть или массивами numpy, или списками.

In [None]:
x_data = np.random.randn(800,10)
y_data = np.random.randn(100)

with tf.Graph().as_default():
    x = tf.placeholder(np.float32,shape=(None,10))
    y = tf.placeholder(np.float32,shape=(None))
    with tf.Session() as sess:
        outs = sess.run(x,feed_dict={x: x_data,y: y_data})
        
print(outs.shape)

# Оптимизация

Для настройки параметров моделей в TensorFlow реализованы различные методы оптимизации.

<img src="./img/optimization.png" width="500">

# Функция потерь (loss function)

Функция потерь отражает то, насколько много мы проигрываем, если система дает тот или иной ответ для заданного примера.

### MSE
(Часто используется для задач регрессии):

# $$L(y,\hat{y})={1\over{n}} \Sigma_{i=1}^n(y_i-\hat{y}_i)^2$$

~~~python 
loss = tf.reduce_mean(tf.square(y_true-y_pred))
~~~


### Перекрестная энтропия 
(часто используется для задач классификации)

# $$H(p,q)=-\Sigma_x{p(x) \log q(x)}$$

~~~python 
loss = tf.nn.sigmoid_cross_entropy_with_logits(labels=y_true,logits=y_pred) 

loss = tf.reduce_mean(loss)
~~~


# Оптимизация

Оптимизацию выполняют "оптимизаторы" - объекты, реализующие те или иные методы поиска минимума (максимума). Они обновляют веса моделей таким образом, чтобы функция потерь уменьшалась в процессе работы. Обычно используются в два этапа:
 * создается объект-оптимизатор, настраиваются его параметры;
 * объекту передается функция для поиска её минимума.

~~~python 
optimizer = tf.train.GradientDescentOptimizer(learning_rate=0.5)
train = optimizer.minimize(loss)
~~~

# Пример оптимизации

In [None]:
from tensorflow.examples.tutorials.mnist import input_data
import sys

# This is where the MNIST data will be downloaded to. If you already have it on your 
# machine then set the path accordingly to prevent an extra download. 
DATA_DIR = '/tmp/data' if not 'win' in sys.platform else "c:\\tmp\\data"

# Load data 
data = input_data.read_data_sets(DATA_DIR, one_hot=True)

print("Nubmer of training-set images: {}".format(len(data.train.images)))
print("Luckily, there are also {} matching labels.".format(len(data.train.labels)))

In [None]:
NUM_STEPS = 1000
MINIBATCH_SIZE = 100

with tf.name_scope('model') as scope:
    x = tf.placeholder(tf.float32, [None, 784])
    W = tf.Variable(tf.zeros([784, 10]))

    y_true = tf.placeholder(tf.float32, [None, 10])
    y_pred = tf.matmul(x, W)
    
with tf.name_scope('loss') as scope:
    loss = tf.nn.softmax_cross_entropy_with_logits(logits=y_pred, labels=y_true)
    cross_entropy = tf.reduce_mean(loss)
    
with tf.name_scope('train') as scope:
    gd_step = tf.train.GradientDescentOptimizer(0.5).minimize(cross_entropy)
    correct_mask = tf.equal(tf.argmax(y_pred, 1), tf.argmax(y_true, 1))
    accuracy = tf.reduce_mean(tf.cast(correct_mask, tf.float32))
    
with tf.Session() as sess:

    # Train
    sess.run(tf.global_variables_initializer())
    for _ in range(NUM_STEPS):
        batch_xs, batch_ys = data.train.next_batch(MINIBATCH_SIZE)
        sess.run(gd_step, feed_dict={x: batch_xs, y_true: batch_ys})

    # Test
    is_correct, acc = sess.run([correct_mask, accuracy], 
                               feed_dict={x: data.test.images, y_true: data.test.labels})

print("Accuracy: {:.4}%".format(acc*100))


# Пример .3

# Linear Regression

## $$f(x_i) = w^Tx_i +b$$
## $$y_i = f(x_i) + \epsilon_i$$

# Boston housing dataset

Boston Housing dataset -- небольшоай набор данных (506 примеров), содержащий информацию о ценах на недвижимость пригородных районов Бостона. В нем содержится 13 предикторов (входных переменных) и одна целевая переменная, которая явлется медианной ценой зданий (в 1000 долларов).

### Сводная информация:

Стоимость жилья в пригородах Бостона.

### Атрибуты:

1. CRIM: уровень преступности на душу населения в городе
2. ZN: доля жилой застройки. 
3. INDUS: доля некомерческих площадей в городе
4. CHAS: есть река? (= 1 если да; 0 иначе) 
5. NOX: концентрация оксидов азота (в 10-ти миллионных долях) 
6. RM: среднее число комнат 
7. AGE: доля домов, построенных до 1940г.
8. DIS: взвешенные расстояния до пяти офисных районов Бостона
9. RAD: индекс доступности радиальных магистралей 
10. TAX: налог на имущества на \$10,000 
11. PTRATIO: соотношение учеников и учителей в городе
12. B: 1000(Bk - 0.63)^2 где Bk пропорция негритянского населения в городе 
13. LSTAT: % населения ниского социального статуса

In [None]:
boston = datasets.load_boston()
x_data = preprocessing.StandardScaler().fit_transform(boston.data)

mu = np.mean(x_data,axis=0)
sigma = np.std(x_data,axis=0)
x_data =  (x_data - mu)/sigma

y_data = boston.target

In [None]:
# %load solutions/solution3.py