## Манипулирование данными

Для создания нейронных сетей необходимо использовать удобные форматы данных, позволяющие обепечить наиболее эффективную обработку больших объёмов информации.

Наиболее удобный сегодня для использования формат - Torch.Tensor. По своей конструкции Tensor похож на многомерный массив NumPy. Тем не менее, он даёт несколько ключевых преимуществ. Во-первых, torch.tensor поддерживает асинхронные вычисления на CPU и GPU. Во-вторых, он обеспечивает поддержку автоматического дифференцирования.

In [None]:
import torch

Tensor — это массив (возможно, многомерный) числовых значений. Tensor с одной осью называется (в математике) вектором, с двумя — матрицей. Для массивов с более чем двумя осями нет специальных имен, их называют просто тензорами.
Самый простой объект, который мы можем создать, — это вектор. Для начала мы можем использовать arange для создания вектора строки с 12 последовательными целыми числами.

In [None]:
x = torch.arange(12)
x

tensor([ 0,  1,  2,  3,  4,  5,  6,  7,  8,  9, 10, 11])

In [None]:
xx = torch.Tensor([[x, x**2, x**3] for x in range(12)])
xx

tensor([[0.0000e+00, 0.0000e+00, 0.0000e+00],
        [1.0000e+00, 1.0000e+00, 1.0000e+00],
        [2.0000e+00, 4.0000e+00, 8.0000e+00],
        [3.0000e+00, 9.0000e+00, 2.7000e+01],
        [4.0000e+00, 1.6000e+01, 6.4000e+01],
        [5.0000e+00, 2.5000e+01, 1.2500e+02],
        [6.0000e+00, 3.6000e+01, 2.1600e+02],
        [7.0000e+00, 4.9000e+01, 3.4300e+02],
        [8.0000e+00, 6.4000e+01, 5.1200e+02],
        [9.0000e+00, 8.1000e+01, 7.2900e+02],
        [1.0000e+01, 1.0000e+02, 1.0000e+03],
        [1.1000e+01, 1.2100e+02, 1.3310e+03]])

In [None]:
torch.Tensor([1])

tensor([1.])

Размеры тензоров можно узнать с помощью стандартного запроса.

In [None]:
x.shape, xx.shape

(torch.Size([12]), torch.Size([12, 3]))

Узнать, расположен ли он на gpu или cpu, можно через специальный аттрибут device.

In [None]:
x.device

device(type='cpu')

Можно использоват функцию view, чтобы изменить форму одного (возможно, многомерного) массива на другой, который содержит такое же количество элементов. Например, можно преобразовать форму нашего вектора x в матрицу размера (3, 4), которая содержит те же значения, но интерпретирует их как матрицу, содержащую 3 строки и 4 столбца. Обратите внимание, что, хотя форма изменилась, элементы в x не изменились. Причём количество элементов осталось прежним.

In [None]:
x.view((2,-1,2)).shape

torch.Size([2, 3, 2])

In [None]:
x.reshape((2,-1,3)).shape

torch.Size([2, 2, 3])

torch может автоматически выводить одно измерение, учитывая другие. Можно указывать -1 для измерения, которое мы хотели бы, чтобы torch автоматически выводил. В нашем случае вместо x.view((3, 4)) мы могли бы использовать x.view ((- 1, 4)) или x.view((3, -1)).

In [None]:
x.view((-1, 4))

tensor([[ 0,  1,  2,  3],
        [ 4,  5,  6,  7],
        [ 8,  9, 10, 11]])

Другие две полезные функции — zeros и ones. Они создают массивы из всех нулей и всех единиц. Они принимают форму создаваемого тензора в качестве параметра.

In [None]:
torch.zeros((2,3,4))

tensor([[[0., 0., 0., 0.],
         [0., 0., 0., 0.],
         [0., 0., 0., 0.]],

        [[0., 0., 0., 0.],
         [0., 0., 0., 0.],
         [0., 0., 0., 0.]]])

In [None]:
torch.ones((2,3,4))

tensor([[[1., 1., 1., 1.],
         [1., 1., 1., 1.],
         [1., 1., 1., 1.]],

        [[1., 1., 1., 1.],
         [1., 1., 1., 1.],
         [1., 1., 1., 1.]]])

Конечно же, можно создать тензор явно, указав все значения.

In [None]:
torch.tensor([[1,2,3], [4,5,6], [10,11,0]])

tensor([[ 1,  2,  3],
        [ 4,  5,  6],
        [10, 11,  0]])

Иногда бывает полезно создать массив, заполненный случайными значениями. Для этого используются функции torch.rand и torch.randn. Первое использует равномерное распределение, второе — нормальное

In [None]:
torch.rand((2,3,4))

tensor([[[0.6395, 0.9673, 0.1783, 0.7475],
         [0.1175, 0.1170, 0.0439, 0.0460],
         [0.1690, 0.3159, 0.5858, 0.0013]],

        [[0.8692, 0.4489, 0.9983, 0.8434],
         [0.5657, 0.2207, 0.5812, 0.2472],
         [0.1624, 0.3124, 0.0330, 0.2344]]])

In [None]:
torch.randn((2,3,4))

tensor([[[ 0.4045,  0.9398, -1.6803,  1.0544],
         [ 2.9761, -0.0808, -1.3215,  0.6697],
         [-0.0563,  2.8078,  0.0152,  1.6564]],

        [[ 2.7859, -1.1182, -0.3278,  2.3890],
         [-1.2613, -1.4962,  1.6390, -1.6176],
         [ 0.6995,  2.4876,  0.3505, -0.6091]]])

## Операции

С тезнорами можно проводить операции, аналогичные операциям с NumPy.

In [None]:
x = torch.tensor([1., 2., 4., 8.])
y = torch.ones_like(x) * 2
print('x =', x)
print('y =', y)
print('x + y', x + y)
print('x - y', x - y)
print('x * y', x * y)
print('x / y', x / y)

x = tensor([1., 2., 4., 8.])
y = tensor([2., 2., 2., 2.])
x + y tensor([ 3.,  4.,  6., 10.])
x - y tensor([-1.,  0.,  2.,  6.])
x * y tensor([ 2.,  4.,  8., 16.])
x / y tensor([0.5000, 1.0000, 2.0000, 4.0000])


Ещё больше операций может быть выполненно поэлементно. Например, операции exp.

In [None]:
x.exp()

tensor([2.7183e+00, 7.3891e+00, 5.4598e+01, 2.9810e+03])

В дополнение к поэлементным вычислениям, мы также можем выполнять матричные операции. Например, матричное умножение. Для этого используется функция mm.

In [None]:
x1 = torch.arange(12)
x2 = torch.arange(12)
x3 = torch.arange(12)

In [None]:
x = torch.arange(12).reshape((3,4))
y = torch.tensor([[2, 1, 4, 3], [1, 2, 3, 4], [4, 3, 2, 1]])
print(x)
print(y)
torch.mm(x, y.T)

tensor([[ 0,  1,  2,  3],
        [ 4,  5,  6,  7],
        [ 8,  9, 10, 11]])
tensor([[2, 1, 4, 3],
        [1, 2, 3, 4],
        [4, 3, 2, 1]])


tensor([[ 18,  20,  10],
        [ 58,  60,  50],
        [ 98, 100,  90]])

Мы также можем объединить несколько тензоров. Для этого нам нужно указать, по какому измерению производить объединение. В приведённом ниже примере объединяются две матрицы по измерению 0 (по строкам) и измерению 1 (по столбцам) соответственно.

In [None]:
torch.cat((x, y), axis=0)

tensor([[ 0,  1,  2,  3],
        [ 4,  5,  6,  7],
        [ 8,  9, 10, 11],
        [ 2,  1,  4,  3],
        [ 1,  2,  3,  4],
        [ 4,  3,  2,  1]])

In [None]:
torch.cat((x, y), dim=1)

tensor([[ 0,  1,  2,  3,  2,  1,  4,  3],
        [ 4,  5,  6,  7,  1,  2,  3,  4],
        [ 8,  9, 10, 11,  4,  3,  2,  1]])

Для получения булевых тензоров можно использовать булевы операторы. Например, можно сравнить два тензора при помощи оператора ==

In [None]:
(x <= y).int()

tensor([[1, 1, 1, 1],
        [0, 0, 0, 0],
        [0, 0, 0, 0]], dtype=torch.int32)

In [None]:
x

tensor([4, 5, 6, 7])

Суммирование всех элементов тензора даёт тензор с одним элементом.

In [None]:
x.sum()

tensor(66)

Мы можем преобразовать результат в скаляр в Python, используя функцию item

In [None]:
x.sum().item()

66

In [None]:
x.sum(dim=1).shape

torch.Size([3])

In [None]:
x.sum(dim=1, keepdim=True).shape

torch.Size([3, 1])

In [None]:
x.sum(dim=0, keepdim=True).shape

torch.Size([1, 4])

Преобразование типов

In [None]:
x.dtype

torch.int64

In [None]:
x.double()

tensor([[ 0.,  1.,  2.,  3.],
        [ 4.,  5.,  6.,  7.],
        [ 8.,  9., 10., 11.]], dtype=torch.float64)

In [None]:
x.type('torch.DoubleTensor')

tensor([[ 0.,  1.,  2.,  3.],
        [ 4.,  5.,  6.,  7.],
        [ 8.,  9., 10., 11.]], dtype=torch.float64)

In [None]:
x = torch.tensor([4,5,6,7])
y = 3
x - y

tensor([1, 2, 3, 4])

##Изменение размерности

С помощью команды unsqueeze можно вставлять заданную размерность внтрь тензора.

In [None]:
x = torch.arange(12).reshape((3,4))

In [None]:
x.shape

torch.Size([3, 4])

In [None]:
x

tensor([[ 0,  1,  2,  3],
        [ 4,  5,  6,  7],
        [ 8,  9, 10, 11]])

In [None]:
x.unsqueeze(1).shape

torch.Size([3, 1, 4])

In [None]:
x.unsqueeze(1)

tensor([[[ 0,  1,  2,  3]],

        [[ 4,  5,  6,  7]],

        [[ 8,  9, 10, 11]]])

In [None]:
x.unsqueeze(2).shape

torch.Size([3, 4, 1])

In [None]:
x.unsqueeze(2)

tensor([[[ 0],
         [ 1],
         [ 2],
         [ 3]],

        [[ 4],
         [ 5],
         [ 6],
         [ 7]],

        [[ 8],
         [ 9],
         [10],
         [11]]])

In [None]:
x.unsqueeze(2).unsqueeze(1).squeeze()

tensor([[ 0,  1,  2,  3],
        [ 4,  5,  6,  7],
        [ 8,  9, 10, 11]])

In [None]:
x.unsqueeze(2).unsqueeze(1).squeeze().shape

torch.Size([3, 4])

In [None]:
x.T

tensor([[ 0,  4,  8],
        [ 1,  5,  9],
        [ 2,  6, 10],
        [ 3,  7, 11]])

In [None]:
x

tensor([[ 0,  1,  2,  3],
        [ 4,  5,  6,  7],
        [ 8,  9, 10, 11]])

In [None]:
x.unsqueeze(0).squeeze().shape

torch.Size([3, 4])

##Транспонирование

In [None]:
x.T

tensor([[ 0,  4,  8],
        [ 1,  5,  9],
        [ 2,  6, 10],
        [ 3,  7, 11]])

In [None]:
x.permute(1,0)

tensor([[ 0,  4,  8],
        [ 1,  5,  9],
        [ 2,  6, 10],
        [ 3,  7, 11]])

In [None]:
xx = torch.rand((2,3,4))

In [None]:
xx

tensor([[[0.6050, 0.2499, 0.2198, 0.3638],
         [0.7401, 0.4837, 0.6330, 0.7579],
         [0.8696, 0.1611, 0.0167, 0.3191]],

        [[0.2913, 0.4836, 0.0449, 0.6589],
         [0.2333, 0.4198, 0.3311, 0.3836],
         [0.7576, 0.1027, 0.8624, 0.1846]]])

In [None]:
xx.permute(1,2,0)

tensor([[[0.6050, 0.2913],
         [0.2499, 0.4836],
         [0.2198, 0.0449],
         [0.3638, 0.6589]],

        [[0.7401, 0.2333],
         [0.4837, 0.4198],
         [0.6330, 0.3311],
         [0.7579, 0.3836]],

        [[0.8696, 0.7576],
         [0.1611, 0.1027],
         [0.0167, 0.8624],
         [0.3191, 0.1846]]])

## Broadcast

Выполнять операции можно не только с тензорами одинакового размера, но и разного. Когда их формы различаются, запускается механизм broadcast'а. Сначала элементы копируются соответствующим образом, чтобы два тензора имели одинаковую форму, а затем операции выполняются поэлементно.

In [None]:
a = torch.arange(3).reshape((3, 1))
b = torch.arange(4).reshape((1, 4))
a, b

(tensor([[0],
         [1],
         [2]]), tensor([[0, 1, 2, 3]]))

Поскольку a и b являются матрицами (3x1) и (1x2) соответственно, их формы не совпадают. Torch решает эту проблему путём broadcast'а значений обеих матриц в большую (3x2) матрицу следующим образом: для матрицы a он реплицирует столбцы, для матрицы b он реплицирует строки. После чего запускается операция сложения

In [None]:
a + b

tensor([[0, 1, 2, 3],
        [1, 2, 3, 4],
        [2, 3, 4, 5]])

## Индексирование

Как и в любом другом массиве Python, элементы в тензоре могут быть доступны по их индексу. По традиции первый элемент имеет индекс 0, а диапазоны указываются для включения первого, но не последнего элемента. По этой логике `1: 3` выбирает второй и третий элемент из тензора

In [None]:
x

tensor([[ 0,  1,  2,  3],
        [ 4,  5,  6,  7],
        [ 8,  9, 10, 11]])

In [None]:
x[1:3,1:3]

tensor([[ 5,  6],
        [ 9, 10]])

Мы так же можем изменять значения в тензоре

In [None]:
x[1:3, 2:3] = 9
x

tensor([[ 0,  1,  2,  3],
        [ 4,  5,  9,  7],
        [ 8,  9,  9, 11]])

Если мы хотим присвоить нескольким элементам одно и то же значение, мы просто индексируем все из них (при помощи оператора `:`), а затем присваиваем им значения. Например, `[0:2,:]` обращается к первой и второй строчкам.

In [None]:
x[0:2, :] = 12
x

tensor([[12, 12, 12, 12],
        [12, 12, 12, 12],
        [ 8,  9,  9, 11]])

## В numpy и назад

In [None]:
x.numpy()

array([[12, 12, 12, 12],
       [12, 12, 12, 12],
       [ 8,  9, 10, 11]])

In [None]:
y = torch.tensor(x.numpy())
y

tensor([[12, 12, 12, 12],
        [12, 12, 12, 12],
        [ 8,  9, 10, 11]])

## Проверим вычисление градиента

In [None]:
from torch import autograd

In [None]:
x = torch.arange(4).type(torch.float)
print(x)

tensor([0., 1., 2., 3.])


In [None]:
x.requires_grad

False

In [None]:
x = x.requires_grad_()

In [None]:
x.requires_grad

True

Возьмём функцию: $$y = 2\mathbf{x}^{\top}\mathbf{x} = 2*x^2$$

$$\frac{\partial y}{\partial \mathbf x} = 4\mathbf{x}$$

In [None]:
y = 2 * x.dot(x.T)
y2 = 2 * x.dot(x.T)

  y = 2 * x.dot(x.T)


In [None]:
y

tensor(28., grad_fn=<MulBackward0>)

In [None]:
y.backward()

In [None]:
x.grad

tensor([ 0.,  4.,  8., 12.])

In [None]:
4 * x == x.grad

tensor([True, True, True, True])