# Лекция 1 (часть 2): Введение в работу с PyTorch

__Автор: Сергей Вячеславович Макрушин__ e-mail: SVMakrushin@fa.ru 

Финансовый универсиет, 2021 г. 

При подготовке лекции использованы материалы:
* ...

V 0.5 04.02.2021

## Разделы: <a class="anchor" id="разделы"></a>
* [Установка PyTorch](#установка)
* [Тензоры и опреации с ними в PyTorch](#тензоры)
    * [Создание тензоров](#создание-тензоров)
    * [Операции с тензорами](#операции-тензоры)    
        * [Арифметические операции и математические функции:](#aрифметические)        
        * [Операции, изменяющие размер тензора](#размер)        
        * [Операции агрегации](#агрегации)        
        * [Матричные операции](#aрифметические)                
-

* [к оглавлению](#разделы)

In [1]:
# загружаем стиль для оформления презентации
from IPython.display import HTML
from urllib.request import urlopen
html = urlopen("file:./lec_v1.css")
HTML(html.read().decode('utf-8'))

-----
### Современные инструменты для создание моделей на основе ИНС

* TensorFlow / Keras 
* PyTorch


TODO: более полный обзор современного "рынка"

## Установка PyTorch <a class="anchor" id="установка"></a>
* [к оглавлению](#разделы)

1. Стартуем консоль Анаконды:

<center> 
<img src="./img/lnnp2_anaconda_prompt1.png" alt="Запуск консоли Анаконды" style="width: 200px;"/><br/>
    <b>Запуск консоли Анаконды</b>    
</center> 

Далее в консоли:
2. Определяем текущую версию Python. Пример:

```console
(base) C:\Users\alpha>python --version
Python 3.7.6
```

3. Экспортируем текущую версию окружения (например, в файл `environment.yml` ). Пример:

```console
(base) C:\Users\alpha>conda env export > environment.yml
```
4. Создаем новое __виртуальное окружение__ для текущей версии Python (можете выбрать удобноее Вам имя виртуального окружения).
    * <em class="qs"></em> Что такое __virtualenv__ (виртуальное окружение Python) и зачем оно нужно?
    * <em class="an"></em> Базовые ответы есть тут: 
        * https://pythontips.com/2013/07/30/what-is-virtualenv/
        * https://stackoverflow.com/questions/41972261/what-is-a-virtualenv-and-why-should-i-use-one
        * Важно знать, что у Anaconda есть собственный инсрументарий для работы c __virtualenv__, и если вы пользуетесь анакондой, то предпочитительно пользоваться им:
            * Шпаргалка с кратким набором команд (см. раздел "Using environments"): https://docs.conda.io/projects/conda/en/4.6.0/_downloads/52a95608c49671267e40c689e0bc00ca/conda-cheatsheet.pdf
            * Документация: https://docs.conda.io/projects/conda/en/latest/user-guide/tasks/manage-environments.html
    * Пример (`pyTorch_1_5v2` - имя нового окружения, `-f=environment.yml` - импортируем окружение из файла, созданного на шаге 3):

```console
(base) C:\Users\alpha>conda-env create -n pyTorch_1_5v2 python=3.7 -f=environment.yml
Collecting package metadata (repodata.json): done
Solving environment: done


==> WARNING: A newer version of conda exists. <==
  current version: 4.8.2
  latest version: 4.8.3

Please update conda by running

    $ conda update -n base -c defaults conda



Downloading and Extracting Packages
anaconda-navigator-1 | 4.4 MB    | ############################################################################ | 100%
Preparing transaction: done
Verifying transaction: done
Executing transaction: done
#
# To activate this environment, use
#
#     $ conda activate pyTorch_1_5v2
#
# To deactivate an active environment, use
#
#     $ conda deactivate
```
            
4. С помощью `conda env list` Просматриваем список доступных виртуальных окружений. Пример:

```console
(base) C:\Users\alpha>conda env list
# conda environments:
#
base                  *  C:\ProgramData\Anaconda3
pyTorch_1_5              C:\Users\alpha\.conda\envs\pyTorch_1_5
pyTorch_1_5v2            C:\Users\alpha\.conda\envs\pyTorch_1_5v2
```

4. С помощью команды `activate` переходим в созданное окружение. В результате имя окружения перед приглашением должно измениться на имя выбранного окружения. Пример:

```console
(base) C:\Users\alpha>activate pyTorch_1_5v2

(pyTorch_1_5v2) C:\Users\alpha>
```

<!-- <center> 
<img src="./img/lnnp2_anaconda_prompt2.png" alt="Создание новго virtualenv" style="width: 600px;"/><br/>
    <b>Создание новго virtualenv</b>    
</center>  -->

5. На сайте https://pytorch.org выбираем конфигурацию в которой необходимо установить PyTorch и копируем строку из поля __Run this Command__  и выполняем ее в консоли в новом окружении, например:

```console
(pyTorch_1_5) C:\Users\alpha>conda install pytorch torchvision cpuonly -c pytorch
```

Соглашаемся на установку новых пакетов:

```console
The following NEW packages will be INSTALLED:

  blas               pkgs/main/win-64::blas-1.0-mkl
  cpuonly            pytorch/noarch::cpuonly-1.0-0
  freetype           pkgs/main/win-64::freetype-2.9.1-ha9979f8_1
  icc_rt             pkgs/main/win-64::icc_rt-2019.0.0-h0cc432a_1
  intel-openmp       pkgs/main/win-64::intel-openmp-2020.0-166
  jpeg               pkgs/main/win-64::jpeg-9b-hb83a4c4_2
  libpng             pkgs/main/win-64::libpng-1.6.37-h2a8f88b_0
  libtiff            pkgs/main/win-64::libtiff-4.1.0-h56a325e_0
  mkl                pkgs/main/win-64::mkl-2020.0-166
  mkl-service        pkgs/main/win-64::mkl-service-2.3.0-py37hb782905_0
  mkl_fft            pkgs/main/win-64::mkl_fft-1.0.15-py37h14836fe_0
  mkl_random         pkgs/main/win-64::mkl_random-1.1.0-py37h675688f_0
  ninja              pkgs/main/win-64::ninja-1.9.0-py37h74a9793_0
  numpy              pkgs/main/win-64::numpy-1.18.1-py37h93ca92e_0
  numpy-base         pkgs/main/win-64::numpy-base-1.18.1-py37hc3f5095_1
  olefile            pkgs/main/win-64::olefile-0.46-py37_0
  pillow             pkgs/main/win-64::pillow-7.0.0-py37hcc1f983_0
  pytorch            pytorch/win-64::pytorch-1.5.0-py3.7_cpu_0
  six                pkgs/main/win-64::six-1.14.0-py37_0
  tk                 pkgs/main/win-64::tk-8.6.8-hfa6e2cd_0
  torchvision        pytorch/win-64::torchvision-0.6.0-py37_cpu
  xz                 pkgs/main/win-64::xz-5.2.5-h62dcd97_0
  zstd               pkgs/main/win-64::zstd-1.3.7-h508b16e_0


Proceed ([y]/n)? y
```

6. Проверяем успешность установки PyTorch:
  
    * В консоли, в текущем виртуальном окружении стартуем консоль Python:

```console
(pyTorch_1_5) C:\Users\alpha>python
Python 3.7.7 (default, Apr 15 2020, 05:09:04) [MSC v.1916 64 bit (AMD64)] :: Anaconda, Inc. on win32
Type "help", "copyright", "credits" or "license" for more information.
>>>```
   
   * В консоли импортируем модуль torch, и пишем тривиальное выражение с использованием torch:
```console
>>> import torch
>>> x = torch.rand(3)
```

* для выхода из консоли Python пишем:
```console
>>> exit()
```

<!--
1. В новом виртуальном окружении выполняем комадну 

```console
(pyTorch_1_5) C:\Users\alpha>pip install ipykernel
```
-->

__Добавление нового виртуального окружения к Jupyter Notebook__

1. В новом виртуальном окружении выполняем комадну настройки ipykernel (в параемтре __name__ передаем имя нового виртуального окружения):
```console
(pyTorch_1_5v2) C:\Users\alpha>python -m ipykernel install --user --name=pyTorch_1_5v2
```
* настройка `ipykernel` позволяет jupyter работать с разными языками (например: julia, R; кстати JuPyteR, называется так именно из-за поддержки работы с этими (и многими другими) языками) и разными версями Python (и, естественно, разными virtualenv). Базовое описание архитектуры jupyter дано, например, тут: https://jupyter.readthedocs.io/en/latest/architecture/how_jupyter_ipython_work.html

* Примеры работы с `ipykernel` есть тут:
    * (ищите поиском по странице `ipykernel`)  https://www.datacamp.com/community/tutorials/tutorial-jupyter-notebook
    * и тут: http://queirozf.com/entries/jupyter-kernels-how-to-add-change-remove

2. Стартуем Jupyter Notebook для нового виртуалного окружения:

<center> 
<img src="./img/lnnp2_anaconda_2.png" alt="Старт Jupyter Notebook для нового виртуалного окружения" style="width: 300px;"/><br/>
    <b>Старт Jupyter Notebook для нового виртуалного окружения</b>    
</center>


3. Стратуем Jupyter Notebook и убеждаемся что при создании нового ноутбука есть возможность выбрать новое окружение:

<center> 
<img src="./img/lnnp2_jn2.png" alt="Создание ноутбука в новом virtualenv" style="width: 650px;"/><br/>
    <b>Создание ноутбука в новом virtualenv</b>    
</center>

4. Проверяем в каком окружении мы запустили ноутбук (звездочка должна стоять напротив нужного ноутбука):

In [5]:
!conda env list

# conda environments:
#
pyTorch_1_5              C:\Users\alpha\.conda\envs\pyTorch_1_5
base                  *  C:\Users\alpha\.conda\envs\pyTorch_1_5v2



5. Проверяем что в новом ноутбуке можно успешно работать с PyTorch:

In [1]:
import torch

ModuleNotFoundError: No module named 'torch'

In [3]:
torch.__version__

'1.5.0'

In [2]:
x = torch.rand(3)

## Тензоры и опреации с ними в PyTorch <a class="anchor" id="тензоры"></a>
* [к оглавлению](#разделы)

__Что понимается под тензором в TensorFlow, PyTorch и аналогичных инструментах?__

* <em class="df"></em> __Тензор (в линейной алгербре)__ — объект линейной алгебры, линейно преобразующий элементы одного линейного пространства в элементы другого. Частными случаями тензоров являются скаляры, векторы, билинейные формы и т. п.

* Часто тензор представляют как многомерную таблицу $ d \times d \times \cdots \times d $, заполненную числами - компонентами тензора (где $d$ — размерность векторного пространства, над которым задан тензор, а число размерностей совпадает рангом (валентностью) тензора. В случае ранга 2 запись тензора на письме выглядит как матрица.

* Запись тензора в виде многомерной таблицы возможна __только после выбора базиса (системы координат)__ (кроме скаляров - тензоров размерности 0). Сам тензор как "геометрическая сущность" от выбора базиса не зависит. Это можно наглядно видеть на примере вектора (тензора ранга 1) при смене системы координат: 
    * при смене системы координат __компоненты вектора__ (и в общем случае - тензора) __меняются__ определённым образом.
    * но сам __вектор__ — как "геометрическая сущность", образом которого может быть просто направленный отрезок — __при смене системы координат не изменяется__. Это же относится и к общему случаю - тензору.

* В TensorFlow, PyTorch и  аналогичных библиотеках ключевыми объектами являются __тензоры__, но:
    * __это не настоящие тензоры линейной алгебры__, а просто __многомерные таблицы__. В частности:
        * эти тензоры __не прдедусматривают определение базиса и возможности его изменения__.
    * для тензов (многомерных таблиц) в TensorFlow определены различные операции, важные для построения графа потока вычислений для численногомоделирования ИНС и ряда других приложений.
    
* Далее под тензорами мы будем иметь в виду то, что под ними понимается в TensorFlow, PyTorch и других аналогичных библиотеках.
* __Тензоры__ в TensorFlow, PyTorch и аналогичных библиотеках в очень многих аспектах __похожы на массивы NumPy__.
    
<center> 
<img src="./img/ker_5.png" alt=""Тензоры" в TensorFlow и аналогичных инструментах." style="width: 600px;"/><br/>
    <b>"Тензоры" в TensorFlow и аналогичных инструментах.</b>    
</center> 

Тензоры в TensorFlow по логике использования и интерфейсу очень близки к `ndarray` в NumPy.
* тензор размерности 0 - скаляр
* тензор размерности 1 - вектор (одномерный массив)
* тензор размерности 2 - матрица (двухмерный массив массив)
* тензор размерности N - N-мерный массив

In [7]:
import torch
import numpy as np

---

### Создание тензоров <a class="anchor" id="создание-тензоров"></a>
* [к оглавлению](#разделы)

In [5]:
# В pytorch все основано на операциях с тензорами
# Тензоры могут иметь:
# 0 измерений - скаляры
# 1 измерение - векторы
# 2 измерения - матрицы
# 3, 4, ... измерения - тензоры

# Создание не инициализизированного тензора: torch.empty(size)
# Нужно помнить, что перед использованием такого тензора его обязательно нужно инициализировать!

x = torch.empty(1) # scalar
print(x)
x = torch.empty(3) # vector, 1D
print(x)
x = torch.empty(2,3) # matrix, 2D
print(x)
x = torch.empty(2,2,3) # tensor, 3 dimensions
print(x)
x = torch.empty(2,2,2,3) # tensor, 4 dimensions
print(x)

tensor([1.0469e-38])
tensor([ 0.0000e+00,  0.0000e+00, -5.4389e-27])
tensor([[4.3726e-05, 2.6881e-06, 4.2039e-45],
        [0.0000e+00, 1.4013e-45, 0.0000e+00]])
tensor([[[0., 0., 0.],
         [0., 0., 0.]],

        [[0., 0., 0.],
         [0., 0., 0.]]])
tensor([[[[8.9082e-39, 4.2246e-39, 1.0194e-38],
          [9.1837e-39, 8.4490e-39, 1.0102e-38]],

         [[1.0561e-38, 1.0286e-38, 7.7144e-39],
          [1.0469e-38, 9.5510e-39, 4.5001e-39]]],


        [[[4.8674e-39, 9.9184e-39, 9.0000e-39],
          [1.0561e-38, 1.0653e-38, 4.1327e-39]],

         [[8.9082e-39, 9.8265e-39, 9.4592e-39],
          [1.0561e-38, 1.0653e-38, 1.0469e-38]]]])


In [8]:
# Большинство операций с тензорами очень похожа на опреации с массивами NumPy, но часть имеют небольшие отличия: 
x_np = np.empty((2,2,3))
print(x_np)
# x_np = np.empty(2,2,3) # Ошибка!

[[[1.20556915e-311 3.16202013e-322 0.00000000e+000]
  [1.20556915e-311 4.37257913e-005 2.68810072e-006]]

 [[4.20389539e-045 1.40129846e-045 8.37699992e+169]
  [7.46072016e-038 8.24339157e-067 3.88813040e-033]]]


In [9]:
# Создание тензора, заполненного случайными значениями (равномерно распредленными в [0, 1]): torch.rand(size)
x = torch.rand(5, 3)
x

tensor([[0.7196, 0.0637, 0.9817],
        [0.7202, 0.5812, 0.4477],
        [0.9523, 0.2562, 0.3778],
        [0.4160, 0.3518, 0.2820],
        [0.6643, 0.2659, 0.4579]])

In [10]:
# Создание тензоров заполненных:
# нулями: 
x = torch.zeros(5, 3)
print(x)
# единицами: 
x = torch.ones(5, 3)
print(x)
# тензор c единицами на главной диагонали:
x = torch.eye(5, 3)
print(x)

tensor([[0., 0., 0.],
        [0., 0., 0.],
        [0., 0., 0.],
        [0., 0., 0.],
        [0., 0., 0.]])
tensor([[1., 1., 1.],
        [1., 1., 1.],
        [1., 1., 1.],
        [1., 1., 1.],
        [1., 1., 1.]])
tensor([[1., 0., 0.],
        [0., 1., 0.],
        [0., 0., 1.],
        [0., 0., 0.],
        [0., 0., 0.]])


In [11]:
# определение размера тензора:
x.size()

torch.Size([5, 3])

In [12]:
# для каждого тензора задан тип значений:
print(x.dtype) # тип заданный автоматически

# явное указание типа:
x = torch.zeros(5, 3, dtype=torch.float16)
print(x)

torch.float32
tensor([[0., 0., 0.],
        [0., 0., 0.],
        [0., 0., 0.],
        [0., 0., 0.],
        [0., 0., 0.]], dtype=torch.float16)


<center> 
<img src="./img/lnnp2_types1.png" alt="Типы тензоров в PyTorch и массивов в NumPy" style="width: 600px;"/><br/>
    <b>Типы тензоров в PyTorch и массивов в NumPy</b>    
</center> 

In [13]:
x = torch.Tensor(2, 3) # аналогично torch.empty
x

tensor([[0.0000e+00, 0.0000e+00, 2.1019e-44],
        [0.0000e+00, 1.4013e-45, 0.0000e+00]])

In [14]:
# создание тензора из данных:
x = torch.Tensor([[0.6768, 0.5198, 0.6978], 
                  [0.1581, 0.2027, 0.3723]])
x

tensor([[0.6768, 0.5198, 0.6978],
        [0.1581, 0.2027, 0.3723]])

In [15]:
# создание тензора из данных:
x = torch.tensor([[6, 51, 6],
                  [15, 0, 37]])
print(x, type(x), x.dtype)

x = torch.tensor([[6, 51, 6],
                  [15, 0, 37]], dtype=torch.float64)
print(x, type(x), x.dtype)

tensor([[ 6, 51,  6],
        [15,  0, 37]]) <class 'torch.Tensor'> torch.int64
tensor([[ 6., 51.,  6.],
        [15.,  0., 37.]], dtype=torch.float64) <class 'torch.Tensor'> torch.float64


In [16]:
# создание тензора из массива numpy:
a = np.array([1, 2, 3])
x = torch.from_numpy(a)
x

tensor([1, 2, 3], dtype=torch.int32)

In [17]:
# Carful: If the Tensor is on the CPU (not the GPU),
# both objects will share the same memory location, so changing one
# will also change the other

a[0] += 10
print(a)
print(x)

[11  2  3]
tensor([11,  2,  3], dtype=torch.int32)


In [18]:
# torch to numpy with .numpy()
# Специфика использования общего массива данных сохраняется!
b = x.numpy()
b

array([11,  2,  3])

In [19]:
# заполнение тензора значениями:
x = torch.Tensor(2, 3)
x.fill_(0.5) # функции, оканчивающиеся на _ меняют значение тензора слева от точки
x

tensor([[0.5000, 0.5000, 0.5000],
        [0.5000, 0.5000, 0.5000]])

Справка по операциям создания тензоров тут: https://pytorch.org/docs/stable/torch.html#creation-ops

---

### Операции с тензорами <a class="anchor" id="операции-тензоры"></a>
* [к оглавлению](#разделы)

#### Арифметические операции и математические функции: <a class="anchor" id="aрифметические"></a>
* [к оглавлению](#разделы)

In [20]:
x = torch.rand(2, 2)
print(f'x:\n {x}\n')
y = torch.rand(2, 2)
print(f'y:\n {y}\n')

# поэлементное сложение:
z = x + y
print(f'z = x + y:\n {z}\n')
z = torch.add(x,y)
print(f'z = torch.add(x,y):\n {z}\n')

x:
 tensor([[0.2830, 0.7729],
        [0.4965, 0.5944]])

y:
 tensor([[0.3583, 0.9232],
        [0.9019, 0.4403]])

z = x + y:
 tensor([[0.6412, 1.6961],
        [1.3984, 1.0347]])

z = torch.add(x,y):
 tensor([[0.6412, 1.6961],
        [1.3984, 1.0347]])



In [21]:
y2 = y.clone().detach() # копирование содержимого тензора в новый тензор
print(f'y2:\n {y2}\n')

# операции "in place" (помещают результат в объект слева от точки) в pytorch оканчиваются на _ :
y2.add_(x)
print(f'y2.add_(x) in place:\n {y2}\n')

y2:
 tensor([[0.3583, 0.9232],
        [0.9019, 0.4403]])

y2.add_(x) in place:
 tensor([[0.6412, 1.6961],
        [1.3984, 1.0347]])



In [22]:
# вычитание:
z = x - y
z = torch.sub(x, y)
print(f'z = torch.sub(x, y):\n {z}\n')

# умножение (поэлементное!):
z = x * y
z = torch.mul(x,y)
print(f'z = torch.mul(x,y):\n {z}\n')

# деление:
z = x / y
z = torch.div(x,y)
print(f'z = torch.div(x,y):\n {z}\n')

z = torch.sub(x, y):
 tensor([[-0.0753, -0.1504],
        [-0.4055,  0.1540]])

z = torch.mul(x,y):
 tensor([[0.1014, 0.7135],
        [0.4478, 0.2617]])

z = torch.div(x,y):
 tensor([[0.7898, 0.8371],
        [0.5505, 1.3498]])



In [23]:
print(f'x - y:\n {x - y}\n')

z = torch.abs(x - y) # полэлементный рассчет модуля
print(f'z = torch.abs(x - y):\n {z}\n')

z = x - y
z.abs_()
print(f'z.abs_():\n {z}\n')

x - y:
 tensor([[-0.0753, -0.1504],
        [-0.4055,  0.1540]])

z = torch.abs(x - y):
 tensor([[0.0753, 0.1504],
        [0.4055, 0.1540]])

z.abs_():
 tensor([[0.0753, 0.1504],
        [0.4055, 0.1540]])



In [24]:
torch.cos(x) # поэлементный рассчет cos 
# x.cos_()

tensor([[0.9602, 0.7159],
        [0.8793, 0.8285]])

In [25]:
torch.sigmoid(x) # рассчет сигмоиды
# x.sigmoid_()

tensor([[0.5703, 0.6841],
        [0.6216, 0.6444]])

Справка по математическим опреациям тут: https://pytorch.org/docs/stable/torch.html#math-operations

#### Операции, изменяющие размер тензора: <a class="anchor" id="размер"></a>
* [к оглавлению](#разделы)

In [26]:
# Операции среза (slicing) (работает аналогично NumPy):
x = torch.rand(5,3)
print(x)
print(x[1, 1]) # элемент с индексо 1, 1 (результат: тензор размерности 0!)
print(x[:, 0]) # все строки, столбец 0
print(x[1, :]) # строка 1, все столбцы

tensor([[0.7997, 0.4989, 0.1586],
        [0.1758, 0.5943, 0.3483],
        [0.4643, 0.4594, 0.6720],
        [0.3840, 0.4478, 0.9048],
        [0.2116, 0.7514, 0.1852]])
tensor(0.5943)
tensor([0.7997, 0.1758, 0.4643, 0.3840, 0.2116])
tensor([0.1758, 0.5943, 0.3483])


In [27]:
# тензор размерности 0 (скаляр), все равно остается типом 'torch.Tensor':
print(x[1,1], type(x[1,1])) 

tensor(0.5943) <class 'torch.Tensor'>


In [28]:
# получение самого значения из тензора размерности 0:
print(x[1,1].item())

0.5942692160606384


In [29]:
# итерирование по тензору:
for v in x[1, :]:
    print(v.item())

0.17581236362457275
0.5942692160606384
0.348280131816864


In [30]:
# Изменение формы тензора (reshape) с помощью torch.view():
x = torch.randn(4, 4) # матрица 4 на 4
print(x, x.size(), '\n')

tensor([[-0.8380, -0.5930,  0.4406,  1.3580],
        [ 1.4499,  0.3562,  0.7375,  0.7863],
        [ 1.1890,  1.4015,  1.5559, -1.4440],
        [-0.0319,  0.9698,  1.3826,  1.5762]]) torch.Size([4, 4]) 



In [31]:
y = x.view(16) # вектор из 16 компонент
print(y, y.size(), '\n')
z = x.view(2, 2, 4) # тензор 2 на 2 на 4
print(z, z.size(), '\n')

tensor([-0.8380, -0.5930,  0.4406,  1.3580,  1.4499,  0.3562,  0.7375,  0.7863,
         1.1890,  1.4015,  1.5559, -1.4440, -0.0319,  0.9698,  1.3826,  1.5762]) torch.Size([16]) 

tensor([[[-0.8380, -0.5930,  0.4406,  1.3580],
         [ 1.4499,  0.3562,  0.7375,  0.7863]],

        [[ 1.1890,  1.4015,  1.5559, -1.4440],
         [-0.0319,  0.9698,  1.3826,  1.5762]]]) torch.Size([2, 2, 4]) 



In [32]:
t = x.view(-1, 8)  # размер -1 означает, что размерность этой компоненты будет подобрана автоматически
print(t, t.size())

tensor([[-0.8380, -0.5930,  0.4406,  1.3580,  1.4499,  0.3562,  0.7375,  0.7863],
        [ 1.1890,  1.4015,  1.5559, -1.4440, -0.0319,  0.9698,  1.3826,  1.5762]]) torch.Size([2, 8])


<center> 
<img src="./img/lnnp2_resize1.png" alt="Операции изменения размера матриц" style="width: 300px;"/><br/>
    <b>Операции изменения размера матриц</b>    
</center> 

In [33]:
x1 = torch.rand(2,3)
print(x1)
y1 = torch.rand(2,3)
print(y1)

tensor([[0.1830, 0.2154, 0.6007],
        [0.4754, 0.8501, 0.3963]])
tensor([[0.3986, 0.9731, 0.0460],
        [0.7828, 0.7819, 0.3551]])


In [36]:
# Конкатенация (concatenation):

# Concatenates 2 tensors on zeroth dimension:
concat1 = torch.cat((x1, y1))
print(concat1, concat1.size())         

# Concatenates 2 tensors on zeroth dimension
x = torch.rand(2,3)
concat2 = torch.cat((x1, y1), dim=0)
print(concat2, concat2.size()) 

# Concatenates 2 tensors on first dimension
x = torch.rand(2,3)
concat3 = torch.cat((x1, y1), dim=1)
print(concat3, concat3.size())       

tensor([[0.1830, 0.2154, 0.6007],
        [0.4754, 0.8501, 0.3963],
        [0.3986, 0.9731, 0.0460],
        [0.7828, 0.7819, 0.3551]]) torch.Size([4, 3])
tensor([[0.1830, 0.2154, 0.6007],
        [0.4754, 0.8501, 0.3963],
        [0.3986, 0.9731, 0.0460],
        [0.7828, 0.7819, 0.3551]]) torch.Size([4, 3])
tensor([[0.1830, 0.2154, 0.6007, 0.3986, 0.9731, 0.0460],
        [0.4754, 0.8501, 0.3963, 0.7828, 0.7819, 0.3551]]) torch.Size([2, 6])


In [131]:
# Разбиение тензора (split): 
print(x1)

splitted1 = x1.split(split_size=1, dim=0)
print(splitted1, splitted1[0].size())       # 2 tensors of 2x2 and 1x2 size

splitted2 = x1.split(split_size=2, dim=1)
print(splitted2[0], splitted2[0].size(), '\n', splitted2[1], splitted2[1].size())       # 2 tensors of 2x2 and 1x2 size

tensor([[0.1249, 0.9633, 0.0452],
        [0.0543, 0.3090, 0.6743]])
(tensor([[0.1249, 0.9633, 0.0452]]), tensor([[0.0543, 0.3090, 0.6743]])) torch.Size([1, 3])
tensor([[0.1249, 0.9633],
        [0.0543, 0.3090]]) torch.Size([2, 2]) 
 tensor([[0.0452],
        [0.6743]]) torch.Size([2, 1])


In [39]:
# stack:
print(x1)
print(y1)

stacked1 = torch.stack((x1, y1), dim=0)
print(stacked1, stacked1.size()) # возвращает тензор: 2(в результате stak!) x 2 x 3 

tensor([[0.1830, 0.2154, 0.6007],
        [0.4754, 0.8501, 0.3963]])
tensor([[0.3986, 0.9731, 0.0460],
        [0.7828, 0.7819, 0.3551]])
tensor([[[0.1830, 0.2154, 0.6007],
         [0.4754, 0.8501, 0.3963]],

        [[0.3986, 0.9731, 0.0460],
         [0.7828, 0.7819, 0.3551]]]) torch.Size([2, 2, 3])


In [40]:
stacked2 = torch.stack((x1, y1), dim=1)
print(stacked2, stacked2.size()) # возвращает тензор: 2 x 2(в результате stak!) x 3 

tensor([[[0.1830, 0.2154, 0.6007],
         [0.3986, 0.9731, 0.0460]],

        [[0.4754, 0.8501, 0.3963],
         [0.7828, 0.7819, 0.3551]]]) torch.Size([2, 2, 3])


In [41]:
#sqeeze and unsqueeze
x2 = torch.rand(3, 2, 1) # a tensor of size 3x2x1
print(x2)
squeezed1 = x2.squeeze()
print(squeezed1)  # remove the 1 sized dimension

tensor([[[0.7298],
         [0.8666]],

        [[0.9598],
         [0.2414]],

        [[0.4696],
         [0.6808]]])
tensor([[0.7298, 0.8666],
        [0.9598, 0.2414],
        [0.4696, 0.6808]])


In [182]:
x3 = torch.rand(3)
print(x3)

with_fake_dimension1 = x3.unsqueeze(0)
print(with_fake_dimension1, with_fake_dimension1.size()) # added a fake zeroth dimensionz 

with_fake_dimension2 = x3.unsqueeze(1)
print(with_fake_dimension2, with_fake_dimension2.size()) # added a fake zeroth dimensionz 

tensor([0.3965, 0.5168, 0.6922])
tensor([[0.3965, 0.5168, 0.6922]]) torch.Size([1, 3])
tensor([[0.3965],
        [0.5168],
        [0.6922]]) torch.Size([3, 1])


In [44]:
# Распространение (broadcasting) - так же как в NumPy:

t1 = torch.arange(1.0, 5.0)
t3 = torch.arange(0.0, 3.0)
print(t1, t3)
tm = t1.ger(t3)
print(tm, tm.size())

tensor([1., 2., 3., 4.]) tensor([0., 1., 2.])
tensor([[0., 1., 2.],
        [0., 2., 4.],
        [0., 3., 6.],
        [0., 4., 8.]]) torch.Size([4, 3])


In [45]:
t1 * tm

RuntimeError: The size of tensor a (4) must match the size of tensor b (3) at non-singleton dimension 1

In [46]:
t1.size(), tm.size()

(torch.Size([4]), torch.Size([4, 3]))

In [50]:
print(t1.unsqueeze(1))
print(tm)

tensor([[1.],
        [2.],
        [3.],
        [4.]])
tensor([[0., 1., 2.],
        [0., 2., 4.],
        [0., 3., 6.],
        [0., 4., 8.]])


In [51]:
t1.unsqueeze(1) * tm

tensor([[ 0.,  1.,  2.],
        [ 0.,  4.,  8.],
        [ 0.,  9., 18.],
        [ 0., 16., 32.]])

In [52]:
t1.unsqueeze(1).size(), tm.size()

(torch.Size([4, 1]), torch.Size([4, 3]))

#### Операции агрегации: <a class="anchor" id="агрегации"></a>
* [к оглавлению](#разделы)

In [53]:
mat = torch.tensor(
        [[0., 1., 2.],
        [0., 2., 4.],
        [0., 3., 6.],
        [0., 4., 8.]])

# суммирование по всем элементам:
mat.sum()

tensor(30.)

In [54]:
# суммирование по оси 0:
mat.sum(dim=0)

tensor([ 0., 10., 20.])

In [55]:
# суммирование по оси 1:
mat.sum(dim=1)

tensor([ 3.,  6.,  9., 12.])

In [56]:
# получение среднего значения:

print(mat.mean())
print(mat.mean(dim=0))
print(mat.mean(dim=1))

tensor(2.5000)
tensor([0.0000, 2.5000, 5.0000])
tensor([1., 2., 3., 4.])


#### Матричные операции: <a class="anchor" id="матричные"></a>
* [к оглавлению](#разделы)

In [57]:
# Умножение (поэлементное!):

x = torch.rand(2, 2)
print(f'x:\n {x}\n')
y = torch.rand(2, 2)
print(f'y:\n {y}\n')

z = x * y
print(f'z = torch.mul(x,y):\n {z}\n')
z = torch.mul(x,y)
print(f'z = torch.mul(x,y):\n {z}\n')

x:
 tensor([[0.7255, 0.9459],
        [0.0180, 0.9965]])

y:
 tensor([[0.5618, 0.6862],
        [0.2016, 0.1258]])

z = torch.mul(x,y):
 tensor([[0.4076, 0.6491],
        [0.0036, 0.1253]])

z = torch.mul(x,y):
 tensor([[0.4076, 0.6491],
        [0.0036, 0.1253]])



In [58]:
# Умножение матрицы на вектор:

# torch.mv(input, vec, out=None) → Tensor
# Performs a matrix-vector product of the matrix input and the vector vec.
# If input is a (n \times m)(n×m) tensor, vec is a 1-D tensor of size mm , out will be 1-D of size nn .

mat = torch.randn(2, 3)
print(mat, mat.size())
vec = torch.randn(3)
print(vec, vec.size())
res = torch.mv(mat, vec)
print(res, res.size())

tensor([[ 0.2450, -0.9958,  0.3320],
        [-1.1015,  1.3226,  3.2153]]) torch.Size([2, 3])
tensor([-0.0979,  2.0161, -0.1482]) torch.Size([3])
tensor([-2.0808,  2.2977]) torch.Size([2])


In [59]:
# Умножение матрицы на матрицу:

# torch.mm(input, mat2, out=None) → Tensor
# Performs a matrix multiplication of the matrices input and mat2.
# If input is a (n×m) tensor, mat2 is a (m×p) tensor, out will be a (n×p) tensor.

mat1 = torch.randn(2, 3)
print(mat1, mat1.size())
mat2 = torch.randn(3, 3)
print(mat2, mat2.size())
res = torch.mm(mat1, mat2)
print(res, res.size())

tensor([[-1.6114,  0.1754, -0.1479],
        [-0.8400, -1.4489, -0.1735]]) torch.Size([2, 3])
tensor([[-0.2815,  0.7116, -1.1436],
        [ 0.1062,  0.8233,  1.0840],
        [ 0.4111,  1.1746, -0.1564]]) torch.Size([3, 3])
tensor([[ 0.4115, -1.1759,  2.0561],
        [ 0.0113, -1.9944, -0.5829]]) torch.Size([2, 3])


In [60]:
mat1.mm(mat2)

tensor([[ 0.4115, -1.1759,  2.0561],
        [ 0.0113, -1.9944, -0.5829]])

In [61]:
# Outer product of 2 vectors
vec1 = torch.arange(1, 4)    # Size 3
print(vec1, vec1.size())
vec2 = torch.arange(1, 3)    # Size 2
print(vec2, vec2.size())
res = torch.ger(vec1, vec2) # vec1 - рассматривается как вектор-столбец; vec2 - рассматривается как вектор-строка
print(res, res.size()) # Size 3x2

tensor([1, 2, 3]) torch.Size([3])
tensor([1, 2]) torch.Size([2])
tensor([[1, 2],
        [2, 4],
        [3, 6]]) torch.Size([3, 2])


In [62]:
vec1.ger(vec2)

tensor([[1, 2],
        [2, 4],
        [3, 6]])

__Функция matmul__

* Matrix product of two tensors: `torch.matmul(input, other, out=None)` → Tensor
* The behavior depends on the dimensionality of the tensors as follows:
    * If __both tensors are 1-dimensional__, the __dot product (scalar) is returned__.
    * If __both arguments are 2-dimensional__, the __matrix-matrix product is returned__.
    * If the __first argument is 1-dimensional and the second argument is 2-dimensional__, a 1 is prepended to its dimension for the purpose of the matrix multiply. After the matrix multiply, the prepended dimension is removed.
    * If the __first argument is 2-dimensional and the second argument is 1-dimensional__, the matrix-vector product is returned.
    * If __both arguments are at least 1-dimensional and at least one argument is N-dimensional (where N > 2)__, then a batched matrix multiply is returned. If the first argument is 1-dimensional, a 1 is prepended to its dimension for the purpose of the batched matrix multiply and removed after. If the second argument is 1-dimensional, a 1 is appended to its dimension for the purpose of the batched matrix multiple and removed after. The non-matrix (i.e. batch) dimensions are broadcasted (and thus must be broadcastable). For example, if input is a $j \times 1 \times n \times m$ tensor and other is a $k \times m \times p$ tensor, out will be an $j \times k \times n \times p$ tensor.

In [63]:
torch.arange(4)

tensor([0, 1, 2, 3])

In [64]:
torch.arange(3*4).view(3, 4)

tensor([[ 0,  1,  2,  3],
        [ 4,  5,  6,  7],
        [ 8,  9, 10, 11]])

In [65]:
# vector x vector
tensor1 = torch.randn(3)
print(tensor1, tensor1.size())
tensor2 = torch.randn(3)
print(tensor2, tensor2.size())
res = torch.matmul(tensor1, tensor2)
print(res, res.size()) # результат: скаляр

tensor([-2.5219, -1.2146,  1.3170]) torch.Size([3])
tensor([ 0.2303,  0.9512, -0.0546]) torch.Size([3])
tensor(-1.8081) torch.Size([])


In [66]:
# Вызов функции matmul можно выполнять с помощью оператора @:
tensor1 @ tensor2

tensor(-1.8081)

In [72]:
# vector x matrix 
tensor1 = torch.arange(3*4).view(3, 4)
print(tensor1, tensor1.size())
tensor2 = torch.arange(3)
print(tensor2, tensor2.size())

res = torch.matmul(tensor2, tensor1)
print(res, res.size())

tensor([[ 0,  1,  2,  3],
        [ 4,  5,  6,  7],
        [ 8,  9, 10, 11]]) torch.Size([3, 4])
tensor([0, 1, 2]) torch.Size([3])
tensor([20, 23, 26, 29]) torch.Size([4])


In [71]:
# или:
tensor2 @ tensor1

tensor([20, 23, 26, 29])

In [279]:
# matrix x vector
tensor1 = torch.arange(3*4).view(3, 4)
print(tensor1, tensor1.size())
tensor2 = torch.arange(4)
print(tensor2, tensor2.size())

res = torch.matmul(tensor1, tensor2)
print(res, res.size())

tensor([[ 0,  1,  2,  3],
        [ 4,  5,  6,  7],
        [ 8,  9, 10, 11]]) torch.Size([3, 4])
tensor([0, 1, 2, 3]) torch.Size([4])
tensor([14, 38, 62]) torch.Size([3])


In [68]:
tensor1 @ tensor2

tensor([14, 38, 62])

In [73]:
# batched matrix x broadcasted vector
tensor1 = torch.randn(10, 3, 4)
print(tensor1, tensor1.size(), '\n------------')
tensor2 = torch.randn(4)
print(tensor2, tensor2.size(), '\n------------')
res = torch.matmul(tensor1, tensor2)
print(res, res.size())

tensor([[[-0.0254,  0.7122, -2.5060,  0.5180],
         [ 0.1458, -0.8855, -0.8308,  1.5698],
         [-0.7911,  0.8250, -0.9246, -0.1922]],

        [[-0.3259, -0.8213,  1.5900, -0.1392],
         [-0.5806, -0.1336, -2.4994, -0.2150],
         [-0.1507, -1.1597,  0.4157,  0.5377]],

        [[ 0.1935, -0.6100, -0.0840, -0.2509],
         [ 0.2435,  0.0852, -0.7656, -0.5838],
         [-1.1525,  1.2272, -0.6801,  1.1422]],

        [[ 1.5298,  0.4393,  1.0724, -1.3998],
         [ 0.5910,  1.0698,  0.0492, -0.4684],
         [-0.5860,  0.3775, -0.4975,  0.1747]],

        [[ 0.6234, -1.6125,  0.0581, -0.9023],
         [ 0.8492,  0.4678,  2.2095, -0.4018],
         [-0.4183,  1.1057,  0.4946,  0.2117]],

        [[-0.4135, -1.1620, -0.4104,  0.7465],
         [-1.5399,  0.3171,  0.6196, -1.0964],
         [-1.4138, -0.7486, -0.2011, -0.4922]],

        [[-0.1190,  0.5037,  1.6496,  0.6041],
         [ 0.0585,  1.0287, -0.0672,  0.6690],
         [-0.2793, -0.8093, -1.3930, -0.2564]],


In [74]:
# batched matrix x batched matrix
tensor1 = torch.randn(10, 3, 4)
print(tensor1.size(), '\n------------')
tensor2 = torch.randn(10, 4, 5)
print(tensor2.size(), '\n------------')
res = torch.matmul(tensor1, tensor2)
print(res.size())

torch.Size([10, 3, 4]) 
------------
torch.Size([10, 4, 5]) 
------------
torch.Size([10, 3, 5])


In [75]:
# batched matrix x broadcasted matrix
tensor1 = torch.randn(10, 3, 4)
print(tensor1.size(), '\n------------')
tensor2 = torch.randn(4, 5)
print(tensor2, tensor2.size(), '\n------------')
res = torch.matmul(tensor1, tensor2)
print(res.size())

torch.Size([10, 3, 4]) 
------------
tensor([[ 2.3362,  0.1706,  0.4528,  0.8596,  1.0453],
        [-0.0351,  0.2272, -0.4056, -0.2502,  0.9134],
        [-1.5136,  0.4217,  1.3492,  0.6766,  0.9003],
        [-1.6946, -1.3057,  1.5708,  0.5506, -2.0987]]) torch.Size([4, 5]) 
------------
torch.Size([10, 3, 5])


---
# Спасибо за внимание!

---
### Технический раздел:

 * И Введение в искусственные нейронные сети
     * Базовые понятия и история
 * И Машинное обучение и концепция глубокого обучения
 * И Почему глубокое обучение начало приносить плоды и активно использоваться только после 2010 г?
     * Производительность оборудования
     * Доступность наборов данных и тестов
     * Алгоритмические достижения в области глубокого обучения
         * Улчшенные подходы к регуляризации
         * Улучшенные схемы инициализации весов
         * (повтор) Усовершенствованные методы градиентного супска
         

* Обратное распространение ошибки
 * Оптимизация
     * Стохастический градиентный спуск
     * Усовершенствованные методы градиентного супска
* Введение в PyTorch

<br/> next <em class="qs"></em> qs line 
<br/> next <em class="an"></em> an line 
<br/> next <em class="nt"></em> an line 
<br/> next <em class="df"></em> df line 
<br/> next <em class="ex"></em> ex line 
<br/> next <em class="pl"></em> pl line 
<br/> next <em class="mn"></em> mn line 
<br/> next <em class="plmn"></em> plmn line 
<br/> next <em class="hn"></em> hn line 

* Работа с графом потока вычислений нужна  для того, чтобы решить __задачу обучения многослойной ИНС__. А эта задача требует после получения резуьтатов и оценки ошибки __выполнения обратного прохода__ дающего градиент ошибки для весов (параметров) модели и последующей процедуры оптимизации весов. 

<center> 
<img src="./img/ker_7.png" alt="" style="width: 500px;"/>
<img src="./img/ker_8.png" alt="" style="width: 500px;"/>    
<img src="./img/ker_9.png" alt="" style="width: 500px;"/>        
<img src="./img/ker_10.png" alt="" style="width: 500px;"/>        
<img src="./img/ker_11.png" alt="" style="width: 500px;"/>            
<img src="./img/ker_12.png" alt="" style="width: 500px;"/>                
</center>

In [None]:
|