# NumPy

## Виртуальное окружение

Но прежде, чем перейдём к основной теме $\text{---}$ есть ещё вещь, которую надо обсудить. Возможно, в этом курсе она не такая уж и важная, но в приличном обществе так делать принято. Я говорю о виртуальном окружении. 

Виртуальное окружение $\text{---}$ это среда, изолирующая набор установленных пакетов и версий Python от системной среды и/или от других проектов. Зачем?
1. Разные проекты могут требовать разные версии одних и тех же библиотек. Если устанавливать их без использования виртуальных окружений (т.е. глобально), то вы неизбежно наткнётесь на несовместимость. Как можете догадаться каждый раз удалять и ставить необходимую версию библиотеки для работы с тем или иным проектом $\text{---}$ не самое увлекательное занятие, поэтому используйте виртуальные окружения.
2. При переходе на другую рабочую машину можно быстро воссоздать используемое [на изначальной машине] окружение (с помощью фиксации списков пакетов в `requirements.txt`, например). Опять же, ничего не сломав при этом новой. 
3. Большое количество пакетов, скаченных однажды для какой-то мелкой задачки, может захламить систему и привести к конфликтам.
4. Возможность использовать несколько разных версий Python (например, для поддержки legacy проектов).

Более "традиционный" способ создавать виртуальные окружения с помощью терминала (и в этом абсолютно нет ничего сложного), но ввиду демонстративных целей данного курса и отсюда максимального упрощения $\text{---}$ мы сделаем это через VSCode.

1. В правом верхнем углу нажимаем кнопку "Select Kernel" (или "Python 3.x.y", где x, y версия Python).

![Select Kernel](pictures/1.png)

2. В появившемся меню нажимаем "Select Another Kernel..."

![Select Another Kernel](pictures/2.png)

3. Нажимаем "Python Environments..."

![Python Environments](pictures/3.png)

4. "Create New Environment..."

![Create New Environment](pictures/4.png)

5. "Venv"

> NB: Если вы используете конду, то вместо `.venv` выберете опцию конды. В шаге 8 изменения должны быть аналогичные.

![Venv](pictures/5.png)

6. "Use Python from \`python.defaultInterpreterPath\` setting

![default path](./pictures/6.png)

7. Ждём пока окошко в правом нижнем углу не пропадёт.

![info](./pictures/7.png)

8. Если на месте кнопки "Select Kernel" или что у вас там было в шаге №1 теперь написано ".venv (Python.3.x.y)", то у вас всё удалось. Слева, в обозревателе (напоминание: если он закрыт, то его можно открыть нажав на пиктограму двух файлов в левом верхнем углу или по комбинации клавиш `Ctrl+B`) должна появиться папка `.venv`. Если решите использовать виртуальное окружение, то не забывайте путь к этой папке (пусть она нужна будет для наших учебных целей).

Если вы не хотите использовать виртуальное окружение (зря), но всё равно выполнили все действия, то прежде, чем перейти дальше -- не забудьте вернуться к глобальной версии (нажав на кнопку выбора ядра и выбрав там то, что вам надо). С другой стороны, если вы уже создали виртуальное окружение, то зачем отказываться им пользоваться, если вещь нужная и полезная? Определитесь сами, а мы продолжим.

## О NumPy

NumPy $\text{---}$ библиотека для научных вычислений. Плюшки:
* Ndarray $\text{---}$ многомерный массив, оптимизированный для быстрых вычислений (скажите спасибо за это C (языку))
* Замена явных циклов на операции над массивами (векторизация), ускоряет вычисления
* Операции линейной алгебры, генерация псевдослучаных чисел, статистические функции и многое другое.

Зачем? Помимо вышеописанного многие библиотеки для МО и ИИ основаны на NumPy, поэтому нужно знать хотя бы его азы.

## Установка

В терминале необходимо выполнить комманду: `pip install numpy` (в случае конды: `conda install numpy`). Если вы используете виртуальное окружение, которое только что создали, то убейте терминал (нажав на пиктограмму мусорного ведра, расположенной на одном уровне с нижними вкладками (среди которых есть вкладка терминала) в правой части) и откройте новый. Ну или закройте/откройте VS Code, как вам удобнее будет.

Если следующая ячейка выполнится корректно, то значит установка прошла успешно.

In [1]:
import numpy as np

Обратим внимение на часть `as np`. `np` $\text{---}$ общепринятое сокращение для NumPy. Если убрать `as np`, то вместо `np` придётся писать `numpy`, поэтому рекомендуется сокращать и рационально использовать сэкономленное время.

## База

### Инициализация векторов и матриц

In [51]:
vec = np.array([1, 2, 3, 4]) # передаём список
matrix = np.array([          # передаём список списков
    [1, 2, 3],
    [4, 5, 6]
])

print(f'Вектор: {vec}')
print(f'Матрица:\n{matrix}\n')

print(f'Размер вектора: {vec.shape}')
print(f'Размер матрицы: {matrix.shape} (строк, столбцов)')
print(f'Длина вектора: {len(vec)}')
print(f'Длина матрицы: {len(matrix)} (sic!)')


Вектор: [1 2 3 4]
Матрица:
[[1 2 3]
 [4 5 6]]

Размер вектора: (4,)
Размер матрицы: (2, 3) (строк, столбцов)
Длина вектора: 4
Длина матрицы: 2 (sic!)


Обратите внимание на последнюю строку. *Длина* матрицы (и другого многомерного объекта) $\text{---}$ это длина *только первого* измерения, а не общее количество элементов. 

Также отметим, что все элементы должны быть одного и того же типа.

In [52]:
vec2 = np.array([1, 2.3, 3, 4])
vec3 = np.array([1, True, False, 4])
vec4 = np.array([1, True, False, 4.])
vec5 = np.array([1, 'х', 2, 3.])

template = '{:4} {:20} {:<21}'
print(template.format('vec',  str(vec),  str(vec.dtype)))
print(template.format('vec2', str(vec2), str(vec2.dtype)))
print(template.format('vec3', str(vec3), str(vec3.dtype)))
print(template.format('vec4', str(vec4), str(vec4.dtype)))
print(template.format('vec5', str(vec5), str(vec5.dtype)))

vec  [1 2 3 4]            int64                
vec2 [1.  2.3 3.  4. ]    float64              
vec3 [1 1 0 4]            int64                
vec4 [1. 1. 0. 4.]        float64              
vec5 ['1' 'х' '2' '3.0']  <U32                 


<a name="for_curious1">Для любознательных</a>: разобраться в коде выше, что именно и как он делает. 

Для всех остальных $\text{---}$ это способ красиво оформить вывод, по сути тоже самое, что и `print(vec, type(vec[0]))`. 

Как видим, при передаче разнородных элементов происходит конвертация:
* Дробное среди целых $\text{---}$ все целые становятся дробным
* Булевая среди целых $\text{---}$ `True` становится `1`, а `False` $\text{---}$ `0`.
* Случай с `vec4` разобрать самостоятельно.
* Строка $\text{---}$ конвертирует всё в строку.

#### Функции инициализации

Функция `zeros` $\text{---}$ инициализирует нулевую матрицу заданного размера (по умолчанию типа `float64`). Обратите внимание на индексацию матрицы (`[x, y]` можно использовать также, как и `[x][y]`).

In [54]:
zeros_matrix = np.zeros((2, 3)) # передаём кортеж длин измерений:
                                # (строк, столбцов)
print(zeros_matrix, type([0,0]))

[[0. 0. 0.]
 [0. 0. 0.]] <class 'numpy.float64'>


Тип можно указывать:

In [53]:
int_zeros_matrix = np.zeros((2, 3), dtype=int)
print(int_zeros_matrix, int_zeros_matrix.dtype)

[[0 0 0]
 [0 0 0]] int64


Тип данных может поменять.

In [54]:
float_zeros_matrix = int_zeros_matrix.astype(np.float64)
print(float_zeros_matrix, float_zeros_matrix.dtype)

[[0. 0. 0.]
 [0. 0. 0.]] float64


`ones` $\text{---}$ матрица, заполненная единицами (*не* единичная матрица).

In [51]:
print(np.ones((2, 3)))

[[1. 1. 1.]
 [1. 1. 1.]]


`full` $\text{---}$ создать и заполнить матрицу значением

In [53]:
print(np.full((2, 3), 6)) # второй (не третий, его тут нет) аргумент --
                          # желаемое значение

[[6 6 6]
 [6 6 6]]


`identity` и `eye` для создания единичных матриц. `identity` $\text{---}$ прямой как палка: даёшь размер (одним числом, т.к. единичная матрица по определению квадратная), получаешь матрицу.

In [55]:
print(np.identity(3))

[[1. 0. 0.]
 [0. 1. 0.]
 [0. 0. 1.]]


Функция `eye` интереснее. Она может создавать прямоугольные "единичные" матрицы, но и смещать диагональ вверх или вниз. За это отвечают аргументы `M` (количество столбцов) и `k` соответственно.

In [9]:
print('np.eye(3):')
print(np.eye(3))
print('\nnp.eye(3, M=5):')
print(np.eye(3, M=5))
print('\nnp.eye(3, M=2):')
print(np.eye(3, M=2))
print('\nnp.eye(3, k=1):')
print(np.eye(3, k=1))
print('\nnp.eye(3, k=-1):')
print(np.eye(3, k=-1))

np.eye(3):
[[1. 0. 0.]
 [0. 1. 0.]
 [0. 0. 1.]]

np.eye(3, M=5):
[[1. 0. 0. 0. 0.]
 [0. 1. 0. 0. 0.]
 [0. 0. 1. 0. 0.]]

np.eye(3, M=2):
[[1. 0.]
 [0. 1.]
 [0. 0.]]

np.eye(3, k=1):
[[0. 1. 0.]
 [0. 0. 1.]
 [0. 0. 0.]]

np.eye(3, k=-1):
[[0. 0. 0.]
 [1. 0. 0.]
 [0. 1. 0.]]


In [11]:
print('np.eye(5, M=2, k=-1):')
print(np.eye(5, M=2, k=-1))

np.eye(5, M=2, k=-1):
[[0. 0.]
 [1. 0.]
 [0. 1.]
 [0. 0.]
 [0. 0.]]


#### Создание последовательностей

##### `np.arange`

Вспоминаем про `range` из прошлого файла. Если по какой-то причине у вас не было его, то можете обновить с моего [github](https://github.com/dragondangun/em_ml)а. Та же самая идея, только возвращается `ndarray`, а также шаг может быть вещественным.

In [55]:
aranged = np.arange(3)
print(aranged)
print(aranged.dtype)

[0 1 2]
int64


In [56]:
aranged = np.arange(-2, 3)
print(aranged)
print(aranged.dtype)

[-2 -1  0  1  2]
int64


In [57]:
aranged = np.arange(-2, 2, 0.4) # здесь range бы сломался
print(aranged)
print(aranged.dtype)

[-2.0000000e+00 -1.6000000e+00 -1.2000000e+00 -8.0000000e-01
 -4.0000000e-01 -4.4408921e-16  4.0000000e-01  8.0000000e-01
  1.2000000e+00  1.6000000e+00]
float64


In [58]:
aranged = np.arange(1.1, -1, -0.4) # здесь range бы сломался
print(aranged)
print(aranged.dtype)

[ 1.1  0.7  0.3 -0.1 -0.5 -0.9]
float64


##### `np.linspace`

Идея тоже простая. Указываете начальную точку, указываете конечную (здесь **включительно**) и указываете желаемое количество точек, а функция генерирует массив равномерно расположенных точек.

In [21]:
np.linspace(-2, 2, 10)

array([-2.        , -1.55555556, -1.11111111, -0.66666667, -0.22222222,
        0.22222222,  0.66666667,  1.11111111,  1.55555556,  2.        ])

In [23]:
np.linspace(3, 2, 10) # в сторону уменьшения тоже можно

array([3.        , 2.88888889, 2.77777778, 2.66666667, 2.55555556,
       2.44444444, 2.33333333, 2.22222222, 2.11111111, 2.        ])

<a name="for_curious2">Для любознательных</a>: разобраться с функцией `logspace`. 

#### Генерация псевдослучайных чисел

Из курса теории вероятности вы знаете, что "случайность бывает разная". Есть такая штука как распределение и от него зависит как "должны вести себя случайные величины". 

Для генерации равномерно распределённой псевдойслучайной величина на полуинтервале $[0;1)$ используется функция `rand` из `numpy.random`. Можно писать так: 

In [24]:
np.random.rand()

0.9547204837595107

Можно ввести синоним (как и в случае с `np`, но в там это чуть ли не "обязательная" вещь, то здесь это вкусовщина): 

In [27]:
import numpy.random as rnd

rnd.rand()

0.4162096808724933

Можно создать матрицу из псевдослучайных (р.р) чисел, для этого передаём желаемую форму в функцию.

In [28]:
rnd.rand(3, 2)

array([[0.68702838, 0.53629233],
       [0.24807523, 0.76044603],
       [0.88669286, 0.10913238]])

Нормальное распределение, как известно, параметрическое, а значит определяется ими (а точнее мат., ожиданием и дисперсией). Следовательно для того, чтобы сгенерировать псевдослучайную величину, распределённую нормально, нужно передать эти параметры, если этого не сделать, то мы получим псевдослучайную, стандартно распределённую величину ($N(\mu=0,~\sigma=1)$).

In [36]:
rnd.normal(3, 4) # \mu = 3, \sigma = 4

1.3920549337803085

In [37]:
rnd.normal(3, 4, (2, 3)) # 2 строки, 3 столбца

array([[10.54400637,  3.97854519, -0.02990886],
       [-2.70807928, -1.08869334,  1.81491874]])

<a name="for_curious3">Для любознательных</a>: понять, что делает вызов кода ниже:

In [47]:
rnd.normal((2, 3, 2), (3, 4, 5)) 

array([ 4.36351287,  2.6259662 , -2.86410163])

Если нам нужно просто стандартное распределение, то можем воспользоваться функцией `random.randn`, которая работает по тому же принципу, как и `random.rand`.

In [49]:
rnd.randn(3,2)

array([[ 0.78520433, -1.12349732],
       [-0.45039312, -0.75701072],
       [-0.48099677,  0.3476676 ]])

<a name="for_curious4">Для любознательных</a>: найти как генерировать другие распределения.

### Атрибуты и операции

Мы уже разобрали некоторые атрибуты, как `shape` и `dtype` (тип данных элементов, если вдруг), давайте рассмотрим остальные. Для примера создадим небольшую матрицу.

In [60]:
matrix = np.array([
    [1, 2, 3],
    [4, 5, 6]
])

print(f'Число измерений {matrix.ndim}\n'\
      f'Общее число элементов: {matrix.size}')

Число измерений 2
Общее число элементов: 6


#### `reshape` (**важно**)

Давайте изменим вид нашей матрицы.

In [77]:
matrix_reshaped = matrix.reshape(3, 2)

print('Оригинал:')
print(matrix)
print('\nИзменённая:')
print(matrix_reshaped)

Оригинал:
[[0 2 3]
 [4 5 6]]

Изменённая:
[[0 2]
 [3 4]
 [5 6]]


**Важно**, данные не копируются, они передаются по ссылке, если изменится новая матрица, старая также изменится.

In [80]:
matrix_reshaped[0, 0] = 0
print('Изменённая:')
print(matrix_reshaped)
print('\nОригинальная:')
print(matrix)

Изменённая:
[[0 2]
 [3 4]
 [5 6]]

Оригинальная:
[[0 2 3]
 [4 5 6]]


Сделать "плоским". `ravel` тоже работает со ссылками.

In [82]:
array = matrix.ravel()
array

array([0, 2, 3, 4, 5, 6])

Если нужно скопировать используйте `flatten`.

In [85]:
flatted = matrix.flatten()
flatted

array([0, 2, 3, 4, 5, 6])

Изменения во `flatted` не изменят оригинальный `matrix`. 

In [86]:
flatted[0] = 1
print(flatted, '\nИсходная матрица:')
print(matrix)

[1 2 3 4 5 6] 
Исходная матрица:
[[0 2 3]
 [4 5 6]]


Продемонстрирую, что изменения в `array` (который был создан с помощью `ravel`) изменит оригинальную матрицу.

In [87]:
array[0] = 1
print(array, '\nИсходная матрица:')
print(matrix)

[1 2 3 4 5 6] 
Исходная матрица:
[[1 2 3]
 [4 5 6]]


### Индексация

Индексация одномерных массивов не отличается от индексации в "простом" Python, в том числе и слайсы/срезы, а базовую индексацию многомерных вы видели в [этом разделе](#функции-инициализации), так что без повторений двигаемся дальше. 

Во-первых, отрицательная идексация многомерных массивов работает.

In [92]:
print(matrix[-1, -1])

6


Во-вторых, для кого это было не очевидно, "одномерным индексом" в матрице индексируются строки, например ниже мы получаем первую строку из нашей матрицы. 

In [94]:
print(matrix[0])

[1 2 3]


#### Многомерные срезы

С многомерными срезами дела обстоят интереснее. 

In [99]:
matrix = (rnd.rand(3,3)*20).astype(int) # создаём случайную матрицу размером 3x3
                                        # умножаем каждый её элемент (из 
                                        # полуинтервала [0;1)) на 20 и 
                                        # конвертируем в целочисленные для 
                                        # простоты и красоты
print(matrix)

[[ 6  8  3]
 [ 6 13  9]
 [ 5  5  4]]


In [108]:
print(matrix[:2]) # первые две строки, все столбцы

[[ 6  8  3]
 [ 6 13  9]]


In [113]:
print(matrix[-1, :]) # последняя строка

[5 5 4]


In [114]:
print(matrix[:, -1]) # последний столбец

[3 9 4]


In [111]:
print(matrix[:, :2]) # все строки, первые два столбца

[[ 6  8]
 [ 6 13]
 [ 5  5]]


In [109]:
print(matrix[1:]) # последние две строки, все столбцы

[[ 6 13  9]
 [ 5  5  4]]


In [103]:
print(matrix[:, ::2]) # все строки, каждый второй столбец

[[6 3]
 [6 9]
 [5 4]]


In [110]:
print(matrix[:, 1:]) # все строки, последние два столбца

[[ 8  3]
 [13  9]
 [ 5  4]]


In [105]:
print(matrix[::2, :]) # каждая вторая строка, все столбцы

[[6 8 3]
 [5 5 4]]


In [106]:
print(matrix[::2, ::2]) # каждая вторая строка, каждый второй столбец

[[6 3]
 [5 4]]


In [107]:
print(matrix[:2, 1:]) # первые две строки, последние два столбца

[[ 8  3]
 [13  9]]


<a name="for_curious5">Для любознательных</a>: рассмотреть какие варианты я упустил (также потренироваться на матрицах большего размера).

#### Булева индексация

Идея проста. Есть массив, есть массив булевых значений того же размера. Применяем одно к другому, забираем только те элементы первого массива, которые по порядку совпали с `True`-элементами булевого массива. 

Рассмотрим на примере. Во время зарождения black metal были споры является та или иная группа истинным (true) black metal или нет. Один из критериев $\text{---}$ количество фанатов, если группа была слишком известной, то она не была настоящим black metal. Ниже представлен массив количества фанатов каких-то групп. Будем считать, что если о группе знает больше двух человек (самого исполнителя и его матери), то группа не может считаться настоящим black metal. Найдите количество true black metal групп.

In [116]:
bm_bands_fans = np.array([3, 1, 2, 5, 6, 1, 6, 7, 4, 9]) # количество фанатов
mask = bm_bands_fans <= 2 # выбираем только те, где количество фанатов не больше 2 
print(len(bm_bands_fans), len(mask)) # демонстрация того, что количество элементов одинаковое

selected = bm_bands_fans[mask] # выбираем только подходящие
print(len(selected)) # находим количестов подходящих

10 10
3


#### "Прихотливая" индексация (фанси / фэнси / fancy indexing)

Всё снова довольно просто: массивы могут быть использованы для индексации.

In [None]:
arr = np.arange(11)
print(arr[[1, 6, 7]]) # передаём список индексов
print(arr[[1, 9, 3]]) # "неправильный" порядок допустим

inds = np.array([0, 2, 4])
print(arr[inds])
inds = np.array([0, 8, 4])
print(arr[inds])

[1 6 7]
[1 9 3]
[0 2 4]
[0 8 4]


Для многомерных массивов та же история:

In [6]:
matrix = np.array([[1, 2, 3],
                  [4, 5, 6],
                  [7, 8, 9]])

print(matrix[[0, 2], :]) # первая, третья строка
print(matrix[:, [1, 2]]) # второй, третий столбец

[[1 2 3]
 [7 8 9]]
[[2 3]
 [5 6]
 [8 9]]


#### Изменение части массива

Можно изменять сразу несколько элементов в массиве (мне же не стоит уточнять, что изменить только один элемент также возможно?).

In [7]:
arr[1:4] = [100, 50, 75] # напоминаю, что последний индекс не включён
print(arr)

[  0 100  50  75   4   5   6   7   8   9  10]


### Операции над массивами и broadcasting (броадкастинг / транслирование)

#### Арифмитические операции

Операции сложения, вычитания, умножения и деления выполняются поэлементно.

In [2]:
a = np.array([1, 2, 3])
b = np.array([4, 5, 6])

print(f'Сложение: {a + b}')
print(f'Вычитание: {a - b}')
print(f'Умножение: {a * b}')
print(f'Деление: {a / b}')

Сложение: [5 7 9]
Вычитание: [-3 -3 -3]
Умножение: [ 4 10 18]
Деление: [0.25 0.4  0.5 ]


##### Операции со скалярами

In [3]:
print(f'a + 10: {a + 10}')
print(f'a * 2: {a * 2}')

a + 10: [11 12 13]
a * 2: [2 4 6]


#### Поэлементные математические функции

Можно применить одну функцию ко всем элементам массива, без использования функций высшего порядка (см. `map` в прошлом занятии).

In [4]:
print(np.sin(a))
print(np.log(a))
print(np.exp(a))

[0.84147098 0.90929743 0.14112001]
[0.         0.69314718 1.09861229]
[ 2.71828183  7.3890561  20.08553692]


#### Broadcasting

В NumPy можно выполнять арифмитические операции над массивами разных размеров, если они удовлетворяют правилам броадкастинга. Один из случаев был показан выше, взаимодействие массива и скаляра.

##### Правила

Если размеры массивов не совпадают, NumPy добавляет недостающие оси слева. Здесь `b` из `(3,)` дополнили до `(3, 3)`


In [13]:
A = np.random.randint(0, 11, (3, 3))
print('A:')
print(A, A.shape)

b = np.array([10, 20, 30])
print('b: ', b, b.shape)

print(A + b)

A:
[[0 0 1]
 [6 1 0]
 [7 1 8]] (3, 3)
b:  [10 20 30] (3,)
[[10 20 31]
 [16 21 30]
 [17 21 38]]


Если размеры осей различаются, но одна из них равна 1, NumPy расширяет её.  

Случай: вектор-столбец `A` + вектор-строка `B`. В данной ситуации `A` из `(3, 1)` дополняется до `(3, 3)`, а `b` из `(3, )` $\text{---}$ до `(3, 3)`.


In [14]:
A = np.array([[1],
              [2],
              [3]])
print('A:')
print(A, A.shape)

b = np.array([10, 20, 30])

print('b: ', b, b.shape)

print(A + b)

A:
[[1]
 [2]
 [3]] (3, 1)
b:  [10 20 30] (3,)
[[11 21 31]
 [12 22 32]
 [13 23 33]]


In [18]:
A = np.random.randint(0, 11, (1, 3, 1))
B = np.random.randint(0, 11, (3, 1, 2))

S = A + B
print('A: ')
print(A, A.shape)
print('\nB: ')
print(B, B.shape)
print('\nA+B: ')

print(S, S.shape)

A: 
[[[9]
  [8]
  [7]]] (1, 3, 1)

B: 
[[[10  6]]

 [[ 5  9]]

 [[ 3  4]]] (3, 1, 2)

A+B: 
[[[19 15]
  [18 14]
  [17 13]]

 [[14 18]
  [13 17]
  [12 16]]

 [[12 13]
  [11 12]
  [10 11]]] (3, 3, 2)


<a name="for_curious6">Для любознательных</a>: разобраться в сложении выше.

Если две оси имеют разные размеры и ни одна из них не равна `1`, то транслирование невозможно.

In [None]:
A = np.random.randint(0, 11, (3, 4))
B = np.random.randint(0, 11, (2, 4))

print(A + B) # получите ошибку

## Для любознательных

(напоминание, ссылки почему-то работают только в html и pdf версии, VS Code не хочет)

1. [Здесь](#for_curious1)
1. [Здесь](#for_curious2)
1. [Здесь](#for_curious3)
1. [Здесь](#for_curious4)
1. [Здесь](#for_curious5)
1. [Здесь](#for_curious6)