# Numpy

* Пакет для Python, реализующий многомерные массивы
* Массивы **статически типизированные**. Тип элементов определяется при создании массива.
* Массивы эффективно используют память.
* Методы линейной алгебры в numpy реализованы на C и Fortran, что обеспечивает хорошую производительность.
* Пакет numpy активно используется в научных проектах по всему миру.

In [None]:
import numpy as np

## Создание массивов

Существует несколько способов создания новых numpy массивов:
* через списки и кортежи Python
* используя специальные функции numpy такие, как `arange`, `linspace`, и так далее.
* вычитывая данные из файлов

### 1D массивы:

In [None]:
a = np.array([0,1,2,3])
a

In [None]:
type(a), a.dtype

In [None]:
a.ndim, a.shape, len(a)

In [None]:
b = np.array((3, 4, 5))
b

В numpy существует множество функций для генерации массивов:

#### `arange`

Генерирует значения в интервале [start, stop) с шагом step. Аналог встроенной функции Python `range`. На уровне типов они, конечно, отличаются. `np.arange` возвращает обычный numpy-массив, в то время как `range` является lazy sequence/lazy iterable и стоит в общем ряду с `list` и `tuple`. Funny fact: `range` не является итератором -- он не "иссякает", для него нельзя вызвать `next()` и можно `len()`, но, в отличие от списка, он lazy

In [None]:
x = np.arange(0, 10, 1) # аргументы: start, stop, step
type(range(10))

In [None]:
x = np.arange(-1, 1, 0.1)
x

#### `linspace` и `logspace`

`linspace` Генерирует равномерно распределенные числа, включая конечные точки.

`logspace` То же, но в логарифмической шкале.

In [None]:
np.linspace(0, 10, 10) # аргументы: start, stop, число точек

In [None]:
np.logspace(0.1, 1, 4, base=2)

#### `zeros`, `ones`, `zeros_like` и `ones_like`

In [None]:
np.zeros((5,))   # Аргумент должен быть кортежем

In [None]:
a = np.ones((4,))
a

In [None]:
b = np.zeros_like(a)
b

In [None]:
c = np.ones_like(b)
c

### Многомерные массивы

In [None]:
# Матрица
m = np.array([[1., 2.], [3., 4.]])
m

In [None]:
type(m), m.dtype

In [None]:
m.ndim, np.shape(m), len(m), np.size(m)

При попытке назначить значение другого типа будет выдана ошибка:

In [None]:
m[0,0] = 'hello' 

#### `zeros`, `ones`, `zeros_like` и `ones_like`

In [None]:
a = np.ones((3, 3))
a

In [None]:
b = np.zeros((2, 2))
b

#### Другие функции

In [None]:
c = np.eye(3) # единичная матрица
c

In [None]:
d = np.diag([3, 5, 7]) # диагональная матрица
d

### Упражнение 1
Построить диагональную матрицу, на диагонали которой расположены числа от 0 до 3.

### Упражнение 2

Создать матрицу размерности 3x3x3 со случайными значениями, имеющими равномерное распределение от 1 до 5.

## Копирование в NumPy

Как мы помним, в Python при присваивании не происходит копирование объектов. 

In [None]:
m = np.array([[1, 2], [3, 4]])
m

In [None]:
n = m

In [None]:
# Изменение N меняет M
n[0, 0] = 10
n

In [None]:
m

Глубокая копия создается в NumPy с помощью функции `copy`:

In [None]:
n = np.copy(m)

In [None]:
# теперь при изменении N M остается нетронутым
n[0,0] = -5
n

In [None]:
m

Слайсинг в numpy создает лишь представление изначального массива, т.е. копирования в памяти не происходит.

При изменении представления меняется и изначальный массив:

In [None]:
a = np.arange(10)
a

In [None]:
b = a[::2]
b

In [None]:
b[0] = 12
b

In [None]:
a # (!!)

In [None]:
a = np.arange(10)
b = a[::2].copy() # глубокое копирование
b[0] = 12
a

## Слияние массивов

Функции `vstack`, `hstack` и `concatenate` позволяются составить общий массив из нескольких массивов:

### `concatenate`

In [None]:
a = np.array([[1, 2], [3, 4]])
a

In [None]:
b = np.array([[5, 6]])
b

In [None]:
np.concatenate((a, b), axis=0)

In [None]:
np.concatenate((a, b.T), axis=1)

### `hstack` и `vstack`

In [None]:
np.vstack((a,b))

In [None]:
np.hstack((a,b.T))

## Индексация

Доступ к данным массива организуется с помощью индексов и оператора `[]`.

In [None]:
a = np.arange(10)
a

In [None]:
a[0], a[2], a[-1]

Для многомерных массивов индексами является кортеж целых чисел:

In [None]:
m = np.diag(np.arange(3))
m

In [None]:
m[1, 1]

In [None]:
m[(1, 1)]

Можно использовать "`:`" для получения доступа к целой колонке или строке: 

In [None]:
m[1, :] # строка 1

In [None]:
m[:, 2] # колонка 2

Присваивание новых значений элементам массива:

In [None]:
m[2, 1] = 10
m

In [None]:
m[1, :] = 5
m[: ,2] = -1

In [None]:
m

## Слайсинг

NumPy поддерживает слайсинг, как и списки с кортежами в Python:

In [None]:
a = np.arange(10)
a

Все три параметра слайсинга являются опциональными: по умолчанию `start` равен **0**, `end` равен последнему элемену и `step` равен **1** в `a[start:stop:step]`:

In [None]:
a[::] # все параметры слайсинга имеют значения по умолчанию

In [None]:
a[1:3]

In [None]:
a[:3]

In [None]:
a[3:]

In [None]:
a[2:9:2] 

Отрицательные индексы отсчитываются от конца массива:

In [None]:
a[-1] # последний элемент массива

In [None]:
a[-3:] # последние три элемента

Слайсы являются представлениями массива, а потому являются изменяемыми:

In [None]:
a[1:3] = [-2,-3]
a

Слайсинг работает точно так же и для многомерных массивов:

In [None]:
m = np.random.randint(1,100, size=(4, 4))
m

In [None]:
m[1:4, 1:4]

In [None]:
m[::2, ::2]

### Упражнение 3
Создать нулевую матрицу размерности 5х5 с единицами по ее "границам".

## Линейная алгебра

Код, написанный на numpy становится эффективным тогда, когда он достаточно векторизован (т.е. векторные и матричные операции используются в бОльшей части программы).

### Поэлементные операции

Все арифметические операции по умолчанию являются поэлементными:

In [None]:
a = np.arange(4)
a + 1

In [None]:
5*a

In [None]:
2**a

In [None]:
j = np.arange(5)
2**(j + 1) - j

### Операции между массивами

In [None]:
a = np.arange(4)
b = np.ones(4) + 3
print('a = ', a)
print('b = ', b)
a - b

In [None]:
a * b

Сравнения:

In [None]:
a = np.array([1, 2, 3, 4])
b = np.array([4, 2, 2, 4])
a == b

In [None]:
a > b

Логические операции:

In [None]:
a = np.array([1, 1, 0, 0], dtype=bool)
b = np.array([1, 0, 1, 0], dtype=bool)
np.logical_or(a, b)

In [None]:
a | b

In [None]:
np.logical_and(a, b)

In [None]:
a & b

Использование логических операторов позволяет обращаться к элементам массива через маску:

In [None]:
c = np.array([1, 2, 3, 4], dtype=int)
d = np.array([1, 2, 5, 6], dtype=int)
c[c == d]

### Упражнение 4
Создать случайный вектор размера 10 и найти его среднее значение.

### Упражнение 5
Создать случайную матрицу размерности 10х2, хранящую декартовы координаты. Затем конвертируйте их в полярные координаты.

### Матричная алгебра

Перемножение массивов является поэлементным. Для матричного умножения необходимо использовать функцию `dot`:

In [None]:
m = np.array([[1., 2.], [3., 4.]])
m

In [None]:
m * m

In [None]:
m.dot(m)

In [None]:
m @ m

### Трансформирование массивов

Для транспонирования матриц используется либо `.T`, либо функция `transpose`:

In [None]:
m

In [None]:
m.T

In [None]:
m.transpose()

Другие математические функции:

In [None]:
c = np.matrix([[1j, 2j], [3j, 4j]])
c

In [None]:
np.conjugate(c)

Эрмитово-сопряженная матрица(transpose + conjugate):

In [None]:
c.H

Вещественная и мнимая части могут быть получены с помощью `real` и `imag`:

In [None]:
np.real(c) # то же: c.real

In [None]:
np.imag(c) # то же: c.imag

Модули элементов матрицы:

In [None]:
np.abs(c)

### Упражнение 6
Найти ближайшее значение к числу 4 в векторе [4.3, 1.0, 3.9, 5.0, 2.0, 1.9]

### Матричные вычисления

#### inverse

In [None]:
np.linalg.inv(c) # то же: C.I 

In [None]:
c.I * c

#### determinant

In [None]:
np.linalg.det(c)

In [None]:
np.linalg.det(c.I)

## Векторизация функций

Numpy предлагает средства для создания векторизованных оберток над функциями, которые изначально принимают на вход скалярные значения.

In [None]:
def foo(x):
    if x >= 0:
        return 1
    else:
        return 0

In [None]:
foo(np.array([-3, -2, -1, 0, 1, 2, 3]))

Эта функция работает для скалярных данных. 

Чтобы это функция принимала векторные значения, необходимо провести векторизацию с помощью функии `vectorize`:

In [None]:
foo_vec = np.vectorize(foo)

In [None]:
foo_vec(np.array([-3, -2, -1, 0, 1, 2, 3]))

# Matplotlib

* Пакет для Python, используемый для создания качественных 2D визуализацией (есть минимальная поддержка 3D)
* Возможность создавать интерактивные графики
* Добавление множества графиков на один рисунок с кастомным расположением
* Экспорт в различные форматы изображений
* Есть поддержка анимаций

In [None]:
# Позволяет matplotlib отображать графики сразу в notebook.
%matplotlib inline

## Matplotlib API

Импортирование модуля `matplotlib.pyplot` под именем `plt`:

In [None]:
import matplotlib.pyplot as plt

In [None]:
import numpy as np

Простейший пример построения графиков в matplotlib:

In [None]:
x = np.linspace(-2., 2., 128, endpoint=True)
y1 = x**2
y2 = np.exp(x)
plt.plot(x, y1)
plt.plot(x, y2)
plt.xlabel(r'$x \in \mathbb{R}$', fontsize=12)
plt.ylabel(r'$y(x)$', fontsize=12)
plt.show()

Рекомендуется создавать отдельный объект для каждого более-менее сложного графика. Это можно реализоваться, например, с помощью функии `subplots`:

In [None]:
# Сетка графиков -- 1x1. Размер задается с помощью figsize.
fig, ax = plt.subplots(nrows=1, ncols=1, figsize=(8, 6))
ax.plot(x, y1, color="blue", linewidth=1.0, linestyle="-")
ax.plot(x, y2, color="green", linewidth=1.0, linestyle="--")
ax.grid()
ax.set_xlabel(r'$x$', fontsize=12)
ax.set_ylabel(r'$y$', fontsize=12)
plt.show()

Множественные графики

In [None]:
# Создаем 2 графика (в 2 колонках)
fig, axes = plt.subplots(1, 2, figsize=(10, 6))
axes[0].plot(x, y1, 'r')
axes[1].plot(x, y2, 'b')
fig.tight_layout()

## Сохранение графиков

Текущий график можно сохранить, вызвав метод `savefig` класса `Figure`:

In [None]:
fig.savefig("filename.png")

Также можно указать DPI и различные форматы:

In [None]:
fig.savefig("filename.pdf", dpi=200)

### Легенды, описания осей и графиков

**Заголовок графика**


`axes.set_title("title")`

**Описания осей**


`axes.set_xlabel("x")
axes.set_ylabel("y")`

**Легенда**

Легенды могут создаваться двумя способами. Первый -- явно через метод `legend`:

`axes.legend(["curve1", "curve2"])`

Второй метод -- использование `label="label text"` при вызове `plot` с последующим вызовом метода `legend`: 

`axes.plot(x, x**2, label="curve1")
axes.plot(x, x**3, label="curve2")
axes.legend()`

Также можно выбрать расположение легенды на графике:

`ax.legend(loc=0) # автовыбор
ax.legend(loc='upper right')
ax.legend(loc='upper left')
ax.legend(loc='lower left')
ax.legend(loc='lower right')`

Пример использования описанного выше:

In [None]:
fig, ax = plt.subplots()
ax.plot(x, x**2, label="y = x**2")
ax.plot(x, x**3, label="y = x**3")
ax.legend(loc='upper left')
ax.set_xlabel('x')
ax.set_ylabel('y')
ax.set_title('title')