# 8. NumPy

NumPy:
* Пакет для Python, реализующий многомерные массивы
* Массивы **статически типизированные**. Тип элементов определяется при создании массива.
* Массивы эффективно используют память.
* Методы линейной алгебры в NumPy реализованы на C и Fortran, что обеспечивает хорошую производительность.
* Пакет NumPy активно используется в научных проектах по всему миру.

Для использования NumPy необходимо импортировать модуль numpy:

In [None]:
import numpy as np

## 8.1 Создание массивов

Существует несколько способов создания новых NumPy массивов:
* через списки и кортежи Python
* используя специальные функции NumPy такие, как `arange`, `linspace`, и так далее.
* вычитывая данные из файлов

### 8.1.1 1D массивы:

In [None]:
a = np.array([0,1,2,3])
a

In [None]:
type(a), a.dtype

In [None]:
a.ndim, a.shape, len(a)

In [None]:
b = np.array((3, 4, 5))
b

В NumPy существует множество функций для генерации массивов:

<p style="font-size:16px"><b>`arange`</p></b>

Генерирует значения в интервале [start, stop) с шагом step. Аналог встроенной функции Python `range`.

In [None]:
x = np.arange(0, 10, 1) # аргументы: start, stop, step
x

In [None]:
x = np.arange(-1, 1, 0.1)
x

<p style="font-size:16px"><b>`linspace` и `logspace`</b></p>

`linspace` Генерирует равномерно распределенные числа, включая конечные точки.

`logspace` То же, но в логарифмической шкале.

In [None]:
np.linspace(0, 10, 10) # аргументы: start, stop, число точек

In [None]:
np.logspace(0.1, 1, 4, base=2)

<p style="font-size:16px"><b>`zeros`, `ones`, `zeros_like` и `ones_like`</b></p>

In [None]:
np.zeros((5,))   # Аргумент должен быть кортежем

In [None]:
a = np.ones((4,))
a

In [None]:
b = np.zeros_like(a)
b

In [None]:
c = np.ones_like(b)
c

### 8.1.2 Многомерные массивы

In [None]:
# Матрица
M = np.array([[1., 2.], [3., 4.]])
M

In [None]:
type(M), M.dtype

In [None]:
M.ndim, np.shape(M), len(M), np.size(M)

При попытке назначить значение другого типа будет выдана ошибка:

In [None]:
M[0,0] = 'hello' 

<p style="font-size:16px"><b>`zeros`, `ones`, `zeros_like` и `ones_like`</b></p>

In [None]:
a = np.ones((3, 3))
a

In [None]:
b = np.zeros((2, 2))
b

<p style="font-size:16px"><b>Другие функции</b></p>

In [None]:
c = np.eye(3) # единичная матрица
c

In [None]:
d = np.diag(np.arange(4)) # диагональная матрица
d

## 8.2 Копирование в NumPy

Как мы помним, в Python при присваивании не происходит копирование объектов. 

In [None]:
M = np.array([[1, 2], [3, 4]])
M

In [None]:
N = M 

In [None]:
# Изменение N меняет M
N[0, 0] = 10
N

In [None]:
M

Глубокая копия создается в NumPy с помощью функции `copy`:

In [None]:
N = np.copy(M)

In [None]:
# теперь при изменении N M остается нетронутым
N[0,0] = -5
N

In [None]:
M

Слайсинг в NumPy создает лишь представление изначального массива, т.е. копирования в памяти не происходит.

При изменении представления меняется и изначальный массив:

In [None]:
a = np.arange(10)
a

In [None]:
b = a[::2]; b

In [None]:
b[0] = 12
b

In [None]:
a # (!!)

In [None]:
a = np.arange(10)
b = a[::2].copy() # глубокое копирование
b[0] = 12
a

## 8.3 Слияние массивов

Функции `vstack`, `hstack` и `concatenate` позволяются составить общий массив из нескольких массивов:

<p style="font-size:22px"><b>`concatenate`</b></p>

In [None]:
a = np.array([[1, 2], [3, 4]])
a

In [None]:
b = np.array([[5, 6]])
b

In [None]:
np.concatenate((a, b), axis=0)

In [None]:
np.concatenate((a, b.T), axis=1)

<p style="font-size:22px"><b>`hstack` и `vstack`</b></p>

In [None]:
np.vstack((a,b))

In [None]:
np.hstack((a,b.T))

## 8.4 Индексация

Доступ к данным массива организуется с помощью индексов и оператора `[]`.

In [None]:
a = np.arange(10)
a

In [None]:
a[0], a[2], a[-1]

Для многомерных массивов иднексами является кортеж целых чисел:

In [None]:
M = np.diag(np.arange(3))
M

In [None]:
M[1, 1]

Можно использовать "`:`" для получения доступа к целой колонке или строке: 

In [None]:
M[1, :] # строка 1

In [None]:
M[:, 1] # колонка 1

Присваивание новых значений элементам массива:

In [None]:
M[2, 1] = 10
M

In [None]:
M[1, :] = 5
M[: ,2] = -1

In [None]:
M

## 8.5 Слайсинг

NumPy поддерживает слайсинг, как и списки с кортежами в Python:

In [None]:
a = np.arange(10)
a

Все три параметра слайсинга являются опциональными: по умолчанию `start` равен **0**, `end` равен последнему элемену и `step` равен **1** в `a[start:stop:step]`:

In [None]:
a[::] # все параметры слайсинга имеют значения по умолчанию

In [None]:
a[1:3]

In [None]:
a[:3]

In [None]:
a[3:]

In [None]:
a[2:9:2] 

Отрицательные индексы отсчитываются от конца массива:

In [None]:
a[-1] # последний элемент массива

In [None]:
a[-3:] # последние три элемента

Слайсы являются представлениями массива, а потому являются изменяемыми:

In [None]:
a[1:3] = [-2,-3]
a

Слайсинг работает точно так же и для многомерных массивов:

In [None]:
M = np.random.randint(1,100, size=(4, 4))
M

In [None]:
M[1:4, 1:4]

In [None]:
M[::2, ::2]

## 8.4 Линейная алгебра

Код, написанный на NumPy становится эффективным тогда, когда он достаточно векторизован (т.е. векторные и матричные операции используются в бОльшей части программы).

### 8.4.1 Поэлементные операции

** Все арифметические операции по умолчанию являются поэлементными: **

In [None]:
a = np.arange(4)
a + 1

In [None]:
5*a

In [None]:
2**a

In [None]:
j = np.arange(5)
2**(j + 1) - j

### 8.4.2 Операции между массивами

In [None]:
a = np.arange(4)
b = np.ones(4) + 3
print('a = ', a)
print('b = ', b)
a - b

In [None]:
a * b

Сравнения:

In [None]:
a = np.array([1, 2, 3, 4])
b = np.array([4, 2, 2, 4])
a == b

In [None]:
a > b

Логические операции:

In [None]:
a = np.array([1, 1, 0, 0], dtype=bool)
b = np.array([1, 0, 1, 0], dtype=bool)
np.logical_or(a, b)

In [None]:
np.logical_and(a, b)

### 8.4.3 Матричная алгебра

Перемножение массивов является поэлементным. Для матричного умножения необходимо использовать функцию `dot`:

In [None]:
M = np.array([[1., 2.], [3., 4.]])
M

In [None]:
M * M

In [None]:
M.dot(M)

### 8.4.4 Трансформирование массивов

Для транспонирования матриц используется либо `.T`, либо функция `transpose`:

In [None]:
M

In [None]:
M.T

In [None]:
M.transpose()

Другие математические функции:

In [None]:
C = np.matrix([[1j, 2j], [3j, 4j]])
C

In [None]:
np.conjugate(C)

Эрмитово-сопряженная матрица(transpose + conjugate):

In [None]:
C.H

Вещественная и мнимая части могут быть получены с помощью `real` и `imag`:

In [None]:
np.real(C) # то же: C.real

In [None]:
np.imag(C) # то же: C.imag

Модули элементов матрицы:

In [None]:
np.abs(C)

### 8.4.5 Матричные вычисления

<p style="font-size:18px"><b>inverse</b></p>

In [None]:
np.linalg.inv(C) # то же: C.I 

In [None]:
C.I * C

<p style="font-size:18px"><b>determinant</b></p>

In [None]:
np.linalg.det(C)

In [None]:
np.linalg.det(C.I)

## 8.5 Векторизация функций

NumPy предлагает средства для создания векторизованных оберток над функциями, которые изначально принимают на вход скалярные значения.

In [None]:
def Theta(x):
    if x >= 0:
        return 1
    else:
        return 0

In [None]:
Theta(np.array([-3,-2,-1,0,1,2,3]))

Эта функция работает для скалярных данных. 

Чтобы это функция принимала векторные значения, необходимо провести векторизацию с помощью функии `vectorize`:

In [None]:
Theta_vec = np.vectorize(Theta)

In [None]:
Theta_vec(np.array([-3,-2,-1,0,1,2,3]))

# 9. Matplotlib

In [None]:
# Позволяет matplotlib отображать графики сразу в notebook.
%matplotlib inline

## 10.1 Matplotlib API

Импортирование модуля `matplotlib.pyplot` под именем `plt`:

In [None]:
import matplotlib
import matplotlib.pyplot as plt

In [None]:
import numpy as np

Простейший пример построения графиков в matplotlib:

In [None]:
x = np.linspace(-2., 2., 128, endpoint=True)
y1 = x**2
y2 = np.exp(x)
plt.plot(x, y1)
plt.plot(x, y2)
plt.show()

Рекомендуется создавать отдельный объект для каждого более-менее сложного графика. Это можно реализоваться, например, с помощью функии `subplots`:

In [None]:
# Сетка графиков -- 1x1. Размер задается с помощью figsize.
fig, axes = plt.subplots(nrows=1, ncols=1, figsize=(8, 6), dpi=100)

axes.plot(x, y1, color="blue", linewidth=1.0, linestyle="-")

axes.plot(x, y2, color="green", linewidth=1.0, linestyle="--")

axes.grid()

plt.show()

** Множественные графики **

In [None]:
# Создаем 2 графика (в 2 колонках)
fig, axes = plt.subplots(nrows=1, ncols=2, figsize=(10, 6))

axes[0].plot(x, y1, 'r')

axes[1].plot(x, y2, 'b')

fig.tight_layout() 

## 10.2 Сохранение графиков

Текущий график можно сохранить, вызвав метод `savefig` класса `Figure`:

In [None]:
fig.savefig("filename.png")

Также можно указать DPI и различные форматы:

In [None]:
fig.savefig("filename.pdf", dpi=200)

### 10.3 Легенды, описания осей и графиков

**Заголовок графика**


`axes.set_title("title")`

**Описания осей**


`axes.set_xlabel("x")
axes.set_ylabel("y")`

**Легенда**

Легенды могут создаваться двумя способами. Первый -- явно через метод `legend`:

`axes.legend(["curve1", "curve2"])`

Второй метод -- использование `label="label text"` при вызове `plot` с последующим вызовом метода `legend`: 

`axes.plot(x, x**2, label="curve1")
axes.plot(x, x**3, label="curve2")
axes.legend()`

Также можно выбрать расположение легенды на графике:

`ax.legend(loc=0) # автовыбор
ax.legend(loc='upper right')
ax.legend(loc='upper left')
ax.legend(loc='lower left')
ax.legend(loc='lower right')`

Пример использования описанного выше:

In [None]:
fig, ax = plt.subplots()

ax.plot(x, x**2, label="y = x**2")
ax.plot(x, x**3, label="y = x**3")
ax.legend(loc='upper left');
ax.set_xlabel('x')
ax.set_ylabel('y')
ax.set_title('title');