## numpy

Основная структура данных, на которой построен numpy - ndarray - n-мерный массив

ndarray имеет фиксированный размер и хранит в себе объекты одного типа. Размер определяется n-мерным вектором, элементы которого обозначают размер по каждой из осей

In [None]:
import numpy as np

#### Типы данных numpy

Целые знаковые
* np.int8
* np.int16
* np.int32
* np.int64

Целые беззнаковые
* np.uint8
* np.uint16
* np.uint32
* np.uint64

С плавающей точкой
* np.float16
* np.float32
* np.float64

#### Константы в numpy

```
np.inf - аналог математической бесконечности
np.nan - Not a Number
np.e - Постоянная Эйлера, число e
np.pi - Число пи
```

#### Математические операции в numpy

In [None]:
x = np.pi / 3

print(np.sin(x))
print(np.cos(x))
print(np.tan(x))

In [None]:
x = 0.5

print(np.arcsin(x))
print(np.arccos(x))
print(np.arctan(x))

In [None]:
x_rad = np.pi / 3
x_deg = 60

print(np.degrees(x_rad))
print(np.rad2deg(x_rad))  # Радианы в градусы

print(np.radians(x_deg))
print(np.deg2rad(x_deg))  # градусы в радианы

In [None]:
x = 2.55
y = -1.3

print(np.floor(x), np.floor(y))  # округление вниз
print(np.ceil(x), np.ceil(y))  # округление вверх
print(np.around(x, 1), np.around(y))  # Математическое округление, второй аргумент - количество знаков после запятой
print(np.trunc(x), np.trunc(y))  # Взятие целой части

In [None]:
print(np.exp(2))  # натуральная экспонента
print(np.exp2(5))  # экспонента с основанием 2
print(np.log(np.e ** 4))  # натуральный логарифм
print(np.log10(1e8))  # десятичный логарифм
print(np.log2(2 ** 14))  # логарифм с основанием 2

In [None]:
print(np.sqrt(144))  # взятие корня
print(np.cbrt(4**3))  # взятие кубического корня
print(np.square(6))  # возведение в квадрат
print(np.absolute(-5), np.abs(3 + 4 * 1j), np.fabs(-1))  # взятие модуля числа
print(np.sign(-0.5), np.sign(0), np.sign(1))  # взятие знака числа

#### Создание ndarray

Способ 1: из других типов данных

In [None]:
a_list = [i ** 2 for i in range(10)]
a_tuple = tuple(i * 5 for i in range(5))

a = np.array(a_list)
print(a, type(a))

a = np.array(a_tuple)
print(a, type(a))

Способ 2: При помощи функций создания специальных массивов

```
empty(shape[, dtype]) - возвращает новый непроинициализированный массив заданных размеров и типа
empty_like(prototype[, dtype]) - возвращает новый непроинициализированный массив с размерами и типом как у prototype
eye(N[, M, k, dtype]) - возвращает матрицу с размерами N*M (N*N, если M не указано), в которой на k-ой диагонали
расположены 1, а в остальной части - 0
identity(n[, dtype]) - возвращает единичную матрицу n*n
ones(shape[, dtype]) - возвращает новый заполненный единицами массив заданных размеров и типа
ones_like(a[, dtype]) - возвращает новый заполненный единицами массив тех же размеров и типа, что a
zeros(shape[, dtype]) - возвращает новый заполненный нулями массив заданных размеров и типа
zeros_like(a[, dtype]) - возвращает новый заполненный нулями массив тех же размеров и типа, что a
full(shape, fill_value[, dtype]) - возвращает новый заполненный fill_value массив заданных размеров и типа
full_like(a, fill_value[, dtype]) - возвращает новый заполненный fill_value массив тех же размеров и типа, что a

```

In [None]:
sample = np.array([[1, 2, 3, 4],
                   [4, 3, 2, 1]])

In [None]:
print(np.empty((3, 5), np.float32))
print(np.empty_like(sample))

In [None]:
print(np.eye(5), end='\n\n')
print(np.eye(6, 5, -1))

In [None]:
print(np.identity(5))

In [None]:
print(np.ones((2, 3, 4)), end='\n\n')
print(np.ones_like(sample))

In [None]:
print(np.zeros((3, 5)), end='\n\n')
print(np.zeros_like(sample))

In [None]:
print(np.full((4, 4), 1j), end='\n\n')
print(np.full_like(sample, 1 + 1j, complex))

Способ 3: при помощи функций разбиений

```
arange([start,] stop[, step,][, dtype]) - возвращает массив с числами start, start + step, start + 2 * step, ...,
start + n * step, где start + n * step < stop, а start + (n + 1) * step >= stop
linspace(start, stop[, num, endpoint]) - возвращает массив из num чисел, равномерно охватывающих интервал [start, stop),
если endpoint = False, и [start, stop], если endpoint=True
logspace(start, stop[, num, endpoint, base]) - аналог linspace на логарифмической шкале
```

In [None]:
print(np.arange(10.), end='\n\n')
print(np.arange(0.5, 10.), end='\n\n')
print(np.arange(0., 1e-6, 1e-7, dtype=np.float16))

In [None]:
print(np.linspace(start=0, stop=9, num=10), end='\n\n')
print(np.linspace(0, 9, 10, endpoint=False), end='\n\n')
print(np.linspace(0, 20, 21, dtype=int))

In [None]:
print(np.logspace(0, 10, 10, endpoint=False, base=2))

#### Операции с элементами ndarray

numpy поддерживает векторные операции, при которых функции работают поэлементно с каждым элементом массива. К таким операциям относятся все описанные выше математические операции; математические операции, применяемые между массивами или между массивом и числом; некоторые другие функции numpy



In [None]:
a = np.array([[1, 2, 3, 4],
              [6, 5, 4, 3],
              [4, 5, 6, 7]])

print(np.exp2(a), end='\n\n')
print(np.log(a), end='\n\n')
print(np.sqrt(a), end='\n\n')
print(np.around(a / 3.))

In [None]:
print(a + 3, end='\n\n')
print(a - 1, end='\n\n')
print(a * 2, end='\n\n')
print(a ** 2, end='\n\n')
print(a + np.ceil(a / 3.), '\n\n')
print(a > 4, end='\n\n')
print(a <= 4)

In [None]:
print(np.clip(a, 2, 5))  # clip(arr, a_min, a_max) - "урезает" все элементы arr до диапазона [a_min, a_max]

ndarray поддерживает операции между массивами с формами $(d_1, d_2, ..., d_n)$ и $(a_1, a_2, ..., a_n)$, где $a_i$ - или 1, или $d_i$

In [None]:
a = np.zeros((3, 3, 3))
b = np.array([[[1, 2, 3],
               [4, 5, 6],
               [7, 8, 9]]])

print(a, a.shape, end='\n\n')

print(f"b:\n{b}\nb shape: {b.shape}\n")
print(f"a + b:\n{a + b}\n\n")

b = np.array([[[1, 2, 3]],
               [[4, 5, 6]],
               [[7, 8, 9]]])
print(f"b:\n{b}\nb shape: {b.shape}\n")
print(f"a + b:\n{a + b}\n\n")

b = np.array([[[1], [2], [3]],
               [[4], [5], [6]],
               [[7], [8], [9]]])
print(f"b:\n{b}\nb shape: {b.shape}\n")
print(f"a + b:\n{a + b}\n\n")

In [None]:
a = np.zeros((3, 3, 3))
b = np.array([[[1, 2, 3]]])

print(a, a.shape, end='\n\n')

print(f"b:\n{b}\nb shape: {b.shape}\n")
print(f"a + b:\n{a + b}\n\n")

b = np.array([[[1],
               [2],
               [3]]])
print(f"b:\n{b}\nb shape: {b.shape}\n")
print(f"a + b:\n{a + b}\n\n")

b = np.array([[[1]],
               [[2]],
               [[3]]])
print(f"b:\n{b}\nb shape: {b.shape}\n")
print(f"a + b:\n{a + b}\n\n")

In [None]:
a = np.zeros((3, 3, 3))
b = np.array([[[1]]])

print(a, a.shape, end='\n\n')

print(f"b:\n{b}\nb shape: {b.shape}\n")
print(f"a + b:\n{a + b}\n\n")


Также, если первый массив имеет форму $(d_1, d_2, ..., d_n)$, а второй $(a_k, a_{k+1}, ..., a_n)$, $k > 1$, то перед применением операции он будет расширен до массива с формой $(1, 1, ..., 1, a_k, a_{k+1}, ..., a_n)$

In [None]:
a = np.zeros((3, 3, 3))

print(a, a.shape, end='\n\n')

b = np.array([[1], [2], [3]])

print(f"b:\n{b}\nb shape: {b.shape}\n")
print(f"a + b:\n{a + b}\n\n")

b = np.array([1, 2, 3])

print(f"b:\n{b}\nb shape: {b.shape}\n")
print(f"a + b:\n{a + b}\n\n")


#### Индексирование массивов

ndarray поддерживает взятие по индексу и срезы по нескольким осям одновременно

In [None]:
# Для индексирования необходимо знать размеры массивов. Следующие функции позволят получить эту информацию

a = np.array(list(range(3 * 4 * 5))).reshape((3, 4, 5))

print("a.size:", a.size)  # общее количество элементов
print("a.ndim:", a.ndim)  # размерность массива
print("a.shape:", a.shape)  # форма массива - размер по каждой из осей
print("len(a):", len(a))  # то же, что a.shape[0]

In [None]:
a = np.array(list(range(3 ** 3))).reshape((3, 3, 3))

print(a)

In [None]:
print(a[0], end='\n\n')
print(a[0, 0], end='\n\n')
print(a[0, 0, 0])

In [None]:
print(a[..., 0])  # то же, что a[:, :, 0]

In [None]:
print(a[1, :, 1])
print(a[2, 0, :])
print(a[:, 1, 2])

In [None]:
print(a[0, 1:, 1:], end='\n\n')
print(a[:2, 1, 1::-1], end='\n\n')
print(a[1::-1, ::2, 2])

Также ndarray поддерживает индексирование при помощи булевых масок

In [None]:
a = np.array([1, 2, 3, 4, 5])
mask = np.array([False, True, True, False, True])
print(a[mask])

In [None]:
# Важно, чтобы значения в маске были именно булевы, а не другого типа данных, так как иначе numpy воспримет их как индексы

mask = np.array([0, 1, 1, 0, 1])
print(a[mask])

In [None]:
# Индексирование при помощи булевых масок удобно использовать с поэлементными операциями над массивами

a = np.array([9, 2, 5, 3, 1, 8, -5, 9, 3, 0, -1, 2]).reshape((3, 4))
print(a, end='\n\n')

print(a[a > 0], end='\n\n')  # получение положительных элементов массива
print(a[np.abs(a) > 3], end='\n\n')  # получение элементов, по модулю больше 3

a[a < 0] = 0 # обнуление отрицательных элементов массива
print(a, end='\n\n')

In [None]:
# Для комбинирования нескольких условий необходимо использовать поэлементные логические операции &, |, а не их обычные версии

print(a[(2 < a) & (a <= 5)], end='\n\n')

a[(a <= 2) | (7 <= a)] *= -1

print(a)

#### Изменение размеров и формы массивов

In [None]:
a = np.array(list(range(12)))
print(f"a:\n{a}\na shape: {a.shape}\n")

a = a.reshape((3, 4))
print(f"a:\n{a}\na shape: {a.shape}\n")

a = np.reshape(a, (2, 2, 3))
print(f"a:\n{a}\na shape: {a.shape}\n")

a = np.reshape(a, (-1, 1))
print(f"a:\n{a}\na shape: {a.shape}\n")

a = a.flatten()
print(f"a:\n{a}\na shape: {a.shape}\n")

In [None]:
a = np.array(list(range(2 * 3 * 4))).reshape((2, 3, 4))
print(f"a:\n{a}\na shape: {a.shape}\n")

b = np.moveaxis(a, 0, 1)
print(f"b:\n{b}\nb shape: {b.shape}\n")

b = np.moveaxis(a, 0, 2)
print(f"b:\n{b}\nb shape: {b.shape}\n")

b = np.moveaxis(a, 1, 2)
print(f"b:\n{b}\nb shape: {b.shape}\n")

In [None]:
a = np.array(list(range(2 * 3 * 4))).reshape((2, 3, 4))
print(f"a:\n{a}\na shape: {a.shape}\n")

b = np.swapaxes(a, 0, 1)
print(f"b:\n{b}\nb shape: {b.shape}\n")

b = np.swapaxes(a, 0, 2)  #
print(f"b:\n{b}\nb shape: {b.shape}\n")

b = np.swapaxes(a, 1, 2)  #
print(f"b:\n{b}\nb shape: {b.shape}\n")

In [None]:
a = np.array(list(range(2 * 3 * 4))).reshape((2, 3, 4))
print(f"a:\n{a}\na shape: {a.shape}\n")

b = a.T
print(f"b:\n{b}\nb shape: {b.shape}\n")

b = np.transpose(a)
print(f"b:\n{b}\nb shape: {b.shape}\n")

b = np.transpose(a, [2, 0, 1])
print(f"b:\n{b}\nb shape: {b.shape}\n")

In [None]:
a = np.array(list(range(3 * 4))).reshape((3, 4))
print(f"a:\n{a}\na shape: {a.shape}\n")

b = a[..., np.newaxis]  # то же что a.reshape((3, 4, 1))
print(f"b:\n{b}\nb shape: {b.shape}\n")

b = a[:, np.newaxis, :]
print(f"b:\n{b}\nb shape: {b.shape}\n")

b = a[np.newaxis, ...]
print(f"b:\n{b}\nb shape: {b.shape}\n")

In [None]:
a = np.array(list(range(3 * 4))).reshape((1, 1, 3, 1, 4, 1))
print(f"a:\n{a}\na shape: {a.shape}\n")

b = np.squeeze(a)
print(f"b:\n{b}\nb shape: {b.shape}\n")

b = np.squeeze(a, (0, 1, 3))
print(f"b:\n{b}\nb shape: {b.shape}\n")

In [None]:
a = np.array(list(range(3 * 4))).reshape((3, 4))
b = a + 3 * 4
print(f"a:\n{a}\na shape: {a.shape}\n")
print(f"b:\n{b}\nb shape: {b.shape}\n")

c = np.concatenate((a, b), axis=0)
print(f"concatenate axis 0:\n{c}\nshape: {c.shape}\n")

c = np.concatenate((a, b), axis=1)
print(f"concatenate axis 1:\n{c}\nshape: {c.shape}\n")

b = np.array(list(range(3 * 4, 3 * 4 + 3 * 2))).reshape((3, 2))
print(f"b:\n{b}\nb shape: {b.shape}\n")

c = np.concatenate((a, b), axis=1)
print(f"concatenate axis 1:\n{c}\nshape: {c.shape}\n")

print("concatenate axis 0:")
try:
    c = np.concatenate((a, b), axis=0)
    print(f"c:\n{c}\nc shape: {c.shape}\n")
except ValueError as e:
    print(e)


In [None]:
a = np.array(list(range(3 * 4))).reshape((3, 4))
b = a + 3 * 4
print(f"a:\n{a}\na shape: {a.shape}\n")
print(f"b:\n{b}\nb shape: {b.shape}\n")

c = np.stack((a, b), axis=0)
print(f"stack axis 0:\n{c}\nshape: {c.shape}\n")

c = np.stack((a, b), axis=1)
print(f"stack axis 1:\n{c}\nshape: {c.shape}\n")

c = np.stack((a, b), axis=2)
print(f"stack axis 2:\n{c}\nshape: {c.shape}\n")

In [None]:
a = np.array(list(range(3 * 4))).reshape((3, 4))
b = np.array(list(range(3 * 2))).reshape((3, 2)) + 3 * 4
c = np.array(list(range(3 * 1))).reshape((3, 1)) + 3 * 6
print(f"a:\n{a}\na shape: {a.shape}\n")
print(f"b:\n{b}\nb shape: {b.shape}\n")
print(f"c:\n{c}\nc shape: {c.shape}\n")

d = np.hstack((a, b, c))
print(f"hstack of a, b, c:\n{d}\nshape: {d.shape}\n")

In [None]:
a = np.array(list(range(5 * 3))).reshape((5, 3))
b = np.array(list(range(3 * 3))).reshape((3, 3)) + 5 * 3
c = np.array(list(range(1 * 3))).reshape((1, 3)) + 8 * 3
print(f"a:\n{a}\na shape: {a.shape}\n")
print(f"b:\n{b}\nb shape: {b.shape}\n")
print(f"c:\n{c}\nc shape: {c.shape}\n")

d = np.vstack((a, b, c))
print(f"vstakc of a, b, c:\n{d}\nshape: {d.shape}\n")

In [None]:
a = np.array(list(range(10)))

print(a)
print(np.split(a, [2, 6]))

In [None]:
a = np.array(list(range(8 * 3))).reshape((8, 3))

print(a, end='\n\n')
print(*np.split(a, [2, 6], axis=0), sep='\n')

In [None]:
a = np.array(list(range(5)))
b = np.tile(a, 5)

print(b, end='\n\n')
print(b.reshape((-1, a.shape[0])))


In [None]:
a = np.array(list(range(2 * 3 * 4))).reshape((2, 3, 4))
print(f"a:\n{a}\na shape: {a.shape}\n")

b = np.flip(a, axis=0)
c = np.flip(a, axis=1)
d = np.flip(a, axis=2)

print(f"flip axis 0:\n{b}\nshape: {b.shape}\n")
print(f"flip axis 1:\n{c}\nshape: {c.shape}\n")
print(f"flip axis 2:\n{d}\nshape: {d.shape}\n")

#### Математические операции над массивами

In [None]:
a = np.array(list(range(3 * 4))).reshape((3, 4))

print(f"a:\n{a}\na shape: {a.shape}\n")

print(f"sum: {np.sum(a)}")
print(f"sum axis 0: {np.sum(a, axis=0)}")
print(f"sum axis 1: {np.sum(a, axis=1)}")

print(f"prod: {np.prod(a)}")
print(f"prod axis 0: {np.prod(a, axis=0)}")
print(f"prod axis 1: {np.prod(a, axis=1)}")

In [None]:
a = np.array(list(range(2 * 3 * 4))).reshape((2, 3, 4))

print(f"a:\n{a}\na shape: {a.shape}\n")

print(f"sum axis 0:\n{np.sum(a, axis=0)}")
print(f"sum axis 1:\n{np.sum(a, axis=1)}")
print(f"sum axis 2:\n{np.sum(a, axis=2)}")

print(f"sum axis (0, 1): {np.sum(a, axis=(0, 1))}")
print(f"sum axis (0, 2): {np.sum(a, axis=(0, 2))}")
print(f"sum axis (1, 2): {np.sum(a, axis=(1, 2))}")


In [None]:
a = np.arange(3 * 4).reshape((3, 4))
b = np.arange(4 * 5).reshape((4, 5))

print(a @ b)

In [None]:
a = np.arange(1, 10)

print(np.cumsum(a))
print(np.cumprod(a))

In [None]:
a = np.arange(1, 10)
b = np.arange(10, 1, -1)

print(np.fmax(a, b))
print(np.fmin(a, b))


In [None]:
a = np.array([3, 0, 8, -3, 7, 3, 6, 0])

print("mean a:", np.mean(a), "- среднее значение элементов массива")
print("std a:", np.std(a), "- среднеквадратичное отклонение элементов массива")
print("median a:", np.median(a), "- медианное значение массива")

#### Сортировка и поиск по массиву

In [None]:
a = np.array([5, 2, 0, 1, 6, 10, -6, 2, -6, 7, 3, -7])

print("argmax a:", np.argmax(a), "- индекс максимального элемента")
print("argmin a:", np.argmin(a), "- индекс минимального элемента")
print("unique a:", np.unique(a), "- набор уникальных элементов массива")

In [None]:
print("sort a:", np.sort(a), "- отсортированный массив")
print("argsort a:", np.argsort(a), "- возвращает индексы отсортированных элементов в изначальном массиве")

```np.where(condition, a, b)``` - если на очередной итерации condition явялется True, берётся значение x (или очередное значение x, если x - iterable), иначе - y

In [None]:
print(np.where(np.abs(a) > 3, a, -1))