In [None]:
"""Глава 16."""

In [2]:
import numpy as np

# Основные операции над массивами NumPy

In [3]:
d_ = np.array([1, 2])
s_ = np.ones(2)

In [4]:
d_

array([1, 2])

In [5]:
s_

array([1., 1.])

In [7]:
o_ = d_ + s_
o_

array([2., 3.])

In [9]:
i_ = d_ - s_
i_

array([0., 1.])

In [26]:
u_ = d_**2  # d_ * d_ тоже работает
u_

array([1, 4])

In [37]:
f_ = np.array([[2, 4, 5, 7], [4, 5, 5, 2]])

y_ = np.array([[2, 3, 5, 9], [4, 2, 5, 8], [19, 25, 5, 2], [9, 12, 8, 3]])

e_ = f_ @ y_  # умножение по правилам линейной алгебры

e_

array([[178, 223, 111,  81],
       [141, 171,  86,  92]])

In [38]:
w_ = e_ * 2
w_

array([[356, 446, 222, 162],
       [282, 342, 172, 184]])

# Универсальные функции

В NumPy есть стандартные математические функции, такие как синус, косинус и экспонента. В NumPy они называются универсальными функциями (ufunc) и вы­полняются поэлементно, создавая на выходе новый массив


![image.png](attachment:image.png)

# Транслирование

Например, у вас есть массив (назовем его data), содержащий информа­ цию о расстояниях в милях, но вы хотите преобразовать мили в километры. Это делается следующим образом:

In [39]:
w_  # массив с милями

array([[356, 446, 222, 162],
       [282, 342, 172, 184]])

In [41]:
kms = w_ * 1.6
kms

array([[569.6, 713.6, 355.2, 259.2],
       [451.2, 547.2, 275.2, 294.4]])

NumPy понимает, что умножение выполняется над каждым элементом массива. Этот принцип называется транслирование. Транслирование массивов - это меха­низм, который позволяет NumPy выполнять операции над массивами разной фор­мы. Размеры массивов при этом должны быть совместимыми, т. е. размеры по об­щим осям должны совпадать или один из них должен быть равен 1 . Если размеры окажутся несовместимы, вы получите исключение ValueError.

# Функции агрегирования

В NumPy также есть функции агрегирования. В дополнение к стандарт­ным функциям min(), max() и sum() есть также функция mean() , позволяющая полу­чить среднее значение, prod(), выдающая результат умножения всех элементов, std(), вычисляющая стандартное отклонение, и многие другие.

In [42]:
kms.std()

154.57140744652614

# Двумерные массивы

In [47]:
data = np.array([[1, 2], [3, 4]])
data[1, 1]

4

В срезе первый элемент это индекс строки, второй - столбца, начинающиеся с 0

In [50]:
w_

array([[356, 446, 222, 162],
       [282, 342, 172, 184]])

In [52]:
j_ = w_[1].std()  # функция агрегирования для 2 столбца
j_

70.40596565632774

axis=0 - по столбцам

axis=1 - по строкам

In [59]:
w_.max(axis=0)

array([356, 446, 222, 184])

# Уникальные элементы массива

Найти уникальные элементы в массиве можно с помощью функции np.unique().

In [61]:
g_ = np.array([1, 2, 2, 2, 3, 44, 44, 55, 66, 6])
np.unique(g_, return_index=True)  # возвращает массив уникальных значений
# и их индексов

(array([ 1,  2,  3,  6, 44, 55, 66]), array([0, 1, 4, 9, 5, 7, 8]))

In [63]:
np.unique(g_, return_counts=True)  # уникльные значения +
# считает сколько каждых значений

(array([ 1,  2,  3,  6, 44, 55, 66]), array([1, 3, 1, 1, 2, 1, 1]))

# Транспонирование и изменение формы матрицы

In [65]:
w_

array([[356, 446, 222, 162],
       [282, 342, 172, 184]])

In [69]:
m_ = w_.T
m_

array([[356, 282],
       [446, 342],
       [222, 172],
       [162, 184]])

# Обратный порядок элементов массива

Функция NumPy np.flip() позволяет менять порядок элементов на обратный или «переворачивать» содержимое массива вдоль оси. Функции np.flip() нужно пере­дать массив, который вы хотите перевернуть, и ось. Если вы не укажете ось, NumPy поменяет порядок элементов по всем осям вашего массива.

In [71]:
v_ = np.flip(m_, axis=1)  # переворачиваем только строки

array([[282, 356],
       [342, 446],
       [172, 222],
       [184, 162]])

In [74]:
n_ = np.flip(m_, axis=0)  # переворачиваем только столбцы
n_

array([[162, 184],
       [222, 172],
       [446, 342],
       [356, 282]])

# Сжатие многомерного массива в одномерный

Есть два метода - flatten() и ravel(). Разница в том, что flatten возвращает новый массив, а результат ravel является ссылкой на исходный массив, то есть, ravel эффективнее использует память. ravel изменяет исходный массив, а flatten его не изменяет

In [76]:
q_ = w_.flatten()
q_

array([356, 446, 222, 162, 282, 342, 172, 184])

# Работа с математическими формулами

Простота реализации математических формул для работы с массивами - одна из причин, благодаря которым NumPy так широко используется в научном сообщест­ве Python.

error = (1/n) * np.sum(np.square(predictions - labels)) # MSE

# Сохранение массива в файл и чтение из файла

В какой-то момент вам может потребоваться сохранить какие-нибудь массивы на диск и загрузить их обратно без повторного запуска кода. В NumPy есть несколько способов сохранять и загружать объекты. Объект ndarray можно сохранять в файл и загружать из файла с помощью функций np.loadtxt() и np.savetxt(), которые рабо­тают с обычными текстовыми файлами, с помощью функций np.load() и np.save(), которые работают с двоичными файлами NumPy с расширением nру, а также есть функция np.savez(), которая сохраняет массивы в файлы NumPy с расширением npz.
В файлах пру и npz хранятся данные, форма, dtype и другая информация, необхо­димая для восстановления ndarray и позволяющая правильно извлечь массив, даже если файл был создан на другом компьютере с другой операционной системой.
Если вы хотите записать один объект ndarray, сохраните его как файл nру с по­мощью функции save(). Если вы хотите записать более одного объекта ndarray в одном файле, сохраните их в файл npz с помощью функции savez(). В ы также можете сохранить несколько массивов в один файл в сжатом формате npz с помо­щью функции savez_compressed().