# Введение в библиотеку NumPy

In [1]:
import numpy as np

In [2]:
print(np.__version__)

1.26.4


## Создание массивов из списков языка Python

In [6]:
np.array([1, 4, 2, 5, 3]) # Массив целочисленных значений

array([1, 4, 2, 5, 3])

In [8]:
np.array([3.14, 4, 2, 3]) # Массив ограничивается только одним типом. Если добавить float, то он исправит все значения на float

array([3.14, 4.  , 2.  , 3.  ])

In [9]:
np.array([1, 2, 3, 4], dtype='float32') # если нужно явно указать тип данных для массива

array([1., 2., 3., 4.], dtype=float32)

In [10]:
# Вложенные списки прообразуются в многомерный массив
np.array([range(i, i + 3) for i in [2, 4, 6]])

array([[2, 3, 4],
       [4, 5, 6],
       [6, 7, 8]])

## Создание массивов с нуля

In [19]:
# Создать массив целых чисел длины 10, заполненных нулями
np.zeros(10, dtype=int)

array([0, 0, 0, 0, 0, 0, 0, 0, 0, 0])

In [23]:
# Массив 3x5 с единицами с плавающей точкой
np.ones((3, 5), dtype='float32')

array([[1., 1., 1., 1., 1.],
       [1., 1., 1., 1., 1.],
       [1., 1., 1., 1., 1.]], dtype=float32)

In [24]:
# Массив, заполненный конкретным значением
np.full((3, 5), 3.14)

array([[3.14, 3.14, 3.14, 3.14, 3.14],
       [3.14, 3.14, 3.14, 3.14, 3.14],
       [3.14, 3.14, 3.14, 3.14, 3.14]])

In [28]:
# Массив, заданной линейной последовательностью с 0 до 20 с шагом в 2
np.arange(0, 20, 2)

array([ 0,  2,  4,  6,  8, 10, 12, 14, 16, 18])

In [32]:
# Массив из пяти значений, равномерно распределенных между 0 и 1
np.linspace(0, 1, 5)

array([0.  , 0.25, 0.5 , 0.75, 1.  ])

In [34]:
# Массив 3x3 равномерно распределенных СЛУЧАЙНЫХ значений между 0  и 1
np.random.random((3, 3))

array([[0.90564238, 0.43472441, 0.23978443],
       [0.50236998, 0.98417084, 0.5123305 ],
       [0.0743034 , 0.16268584, 0.183389  ]])

In [35]:
# Массив 3x3 нормально распределныых случайных значений с медианой 0 и стандартным отклонение 1

# Медиана 0: Медиана — это значение, которое делит распределение на две равные части.
# Если медиана равна 0, это означает, что половина значений меньше или равна 0, а другая половина больше или равна 0.

# Стандартное отклонение 1: Стандартное отклонение — это мера разброса значений относительно средней.
# Если стандартное отклонение равно 1, это указывает на то, что значения распределены относительно среднего значения (в данном случае 0)
# с характерным разбросом, который соответствует нормальному распределению.

np.random.normal(0, 1, (3, 3)) # Или подругому с явными указаниями:  np.random.normal(loc=0, scale=1, size=(3, 3))

array([[-1.23960236, -0.49453963, -1.73737272],
       [ 0.22362313,  0.6696425 , -0.44140676],
       [ 2.26212383,  1.47829973, -0.03397979]])

In [36]:
# Массив 3x3  случайных целых чисел в [0, 10)
np.random.randint(0, 10, (3, 3))

array([[6, 6, 2],
       [5, 6, 0],
       [1, 5, 9]])

In [37]:
# Единичная матрица 3x3
np.eye(3)

array([[1., 0., 0.],
       [0., 1., 0.],
       [0., 0., 1.]])

In [38]:
# Неинициализированный мастив из трёх целочисленных значений
# Значения будут производные, случайно оказавшиеся в соответствующих ячейках памяти
np.empty(3)

array([1., 1., 1.])

## Введение в массивы библиотеки NumPy

### Атрибуты массивов библиотеки NumPy

In [39]:
np.random.seed(0) # seed нужен для генерации одних и тех же рандомных значений после каждом выполнении кода

In [3]:
x1 = np.random.randint(10, size=6) # одномерный массив
x2 = np.random.randint(10, size=(3, 4)) # двумерный массив
x3 = np.random.randint(10, size=(3, 4, 5)) # трехмерный массив

In [4]:
x3

array([[[3, 4, 5, 1, 1],
        [7, 7, 0, 0, 4],
        [0, 5, 7, 7, 6],
        [5, 3, 9, 8, 9]],

       [[7, 5, 0, 8, 3],
        [1, 4, 2, 4, 2],
        [3, 0, 0, 0, 2],
        [1, 3, 5, 8, 0]],

       [[8, 7, 9, 1, 7],
        [8, 2, 6, 0, 0],
        [7, 8, 9, 2, 8],
        [8, 8, 6, 0, 1]]])

In [42]:
print('x3 ndim:', x3.ndim) # размерность
print('x3 shape:', x3.shape) # размер каждого измерения
print('x3 size:', x3.size) # общий размер массива (количество элементов)

x3 ndim: 3
x3 shape: (3, 4, 5)
x3 size: 60


In [44]:
print('dtype:', x3.dtype)

dtype: int32


In [46]:
print('itemsize:', x3.itemsize, 'bytes') # размер каждого элемента в байтах
print('nbytes:', x3.nbytes, 'bytes') # полный размер массива в байтах (.itemsize * .size)

itemsize: 4 bytes
nbytes: 240 bytes


### Индексация массива: доступ к отдельным элементам

In [5]:
x1

array([2, 9, 3, 9, 3, 4])

In [6]:
x1[0]

2

In [7]:
x1[4]

3

In [9]:
x1[-1] # индексация с конца

4

In [10]:
x2

array([[8, 9, 4, 2],
       [7, 4, 0, 7],
       [4, 3, 0, 1]])

In [13]:
x2[2, 2] # так же можно использовать [2][2]

0

In [15]:
# Изменить значения
x2[2, 2] = 100
x2

array([[  8,   9,   4,   2],
       [  7,   4,   0,   7],
       [  4,   3, 100,   1]])

### Срезы массивов: доступ к подмассивам

#### Одномерные подмассивы

In [17]:
x = np.arange(10)
x

array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])

In [18]:
x[:5] # первые 5 элементов

array([0, 1, 2, 3, 4])

In [19]:
x[4:7]

array([4, 5, 6])

In [20]:
x[1::2]

array([1, 3, 5, 7, 9])

In [21]:
# Когда применяется обратный индекс - начало и конец меняются местами
x[5::-2]

array([5, 3, 1])

#### Многомерные подмассивы

In [22]:
x2

array([[  8,   9,   4,   2],
       [  7,   4,   0,   7],
       [  4,   3, 100,   1]])

In [23]:
x2[:2, :3] # две строки, три столбца

array([[8, 9, 4],
       [7, 4, 0]])

In [24]:
x2[:3, ::2] # все строки, каждый второй столбец

array([[  8,   4],
       [  7,   0],
       [  4, 100]])

In [25]:
x2[::-1, ::-1] # измерения тоже можно "переворачивать"

array([[  1, 100,   3,   4],
       [  7,   0,   4,   7],
       [  2,   4,   9,   8]])

#### Доступ к строкам и столбцам массива

In [30]:
x2

array([[  8,   9,   4,   2],
       [  7,   4,   0,   7],
       [  4,   3, 100,   1]])

In [27]:
print(x2[:, 0]) 

[8 7 4]


In [28]:
print(x2[1, :]) # вывод второй строки

[7 4 0 7]


In [31]:
# НО ЛУЧШЕ ИСПОЛЬЗОВАТЬ ПРОСТО ТАКОЙ ВЫВОД
x2[0] # первая строка

array([8, 9, 4, 2])

#### Подмассивы как предназначенные только для чтения представления

Срезы массивов возвращают **представления (views)**, а не **копии (copies)** данных массива.
Короче говоря: если мы возьмём срез массива в NumPy, затем изменим исходный массив - то и срез тоже изменится.

In [32]:
x2

array([[  8,   9,   4,   2],
       [  7,   4,   0,   7],
       [  4,   3, 100,   1]])

In [34]:
# Возьмем срез 2x2
x2_sub = x2[:2, :2]
x2_sub # Если что вывод вначале был [[8, 9][7, 4]]

array([[8, 9],
       [7, 4]])

In [43]:
# Затем изменим x2
x2[1, 1] = 101

In [44]:
x2_sub # теперь вывод стал: [[8, 9][7, 101]]

array([[  8, 102],
       [  7, 101]])

In [45]:
# Таким же образом, если мы изменим значение в срезе - то основной массив тоже изменится
x2_sub[0, 1] = 102 

In [46]:
x2

array([[  8, 102,   4,   2],
       [  7, 101,   0,   7],
       [  4,   3, 100,   1]])

#### Создание копий массивов

In [47]:
x2_sub_copy = x2[:2, :2].copy()
print(x2_sub_copy)

[[  8 102]
 [  7 101]]


In [49]:
# Если мы теперь поменяем этот подмассив, то исходный массив останется неизмененным
x2_sub_copy[0, 0] = 200
print(x2_sub_copy)

[[200 102]
 [  7 101]]


In [50]:
x2 # не изменился

array([[  8, 102,   4,   2],
       [  7, 101,   0,   7],
       [  4,   3, 100,   1]])

#### Изменения формы массивов .reshape()

In [51]:
# Поместить числа от 1 до 9 в матрицу 3x3
grid = np.arange(1, 10).reshape((3, 3))
grid

array([[1, 2, 3],
       [4, 5, 6],
       [7, 8, 9]])

РАЗМЕР ИСХОДНОГО МАССИВА ДОЛЖЕН БЫТЬ = ИЗМЕНЕННОМУ РАЗМЕРУ.

In [54]:
# Преобразование одномерного массива в матрицу-строку или матрицу столбец (лучше использовать newaxis)
x = np.array([1, 2, 3])

In [56]:
# С помощью reshape(). Матрица столбец
x.reshape((3, 1))

array([[1],
       [2],
       [3]])

In [57]:
# С помощью reshape(). Матрица строка
x.reshape(1, 3)

array([[1, 2, 3]])

In [60]:
# В матрицу столбец используя newaxis
x[:, np.newaxis]

array([[1],
       [2],
       [3]])

### Слияние и разбиение массивов

#### Слияние

Используют: **np.concatenate. np.vstack, np.hstack**

In [62]:
# np.concatenate принимает на вхож кортеж или список массивов
x = np.array([1, 2, 3])
y = np.array([3, 2, 1])
np.concatenate([x, y])

array([1, 2, 3, 3, 2, 1])

In [63]:
# Можно более двух
z = np.array([99, 99 ,99])
np.concatenate([x, y, z])

array([ 1,  2,  3,  3,  2,  1, 99, 99, 99])

In [69]:
# Объединение двумерных массивов
grid = np.array([[1, 2, 3],
                [4, 5 ,6]])
grid

array([[1, 2, 3],
       [4, 5, 6]])

In [67]:
# Слияние по первой оси координат
np.concatenate([grid, grid])

array([[1, 2, 3],
       [4, 5, 6],
       [1, 2, 3],
       [4, 5, 6]])

In [70]:
# Слияние по второй оси коордианат (с индексом 0)
np.concatenate([grid, grid], axis=1)


array([[1, 2, 3, 1, 2, 3],
       [4, 5, 6, 4, 5, 6]])

Если размеры у массивов разные - то для конкатенации по вертикали используем np.vstack, для горизонтали - np.hstack.

In [73]:
x = np.array([1, 2, 3])
grid = np.array([[9, 8, 7],
                 [6, 5, 4]])

np.vstack([x, grid])

array([[1, 2, 3],
       [9, 8, 7],
       [6, 5, 4]])

In [76]:
y = np.array([[99],
             [99]])

np.hstack([grid, y])

array([[ 9,  8,  7, 99],
       [ 6,  5,  4, 99]])

Функция **np.dstack** аналогично объединяет массивы по третьей оси

#### Разбиение массивов

Используют: **np.split. np.vsplit, np.hsplit**. В каждый из них нужно передавать список с индексами, которые будут разделять исходный массив.

In [81]:
x = [1, 2, 3, 99, 99, 3, 2, 1]

In [82]:
x1, x2, x3 = np.split(x, [3, 5])
print(x1, x2, x3)

[1 2 3] [99 99] [3 2 1]


In [83]:
grid = np.arange(16).reshape((4, 4))
grid

array([[ 0,  1,  2,  3],
       [ 4,  5,  6,  7],
       [ 8,  9, 10, 11],
       [12, 13, 14, 15]])

In [87]:
upper, lower = np.vsplit(grid, [2])
print(upper)
print(lower)


[[0 1 2 3]
 [4 5 6 7]]
[[ 8  9 10 11]
 [12 13 14 15]]


In [89]:
left, right = np.hsplit(grid, [2])
print(left)
print(right)

[[ 0  1]
 [ 4  5]
 [ 8  9]
 [12 13]]
[[ 2  3]
 [ 6  7]
 [10 11]
 [14 15]]


Функция **np.dsplit** разделяем массивы по третьей оси

### Выполнения вычислений над массивами библиотеки NumPy: универсальные функции

#### Арифметические функции над массивами

In [92]:
x = np.arange(4)
x

array([0, 1, 2, 3])

In [95]:
print('x = ', x)
print('x + 5 =', x + 5)
print('x - 5 =', x - 5)
print('x * 2 =', x * 2)
print('x / 2 =', x / 2)
print('x ** 2 =', x ** 2)

x =  [0 1 2 3]
x + 5 = [5 6 7 8]
x - 5 = [-5 -4 -3 -2]
x * 2 = [0 2 4 6]
x / 2 = [0.  0.5 1.  1.5]
x ** 2 = [0 1 4 9]


In [96]:
# Можно соединять в несколько операций (преоритет будет соблюдаться)
-(0.5*x + 1) ** 2

array([-1.  , -2.25, -4.  , -6.25])

Все арифметические функции - удобные адаптеры для встроенных функций библиотеки NumPy.

In [97]:
# Например операция "+" это .add()
np.add(x, 2)

array([2, 3, 4, 5])

#### Абсолютное значение

In [98]:
x = np.array([-2, -1, 0, 1, 2])
abs(x)

array([2, 1, 0, 1, 2])

In [99]:
np.absolute(x)

array([2, 1, 0, 1, 2])

In [100]:
np.abs(x)

array([2, 1, 0, 1, 2])

#### Тригонометрические функции

In [102]:
theta = np.linspace(0, np.pi, 3) # np.linspace - равномерно распределенные значения между 0 и PI (3 штуки)
theta

array([0.        , 1.57079633, 3.14159265])

In [103]:
print('cos(theta) = ', np.cos(theta))
print('sin(theta) = ', np.sin(theta))

cos(theta) =  [ 1.000000e+00  6.123234e-17 -1.000000e+00]
sin(theta) =  [0.0000000e+00 1.0000000e+00 1.2246468e-16]


#### Показательные функции и логарифмы

In [104]:
x = [1, 2, 3]
x

[1, 2, 3]

In [109]:
print('e^x = ', np.exp(x))
print('2^x = ', np.exp2(x))
print('3^x = ', np.power(x, 3))

e^x =  [ 2.71828183  7.3890561  20.08553692]
2^x =  [2. 4. 8.]
3^x =  [ 1  8 27]


In [110]:
print('ln(x) = ', np.log(x)) # По натуральному основанию
print('log2(x) = ', np.log2(x))
print('log10(x) = ', np.log10(x))

ln(x) =  [0.         0.69314718 1.09861229]
log2(x) =  [0.        1.        1.5849625]
log10(x) =  [0.         0.30103    0.47712125]


#### Специализированные универсальные функции 

Если необходимо вычислить значение какой-то хитрой математической функции - найти можно в **scipy.special**.

In [3]:
from scipy import special

In [8]:
# Гамма-функции (обобщенные факториалы) и тому подобные функции
x = [1, 5, 10]
print('gamma(x) =', special.gamma(x))
print('ln|gamma(x) =', special.gammaln(x))
print('beta(x, 2) =', special.beta(x, 2))

gamma(x) = [1.0000e+00 2.4000e+01 3.6288e+05]
ln|gamma(x) = [ 0.          3.17805383 12.80182748]
beta(x, 2) = [0.5        0.03333333 0.00909091]


In [10]:
# Функция ошибок (интеграл от Гауссовой функции),
# дополнительная и обратная к ней функции
x = np.array([0, 0.3, 0.7, 1.0])
print('erf(x) =', special.erf(x))
print('erfc(x) =', special.erfc(x))
print('erfinv(x) =', special.erfinv(x))

erf(x) = [0.         0.32862676 0.67780119 0.84270079]
erfc(x) = [1.         0.67137324 0.32219881 0.15729921]
erfinv(x) = [0.         0.27246271 0.73286908        inf]


### Продвинутые возможности универсальных функций

#### Указание массива для вывода результата

Вместо того, чтобы создавать временный массив можно воспользоваться возможностью для записи результатов вычислений
непосредственно в нужное место в памяти. Для любой универсальной функции можно сделать через аргумент **out**.

In [11]:
x = np.arange(5)
y = np.empty(5)
np.multiply(x, 10, out=y)
print(y)

[ 0. 10. 20. 30. 40.]


In [12]:
# Например можно записать результат в каждый второй элемент массива
y = np.zeros(10)
np.power(2, x, out=y[::2])
print(y)

[ 1.  0.  2.  0.  4.  0.  8.  0. 16.  0.]


Если бы я написал y[::2] = 2 ** x, был бы создан временный массив для хранения результатов операции 2 ** x с последующим копированием этих значений в массив y. Для большого массива - это занимало бы много памяти.

#### Сводные показатели

У бинарных универсальных функций есть возможность вычислять непосредственно на основе объекта некоторые свобдные данные.

In [17]:
# Например, вызов метода reduce для универсальной функции add возвращает сумму всех элементов массива
x = np.arange(1, 6)
print(x)
np.add.reduce(x)

[1 2 3 4 5]


15

In [20]:
np.multiply.reduce(x)

120