# Библиотека NumPy

![%D0%B8%D0%B7%D0%BE%D0%B1%D1%80%D0%B0%D0%B6%D0%B5%D0%BD%D0%B8%D0%B5.png](attachment:%D0%B8%D0%B7%D0%BE%D0%B1%D1%80%D0%B0%D0%B6%D0%B5%D0%BD%D0%B8%D0%B5.png)

`NumPy` это open-source модуль для python, который предоставляет общие математические и числовые операции в виде пре-скомпилированных, быстрых функций. Они объединяются в высокоуровневые пакеты. Они обеспечивают функционал, который можно сравнить с функционалом `MatLab`. В `numpy` реализовано много операций над массивами в целом. Если задачу можно решить, произведя некоторую последовательность операций над массивами, то это будет столь же эффективно, как в `C` или `matlab`, поскольку функции этой библиотеки реализованы на `C`, и просто вызываются  из питона.

С помощью bash-команд установим библиотеку `numpy`.

In [1]:
!pip install numpy

Defaulting to user installation because normal site-packages is not writeable


Импортируем библиотеку `numpy`. Стандартное название для импорта  библиотеки numpy - `np`.

In [2]:
import numpy as np

## Векторы и матрицы в numpy

* **Одномерные массивы**.
Обычные списки в python выглядят следующим образом:

In [3]:
x = [6, 8, 3]
x

[6, 8, 3]

Преобразуем список `x` в __numpy__ массив с помощью функции `np.array` и напечатаем его.

In [4]:
a = np.array(x)
a

array([6, 8, 3])

`print` печатает массивы в более удобном виде:

In [5]:
print(a)

[6 8 3]


Выведем тип, созданного __numpy__ массива `a`:

In [6]:
type(a)

numpy.ndarray

Массивы в `numpy` поддерживают бинарные операции со скалярами:

In [9]:
print(a / 73)

[0.08219178 0.10958904 0.04109589]


In [10]:
print(a - 5)

[ 1  3 -2]


In [11]:
print(a ** 2)

[36 64  9]


А также унарные операции:

In [12]:
print(-a)

[-6 -8 -3]


* **Многомерные массивы**

Обычные списки, содержащие другие списки в `python` выглядят следующим образом:

In [13]:
x = [[3, 4, 1],
     [1, 2, 3]]
x

[[3, 4, 1], [1, 2, 3]]

Создадим из списка `x` многомерный __numpy__ массив. Функция `np.array` трансформирует вложенные последовательности в многомерные массивы. Тип элементов массива зависит от типа элементов исходной последовательности.

In [14]:
a = np.array(x)
print(a)

[[3 4 1]
 [1 2 3]]


Выведем тип, созданного numpy массива a:

In [15]:
type(a)

numpy.ndarray

Попробуем создать массив большей размернеости:

In [16]:
x = [
        [ [1, 2, 3], [4, 5, 6]],
        [ [7, 8, 9], [10, 11, 12]], 
    ]
x

[[[1, 2, 3], [4, 5, 6]], [[7, 8, 9], [10, 11, 12]]]

In [17]:
a = np.array(x)
print(a)

[[[ 1  2  3]
  [ 4  5  6]]

 [[ 7  8  9]
  [10 11 12]]]


При создании __numpy__ массива любой размерности не обязательно использовать промежуточный список `x`:

In [18]:
a = np.array([
    [ [1, 2, 3], [4, 5, 6]],
    [ [7, 8, 9], [10, 11, 12]],
])
print(a)

[[[ 1  2  3]
  [ 4  5  6]]

 [[ 7  8  9]
  [10 11 12]]]


Выведем тип, созданного numpy массива a:

In [19]:
type(a)

numpy.ndarray

Видно, что любой многомерный и одномерный numpy массив представляется __numpy.ndarray__. Объект массива представляет однородный массив элементов фиксированного размера. 

# Типы данных в numpy

`numpy` предоставляет несколько типов для целых чисел (`int16`, `int32`, `int64`) и чисел с плавающей точкой (`float32`, `float64`).

`ndarray.dtype` возвращает тип переменных, хранящихся в массиве.
`ndarray.itemsize` возвращает размер каждого элемента массива в байтах.

In [20]:
a = np.array([1, 2, 3])
a.dtype, a.itemsize

(dtype('int64'), 8)

In [21]:
b = np.array([0.1, 2, 1.7])
b.dtype, b.itemsize

(dtype('float64'), 8)

Точно такой же массив:

In [22]:
c = np.array([0.1, 2, 1.7], dtype=np.float64)
c.dtype

dtype('float64')

В данном случае дробная часть чисел будет отброшена:

In [23]:
d = np.array([0.1, 2, 1.7], dtype=np.int64)
d.dtype, d

(dtype('int64'), array([0, 2, 1]))

Преобразование данных в уже существующем numpy массиве. В результате работы метода `astype` будет создан новый numpy массив.

In [24]:
print(c.dtype)
print(c.astype(int))
print(c.astype(str))

float64
[0 2 1]
['0.1' '2.0' '1.7']


# Другие способы создания numpy массивов 

Функция `np.array` не единственная функция для создания массивов. Обычно элементы массива вначале неизвестны, а массив, в котором они будут храниться, уже нужен. Поэтому имеется несколько функций для того, чтобы создавать массивы с каким-то исходным содержимым.

* Функция `np.zeros` создает массив из нулей. На вход функция принимает кортеж с размерами и аргумент `dtype` (по умолчанию тип создаваемого массива — `float64`). 

Создадим одномерный массив из трех элементов, состоящий из нулей:

In [25]:
np.zeros((3))

array([0., 0., 0.])

Создадим двумерный массив размера 3 x 4, состоящий из нулей:

In [26]:
np.zeros((3, 4))

array([[0., 0., 0., 0.],
       [0., 0., 0., 0.],
       [0., 0., 0., 0.]])

Создадим трехмерный массив, состоящий из нулей:

In [27]:
np.zeros((3, 4, 2))

array([[[0., 0.],
        [0., 0.],
        [0., 0.],
        [0., 0.]],

       [[0., 0.],
        [0., 0.],
        [0., 0.],
        [0., 0.]],

       [[0., 0.],
        [0., 0.],
        [0., 0.],
        [0., 0.]]])

* Функция `np.ones` создает массив из единиц. На вход функция принимает кортеж с размерами и аргумент `dtype` (по умолчанию тип создаваемого массива — `float64`). 

In [28]:
np.ones((2, 3))

array([[1., 1., 1.],
       [1., 1., 1.]])

* Функция `np.full` - возвращает новый массив, заполненый указанным значением, определенного размера и типа. На вход функция принимает кортеж с размерами, аргумент `dtype` и `fill_value` - значение элементов массива.

In [29]:
np.full((2, 3), 7)

array([[7, 7, 7],
       [7, 7, 7]])

* Функция `np.eye` создаёт единичную матрицу. На вход функция принимает размер единичной матрицы. Создадим единичную матрицу размера 4 x 4.

In [30]:
np.eye(4)

array([[1., 0., 0., 0.],
       [0., 1., 0., 0.],
       [0., 0., 1., 0.],
       [0., 0., 0., 1.]])

Если в функции `np.eye` в качестве размера массива передать два числа, то можно получить прямоугольную единичную матрицу. 

In [37]:
np.eye(3, 5)

array([[1., 0., 0., 0., 0.],
       [0., 1., 0., 0., 0.],
       [0., 0., 1., 0., 0.]])

* Функция `np.empty` создает массив без его заполнения. Исходное содержимое случайно и зависит от состояния памяти на момент создания массива (то есть от того мусора, что в ней хранится). На вход функция принимает кортеж с размерами, создаваемого массива. Создадим массив размера 2 x 3:

In [38]:
np.empty((2, 4))

array([[1.11899545e-316, 0.00000000e+000, 0.00000000e+000,
        0.00000000e+000],
       [0.00000000e+000, 0.00000000e+000, 5.03961303e-266,
        3.99046880e-008]])

* Для создания последовательностей чисел, в numpy имеется функция `np.arange`, аналогичная встроенной в Python `range`, только вместо списков она возвращает массивы, и принимает не только целые значения. Функция принимает параметры:
    * `start` - начало интервала. Интервал включает это значение. Начальное значение по умолчанию - 0.
    * `stop ` - конец интервала. Интервал не включает это значение
    * `step` - Интервал между значениями. Для любого выхода $out$ это расстояние между двумя соседними значениями $out[i + 1] - out[i]$. Размер шага по умолчанию равен 1. Если шаг указан в качестве аргумента позиции, также необходимо указать начало интервала.
    * `dtype` - тип создаваемого массива, по умолчению `None`

In [39]:
np.arange(0, 30, 5)

array([ 0,  5, 10, 15, 20, 25])

In [40]:
np.arange(0, 3, 0.5)

array([0. , 0.5, 1. , 1.5, 2. , 2.5])

* При использовании `np.arange` с аргументами типа `float`, сложно точно сказать, сколько элементов будет получено (из-за ограничения точности чисел с плавающей запятой). Поэтому, в таких случаях обычно лучше использовать функцию `np.linspace`, которая вместо шага `step` в качестве одного из аргументов принимает число `num`, равное количеству нужных элементов. 

В функции `np.linspace` в отличие от функции `np.arange` конец интервала включается в сам интервал.

In [41]:
np.linspace(0, 3, 6)

array([0. , 0.6, 1.2, 1.8, 2.4, 3. ])

# numpy.random

Для создания массивов со случайными элементами служит модуль `numpy.random`.

Самый простой способ задать массив со случайными элементами - использовать функцию `sample` (или `random`, или `random_sample`, или `ranf` - это всё одна и та же функция).

Без аргументов возвращает просто число в промежутке $[0, 1)$.

In [113]:
np.random.sample()

0.7591733704174298

C одним целым числом возвращается одномерный массив:

In [114]:
np.random.sample(4)

array([0.58967415, 0.8070653 , 0.40468505, 0.28465999])

С кортежем - массив с размерами, указанными в кортеже:

In [115]:
np.random.sample((2, 3, 4))

array([[[0.75355002, 0.14582325, 0.94724388, 0.46819961],
        [0.84233127, 0.94365168, 0.10496117, 0.5805423 ],
        [0.78684894, 0.62742638, 0.51627193, 0.9478522 ]],

       [[0.71044435, 0.11372331, 0.06468774, 0.44810057],
        [0.18742224, 0.30617749, 0.55434018, 0.13015393],
        [0.15248773, 0.85698161, 0.87461305, 0.27087293]]])

С помощью функции `randint` или `random_integers` можно создать массив из целых чисел. Аргументы: `low`, `high`, `size` означает от какого, до какого числа генерируются числа (`randint` не включает в себя это число, а `random_integers` включает), и `size` - размеры массива.

In [118]:
np.random.randint(low=0, high=10, size=(2, 10))

array([[5, 7, 3, 6, 3, 9, 3, 2, 1, 6],
       [7, 5, 8, 5, 9, 5, 7, 1, 0, 4]])

Перемешать numpy массив можно с помощью функции `shuffle`:

In [121]:
a = np.arange(10)
np.random.shuffle(a)
a

array([6, 0, 2, 9, 4, 7, 3, 1, 8, 5])

# Методы массивов в numpy
Выведем методы для класса `ndarray`.

In [42]:
print(dir(np.ndarray))

['T', '__abs__', '__add__', '__and__', '__array__', '__array_finalize__', '__array_function__', '__array_interface__', '__array_prepare__', '__array_priority__', '__array_struct__', '__array_ufunc__', '__array_wrap__', '__bool__', '__class__', '__complex__', '__contains__', '__copy__', '__deepcopy__', '__delattr__', '__delitem__', '__dir__', '__divmod__', '__doc__', '__eq__', '__float__', '__floordiv__', '__format__', '__ge__', '__getattribute__', '__getitem__', '__gt__', '__hash__', '__iadd__', '__iand__', '__ifloordiv__', '__ilshift__', '__imatmul__', '__imod__', '__imul__', '__index__', '__init__', '__init_subclass__', '__int__', '__invert__', '__ior__', '__ipow__', '__irshift__', '__isub__', '__iter__', '__itruediv__', '__ixor__', '__le__', '__len__', '__lshift__', '__lt__', '__matmul__', '__mod__', '__mul__', '__ne__', '__neg__', '__new__', '__or__', '__pos__', '__pow__', '__radd__', '__rand__', '__rdivmod__', '__reduce__', '__reduce_ex__', '__repr__', '__rfloordiv__', '__rlshift_

## Hахождение статистик

Для numpy массива можно очень быстро посчитать различные статистики. 

Посчитаем для массива `a` его стандартное отклонение (`std`), сумму элементов (`sum`), произведение элементов (`prod`), минимальный элемент (`min`), максимальный элемент (`max`) и среднее арифметическое (`mean`):

In [43]:
a = np.array([1, 4, 3, 2, 6])
a.std(), a.sum(), a.prod(), a.min(), a.max(), a.mean()

(1.7204650534085253, 16, 144, 1, 6, 3.2)

Функции `argmin` и `argmax` возвращают индекс минимального или максимального элемента

In [44]:
a.argmin(), a.argmax()

(0, 4)

Для многомерных массивов каждая из функций может принять дополнительный аргумент `axis` и в зависимости от его значения выполнять функции по определенной оси, помещая результаты исполнения в массив. 
* $axis = None$ (значение по умолчанию) - будет произведено вычисление статистики по всему массиву,
* $axis = 0$ - будет произведено вычисление статистики по столбцам,
* $axis = 1$ - будет произведено вычисление статистики по строкам,

Найдем максимальный элемент во всем массиве `a`, в каждом столбце, в каждой строке массива `a`:

In [45]:
a = np.array([[0, 2], [3, -1], [4, 7]])
a.max(), a.max(axis=0), a.max(axis=1)

(7, array([4, 7]), array([2, 3, 7]))

Аналогично применяются другие функции для нахождения статистик.

## Математические операции над массивами
Над массивами __одинаковых__ размеров можно выполнять математические операции. Операции над массивами выполняются поэлементно. Создается новый массив, который заполняется результатами действия оператора. 

In [99]:
a = np.array([1, 4, 3, 2, 6])
b = np.array([1, 3, 5, 2, 1])
a + b, a * b, a / b, a ** b, a % b

(array([2, 7, 8, 4, 7]),
 array([ 1, 12, 15,  4,  6]),
 array([1.        , 1.33333333, 0.6       , 1.        , 6.        ]),
 array([  1,  64, 243,   4,   6]),
 array([0, 1, 3, 0, 0]))

В случае, если `a` и `b` разных размеров, будет исключение `ValueError`

In [100]:
b = np.array([4, 5, 7])

In [101]:
a + b, a * b, a / b, a ** b, a % b       

ValueError: operands could not be broadcast together with shapes (5,) (3,) 

Однако, если размерность массивов не совпадает, но они могут быть преобразованы для выполнения математических операций, то в этом случае операция между массивами будет произведена. В данном случае меньший массив будет использован несколько раз для завершения операций. 

Рассмотрим пример в следующей ячейке. Массив `b` будет иметь вид: $[[6, 7],[6, 7]]$

In [102]:
a = np.array([[1, 2], [2, 3]])
b = np.array([6, 7])
a + b

array([[ 7,  9],
       [ 8, 10]])

Также можно производить математические операции между массивом и числом. В этом случае над каждым элементом массива производится математическая операция с заданным числом. 

In [104]:
a = np.array([1, 4, 3, 2, 6])
a + 2, a * 2, a / 2, a ** 2, a % 2

(array([3, 6, 5, 4, 8]),
 array([ 2,  8,  6,  4, 12]),
 array([0.5, 2. , 1.5, 1. , 3. ]),
 array([ 1, 16,  9,  4, 36]),
 array([1, 0, 1, 0, 0]))

## Поэлементные операции


В numpy есть большое количество функции, которых хватает для построения почти любого расчета. 
Вычислим экспоненту, sin, cos и посчитаем квадратный корень всех элементов в массиве:

In [51]:
a = np.array([1.5, 2.1, 6.7, 7, 9])
np.exp(a), np.sin(a), np.cos(a), np.sqrt(a)

(array([4.48168907e+00, 8.16616991e+00, 8.12405825e+02, 1.09663316e+03,
        8.10308393e+03]),
 array([0.99749499, 0.86320937, 0.40484992, 0.6569866 , 0.41211849]),
 array([ 0.0707372 , -0.5048461 ,  0.91438315,  0.75390225, -0.91113026]),
 array([1.22474487, 1.44913767, 2.58843582, 2.64575131, 3.        ]))

Функции `floor`, `ceil` и `rint` возвращают нижние, верхние или ближайшие (округлённое) значение:

In [52]:
a, np.floor(a), np.ceil(a), np.rint(a) 

(array([1.5, 2.1, 6.7, 7. , 9. ]),
 array([1., 2., 6., 7., 9.]),
 array([2., 3., 7., 7., 9.]),
 array([2., 2., 7., 7., 9.]))

Полный список поэлементных операций можно найти в официальной документации.

## Сортировка/добавление/удаление элементов массива

`numpy.sort` - возвращает сортированную копию массива

`ndarray.sort` - сортирует массив на месте, т. е. не возвращает сортированную копию массива, а непосредственно изменяет сам массив.

In [53]:
b = np.arange(9, -1,-1)
print(f'sorted b {np.sort(b)}')    # numpy.sort
print(f'original b {b}')
b.sort()                           # ndarray.sort
print(f'original b after inplace sort {b}')

sorted b [0 1 2 3 4 5 6 7 8 9]
original b [9 8 7 6 5 4 3 2 1 0]
original b after inplace sort [0 1 2 3 4 5 6 7 8 9]


Функции `delete`, `insert` и `append` не меняют массив на месте, а возвращают новый массив, в котором удалены, вставлены в середину или добавлены в конец какие-то элементы.

`numpy.delete` первым параметром принимает массив из которого нужно удалить элементы, вторым параметром `obj` принимает список позиций в массиве, которые нужно удалить.

In [54]:
a = np.arange(0, 11, 1)
b = np.delete(a, obj=[3, 5])
a, b

(array([ 0,  1,  2,  3,  4,  5,  6,  7,  8,  9, 10]),
 array([ 0,  1,  2,  4,  6,  7,  8,  9, 10]))

`numpy.insert` первым параметром принимает массив в который нужно вставить элементы, вторым параметром `obj` принимает список позиций в массиве, в которые нужно вставить новое значение, а также есть необходимый параметр `values` - список значений для вставки в массив, значения преобразуются к типу массива.

In [55]:
a = np.arange(0, 11, 1)
b = np.insert(a, [2, 3], [-100, -200])
b

array([   0,    1, -100,    2, -200,    3,    4,    5,    6,    7,    8,
          9,   10])

В данном случае новые значения преобразовались к целочисленному типу:

In [56]:
a = np.arange(0, 11, 1)
b = np.insert(a, [2, 3], [-1.5, -2.5])
b

array([ 0,  1, -1,  2, -2,  3,  4,  5,  6,  7,  8,  9, 10])

`numpy.append` принимает в качестве параметров массив, в который будут добавлены значения и список значений для добавления в конец массива, значения преобразуются к типу массива.

In [57]:
a = np.arange(0, 11, 1)
a = np.append(a, [1, 2, 3])
a

array([ 0,  1,  2,  3,  4,  5,  6,  7,  8,  9, 10,  1,  2,  3])

# Булевы массивы

Булевы массивы не настолько особенны, чтобы выделять их в отдельную категорию, но у них есть несколько интересных свойств, которые могут быть полезными при написании программ. Булевы массивы  возникают при сравнении каких-то двух массивов в numpy (==,>,>=,<,<=).

In [58]:
a = np.array([1, 2, 3])
b = np.array([1, 2, 0])

a == b, a > b, a >= b, a < b, a <= b

(array([ True,  True, False]),
 array([False, False,  True]),
 array([ True,  True,  True]),
 array([False, False, False]),
 array([ True,  True, False]))

Булев массив можно использовать, как маску элементов другого numpy массива. 

In [124]:
a = np.arange(5)
b = np.array([True, True, False, True, False])
a, b, a[b]

(array([0, 1, 2, 3, 4]),
 array([ True,  True, False,  True, False]),
 array([0, 1, 3]))

К булевым массивам можно применять логические поэлементные операции:

In [59]:
a = np.array([True, False, True])
b = np.array([False, False, True])

# Логические поэлементные операции
print(f'a and b {a & b}')
print(f'a or b {a | b}')
print(f'not a {~a}')
print(f'a xor b {a ^ b}')

a and b [False False  True]
a or b [ True False  True]
not a [False  True False]
a xor b [ True False False]


Если к булевому массиву применить функции, предназначенные только для чисел, то перед применением все `True` сконвертируются в 1, а `False` в 0. В этих функциях также можно добавить параметр `axis` для многомерных массивов.

In [60]:
a.mean(), a.max(), a.sum(), a.std()

(0.6666666666666666, True, 2, 0.4714045207910317)

Допустим есть два массива `y_pred` - массив предсказаний и `y_true` - массив истинных значений. С помощью средств numpy очень легко посчитать точность предсказаний: 

In [61]:
y_pred = np.array([1, 2, 1, 2, 1, 1])
y_true = np.array([1, 2, 1, 1, 1, 1])

(y_pred == y_true).mean()

0.8333333333333334

# Индексы, срезы

Одномерные массивы осуществляют операции индексирования, срезов и итераций очень схожим образом с обычными списками и другими последовательностями Python, за исключением удаления элементов.

In [62]:
a = np.arange(0, 11, 1)
a[2], a[0:6:2], a[::-1]

(2, array([0, 2, 4]), array([10,  9,  8,  7,  6,  5,  4,  3,  2,  1,  0]))

При попытке удаления элементов из numpy массива с использованием срезов произойдет ошибка:

In [63]:
del a[1:3]

ValueError: cannot delete array elements

Зато можно выполнять присваивание таким способом. Присвоим первым трем элементам массива значение 100:

In [64]:
a[:3] = 100
a

array([100, 100, 100,   3,   4,   5,   6,   7,   8,   9,  10])

У многомерных массивов на каждую ось приходится один индекс. Индексы передаются в виде последовательности чисел, разделенных запятыми (т.е. с помощью кортежей):

In [65]:
b = np.array([[  0, 1, 2, 3],
              [10, 11, 12, 13],
              [20, 21, 22, 23],
              [30, 31, 32, 33],
              [40, 41, 42, 43]])

Элемент первой строки, второго столбца:

In [66]:
b[(1,2)]

12

Более распространеной считается запись без скобок:

In [67]:
b[1,2]

12

Выведем третью строку массива `b`:

In [69]:
b[3,:]

array([30, 31, 32, 33])

Выведем третий столбец массива `b`:

In [70]:
b[:,3]

array([ 3, 13, 23, 33, 43])

Выведем первые три строки массива `b`:

In [71]:
b[0:3, : : ]

array([[ 0,  1,  2,  3],
       [10, 11, 12, 13],
       [20, 21, 22, 23]])

Выведем первые две строки без поледнего столбца:

In [72]:
b[0:2,0:3]

array([[ 0,  1,  2],
       [10, 11, 12]])

# Манипуляции с формой

`ndarray.shape` — возвращает размеры массива в виде кортежа натуральных чисел, показывающий длину массива по каждой оси. Для матрицы из n строк и m столбов, shape будет (n,m). В $n$-мерном случае возвращается кортеж размеров по каждой координате.

In [74]:
a = np.array([[1, 2, 3],
              [4, 5, 6]])
a.shape

(2, 3)

Для одномерного массива:

In [75]:
b = np.array([1, 2, 3])
b.shape

(3,)

`ndarray.ndim` - возвращает число измерений (чаще их называют "оси") массива.

In [76]:
a.ndim

2

`ndarray.size` - возвращает количество элементов массива. Очевидно, равно произведению всех элементов атрибута `shape`.

In [77]:
a.size

6

Для смены `shape` есть методы `reshape`, `flatten`, `ravel`. Возвращают новые формы массива.

Функция `reshape` принимает обязательный параметр `newshape` -  кортеж размера массива по каждой оси. Новая форма должна быть совместима с оригинальной формой. Если целое число, то результатом будет одномерный массив этой длины. Одно измерение формы может быть -1. В этом случае значение выводится из длины массива и оставшихся измерений.

Преобразуем массив размера 2 x 3 в массив размера 3 x 2:

In [78]:
a = np.array([[1, 2, 3],
              [4, 5, 6]])
a.reshape(3, 2)

array([[1, 2],
       [3, 4],
       [5, 6]])

Попытаемся вместо одной из осей подставить -1, тогда numpy попытается сам понять, какое там должно быть число:

In [84]:
a.reshape(-1, 2)

array([[1, 2],
       [3, 4],
       [5, 6]])

In [85]:
a.reshape(-1)

array([1, 2, 3, 4, 5, 6])

Если такое число не получится найти, то будет ошибка

In [86]:
a.reshape(-1, 5)

ValueError: cannot reshape array of size 6 into shape (5)

Можно подставить только вместо одной оси -1, в противном случае произойдет ошибка.

In [87]:
a.reshape(-1, -1)

ValueError: can only specify one unknown dimension

Функции `flatten` и `ravel` очень похожи, они вытягивают матрицу любой размерности в одномерный массив. Единственное отличие в том, что `flatten` возвращает копию массива, а `ravel` - изменяет массив, т.е. не происходит реального копирования значений.
Рассмотрим пример, который показывает это отличие:

In [108]:
a = np.array([[1, 2, 3],
              [4, 5, 6]])
flattened = a.flatten()
flattened[0] = 1000
print(a)
flattened

[[1 2 3]
 [4 5 6]]


array([1000,    2,    3,    4,    5,    6])

In [109]:
a = np.array([[1, 2, 3],
              [4, 5, 6]])
raveled = a.ravel()
raveled[0] = 1000
print(a)
raveled

[[1000    2    3]
 [   4    5    6]]


array([1000,    2,    3,    4,    5,    6])

Если нужно перебрать поэлементно весь многомерный массив, как если бы он был одномерным, для этого можно использовать атрибут `flat`:

In [91]:
a = np.array([[1, 2, 3],
              [4, 5, 6]])
for i in a.flat:
    print(i, end=" ")

1 2 3 4 5 6 

# Линейная Алгебра

## Скалярное произведение 
$a~\cdot~b = (a_1, a_2, .., a_n) \cdot (b_1, b_2, .., b_n) = a_1b_1 + a_2b_2 + .. + b_nb_n = \sum_{i=1}^{n} a_ib_i$.

Для векторов в numpy считается с помощью функции `np.matmul`. На вход функция принимает два вектора, для которых нужно посчитать скалярное произведение.  

In [136]:
a = np.array([1, 2, 3])
b = np.array([2, 3, 4])
np.matmul(a, b)

20

Аналогичные действия выполняет оператор `@`

In [137]:
a @ b

20

Поведение функции `np.matmul` для массивов другой формы доступно в официальной документации.

## Операции с матрицами

__Транспонированной матрицей__ $A^{T}$ называется матрица, полученная из исходной матрицы $A$ заменой строк на столбцы. Формально: элементы матрицы $A^{T}$ определяются как $a^{T}_{ij} = a_{ji}$, где $a^{T}_{ij}$ — элемент матрицы $A^{T}$, стоящий на пересечении строки с номером $i$ и столбца с номером $j$.

В `NumPy` транспонированная матрица вычисляется с помощью функции __`numpy.transpose()`__ или с помощью _метода_ __`array.T`__, где __`array`__ — нужный двумерный массив.

In [92]:
a = np.array([[1, 2, 3],
              [4, 5, 6]])
np.transpose(a)

array([[1, 4],
       [2, 5],
       [3, 6]])

In [93]:
a.T

array([[1, 4],
       [2, 5],
       [3, 6]])

__Умножение двух матриц__. Операция __умножения__ определена для двух матриц, таких что число столбцов первой равно числу строк второй. 

Пусть матрицы $A$ и $B$ таковы, что $A \in \mathbb{R}^{n \times k}$ и $B \in \mathbb{R}^{k \times m}$. __Произведением__ матриц $A$ и $B$ называется матрица $C$, такая что $c_{ij} = \sum_{r=1}^{k} a_{ir}b_{rj}$, где $c_{ij}$ — элемент матрицы $C$, стоящий на пересечении строки с номером $i$ и столбца с номером $j$.

В `NumPy` произведение матриц вычисляется с помощью функции __`numpy.dot(a, b, ...)`__ или с помощью _метода_ __`array1.dot(array2)`__, где __`array1`__ и __`array2`__ — перемножаемые матрицы.

Так же по правилам умножения матриц, мы можем умножить матрицу на вектор (одномерный массив).

In [94]:
A = np.array([[1, 2], [3, 4]])
x = np.array([4, 5])
b = np.dot(A, x)
b

array([14, 32])

При этом в таком умножении вектор столбец должен находиться справа, а вектор строка слева. Иначе получится некорректный результат:

In [111]:
A = np.array([[1, 2], [3, 4]])
x = np.array([4, 5])
c = np.dot(x, A)
c

array([19, 28])

In [112]:
A = np.array([[1, 2], [3, 4]])
x = np.array([4, 5])
b = np.dot(A, x)
A.dot(x)

array([14, 32])

Решить СЛАУ __$Ax=b$__ можно с помощью функции `np.linalg.solve`. Данная функция в качестве первого аргумента принимает матрицу коэффицентов (__A__), второй аргумент принимает столбец свободных членов (__b__).

Данная функция вычисляет значение неизвестных __только для квадратных, невырожденных матриц с полным рангом__, т.е. только если матрица A размером ${m, m}$ имеет ранг равный $m$. Если хотя бы одно из этих условий не выполняется, то возвращается ошибка `LinAlgError`. 

In [96]:
x2 = np.linalg.solve(A, b)
x2

array([4., 5.])

В следующем примере возникнет исключение, так как матрица `A` не является квадратной:

In [97]:
A = np.array([[1, 2], [3, 4], [5, 6]])
x = np.array([1, 2])
b = A.dot(x)
b

array([ 5, 11, 17])

In [98]:
x3 = np.linalg.solve(A, b)
x3

LinAlgError: Last 2 dimensions of the array must be square

Одномерные и многомерные numpy массивы являются элементами класса `numpy.ndarray`. Работа с одномерными и многомерными массивами в numpy имеет мало отличий. В случае если массив многомерный, то у большинства случаев появляется дополнительный параметр `axis`, который показывает по какой оси будет применена функция.    

# Преимущества библиотеки NumPy

При правильной работе с объектами `numpy.ndarray` можно достичь значительного выигрыша по времени, чем при выполнении этих же операций стандартными средствами языка `Python`.  

С помощью магический команды `%time` (была описана в предыдущем файле) сравним время работы функций `np.arrange` и `range` при создание последовательности чисел:

In [10]:
%time np.arange(0, 50000000)
%time list(range(0, 50000000))
%time range(0, 50000000)

CPU times: user 28.2 ms, sys: 95.5 ms, total: 124 ms
Wall time: 123 ms
CPU times: user 885 ms, sys: 510 ms, total: 1.4 s
Wall time: 1.39 s
CPU times: user 5 µs, sys: 2 µs, total: 7 µs
Wall time: 10 µs


range(0, 50000000)

Массивы можно использовать в `for` циклах. Но при этом теряется главное преимущество `numpy` - быстродействие. Всегда, когда это возможно, лучше использовать операции, определенные в numpy.

При выполнении совсем простых операциях, таких как сложение двух чисел, `Python` не уступает в скорости `C++` или `C`, а поэтому использование numpy не дает выигрыша, но в более тяжелых вычислениях разница становится колосальной.

Cложение каждого элемента массива с самим собой с помощью средств `numpy` иногда чуть медленее, чем стандартными средствами языка `Python` для небольших массивах (в примере размер массива равен 20). 

In [36]:
a = np.linspace(0, 10, 20)
a

array([ 0.        ,  0.52631579,  1.05263158,  1.57894737,  2.10526316,
        2.63157895,  3.15789474,  3.68421053,  4.21052632,  4.73684211,
        5.26315789,  5.78947368,  6.31578947,  6.84210526,  7.36842105,
        7.89473684,  8.42105263,  8.94736842,  9.47368421, 10.        ])

In [37]:
%%time 
res = a + a

CPU times: user 324 ms, sys: 1.53 ms, total: 325 ms
Wall time: 324 ms


In [38]:
%%time
res = []
for value in a:
    res.append(value + value)

CPU times: user 25 µs, sys: 11 µs, total: 36 µs
Wall time: 40.3 µs


Но при выполнении этой же операции на массивах с большой размерностью с помощью средств `numpy` быстрее, чем с помощью средств языка `Python`.

In [2]:
a = np.linspace(0, 10, 1e6)

In [7]:
%%time 
res = a + a

CPU times: user 102 ms, sys: 4.32 ms, total: 106 ms
Wall time: 105 ms


In [8]:
%%time
res = []
for value in a:
    res.append(value + value)

CPU times: user 289 ms, sys: 2.75 ms, total: 292 ms
Wall time: 290 ms
