# NumPy
**numpy** - библиотека для научных вычислений (обработки набора чисел). Работает с многомерными **однородными** массивами (матрицами).

* быстрая (гораздо быстрее, чем вложенные списки python)
* специальные функции для работы с матрицами (детерминант, ранг, след и тп)
* операции над матрицами

## Источники

* [numpy.org](https://numpy.org/doc/stable/user/index.html) - официальная документация
* [Tutorials](https://github.com/numpy/numpy-tutorials) - учебники (Eng)
* [Сборник рецептов](https://note.nkmk.me/en/numpy/) - как сделать и разъяснения по фукнциям
* [betterprogramming](https://betterprogramming.pub/numpy-illustrated-the-visual-guide-to-numpy-3b1d4976de1d) - сюда с VPN
* [numpy в картинках](https://python-scripts.com/numpy) на русском (возможно, это зеркало данных с предыдущей ссылка)

## Установка

`pip install numpy`

## import

In [2]:
import numpy as np

## Пример создания матрицы и обращение к элементам

Зададим матрицу

$a = \begin{bmatrix}
1 & 2 & 3\\
4 & 5 & 6
\end{bmatrix}$

In [186]:
a = np.array([
    [1, 2, 3],     # строка 0, колонки 0, 1, 2
    [4, 5, 6]      # строка 1, колонки 0, 1, 2
])
a

array([[1, 2, 3],
       [4, 5, 6]])

In [188]:
a[1][0]

4

In [189]:
a[1,0]

4

## Термины

### Строка матрицы (row)

![ar2d1.png](attachment:8c7de7e8-bf28-4d02-a011-e78c16cfbd95.png)

### Столбец матрицы (column)

![ar2d2.png](attachment:26419ae7-0197-49b5-89c7-c5f833d5f253.png)

### Элемент матрицы (cell)

`a[1][0]`

![ar2d_symb3.png](attachment:b5b3240f-e5fd-40e4-9b6f-7616732d7500.png)

### Обращение к элементу

![ar2d4.png](attachment:f67d2897-a958-47ef-bdf1-60ac0b6f70f1.png)

## Оси

`a[1][2]` - матрица имеет 2 оси. Ранг - количество осей.

`a[индекс по оси 0][индекс по оси 1]`

В numpy размерность называют осями (**axes**). Количество осей - **ранг**.

![axes.png](attachment:5429210a-7d90-44d5-98ac-7ca8b08bacba.png)


## np.ndarray

Массив numpy реализован в классе **np.ndarray**

In [6]:
a = np.array([
    [1, 2, 3],     # строка 0, колонки 0, 1, 2
    [4, 5, 6]      # строка 1, колонки 0, 1, 2
])
a

array([[1, 2, 3],
       [4, 5, 6]])

## Характеристики массива

| выражение | значит | равна для массива `a` |
|----|-----|-----|
| `a.shape` | Размерность массива | `(2, 3)` |
| `len(a)` | длина (первой оси) массива | `2` |
| `len(a[0])` | длина (второй оси) массива | `3` |
| `a.ndim` | количество осей | `2` |
| `a.size` | количество элементов (произведение всех чисел shape) | `6` |
| `a.dtype` | тип каждого элемента массива (см. ниже) | `dtype('int32')` |
| `a.dtype.name` | название типа 1 элемента массива | `'int32'` |
| `a.itemsize` | размер 1 элемента в байтах (зависит от типа) (=32/8) | `4` |
| `a.nbytes` | размер всего массива в байтах (=4*6) | `24` |
| `af = a.astype(float)` | преобразовать тип каждого элемента массива к `float`, получится новый массив, тип элементов старого массива не изменится | |  

In [8]:
a = np.array([[1, 2, 3],
       [4, 5, 6]])

In [12]:
type(a)

numpy.ndarray

In [10]:
a.dtype

dtype('int32')

In [11]:
a.dtype.name

'int32'

In [9]:
a.shape

(2, 3)

In [13]:
a.size

6

In [14]:
len(a)

2

In [15]:
len(a[0])

3

### типы данных

| Тип | Значит |
|----|----|
| np.int64 | 64-битный целый тип со знаком |
| np.float32 | стандартное дробное число двойной точности |
| np.complex | комплексное число, представленное 128 floats |
| np.bool | Булевское (логическое) значение. Может быть True или False. |
| np.object | объект python (базовый тип в иерархии классов питона) |
| np.string_  | строка фиксированной длины |
| np.unicode_  |  юникод-строка фиксированной длины |

Основные численные типы данных numpy (т.е. в таблице np.int и np.int32):
| dtype |  варианты |  значит |
|-----|-----|------|
| int  | int8, int16, int32, int64  | целое число со знаком |
| uint  | uint8, uint16, uint32, uint64  | целое число без знака (только положительные) |
| bool  | bool |  булевское (True или False) |
| float  | float16, float32, float64, float128 |  дробное |
| complex  | complex64, complex128, complex256 |  комплексное из дробных чисел |



In [21]:
a

array([[1, 2, 3],
       [4, 5, 6]])

In [18]:
a.dtype

dtype('int32')

In [20]:
af = a.astype(float)
af

array([[1., 2., 3.],
       [4., 5., 6.]])

In [22]:
af.dtype

dtype('float64')

## Создание массива

Массив можно сделать:

* из другой структуры python (список, кортеж итп).
* специальными функциями создания (arange, ones, zeros и другие)
* специальными функциями (random)
* из файла (специальный формат)
* из байт (из строки или буфера)

### из коллекции python

In [25]:
x1 = np.array([2, 3, 1, 0])
x2 = np.array((2, 3, 1, 0))
x3 = np.array([[1,2.0],[0,0],(1+1j,3.)]) # tuple и list вместе

x4 = np.array([[ 1.+0.j, 2.+0.j], [ 0.+0.j, 0.+0.j], [ 1.+1.j, 3.+0.j]])  # комплексные числа

### специальные фукнции создания

В любой функции можно еще указать аргумент dtype.

| функция | перечислением | значит |
|----|----|-----|
| `np.zeros((2, 3))` | `array([[ 0., 0., 0.], [ 0., 0., 0.]])` | все 0 |
| `np.ones((2,3,4))` | `np.ones((2,3)) это array([[ 1, 1, 1], [ 1, 1, 1]])` | все 1 |
| `np.full((2,3), 7)` | `array([[ 7., 7., 7.], [ 7., 7., 7.]])` | матрица 2х3, везде 7 |
| `np.identity(2)` | `array([[ 1., 0.], [ 0., 1.]])` | единичная матрица размера 2 |
| `np.eye(2)` | `array([[ 1., 0.], [ 0., 1.]])` | единичная матрица размера 2 (единицы только на одной диагонали) |
| `np.eye(2, 3, k=1)` | `array([[ 0., 1., 0.], [ 0., 0., 1.]])` | матрица 2х3, все 0, кроме 1 на диагонали номер k=1 |
| `np.empty((2,3))` |   | матрица 2х3, значения не инициализированы (могут быть 0, а могут быть любыми |
| `np.arange(10)` | `array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])` | `[0, 10)` с шагом 1 |
| `np.arange(2, 10, dtype=np.float)` | `array([ 2., 3., 4., 5., 6., 7., 8., 9.])` | `[2, 10)` с шагом 1 |
| `np.arange(2, 3, 0.1)` | `array([ 2. , 2.1, 2.2, 2.3, 2.4, 2.5, 2.6, 2.7, 2.8, 2.9])` | `[2, 3)` с шагом 0.1 |
| `np.linspace(1., 4., 6)` | `array([ 1. , 1.6, 2.2, 2.8, 3.4, 4. ])` | `[1, 4]` из 6 точек |
| `np.logspace(0, 2, 5)` | `array([ 1. , 3.16227766, 10. , 31.6227766 , 100.])` | массив из 5 точек от `10**0=1` до `10**2=100` | 

In [191]:
np.ones((2,3,4), dtype=int)

array([[[1, 1, 1, 1],
        [1, 1, 1, 1],
        [1, 1, 1, 1]],

       [[1, 1, 1, 1],
        [1, 1, 1, 1],
        [1, 1, 1, 1]]])

In [29]:
np.identity(4)

array([[1., 0., 0., 0.],
       [0., 1., 0., 0.],
       [0., 0., 1., 0.],
       [0., 0., 0., 1.]])

In [192]:
np.eye(4)

array([[1., 0., 0., 0.],
       [0., 1., 0., 0.],
       [0., 0., 1., 0.],
       [0., 0., 0., 1.]])

In [27]:
np.eye(2, 3, k=1)

array([[0., 1., 0.],
       [0., 0., 1.]])

In [32]:
np.indices((3,4))  # индексы по строкам и по столбцам

array([[[0, 0, 0, 0],
        [1, 1, 1, 1],
        [2, 2, 2, 2]],

       [[0, 1, 2, 3],
        [0, 1, 2, 3],
        [0, 1, 2, 3]]])

In [31]:
help(np.indices)

Help on function indices in module numpy:

indices(dimensions, dtype=<class 'int'>, sparse=False)
    Return an array representing the indices of a grid.
    
    Compute an array where the subarrays contain index values 0, 1, ...
    varying only along the corresponding axis.
    
    Parameters
    ----------
    dimensions : sequence of ints
        The shape of the grid.
    dtype : dtype, optional
        Data type of the result.
    sparse : boolean, optional
        Return a sparse representation of the grid instead of a dense
        representation. Default is False.
    
        .. versionadded:: 1.17
    
    Returns
    -------
    grid : one ndarray or tuple of ndarrays
        If sparse is False:
            Returns one array of grid indices,
            ``grid.shape = (len(dimensions),) + tuple(dimensions)``.
        If sparse is True:
            Returns a tuple of arrays, with
            ``grid[i].shape = (1, ..., 1, dimensions[i], 1, ..., 1)`` with
            dimensi

### Массив случайных чисел

#### равномерное распределение, float

`np.random.random_sample(shape)` возвращает равномерно распределенные случайные числа на `[0, 1)`

In [193]:
# одно случайное число
np.random.random_sample()

0.4734492901875663

In [35]:
# оно float
type(np.random.random_sample())

float

In [205]:
x = 14,
print(x, type(x))

(14,) <class 'tuple'>


In [200]:
# вектор длины 5 из случайных чисел
np.random.random_sample((5,))

array([6.51772576e-01, 1.79821400e-01, 5.88294547e-04, 4.85659435e-01,
       7.36970131e-01])

Для равномерного распределения на  `[a, b)` где `a < b` есть формула

```(b - a) * random_sample() + a```

In [37]:
# Для массива 2х3 с числами, равномерно распределенными на [-5, 7)
r = (7 - (-5)) * np.random.random_sample((2, 3)) + (-5)
r

array([[ 1.61864008, -2.98760408,  3.32448708],
       [ 1.33582431, -3.88209991,  5.28872738]])

#### нормальное распределение, float

`numpy.random.standard_normal(size=None)`

Массив чисел с нормальным распределением `(mean=0, stdev=1)`.

In [38]:
s = np.random.standard_normal((2, 3))
s

array([[-0.5560546 , -0.28359513,  1.76771098],
       [ 1.50661864,  0.43196077,  0.78755655]])

In [39]:
# одно число
s = np.random.standard_normal()
s

0.4544771134198791

#### равномерное распределение, int


`numpy.random.randint(low, high=None, size=None, dtype='l')`

Равномерно распределенные случайные целые числа

* на `[low, hight)`, если оба определены
* на `[0, low)` если `hight` не определено
* если `size` нет, то вернет 1 число

In [40]:
# 1 целое число из [0, 15)
np.random.randint(15)                  

12

In [41]:
# массив из 10 целых чисел из [0, 2)
np.random.randint(2, size=10)           

array([1, 0, 0, 1, 1, 0, 0, 1, 0, 1])

In [43]:
# массив из 10 целых чисел из [5, 15)
np.random.randint(5, 15, size=10)     

array([ 6, 10, 12,  8,  5,  8, 14,  8,  5,  8])

In [44]:
# массив 2х4 из целых чисел из [0, 5)
np.random.randint(5, size=(2, 4))       

array([[2, 0, 4, 3],
       [2, 0, 2, 1]])

### Сделаем массив по формуле

In [3]:
def foo(n, m):
    return n * 10 + m

m = np.fromfunction(foo, (6, 6), dtype=int)
m

array([[ 0,  1,  2,  3,  4,  5],
       [10, 11, 12, 13, 14, 15],
       [20, 21, 22, 23, 24, 25],
       [30, 31, 32, 33, 34, 35],
       [40, 41, 42, 43, 44, 45],
       [50, 51, 52, 53, 54, 55]])

### Комплексные числа

Из массива комплексных чисел можно получить ссылку на массив действительных **real** и мнимых **imag** частей.
При изменении массива действительной или мнимой части, **изменяется массив исходных чиелсел**

In [48]:
d = np.array([1, 2, 3], dtype=complex)
d

array([1.+0.j, 2.+0.j, 3.+0.j])

In [49]:
d.real

array([1., 2., 3.])

In [50]:
d.imag

array([0., 0., 0.])

In [52]:
d.real[2] = -5
d.imag[1] = 7

In [53]:
d

array([ 1.+0.j,  2.+7.j, -5.+0.j])

### Чтение из файла и запись в файл

[документация](https://numpy.org/doc/stable/reference/routines.io.html)

#### Во внутреннем формате numpy

```python
np.save('my_array', a)
np.savez('array.npz', a, b)
np.load('my_array.npy')
```

#### Из текстового или csv файла

```python
np.loadtxt("myfile.txt")
np.genfromtxt("my_file.csv", delimiter=',')
np.savetxt("myarray.txt", a, delimiter=" ")
```


# Математика на матрицах

### `a+b`, `a-b`, `a*b` - операции над матрицами

Это поэлементные операции.

* `c = a+b` - это `c[i][j] = a[i][j] + b[i][j]`
* `c = a-b` - это `c[i][j] = a[i][j] - b[i][j]`
* `c = a*b` - это `c[i][j] = a[i][j] * b[i][j]`

Внимание, `c = a*b` это **не то умножение**, которое вы видели на математике.

Вместо `a = a + b` можно написать короткую форму `a += b`.

| Операция	| Короткая форма |
|----|----|
| `a+b` |	`a += b` |
| `a-b` |	`a -= b` |
| `a*b` |	`a *= b` |
| `a/2` |	`a /= 2` |
| `a/b` |	`a /= b` |
| `a**2` |	`a **= 2` |
| `2**a` |	нет краткой формы |

In [55]:
a = np.array([[10, 20, 30], [40, 50, 60]])
b = np.array([[1, 2, 3], [4, 5, 6]])
print(a)
print(b)

[[10 20 30]
 [40 50 60]]
[[1 2 3]
 [4 5 6]]


In [56]:
a + b

array([[11, 22, 33],
       [44, 55, 66]])

In [57]:
a - b

array([[ 9, 18, 27],
       [36, 45, 54]])

In [59]:
a * b

array([[ 10,  40,  90],
       [160, 250, 360]])

In [64]:
# транспонируем
b.T

array([[1, 4],
       [2, 5],
       [3, 6]])

In [206]:
np.dot(a, b.T)

array([[14, 32],
       [32, 77]])

In [66]:
# умножение как в математике (dot product)
a.dot(b.T)

array([[140, 320],
       [320, 770]])

In [68]:
# умножение как в математике (dot product)
a @ b.T

array([[140, 320],
       [320, 770]])

### "Правильное" умножение матриц `np.dot` или `@`

Произведением матрицы $A$ с элементами $a[i,j]$ размерности $mxn$ на матрицу $B$ с элементами $b[i,j]$ размерности $nxk$ называется матрица $С$ с элементами $c[i,j]$ размера $mxk$, такое что $$c[i,j] = a[i,1] \cdot b[1,j] + a[i,2]\cdot b[2,j]+..+a[i,n]\cdot b[n,j]$$

Будем дальше обозначать матричное произведение в тексте как $C = A \cdot B$ (как пишут математики, а не программисты)

![умножение](https://www.mathsisfun.com/algebra/images/matrix-multiply-a.svg)

Вместо `a = a + b` можно написать короткую форму `a += b`.

| Операция	| Короткая форма |
|----|----|
| `a+b` |	`a += b` |
| `a-b` |	`a -= b` |
| `a*b` |	`a *= b` |
| `a/2` |	`a /= 2` |
| `a/b` |	`a /= b` |
| `a**2` |	`a **= 2` |
| `2**a` |	нет краткой формы |

### AB != BA

In [69]:
A = np.array([[1, 2, 3],
              [4, 5, 6]])
A

array([[1, 2, 3],
       [4, 5, 6]])

In [70]:
B = np.array([
    [1, 2],
    [3, 4],
    [5, 6]
])
B

array([[1, 2],
       [3, 4],
       [5, 6]])

Следите за порядком сомножителей.
$$A \cdot B \ne B \cdot A$$

$A \cdot B$ можно записать любым способом:
* `np.dot(A, B)`
* `A.dot(B)`
* `A @ B`

In [71]:
np.dot(A,B)      # функция в пакете numpy

array([[22, 28],
       [49, 64]])

In [72]:
A.dot(B)         # метод объекта   

array([[22, 28],
       [49, 64]])

In [74]:
A @ B            # оператор

array([[22, 28],
       [49, 64]])

In [75]:
B @ A

array([[ 9, 12, 15],
       [19, 26, 33],
       [29, 40, 51]])

## Функции и константы

[Документация](https://numpy.org/doc/stable/reference/routines.math.html) - еще больше функций.

| numpy | Математика |
|----|----|
| np.pi | Число $\pi$ |
| np.e | Число e |
| np.cos | Косинус |
| np.sin | Синус |
| np.tan | Тангенс |
| np.acos | Арккосинус |
| np.asin | Арксинус |
| np.atan | Арктангенс |
| np.exp | Экспонента |
| np.log | Логарифм натуральный |
| np.log2 | Логарифм по основанию 2 |
| np.log10 | Логарифм десятичный |
| np.sqrt | $\sqrt{x}$ | 

| функции numpy | Описание |
|----|----|
| np.add, np.subtract, np.multiply, np.divide | +, -, *, / |
| np.power(a, b) | `c[i,j] = a[i,j]**b[i,j]` |
| np.remainder(a, b) | остаток от деления `c[i,j] = a[i,j]%b[i,j]` |
| np.reciprocal(a) | `1/a[i,j]` |
| np.real, np.imag, np.conj | действительная часть; мнимая часть; `a+bj` заменяется на `a-bj` |
| np.sign | знак, 1, -1 или 0 |
| np.abs | модуль |
| np.floor, np.ceil, np.rint | преобразуем к целым числам |
| np.round | округление с указанной точностью |

### Агрегации

| функции numpy | Описание |
|----|----|
| np.mean |  среднее |
| np.std |  стандартное отклонение |
| np.var |  дисперсия |
| np.sum |  сумма всех элементов |
| np.prod |  произведение всех элементов |
| np.cumsum |  сумма всех элементов по указанной оси |
| np.cumprod |  произведение всех элементов по указанной оси |
| np.min, np.max |  минимальное и максимальное число в массиве |
| np.argmin, np.argmax |  **индекс** минимального и максимального числа в массиве |
| np.all  | True если все элементы в массиве НЕ 0 |
| np.any  | True если хоть один элемент в массиве не 0 |

### аргумент axis в sum, min, max

In [84]:
data = np.array([[1, 2, 3],
              [4, 5, 6],
              [7, 8, 9]])
data

array([[1, 2, 3],
       [4, 5, 6],
       [7, 8, 9]])

In [85]:
sum(data)

array([12, 15, 18])

In [86]:
data.sum()

45

In [87]:
data.sum(axis=0)

array([12, 15, 18])

In [88]:
data.sum(axis=1)

array([ 6, 15, 24])

![cumsum.png](attachment:893d11d4-0bf6-4cdc-9acd-4a135fdb0759.png)

### Сортировка

In [207]:
a = np.array([[1,4],[3,1]])
a

array([[1, 4],
       [3, 1]])

In [208]:
# сортируем по последней оси (самые внутренние массивы)
np.sort(a)

array([[1, 4],
       [1, 3]])

In [209]:
# сортируем массив, вытянутый в 1 строку
np.sort(a, axis=None)

array([1, 1, 3, 4])

In [210]:
# сортируем по оси 0
np.sort(a, axis=0)

array([[1, 1],
       [3, 4]])

### np.vectorize - как заставить свою функцию работать с векторами

In [211]:
# обычная функция, работает с числами
def heaviside(x):
    # если можно сделать операцию с вектором, то проблем не будет
    # return x + 3
    # но если вектор неприемлем, то проблема
    return 1 if x > 0 else 0

In [212]:
heaviside(4.5)

1

In [213]:
heaviside(-12)

0

In [214]:
# массив
x = np.linspace(-5, 5, 11)
x

array([-5., -4., -3., -2., -1.,  0.,  1.,  2.,  3.,  4.,  5.])

In [215]:
heaviside(x)

ValueError: The truth value of an array with more than one element is ambiguous. Use a.any() or a.all()

In [216]:
# Как сделать так, чтобы эта функция применялась к каждому элементу массива?
vheaviside = np.vectorize(heaviside)     # сделаем новую функцию vheaviside 
vheaviside(x)                            # vheaviside работает с массивами

array([0, 0, 0, 0, 0, 0, 1, 1, 1, 1, 1])

## Сравнение

In [217]:
a

array([[1, 4],
       [3, 1]])

In [218]:
b = np.sort(a)
b

array([[1, 4],
       [1, 3]])

In [219]:
# одно число
np.array_equal(a, b)

False

In [110]:
# матрица из True и False
a == b

array([[ True,  True],
       [False, False]])

In [97]:
a < b

array([[False, False],
       [False,  True]])

In [98]:
c = a < b
c

array([[False, False],
       [False,  True]])

In [99]:
a[c]

array([1])

In [220]:
c1 = np.array([[True, False],
       [True,  True]])
c1

array([[ True, False],
       [ True,  True]])

### Boolean indexing

In [105]:
a[c1]

array([1, 3, 1])

In [107]:
c2 = np.array([[True, True],
       [True,  True]])
c2

array([[ True,  True],
       [ True,  True]])

In [108]:
a[c2]

array([1, 4, 3, 1])

In [221]:
# можно сразу в одну строку, без промежуточных переменных
a[b < 4]

array([1, 3, 1])

### all и any

In [131]:
a = np.array([1, 2, 3, 4])
b = np.array([4, 3, 2, 1])

In [132]:
a < b

array([ True,  True, False, False])

In [133]:
np.all(a < b)

False

In [134]:
np.any(a < b)

True

In [135]:
if np.all(a < b):
    print("Все элементы a меньше, чем соответствующие элементы b")
elif np.any(a < b):
    print("Некоторые элементы a меньше, чем соответствующие элементы b")
else:
    print("Все элементы a больше или равны, чем соответствующие элементы b")

Некоторые элементы a меньше, чем соответствующие элементы b


## Линейная алгебра

In [223]:
A = np.array([[1, 2, 3],
              [4, 5, 6]])
A

array([[1, 2, 3],
       [4, 5, 6]])

### Транспонированная матрица `A.T`

$$\begin{gather}
\begin{bmatrix}
1 & 2 & 3\\
4 & 5 & 6
\end{bmatrix}^T = \begin{bmatrix}
1 & 4\\
2 & 5\\
3 & 6
\end{bmatrix}\end{gather}
$$

In [116]:
A.T

array([[1, 4],
       [2, 5],
       [3, 6]])

### Единичная матрица 

В единичной матрице на главной диагонали 1, а на остальных местах 0.

Создаем единичную матрицу размера 2х2 функцией `e = np.eye(2)`

$$\begin{bmatrix}
1 & 0\\
0 & 1
\end{bmatrix}$$

In [117]:
e = np.eye(2)
e

array([[1., 0.],
       [0., 1.]])

### Обратная матрица 

Определение (математика): E - единичная матрица. Квадратная матрица В называется обратной по отношению к матрице А того же размера, если $A\cdot B = B \cdot A = E$

Обратная матрица для матрицы $А$ в линейной алгебре обозначается как $А^{-1}$

Для вычисления обратной матрицы используют метод `inv` пакета `numpy.linalg`. В этой библиотеке еще есть функции `det` (вычисление детерминанта матрицы) и `solve` (решение матричных уравнений).

Вычислим обратную матрицу для матрицы $$A = \begin{bmatrix}
1 & 2\\
3 & 4
\end{bmatrix}$$

In [118]:
A = np.array([
    [1, 2],
    [3, 4]
])
A

array([[1, 2],
       [3, 4]])

In [119]:
# очень длинная запись, полные имена
import numpy as np
a = np.array([[1, 2], [3,4]])
print(a)
ai = np.linalg.inv(a) # пишем полное имя функции с указанием библиотек, где она находится
print(ai)

[[1 2]
 [3 4]]
[[-2.   1. ]
 [ 1.5 -0.5]]


In [120]:
# короче, пакет импортируем
import numpy as np
import numpy.linalg as lg    # запоминаем библиотеку numpy.linalg под коротким именем lg
a = np.array([[1, 2], [3,4]])
print(a)

ai = lg.inv(a)               # обращаемся к функции по короткому имени библиотеки
print(ai)

[[1 2]
 [3 4]]
[[-2.   1. ]
 [ 1.5 -0.5]]


In [224]:
# Совсем коротко: перечисляем имена функций, которые будем использовать из этого пакета
import numpy as np
from numpy.linalg import inv, det, solve    # перечислили

a = np.array([[1, 2], [3,4]])
print(a)

ai = inv(a)   # используем импортированное имя
print(ai)

[[1 2]
 [3 4]]
[[-2.   1. ]
 [ 1.5 -0.5]]


### Детерминант матрицы

In [225]:
import numpy as np
from numpy.linalg import inv, det, solve    # перечислили

a = np.array([[1, 2], [3,4]])
print(a)
np.linalg.det(a)

[[1 2]
 [3 4]]


-2.0000000000000004

### Ранг матрицы (в смысле линейной алгебры)
Ранг матрицы - количество линейно независимых столбцов. (Их нельзя получить умножая на числа и складывая другие столбцы).

По теореме о базисном миноре, ранг равен и количеству линейно независимых строк. Ранг матрицы может быть меньше размера матрицы.

В numpy ранг матрицы вычисляется функцией `numpy.linalg.matrix_rank(a)`

In [123]:
a = ([[1, 2, 3], [4, 5, 6]])

np.linalg.matrix_rank(a)

2

In [226]:
# последняя строка = первая * 2 + вторая строка (линейно зависимая)
b = ([[1, 2, 3], [4, 5, 6], [6, 9, 12]])  
np.linalg.matrix_rank(b)

2

**Размер** матрицы определяется **переменной** **shape**. 

In [125]:
a = np.array([[1, 2, 3], [4, 5, 6]])
a.shape

(2, 3)

## Обратные матрицы в решении линейных уравнений
Пусть у нас есть уравнение $A \cdot X = B$

Домножим с ОДИНАКОВОЙ стороны правую и левую сторону на $A^{-1}$

$A^{-1} \cdot A \cdot X = A^{-1} \cdot B$

По определению обратной матрицы $A^{-1} \cdot A = E$ (единичная матрица)

$ E \cdot X = A^{-1}  \cdot B$

$ X = A^{-1}  \cdot B$

### Решение систем линейных уравнений

Пусть дана система линейных уравнений 

\begin{align*} 
2x - 5y &=  8 \\ 
3x + 9y &=  -12
\end{align*}

Запишем ее в виде матричного уравнения $A\cdot X = B$, где

$A = \begin{bmatrix}
2 & -5\\
3 & 9
\end{bmatrix}$

$X = \begin{bmatrix}
x & y
\end{bmatrix}$

$B = \begin{bmatrix}
8\\
-12
\end{bmatrix}$

Дальше можно решить как матричное уравнение. Или использовать функцию `linalg.solve(A, B)`

In [126]:
A = np.array([[2, -5],[3, 9]])
A

array([[ 2, -5],
       [ 3,  9]])

In [127]:
B = np.array([[8], [-12]]) # или можете транспонировать
B

array([[  8],
       [-12]])

In [128]:
# решим систему уравнений AX = B, найдем Х
X = np.linalg.solve(A, B)
X

array([[ 0.36363636],
       [-1.45454545]])

In [129]:
# Проверим решение
np.allclose(A.dot(X), B)

True

# Манипуляции с матрицами 

## Доступ к элементам и срезы

Одномерный массив (ничего нового, это срезы python)
| Выражение | Значение |
|----|----|
| `a[m]` | элемент с номером m, где m целое (нумерация начинается с 0). |
| `a[-m]` | элемент с номером m с конца. |
| `a[m:n]` | элементы с номерами от m (включая) до n (НЕ включая) |
| `a[:]` | все элементы по данной оси |
| `a[:n]` | элементы с номерами от 0 до n-1 (НЕ включая n) |
| `a[m:]` | элементы с номерами от m до конца |
| `a[m:n:p]` | элементы с номерами от m (включая) до n (НЕ включая) с шагом p. |
| `a[::-1]` | все элементы в обратном порядке |

In [155]:
a = np.arange(0, 11)
a

array([ 0,  1,  2,  3,  4,  5,  6,  7,  8,  9, 10])

In [158]:
# первый элемент
a[0]

0

In [159]:
# последний элемент
a[-1]

10

In [161]:
a[1:-1]

array([1, 2, 3, 4, 5, 6, 7, 8, 9])

In [163]:
a[2:]

array([ 2,  3,  4,  5,  6,  7,  8,  9, 10])

In [162]:
a[:-1]

array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])

### Многомерные массивы

К каждой оси применимы правила для одномерных массивов.

In [227]:
A = np.fromfunction(foo, (6, 6), dtype=int)
A

array([[ 0,  1,  2,  3,  4,  5],
       [10, 11, 12, 13, 14, 15],
       [20, 21, 22, 23, 24, 25],
       [30, 31, 32, 33, 34, 35],
       [40, 41, 42, 43, 44, 45],
       [50, 51, 52, 53, 54, 55]])

In [166]:
A[:, 1]                          # вторая колонка (колонка с индексом 1)

array([ 1, 11, 21, 31, 41, 51])

In [167]:
A[1, :]                          # вторая строка (строка с индексом 1)

array([10, 11, 12, 13, 14, 15])

In [168]:
A[:3, :3]                        # верхняя левая часть матрицы

array([[ 0,  1,  2],
       [10, 11, 12],
       [20, 21, 22]])

In [169]:
A[3:, :3]                        # нижняя левая часть матрицы

array([[30, 31, 32],
       [40, 41, 42],
       [50, 51, 52]])

In [170]:
A[::2, ::2]                      # каждый второй элемент, начиная с 0,0

array([[ 0,  2,  4],
       [20, 22, 24],
       [40, 42, 44]])

In [171]:
A[1::2, 1::3]                    # каждая вторая строка, начиная с 1; каждый третий столбец, начиная с 1

array([[11, 14],
       [31, 34],
       [51, 54]])

Взято из https://github.com/rougier/numpy-tutorial
![image.png](attachment:874bd5eb-51f1-46e3-bcfb-be0090f7d94f.png)

### Срезы и модификация исходной матрицы

| Код | Результат |
|----|----|
| `Z`          | ![image.png](attachment:9516b71f-d957-4a19-955a-b61c75120ff0.png) |
| `Z[...] = 1` | ![image.png](attachment:c3d04385-baf8-4167-a051-f91b02a2b979.png) |
| `Z[1,1] = 1` | ![image.png](attachment:07ec365e-92f6-495d-887a-fc558be7d0d4.png) |
| `Z[:,0] = 1` | ![image.png](attachment:93756d64-0c3c-45a5-a196-ecf1e9ea0046.png) |
| `Z[0,:] = 1` | ![image.png](attachment:76a403fb-aedf-49d1-a447-1fdc43efbe67.png) |
| `Z[2:,2:] = 1`     | ![image.png](attachment:3f5d8ba0-9cb9-4da3-aa1c-51861a9fb3e3.png) |
| `Z[:, ::2] = 1`    | ![image.png](attachment:89fa788b-8254-4eb8-8cf8-2eeb2f9ad7bf.png) |
| `Z[::2, :] = 1]`   | ![image.png](attachment:842133cf-97f9-4af3-86c7-6d2b07b86c97.png) |
| `Z[:-2, :-2] = 1`  | ![image.png](attachment:79f5872f-264a-478a-bc2b-ca0a2ba2f6dc.png) |
| `Z[2:4, 2:4] = 1`  | ![image.png](attachment:6c7a1a9d-a8a2-4da9-8d0f-25c7407653ed.png) |
| `Z[::2, ::2] = 1`  | ![image.png](attachment:9658e7cc-314a-4d89-b303-05a5693e4eb2.png) |
| `Z[3::2, 3::2] = 1` | ![image.png](attachment:630d4256-bb92-4e0c-8774-9c71c9b775b1.png) |

### view и copy

Нужно различать действия

* `b1 = a` - переменная `b1` ссылается на тот же объект, что и переменная `a`. Никаких новых объектов не создается. Изменяем `b1[0]`, изменяются данные в `a`.
* `b2 = a.view()` или `b3 = a[3:, :2]` - данные в `a`, во view ссылка на `a` и указания какие области из `a` брать. Изменяем `b3[0]`, меняются данные в `a`.
* `b4 = a.copy()` - копия данных. Изменяем `b4[0]`, `a` **не изменяется**.

In [3]:
a = np.array([[1, 2, 3], [4, 5, 6]])
a

array([[1, 2, 3],
       [4, 5, 6]])

In [17]:
# переменная b ссылается на тот же объект, что и a
b1 = a
print(b1 is a)
print(b1 == a)
print('====')
a[1,0] = 100
print(a)
print(b1)

True
[[ True  True  True]
 [ True  True  True]]
====
[[  1   2   3]
 [100   5   6]]
[[  1   2   3]
 [100   5   6]]


In [18]:
# view - ссылка на данные и указание с какой областью данных работаем
b2 = a.view()         
print('b2 is a', b2 is a)        # это разные объекты
print('b2 == a', b2 == a)        # с одинаковыми данными
print('b2.base is a', b2.base is a)          # а и b2 ссылаются на одни и те же данные
print('-------')
print('a.flags.owndata', a.flags.owndata)    # а имеет данные
print('b2.flags.owndata', b2.flags.owndata)  # b2 - только определяет где данные
print('====')
a[1,0] = 200
print(a)
print(b2)

b2 is a False
b2 == a [[ True  True  True]
 [ True  True  True]]
b2.base is a True
-------
a.flags.owndata True
b2.flags.owndata False
====
[[  1   2   3]
 [200   5   6]]
[[  1   2   3]
 [200   5   6]]


In [19]:
# copy - полная копия всего объекта
b4 = a.copy()         
print('b4 is a', b4 is a)        # это разные объекты
print('b4 == a', b4 == a)        # с одинаковыми данными
print('b4.base is a', b4.base is a)          # а и b4 ссылаются на РАЗНЫЕ КОПИИ данные
print('-------')
print('a.flags.owndata', a.flags.owndata)    # а имеет данные
print('b4.flags.owndata', b4.flags.owndata)  # b4 имеет свои данные
print('====')
a[1,0] = 300
b4[1,0] = 400
print(a)
print(b4)

b4 is a False
b4 == a [[ True  True  True]
 [ True  True  True]]
b4.base is a False
-------
a.flags.owndata True
b4.flags.owndata True
====
[[  1   2   3]
 [300   5   6]]
[[  1   2   3]
 [400   5   6]]


## Fancy indexing

In [228]:
b = np.array([[1, 2, 3], [4, 5, 6]])
b

array([[1, 2, 3],
       [4, 5, 6]])

In [229]:
b[1,2]

6

In [230]:
b[1][2]

6

In [231]:
# b[0,0], b[1,1], b[0,2], b[1,0]
b[[0, 1, 0, 1],[0, 1, 2, 0]]

array([1, 5, 3, 4])

## Fancy index + slice

In [232]:
b = np.array([[1, 2, 3], [4, 5, 6]])
b

array([[1, 2, 3],
       [4, 5, 6]])

In [233]:
# строки нулевая, первая, нулевая, первая
b[[0, 1, 0, 1]]

array([[1, 2, 3],
       [4, 5, 6],
       [1, 2, 3],
       [4, 5, 6]])

In [234]:
# к этому добавить все строки, столбцы в порядке первый, нулевой, второй, нулевой
b[[0, 1, 0, 1]][:,[1, 0, 2, 0]]

array([[2, 1, 3, 1],
       [5, 4, 6, 4],
       [2, 1, 3, 1],
       [5, 4, 6, 4]])

## Broadcasting

Что будет, если к матрице 3х4 прибавить матрицу другого размера, например, строку или столбец? Numpy попробует "расширить" объект до необходимых размеров. Это называется broadcasting.

Примеры broadcasting:

| Слагаемое1 | | Слагаемое2 | | Расширенное слагаемое1 | | Расширенное слагаемое2 | | Результат |
|----|----|-----|----|----|----|-----|----|----|
| ![image.png](attachment:aee18656-f3c5-4998-ae6a-c1f2b01d707c.png) | + | ![image.png](attachment:0c5af417-db9e-4493-a7e1-5bc94ed369cf.png) | → | ![image.png](attachment:aee18656-f3c5-4998-ae6a-c1f2b01d707c.png) | + | ![image.png](attachment:e7acc5aa-a704-44a8-b55f-5af551c6904f.png) | = | ![image.png](attachment:10bf4602-b98e-4dc3-b023-40f31995a428.png) |
| ![image.png](attachment:aee18656-f3c5-4998-ae6a-c1f2b01d707c.png) | + | ![image.png](attachment:3a51ff41-8525-4cd3-9110-1384a201df7c.png) | → | ![image.png](attachment:aee18656-f3c5-4998-ae6a-c1f2b01d707c.png) | + | ![image.png](attachment:a54cdbf3-7288-4ffa-bc99-2a043629c169.png) | = | ![image.png](attachment:f100bdba-8fd5-45de-b3d3-782b1bbe1fdd.png) |
| ![image.png](attachment:aee18656-f3c5-4998-ae6a-c1f2b01d707c.png) | + | ![image.png](attachment:35890d04-afed-473f-a0fb-6e5a7fb640f3.png) | → | ![image.png](attachment:aee18656-f3c5-4998-ae6a-c1f2b01d707c.png) | + | ![image.png](attachment:67b4c908-eb60-4b56-9b48-5e3fc4b9b9c2.png) | = | ![image.png](attachment:3140ad90-1d7d-4411-b97d-bca55b948204.png) |
| ![image.png](attachment:3a51ff41-8525-4cd3-9110-1384a201df7c.png) | + | ![image.png](attachment:35890d04-afed-473f-a0fb-6e5a7fb640f3.png) | → | ![image.png](attachment:a54cdbf3-7288-4ffa-bc99-2a043629c169.png) | + | ![image.png](attachment:67b4c908-eb60-4b56-9b48-5e3fc4b9b9c2.png) | = | ![image.png](attachment:8f590917-a28b-40b4-8f7a-70e6710443f5.png) |

In [22]:
a = np.fromfunction(foo, (3, 4), dtype=int)
a

NameError: name 'foo' is not defined

In [5]:
# сложение с числом
a + 100

array([[100, 101, 102, 103],
       [110, 111, 112, 113],
       [120, 121, 122, 123]])

In [20]:
col = np.array([[3], [6], [9]])
col

array([[3],
       [6],
       [9]])

In [21]:
# сложение с вектор-столбцом
a + col

ValueError: operands could not be broadcast together with shapes (2,3) (3,1) 

In [8]:
row = np.array([100, 200, 300, 400])
row

array([100, 200, 300, 400])

In [10]:
# сложение с вектором-строкой
a + row

array([[100, 201, 302, 403],
       [110, 211, 312, 413],
       [120, 221, 322, 423]])

In [11]:
# столбец + строка
col + row

array([[103, 203, 303, 403],
       [106, 206, 306, 406],
       [109, 209, 309, 409]])

In [13]:
# строка + столбец = то же самое
row + col

array([[103, 203, 303, 403],
       [106, 206, 306, 406],
       [109, 209, 309, 409]])

## Operations

| Операция | Z до | Z после |
|----|----|----|
| `np.where(Z > 11, 0, 1)` | ![image.png](attachment:5a4e8986-78c3-4e60-a3e3-e753000fb410.png) | ![image.png](attachment:d1315695-9d44-4ab8-b36e-4caa1c33aca4.png) |
| `np.maximum(Z, 11)` | ![image.png](attachment:61224ff5-dec8-4d08-9437-cad15458d2ac.png) | ![image.png](attachment:137ffeab-1a24-47bc-8deb-1d3abcef6ee0.png) |
| `np.minimum(Z, 12)` | ![image.png](attachment:61224ff5-dec8-4d08-9437-cad15458d2ac.png) | ![image.png](attachment:4ac14f80-0a76-457d-9fbd-d840443f9341.png) |
| `np.sum(Z, axis=0)` | ![image.png](attachment:61224ff5-dec8-4d08-9437-cad15458d2ac.png) | ![image.png](attachment:a511aa11-c27b-45aa-96e8-ef8506989fa1.png) |

In [14]:
Z = np.fromfunction(foo, (3, 4), dtype=int)
Z

array([[ 0,  1,  2,  3],
       [10, 11, 12, 13],
       [20, 21, 22, 23]])

In [16]:
# where(условие, НЕТ, ДА)
np.where(Z > 11, 0, 1)

array([[1, 1, 1, 1],
       [1, 1, 0, 0],
       [0, 0, 0, 0]])

In [20]:
# все элементы меньше 11 заменить на 11
np.maximum(Z, 11)

array([[11, 11, 11, 11],
       [11, 11, 12, 13],
       [20, 21, 22, 23]])

In [21]:
# все элементы больше 12 сделать числом 12
np.minimum(Z, 12)

array([[ 0,  1,  2,  3],
       [10, 11, 12, 12],
       [12, 12, 12, 12]])

In [25]:
# сумму по столбцам (результат имеет тот axis, который указан)
# суммирование идет с изменением указанного в axis индекса
np.sum(Z, axis=0)

array([30, 33, 36, 39])

In [26]:
# сумму по строкам (результат имеет тот axis, который указан)
# суммирование идет с изменением указанного в axis индекса
np.sum(Z, axis=1)

array([ 6, 46, 86])

## Манипуляции с формой матрицы

### Как сделать столбец из строки

Из строки в столбец. Транспонирование дает тот же вектор-строку, но с пометкой "транспонирован", не столбец!

In [23]:
b = np.array([1, 2, 3, 4])     # вектор в строку
b

array([1, 2, 3, 4])

In [237]:
b.T

array([1, 2, 3, 4])

In [239]:
v = b[:, np.newaxis]           # вектор в столбец
v

array([[1],
       [2],
       [3],
       [4]])

### flatten, reshape

In [25]:
a = np.array([[1, 2, 3], [4, 5, 6]])
a

array([[1, 2, 3],
       [4, 5, 6]])

In [26]:
# вытянем в одну строку
a.flatten()

array([1, 2, 3, 4, 5, 6])

In [27]:
# какая размерность матрицы?
a.shape

(2, 3)

In [30]:
# сделаем другую размерность
# из 2х3 получили 3х2 (вытянули в 1 строку и порезали снова)
b = a.reshape(3, 2)
print(a)
print(b)

[[1 2 3]
 [4 5 6]]
[[1 2]
 [3 4]
 [5 6]]


In [33]:
 # -1 значит "столбцов на 1 меньше"
b = a.reshape(3, -1)
print(a)
print(b)

[[1 2 3]
 [4 5 6]]
[[1 2]
 [3 4]
 [5 6]]


### vstack, hstack, 