---

<h2 style="text-align: center;"><b>DS&ML. Занятие 3: Numpy, многомерные массивы</b></h2>

In [None]:
import numpy as np

## Двумерные массивы (матрицы)

$$
A = \begin{bmatrix}
    x_{11} & x_{12} & x_{13} & \dots  & x_{1m} \\
    x_{21} & x_{22} & x_{23} & \dots  & x_{2m} \\
    \vdots & \vdots & \vdots & \ddots & \vdots \\
    x_{n1} & x_{n2} & x_{n3} & \dots  & x_{nm}
\end{bmatrix}
$$

In [None]:
a = np.array([9,2,5,6,8,3])
a

In [None]:
x = [[5,9,7],[3, 4, 1]]
b = np.array(x)
b

In [None]:
print(b)

`ndarray.ndim` — число осей (измерений) массива. В мире Python число измерений часто называют рангом

Наш массив a одномерный, то есть просто строчка, поэтому

In [None]:
a.ndim

In [None]:
b.ndim

`ndarray.shape` — размеры массива, его форма. Это кортеж натуральных чисел, показывающий длину массива по каждой оси. Для матрицы из n строк и m столбов, shape будет (n,m). 

В $n$-мерном случае возвращается кортеж размеров по каждой координате.

In [None]:
print(a.shape, b.shape)

In [None]:
print(len(a), len(b))

In [None]:
print(a.size, b.size)

**Вопрос:** 
 >Как связаны shape, ndim, size?

**Ответ:**

In [None]:
c = np.array([[5,9,7],[3, 4, 1]])
print(c.shape, c.ndim, c.size)


__Обратите внимание:__ вектор и одномерный массив тождественные понятия в `NumPy`. Помимо этого, также существуют понятия _вектор-столбец_ и _вектор-строка_, которые, несмотря на то что математически задают один и тот же объект, являются двумерными массивами и имеют другое значение поля __`shape`__ (в этом случае поле состоит из двух чисел, одно из которых равно единице).

In [None]:
x = np.array([1, 2, 3, 4, 5])
print(x)

In [None]:
print('shape():', x.shape,'\nndim():', x.ndim, '\nsize():', x.size, '\nlen():', len(x))

In [None]:
y = np.array([[1], [2], [3], [4], [5]])
print(y)

In [None]:
print('shape():', y.shape,'\nndim():', y.ndim, '\nsize():', y.size, '\nlen():', len(y))

**Вопрос:**
>Каковы значения shape, ndim, size, len для картинки RGB 160x100? 

>А для массива из 1000 таких картинок?

**Ответ:**

## Срезы

Наш 2-мерный массив __b__, также его можно назвать матрицей, имеет 2 строки и 3 столбца.
То есть наша матрица состоит из 2 вектор-строк:

In [None]:
print(b)

In [None]:
b[0:2, 0:1]

In [None]:
b[:, 0:1]

In [None]:
b[1:2]

In [None]:
b[1]

Обычно в линейной алгебре под любым вектором подразумевается вектор-столбец. Наша матрица содержит 3 вектор-стобца:

In [None]:
b[:, 0:1]

In [None]:
b[:, 1:2]

In [None]:
b[:, 2:3]

## Создание стандартных матриц

Второй способ создания — с помощью встроенных функций __`numpy.eye(N, M=None, ...)`__, __`numpy.zeros(shape, ...)`__, __`numpy.ones(shape, ...)`__.

Первая функция создает единичную матрицу размера $N \times M$; если $M$ не задан, то $M = N$. 

Вторая и третья функции создают матрицы, состоящие целиком из нулей или единиц соответственно. В качестве первого аргумента необходимо задать размерность массива — кортеж целых чисел. В двумерном случае это набор из двух чисел: количество строк и столбцов матрицы.

__Примеры:__

In [None]:
e = np.eye(5)
print("Единичная матрица:\n", e)

In [None]:
c = np.ones((7, 5))
print("Матрица, состоящая из одних единиц:\n", c)

__Обратите внимание: размерность массива задается не двумя аргументами функции, а одним — кортежем!__ 

Вот так —  __`np.ones(7, 5)`__ — создать массив не получится, так как функции в качестве параметра `shape` передается `7`, а не кортеж `(7, 5)`.

И, наконец, третий способ — с помощью функции __`numpy.arange([start, ]stop, [step, ], ...)`__, которая создает одномерный массив последовательных чисел из промежутка __`[start, stop)`__ с заданным шагом __`step`__, и _метода_ __`array.reshape(shape)`__. 

Параметр __`shape`__, как и в предыдущем примере, задает размерность матрицы (кортеж чисел). Логика работы метода ясна из следующего примера:

In [None]:
v = np.arange(0, 24, 2)
print("Вектор:\n", v)

In [None]:
d = v.reshape((3,4))
print("Матрица:\n",d)

Сумма всех элементов; суммы столбцов; суммы строк.

In [None]:
d

In [None]:
print(d.sum())
print(d.sum(axis=0))
print(d.sum(axis=1))

Аналогично работают `prod`, `max`, `min` и т.д.

In [None]:
print(d.max())
print(d.max(axis=0))
print(d.max(axis=1))

След - сумма диагональных элементов.

In [None]:
d

In [None]:
np.trace(d)

## Многомерные массивы

In [None]:
X = np.arange(24).reshape(2, 3, 4)
print(X)

Суммирование (аналогично остальные операции)

In [None]:
print(X)

In [None]:
# суммируем только по нулевой оси, то есть для фиксированных j и k суммируем только элементы с индексами (*, j, k)
print(X.sum(axis=0))


In [None]:
# суммируем сразу по двум осям, то есть для фиксированной i суммируем только элементы с индексами (i, *, *)
print(X.sum(axis=(1, 2)))

## Операции с матрицами

In [None]:
A = np.array([[1, 0], [0, 1]])
B = np.array([[4, 1], [2, 2]])

In [None]:
A

In [None]:
B

In [None]:
print(A + B)

In [None]:
print(A - B)

In [None]:
print(A / B)

In [None]:
print(A * B)

__Напоминание теории.__ __Транспонированной матрицей__ $A^{T}$ называется матрица, полученная из исходной матрицы $A$ заменой строк на столбцы. Формально: элементы матрицы $A^{T}$ определяются как $a^{T}_{ij} = a_{ji}$, где $a^{T}_{ij}$ — элемент матрицы $A^{T}$, стоящий на пересечении строки с номером $i$ и столбца с номером $j$.

В `NumPy` транспонированная матрица вычисляется с помощью функции __`numpy.transpose()`__ или с помощью _метода_ __`array.T`__, где __`array`__ — нужный двумерный массив.

In [None]:
a = np.array([[1, 2], [3, 4]])
b = np.transpose(a)
c = a.T.T

In [None]:
print("Матрица:\n", a)
print("Транспонирование функцией:\n", b)
print("Транспонирование методом:\n",  c)

__Напоминание теории.__ Операция __умножения__ определена для двух матриц, таких что число столбцов первой равно числу строк второй. 

Пусть матрицы $A$ и $B$ таковы, что $A \in \mathbb{R}^{n \times k}$ и $B \in \mathbb{R}^{k \times m}$. __Произведением__ матриц $A$ и $B$ называется матрица $C$, такая что $c_{ij} = \sum_{r=1}^{k} a_{ir}b_{rj}$, где $c_{ij}$ — элемент матрицы $C$, стоящий на пересечении строки с номером $i$ и столбца с номером $j$.

В `NumPy` произведение матриц вычисляется с помощью функции __`numpy.dot(a, b, ...)`__ или с помощью _метода_ __`array1.dot(array2)`__, где __`array1`__ и __`array2`__ — перемножаемые матрицы.

In [None]:
a

In [None]:
y = np.array([1, 2])
y

In [None]:
z = np.dot(a, y)
z

In [None]:
a = np.array(
[
    [1,2],
    [3,4],
    [5,6],
    [7,8]
]
)

b = np.array(
[
    [0,0],
    [0,1]    
]
    
)

print(np.dot(a,b))

### Задачи по numpy для самостоятельного решения:

1. Создать массив, изображенный на рисунке. Сделать срезы, обозначенные красным, синим, зеленым и сиреневым цветом.


![image.png](attachment:image.png)

2.Сложите, вычтите, поэлементно умножьте и поделите матрицы:

1). 
$
A = \begin{bmatrix}
    1 & 2 & 10 \\
    5 & 1 & -13
\end{bmatrix}
$ 
и
$
B = \begin{bmatrix}
    -5 & -5 & 3 \\
    0 & 1 & 2
\end{bmatrix}
$

2). 
$
A = \begin{bmatrix}
    1 & 2 & 10 \\
    5 & 1 & -13
\end{bmatrix}
$ 
и
$
B = \begin{bmatrix}
    -5 & -5 & 3 & 15 \\
    0 & 1 & 2 & 100
\end{bmatrix}
$

3). 
$
A = \begin{bmatrix}
    1 & 2 & 10 \\
    5 & 1 & -13
\end{bmatrix}
$ 
и
$
B = \begin{bmatrix}
    -5 & -5 \\
    0 & 1 \\
    10 & 20 \\
    -15.5 & -1
\end{bmatrix}
$

3.Перемножьте матрицы (матрично) (они умышленно даны в таком виде -- нужно привыкать):  

**a):**   
A = [[2, 3, -2], [9, 0, 1], [1, 0, 0]]  
B = [[1], [2], [3]]  

**b):**  
A = [[10, 20, 30, 5], [-9, -1, 2, -1]]  
B = [[1, 1], [2, 2], [5, 5], [11, 12]]  

**c):**
A = [[10, 20, 30, 5], [-9, -1, 2, -1]]  
B = [[1, 1], [2, 2], [5, 5]]  

4.Дан двумерный массив размера m x n. Определить, одинакова ли сумма элементов во всех строках и столбцах.

#### Задача 1

#### Задача 2

#### Задача 3

#### Задача 4