# Векторы и матрицы

$\vec{AB}$ - вектор

$A = \begin{bmatrix}
    x_{11}       & x_{12} & x_{13} & \dots & x_{1n} \\
    x_{21}       & x_{22} & x_{23} & \dots & x_{2n} \\
    ...\\
    x_{d1}       & x_{d2} & x_{d3} & \dots & x_{dn}
\end{bmatrix}$ - матрица

# Признаковое описание

Пример

* Задача: предсказать завтрашнюю среднедневную температуру в городе
* День - это объект
* Признаки - числовые характеристики объектов


$ x = (25, 0.7, 1, 2, 10, 13, 37, 122)\\ $ 
Признаковое описание

$ x = (\textbf{25, 0.7, 1, 2}, 10, 13, 37, 122)\\ $
*Показатели погоды*

* температура
* относительная
* влажность
* был ли дождь сегодня
* скорость ветра в м\с)

$ x = (25, 0.7, 1, 2, \textbf{10, 13}, 37, 122)\\ $

*Темпоральные признаки*

* Номер месяца
* Текущее время

$ x = (25, 0.7, 1, 2, 10, 13, \textbf{37, 122})\\ $

*Признаки локации*

* Долгота
* Широта

То есть вектор (неформально) - набор чисел определенного количества

# Несколько объектов - матрица

$\begin{bmatrix}
    44.12       & 1 & 114 &  7.2 \\
    \textbf{38.14}       & \textbf{0} & \textbf{360} &  \textbf{4.9} \\
    16.46       & 1 & 48 &  1.1
\end{bmatrix}$ --> Объект

$\begin{bmatrix}
    44.12       & 1 & \textbf{114} &  7.2 \\
    38.14       & 0 & \textbf{360} &  4.9 \\
    16.46       & 1 & \textbf{48} &  1.1
\end{bmatrix}$ --> Признак

In [5]:
import numpy

In [6]:
import numpy as np

In [13]:
x = np.array((25,0.7,1,2,10, 13,37,122))
x

array([ 25. ,   0.7,   1. ,   2. ,  10. ,  13. ,  37. , 122. ])

In [14]:
print(x[0])
print(x[2:4])


25.0
[1. 2.]


In [16]:
x = np.array([
          [44.12, 1, 114, 7.2],
          [38.14, 0, 360, 4.9],
          [16.46, 1, 48, 1.1]
    ])
x

array([[ 44.12,   1.  , 114.  ,   7.2 ],
       [ 38.14,   0.  , 360.  ,   4.9 ],
       [ 16.46,   1.  ,  48.  ,   1.1 ]])

In [27]:
print("Выбор объекта")
print(x[0])
print('-'*10)

print("Выбор признака")
print(x[:, 1])
print('-'*10)

print("Слайс объектов")
print(x[:2])
print('-'*10)

print("Слайс признаков")
print(x[:, :2])
print('-'*10)

Выбор объекта
[ 44.12   1.   114.     7.2 ]
----------
Выбор признака
[1. 0. 1.]
----------
Слайс объектов
[[ 44.12   1.   114.     7.2 ]
 [ 38.14   0.   360.     4.9 ]]
----------
Слайс признаков
[[44.12  1.  ]
 [38.14  0.  ]
 [16.46  1.  ]]
----------


# Векторное пространство

Для векторов задано две операции:

* Сумма векторов
* Умножение вектора на число

При этом операции должны быть замкнуты:

* Сумма векторов - вектор
* Произведение вектора на число - вектор

#  Аксиомы векторного пространства (некоторые)

* $ x + y = y + x $, для любых $ x,y \in V $  - коммутативность сложения
---
* $ x + (y+z)=(x+y)+z $, для любых $ x,y,z \in V $ - ассоциативность сложения
---
$\href{https://ru.wikipedia.org/wiki/%D0%92%D0%B5%D0%BA%D1%82%D0%BE%D1%80%D0%BD%D0%BE%D0%B5_%D0%BF%D1%80%D0%BE%D1%81%D1%82%D1%80%D0%B0%D0%BD%D1%81%D1%82%D0%B2%D0%BE}{Аксиомы} $

Евклидово векторное пространство -- $ \mathbb{R^n} $

* Точки на плоскости -- $ \mathbb{R^2}$
* Точки в пространстве -- $ \mathbb{R^3}$

# Сложение

* $ a = (a_1, ..., a_n) $
* $ b = (b_1, ..., b_n) $

$a + b = (a_1+b_1, ..., a_n+b_n)$

In [28]:
a = np.array([1, 5, 10])
b = np.array([2, 7, 15])

a + b

array([ 3, 12, 25])

# Умножение

* $ a = (a_1, ..., a_n) $

* $ \beta \in \mathbb{R}$

* $ \beta a = (\beta a_1, ..., \beta a_n)$

In [29]:
a = np.array([1, 5, 10])
a * 3

array([ 3, 15, 30])

# Пример - усреднение

$ \overline{x} = \frac{1}{m}\sum_{i=1}^{m}(x^i_1, ..., x^i_n) $

In [33]:
a = np.array([1, 5, 10])
np.sum(a) / a.shape[0] # a.shape[0] same as len() in this case

5.333333333333333

In [30]:
a = np.array([1, 5, 10])
np.mean(a)

5.333333333333333

# Длина вектора (норма)

$ \overrightarrow{AB} = (1,2) $

Длина вычисляется по теореме Пифагора:

$ |\overrightarrow{AB}| = \sqrt{1^2 + 2^2} = \sqrt{5} \approx 2.24$

In [34]:
np.linalg.norm((1,2))

2.23606797749979

# Скалярное произведение

$ \overrightarrow{AB} = (1,2) $

$ \overrightarrow{CD} = (-2,1) $

$ <\overrightarrow{AB}, \overrightarrow{CD}> = (A \cdot C) + (B \cdot D) = 0$

In [37]:
np.dot((1,2), (-2,1))

0

# Угол между векторами

$ \cos \alpha  =  \frac{<\overrightarrow{a},\overrightarrow{b}>}{|\overrightarrow{a}|\cdot|\overrightarrow{b}|} $

In [62]:
a, b = (1,2), (-2, 1)

np.dot(a, b)/(np.linalg.norm(a)*np.linalg.norm(b))


0.0

# Расстояние между векторами (метрика)

*Евклидово расстояние*

$ \sqrt{\sum_{i=1}^{n}(a_i - b_i)^2} = \sqrt{(1-(-2))^2 + (2-1)^2} = \sqrt{10}$

In [46]:
numpy.linalg.norm(np.array(a)-np.array(b))

3.1622776601683795

# Матрицы

A = $\begin{bmatrix}
    44.12       & 1 & 114 &  -7.2 \\
    -38.14       & 0 & 360 &  4.9 \\
    16.46       & 1 & 48 &  -1.1
\end{bmatrix}$

Первый индекс - строка, второй - столбец

$ A_{01} = 1 $

$ A_{21} = 360 $

$A = \begin{bmatrix}
    44.12       & 1 & 114 &  -7.2 \\
    -38.14       & 0 & 360 &  4.9 \\
    16.46       & 1 & 48 &  -1.1
\end{bmatrix}$

$ y = (0, 0, 1) $

# Линейная классификация как система уравнений
$
  \begin{cases}
               44.12w_1 + 1w_2 + 114w_3 - 7.2w_4 = 0\\
               -38.14w_1 + 0w_2 + 360w_3 - 4.9w_4 = 0\\
               16.46w_1 + 1w_2 + 48w_3 - 1.1w_4 = 1
            \end{cases}
  $

# Запись в виде векторов и матриц

Вектор - тоже матрица, у которой одна из размерностей равна 1

Вектор-столбец: $\begin{bmatrix} w_1 \\ w_2 \\ w_3 \\ w_4\end{bmatrix}$

Вектор-строка: $[w_1, w_2, w_3, w_4]$

# Умножение на вектор

Матрица $m \times n$

Вектор-столбец $n \times 1$

Результат умножения:

$Aw = \begin{bmatrix} \sum_{i=1}^{n}a_{1i}w_i \\ \sum_{i=1}^{n}a_{2i}w_i \\ ... \\ \sum_{i=1}^{n}a_{mi}w_i\end{bmatrix}$

$\begin{bmatrix}
    44.12       & 1 & 114 &  -7.2 \\
    -38.14       & 0 & 360 &  4.9 \\
    16.46       & 1 & 48 &  -1.1
\end{bmatrix} \times \begin{bmatrix} 1 \\ 2 \\ 1 \\0\end{bmatrix} = \begin{bmatrix} 160.12 \\ 321.86 \\ 66.46 \end{bmatrix}$


In [61]:
a = np.array([[44.12, 1, 114, -7.2],
              [-38.14, 0, 360, 4.9],
              [16.46, 1, 48, -1.1]])

b = np.array([[1], [2], [1], [0]])

np.matmul(a,b)

array([[160.12],
       [321.86],
       [ 66.46]])

# Линейное преобразование

Матрица $ m \times n $

При умножении на вектор длины $n$ получаем вектор длины $m$

Матрица задает линейное преобразование из одного векторного пространства в другое

# Умножение матриц

Возможно только при совпадении количества столбцов в первой матрице и количества строк во второй матрице

Первая матрица $m \times n$

Вторая матрица $n \times k$

Результат -- матрица $С$ размера $m \times k$

$ C = AB $

$C_{ij} = \sum_{p=1}^{n}a_{ip}b_{pj}$

![MatMul](https://upload.wikimedia.org/wikipedia/commons/8/86/Matrix_multiplication_.gif?20180604102630 "mm")

In [74]:
a = np.random.randint(10, size=(2,3))
b = np.random.randint(10, size=(3,2))

print("matrix A:")
print(a)
print("matrix B:")
print(b)
print("\nmultiplication result:")
np.matmul(a, b)

matrix A:
[[7 3 5]
 [2 3 8]]
matrix B:
[[2 4]
 [4 7]
 [5 4]]

multiplication result:


array([[51, 69],
       [56, 61]])

# Транспонирование

* Транспонирование - поворот относительно главной диагонали
* Матрица $A$ размера $m \times n$ превращается в $A^T$ размера $n \times m$
* $a_{ij}^T = a_{ji}$
* Строки становятся столбцами

![transpose](https://i.makeagif.com/media/3-31-2015/0Pqxwv.gif "t")

In [79]:
a = np.random.randint(10, size=(2,3))
print(a)

print("\nTransposed:")
print(a.T)

[[4 7 9]
 [9 7 5]]

Transposed:
[[4 9]
 [7 7]
 [9 5]]


[Numpy Stanford tutorial](https://github.com/srigalibe/CS231n-Python-NumPy-Tutorial/blob/master/tutorials/python/CS231n-Python-NumPy-Tutorial.ipynb "Standford") <-- дополнительно

Для домашки:
* Array
* Array indexing
* Distance between points

Просто почитать:
* Boolean array indexing
* Datatypes
* Plotting