# Линейная алгебра

## Вектор

Вектор $\mathbf{v}$ (или $\vec{v}$) - это элемент векторного пространства $\mathrm{V}$.  
Для него определены операции сложения друг с другом и умножения на число (скаляр). Эти операции подчинены аксиомам, которые мы скоро увидим.  
О векторе можно крайне упрощенно думать как о массиве из чисел $x_{\textit{i}}$.

$$\mathbf{v} = \vec{v} = 
\begin{pmatrix}
x_{\textit{1}} \\
x_{\textit{2}} \\
\dots \\
x_{\textit{n}}
\end{pmatrix}
$$

Пример:
$$\mathbf{v} =  
\begin{pmatrix}
12 \\
3 \\
1 \\
17
\end{pmatrix}, 
\mathbf{v}_{2} = 3
$$

### Транспонирование
Обычно вектор представляют в виде столбца.  
Можно представить вектор в виде строки с помощью операции транспонирования $\mathbf{v}^{\top}$:
$$
\begin{pmatrix}
x_{\textit{1}} \\
x_{\textit{2}} \\
\dots \\
x_{\textit{n}}
\end{pmatrix}^{\top}
=
\begin{pmatrix}
x_{\textit{1}} , x_{\textit{2}} , \dots , x_{\textit{n}}
\end{pmatrix}
$$
Если вам по какой-то причине захочется превратить вектор-строку обратно в вектор-столбец, вы можете воспользоваться операцией транспонирования снова, ведь $(\mathbf{v}^{\top})^{\top} = \mathbf{v}$.

---
### Линейные пространства
__Определение.__ Линейное (векторное) пространство $\mathrm{V}(\mathbb{F})$ над полем $\mathbb{F}$ — упорядоченная четверка $(\mathrm{V}, \mathbb{F}, +, •)$, где:

1) $\mathrm{V}$ — непустое множество векторов (произвольной природы),

2) $\mathbb{F}$ — поле скаляров

3) $+: \mathrm{V} \times \mathrm{V} \rightarrow \mathrm{V}$ — операция сложения двух векторов,

4) $•: \mathbb{F} \times \mathrm{V} \rightarrow \mathrm{V}$ — операция умножения скаляра на вектор.

Для линейных пространств задаются следующие аксиомы:

1) $\forall x, y \in \mathrm{V}: x + y = y + x$ *(Коммутативность сложения)*

2) $\forall x, y, z \in \mathrm{V}: (x + y) + z = x + (y + z)$ *(Ассоциативность сложения)*

3) $\exists \mathbb{0} \in \mathrm{V}\ \forall x \in \mathrm{V}: x + \mathbb{0} = x$ *(Существование нейтрального элемента по сложению)*

4) $\forall x \in \mathrm{V}\ \exists (-x) \in \mathrm{V}: x + (-x) = \mathbb{0}$ *(Существования противоположного элемента по сложению)*

5) $\forall \alpha, \beta \in \mathbb{F}\ \forall x \in \mathrm{V}: \alpha(\beta x) = (\alpha \beta) x$ *(Ассоциативность умножения скаляров на вектор)*

6) $\forall x \in \mathrm{V}: \mathbb{1} • x = x $ *(Нейтральный элемент по умножению из поля является нейтральным элементов для операции умножения на вектор)*

7) $\forall \alpha, \beta \in \mathbb{F}\ \forall x \in \mathrm{V}: (\alpha + \beta) x = \alpha x + \beta x$ *(Дистрибутивность сложения скаляров относительно умножения скаляра на вектор)*

8) $\forall \alpha \in \mathbb{F}\ \forall x, y \in \mathrm{V}: \alpha (x + y) = \alpha x + \alpha y$ *(Дистрибутивность сложения векторов относительно умножения на скаляр)*

__Определение__. Пусть $x_1, ..., x_n \in \mathrm{V}, \alpha_1, ..., \alpha_n \in \mathbb{F}$.

Линейной комбинацией векторов $x_1, ..., x_n$ с коэффициентами $\alpha_1, ..., \alpha_n$ называется следующая сумма:

$$ \alpha_1 x_1 + \alpha_2 x_2 + ... + \alpha_n x_n = \sum_{i=1}^{n} \alpha_i x_i$$
___

## Матрица

Матрица $\pmb{M}$ размера $m \times n$- это таблица из элементов $x_{\textit{ij}}$ над полем $\mathbb{F}$.  
$$
\pmb{M} = 
\begin{bmatrix}
    x_{1,1} & x_{1,2} & x_{1,3} & \dots  & x_{1,n} \\
    x_{2,1} & x_{2,2} & x_{2,3} & \dots  & x_{2,n} \\
    \vdots & \vdots & \vdots & \ddots & \vdots \\
    x_{m,1} & x_{m,2} & x_{m,3} & \dots  & x_{m,n}
\end{bmatrix}
$$

Матрица состоит из строк и столбцов.  
Размер матрицы выше - $m \times n$. Это значит, что в ней $m$ строк и $n$ столбцов.  
Возьмем элемент $x_{\textit{i,j}}$.  
*i* - номер строки, в которой находится данный элемент.  
*j* - номер столбца, в котором находится данный элемент.  
Нумерация начинается с 1. Не путайте с `numpy`, где нумерация начинается с 0.  
Возьмем элемент из третьей строки и первого столбца:

Пример:  
$$
\begin{bmatrix}
7 & 2 \\
3 & 999 \\
-2 & 0
\end{bmatrix}_{\textit{ 3,1}} = -2
$$

Матрицу можно представить как вектор-строку из векторов-столбцов $x_i \in \mathbb{F}^n$:

$$ \pmb{M} = \begin{pmatrix}
    x_1 & \cdots & x_n \\
\end{pmatrix}
$$

### Транспонирование

$$
\begin{bmatrix}
1 & 2 & 3 \\
4 & 5 & 6
\end{bmatrix}^{\top}
=
\begin{bmatrix}
1 & 4 \\
2 & 5 \\
3 & 6
\end{bmatrix}
$$

Можно сказать, что после выполнения транспонирования строки становятся столбцами, а столбцы - строками.

### Главная диагональ и Единичная матрица

Главная диагональ - это элементы матрицы $x_{\textit{i,j}}$ при $\textit{i = j}$.  
Проще говоря, это значения матрицы, которые лежат на диагонали, идущей от левого верхнего угла матрицы до ее правого нижнего угла.

$$
\pmb{I} = 
\begin{bmatrix}
    1 & 0 & 0 & 0 \\
    0 & 1 & 0 & 0 \\
    0 & 0 & 1 & 0 \\
    0 & 0 & 0 & 1
\end{bmatrix}
$$

Например, на матрице выше значения на главной диагонали равны $1$, а вне главной диагонали - $0$.  
Кстати, такая матрица (независимо от размера) называется единичной и обозначается $\pmb{I}$.

### Перемножение

В Machine Learning иногда используется перемножение матриц с матрицами и матриц с векторами.  
Поэтому, важно понимать, как оно происходит.

#### Матрица на вектор

$$
\begin{bmatrix}
1 & 2 & 3 \\
4 & 5 & 6
\end{bmatrix}
\cdot
\begin{bmatrix}
a \\
b \\
c 
\end{bmatrix}
=
\begin{bmatrix}
1a + 2b + 3c \\
4a + 5b + 6c 
\end{bmatrix}
$$

#### Матрица на матрицу

$$
\begin{bmatrix}
1 & 2 & 3 \\
4 & 5 & 6
\end{bmatrix}
\cdot
\begin{bmatrix}
a & x \\
b & y \\
c & z
\end{bmatrix}
=
\begin{bmatrix}
1a + 2b + 3c & 1x + 2y + 3z \\
4a + 5b + 6c & 4x + 5y + 6z 
\end{bmatrix}
$$

Правило, при котором матрицы можно перемножать: вторая компонента размерности левой матрицы должна быть равна первой компоненте размерности правой матрицы.  
Если у нас есть матрица $\pmb{A}$ размерностью $m \times n$ и матрица $\pmb{B}$ размерностью $n \times k$, то мы можем их перемножить.  
При произведении $\pmb{AB}$ мы получим матрицу $\pmb{C}$ размерностью $m \times k$.  
Заметим, что $\pmb{BA}$ мы сделать в общем случае уже не можем - размерности не подходят.  
Но можем, если матрица квадратная, то есть, она имеет размерность $n \times n$.

---
## Градиентный спуск

![](img/gradient.jpeg)

### Градиент
__Градиент__ - это  вектор, своим направлением указывающий направление наибольшего возрастания некоторой величины $\phi$ , значение которой меняется от одной точки пространства к другой (скалярного поля), а по величине (модулю) равный скорости роста этой величины в этом направлении.

Например, если взять в качестве $\phi$  высоту поверхности земли над уровнем моря, то её градиент в каждой точке поверхности будет показывать «направление самого крутого подъёма», и своей величиной характеризовать крутизну склона.

![](img/map.jpg)

Для случая трёхмерного пространства градиентом скалярной функции $\phi = \phi (x,y,z)$ координат $x,y,z$ называется векторная функция с компонентами:

<h1>$\frac{\partial\phi}{\partial x},\frac{\partial\phi}{\partial y},\frac{\partial\phi}{\partial z}$</h1>

Или, использовав для единичных векторов по осям прямоугольных декартовых координат $\vec{e_x},\vec{e_y},\vec{e_z}$

## $\nabla\phi = \frac{\partial\phi}{\partial x}\vec{e_x}+\frac{\partial\phi}{\partial y}\vec{e_y}+\frac{\partial\phi}{\partial z}\vec{e_z} $