# Matrices

Табличный способ хранения данных чрезвычайно широко распространён, и если эти данные числовые, то с математической точки зрения они образуют **матрицу** — двумерный массив из чисел. Для эффективной обработки и анализа таких данных, а также обучения моделей машинного обучения на них, важно хорошо ориентироваться в матричных операциях и разложениях и их свойствах.

 Матрицы принято обозначать заглавными жирными буквами: $\boldsymbol A$, $\boldsymbol B$, $\boldsymbol C$, $\boldsymbol X$, $\boldsymbol Y$ и т.п. Множество матриц, имеющих $m$ строк и $n$ столбцов обозначается через $\mathbb R^{m\times n}$. Элемент $i$-й строки и $j$-го столбца матрицы $\boldsymbol A \in \mathbb R^{m\times n}$ будем обозначать $A_{ij}$. Допустимо также обозначение $a_{ij}$, особенно когда дело доходит до подробной записи

$$
    \boldsymbol A  = \begin{pmatrix}
        a_{11} & a_{12} & \dots & a_{1n} \\
        a_{21} & a_{22} & \dots & a_{2n} \\
        \vdots & \vdots & \ddots & \vdots \\
        a_{m1} & a_{m2} & \dots & a_{mn} \\
    \end{pmatrix}.
$$

Эту же матрицу можно представить как набор строк или столбцов:

$$
    \boldsymbol A  = \begin{pmatrix}
        \boldsymbol b_1^\top \\
        \boldsymbol b_2^\top \\
        \vdots\\
        \boldsymbol b_m^\top \\
    \end{pmatrix} = 
    [\boldsymbol c_1 \boldsymbol c_2 \dots \boldsymbol c_n], \quad
    \boldsymbol b_i = \begin{pmatrix}
    a_{i1} \\
    a_{i2} \\
    \vdots \\
    a_{in}
    \end{pmatrix},
    \quad
    \boldsymbol c_j = \begin{pmatrix}
    a_{1j} \\
    a_{2j} \\
    \vdots \\
    a_{mj}
    \end{pmatrix}
$$

Если $m=n$, то матрица $\boldsymbol A$ называется **квадратной**, в противном случае — **прямоугольной**. Вектор $\boldsymbol x \in \mathbb R^n$ можно считать матрицей размера $n\times 1$ (столбец) или $1\times n$ (строка).

**Транспонированная** матрица $\boldsymbol A^\top \in \mathbb R^{n\times m}$ в качестве строк содержит столбцы матрицы $\boldsymbol A$: $A^\top_{ij} = A_{ji}$. В частности, вектор-столбец получается транспонированием из вектора-строки, и наоборот, чем и объясняется обозначение $\boldsymbol x^\top$ для векторов-строк.

## Квадратные матрицы

Квадратные матрицы $\boldsymbol A \in \mathbb R^{n\times n}$ имеют одинаковое количество строк и столцов. Такие матрицы представляют особый интерес как в теории, так и на практике. 

У квадратной матрицы есть две диагонали: главная и побочная.

![](https://cdn.fxyz.ru/img/linear-algebra/matrix-diagonals.png)

Сумма элементов главной диагонали называется **следом** матрицы: $\mathrm{tr}(\boldsymbol A) = \sum\limits_{i=1}^n a_{ii}$.

Перечислим самые распространённые классы квадратных матриц.

1. **Единичная матрица**. Такая матрица содержит единицы на главной диагонали и нули вне неё; обозначается $\boldsymbol I$ или $\boldsymbol I_n$, если нужно подчеркнуть её размер:

    $$
    \boldsymbol I_2 = \begin{pmatrix}
        1 & 0 \\
        0 & 1 \\
    \end{pmatrix}, \quad
    \boldsymbol I_3 = \begin{pmatrix}
        1 & 0 & 0 \\
        0 & 1 & 0 \\
        0 & 0 & 1 \\
    \end{pmatrix}, \quad
    \boldsymbol I_n = \begin{pmatrix}
        1 & 0 & \dots & 0 \\
        0 & 1 & \dots & 0 \\
        \vdots & \vdots & \ddots & \vdots \\
        0 & 0 &\dots & 1 \\
    \end{pmatrix}.
    $$

2. **Диагональная матрица**. Все ненулевые элементы диагональной матрицы находятся на главной диагонали:

    $$
    \boldsymbol \Lambda = \mathrm{diag}\{\lambda_1, \lambda_2, \ldots, \lambda_n\} = \begin{pmatrix}
        \lambda_1 & 0 & \dots & 0 \\
        0 & \lambda_2 & \dots & 0 \\
        \vdots & \vdots & \ddots & \vdots \\
        0 & 0 & \dots & \lambda_n \\
    \end{pmatrix}.
    $$

    Единичная матрица является частным случаем диагональной: 

    $$
    \boldsymbol I = \mathrm{diag}\{1, 1, \dots, 1\}.
    $$

3. **Матрица перестановки**. Такая матрица состоит из нулей и единиц, и содержит ровно одну единицу в каждой строке и в каждом столбце. Любая матрица перестановки получается некоторой перестановкой строк/столбцов единичной матрицы. Существует $n!$ различных матриц перестановок размера $n\times n$. Например, ниже перечислены все $3!=6$ матрицы перестановок размера $3\times3$:

    $$
    \begin{pmatrix}
    1 & 0 & 0 \\
    0 & 1 & 0 \\
    0 & 0 & 1 \\
    \end{pmatrix},
    \quad
    \begin{pmatrix}
    1 & 0 & 0 \\
    0 & 0 & 1 \\
    0 & 1 & 0 \\
    \end{pmatrix},
    \quad
    \begin{pmatrix}
    0 & 1 & 0 \\
    1 & 0 & 0 \\
    0 & 0 & 1 \\
    \end{pmatrix},
    $$

    $$
    \begin{pmatrix}
    0 & 1 & 0 \\
    0 & 0 & 1 \\
    1 & 0 & 0 \\
    \end{pmatrix},
    \quad
    \begin{pmatrix}
    0 & 0 & 1 \\
    1 & 0 & 0 \\
    0 & 1 & 0 \\
    \end{pmatrix},
    \quad
    \begin{pmatrix}
    0 & 0 & 1 \\
    0 & 1 & 0 \\
    1 & 0 & 0 \\
    \end{pmatrix}.
    $$

4. **Треугольные матрицы**. У **верхней треугольной** матрицы $\boldsymbol U$ все элементы ниже главной диагонали равны нулю: $U_{ij} = 0$ при $i > j$, 
    
    $$
    \boldsymbol U  = \begin{pmatrix}
        u_1 & * & * & \dots & * \\
        0 & u_2 & * & \dots & * \\
        0 & 0 & u_3 & \dots & * \\
        \vdots & \vdots & \vdots & \ddots & \vdots \\
        0 & 0 & 0 & \dots & u_n \\
    \end{pmatrix}.
    $$

    У **нижней треугольной** матрицы $\boldsymbol L$, наоборот, все элементы выше главной диагонали равны нулю: $L_{ij} = 0$ при $i < j$,

    $$
    \boldsymbol L = \begin{pmatrix}
        \ell_1 & 0 & 0 & \dots & 0 \\
        * & \ell_2 & 0 & \dots & 0 \\
        * & * & \ell_3 & \dots & 0 \\
        \vdots & \vdots & \vdots & \ddots & \vdots \\
        * & * & * & \dots & \ell_n \\
    \end{pmatrix}. 
    $$

    Матрица $\boldsymbol U$ верхняя треугольная тогда и только тогда, когда матрица $\boldsymbol U^\top$ нижняя треугольная.

5. **Симметричные матрицы**. Квадратная матрица $\boldsymbol A$ называется 

    * **симметричной**, если $\boldsymbol A^\top  = \boldsymbol A$;

    * **кососимметричной**, если $\boldsymbol A^\top  = -\boldsymbol A$.

    На главной диагонали кососимметричной матрицы всегда находятся нули. Всякая квадратная матрица $\boldsymbol A$ может быть единственным образом представлена в виде суммы симметричной и кососимметричной матриц:

    $$
    \boldsymbol A = \frac{\boldsymbol A + \boldsymbol A^\top}2 + \frac{\boldsymbol A - \boldsymbol A^\top}2.
    $$

6. **Ортогональная матрица**. Квадратная матрица $\boldsymbol Q = [\boldsymbol q_1, \ldots, \boldsymbol q_n]$ **ортогональная**, если её столбцы образуют ортонормированную систему, т. е. $\langle \boldsymbol q_i, \boldsymbol q_j\rangle = \delta_{ij}$, где $\delta_{ij}$ — [символ Кронекера](https://ru.wikipedia.org/wiki/%D0%A1%D0%B8%D0%BC%D0%B2%D0%BE%D0%BB_%D0%9A%D1%80%D0%BE%D0%BD%D0%B5%D0%BA%D0%B5%D1%80%D0%B0){:target="_blank"}.

    Любая матрица перестановки является ортогональной. Также ортогональна, к примеру, **матрица поворота** на угол $\theta$

    $$
    \boldsymbol Q = \begin{pmatrix}
        \cos \theta & -\sin\theta \\
        \sin \theta & \cos\theta \\
    \end{pmatrix}.
    $$

<!--
* Иногда бывает полезна матрица из одних нулей или одних единиц; такие матрицы размера $m\times n$ будем обозначать $$\boldsymbol 0_{m\times n}$$ и $$\boldsymbol 1_{m\times n}$$ соответственно.

* **Блочная матрица** имеет вид

    $$
        \begin{pmatrix}
        \boldsymbol A & \boldsymbol B \\
        \boldsymbol C & \boldsymbol D 
        \end{pmatrix} =
        \left(\begin{array}{@{}c|c@{}}
        \begin{matrix}
            a_{11} & \dots & a_{1m} \\
            \vdots & \ddots & \vdots \\
            a_{k1} & \dots & a_{km}
        \end{matrix}
        &
        \begin{matrix}
            b_{11} & \dots & b_{1n} \\
            \vdots & \ddots & \vdots \\
            b_{k1} & \dots & b_{kn}
        \end{matrix} \\
        \hline
        \begin{matrix}
            c_{11} & \dots & c_{1m} \\
            \vdots & \ddots & \vdots \\
            c_{\ell 1} & \dots & c_{\ell m}
        \end{matrix} 
        &
        \begin{matrix}
            d_{11} & \dots & d_{1n} \\
            \vdots & \ddots & \vdots \\
            d_{\ell 1} & \dots & d_{\ell n}
        \end{matrix}
        \end{array}\right).
    $$

    Блочные матрицы могут иметь произвольное число матричных блоков по каждому измерению.

<!--
    где $\boldsymbol A \in \mathbb R^{k\times m}$, $\boldsymbol B \in \mathbb R^{k\times n}$, $\boldsymbol C \in \mathbb R^{\ell\times m}$, $\boldsymbol D \in \mathbb R^{\ell\times n}$. 

    
Квадратные матрицы — очень важный класс матриц, среди них в свою очередь выделяют несколько часто встречающихся семейств
-->