✍ В этом юните мы начнём разговор о **матрицах**.

На матричных вычислениях стоит всё машинное обучение. Они будут
необходимы для понимания сути таких алгоритмов, как, например,
построение линейной регрессии, градиентный спуск и линейная оптимизация.
Как правило, операции с матрицами зашиты глубоко внутри алгоритмов,
поэтому нас ждёт меньше контекстных задач и больше технических.

Кроме того, мы уделим особое внимание тонкостям выполнения действий с
матрицами в *Python* и возможным источникам ошибок.

Сам термин «матрица» мы также видели множество раз на протяжении курса.
Однако введём формальное определение матрицы.

**Матрица **--- это структура, представляющая собой таблицу, состоящую
из чисел, расположенных по строкам и столбцам.

В линейной алгебре матрицы обозначаются заглавными латинскими буквами.
Рассмотрим два примера матриц:

В первой матрице три строки и пяти столбцов. Говорят, что это
матрица **3 x 5** или .

Во второй матрице четыре строки и два столбца. Её размер --- **4 x
2** или .

Числа, стоящие на пересечении строк и столбцов, называются **элементами
матрицы**.

Элементы матрицы обозначаются прописными латинскими нумеруются в
формате {номер\_строки}, {номер\_столбца}. Пример:

В общем случае матрица может иметь  строк и  столбцов. Тогда в общем
виде запись будет иметь вид:

**Примечание.** Математики не любят такую громоздкую запись, поэтому,
чтобы обозначить, что матрица состоит из чисел , нередко пишут следующим
образом: .

Определите размер матрицы и запишите её элементы ,  и .

В нашей матрице четыре строки и три столбца. Тогда размерность матрицы
составляет .

Элемент  расположен во второй строке и третьем столбце. Первый индекс
отвечает за номер строки, второй --- за номер столбца.

![](./matrices/image1.png "img")

Элемент  расположен в третьей строке и втором столбце.

Элемент  имеет одинаковые индексы: третья строка и третий столбец. Он
находится на **главной диагонали матрицы**.

**Примечание.** Элементами главной диагонали называются элементы, у
которых индексы строк и столбцов совпадают, то есть .

![](./matrices/image2.png "img")

**→ Решение на Python**

Матрицу можно создать функцией np.matrix() или np.array(). Разницу между
двумя этими способами мы обсудим в скринкасте.

За размер матрицы отвечает атрибут shape. 

Матрицы, как и массивы, индексируются с 0, а не с 1. Поэтому для
вызова  нужно обратиться к элементу матрицы с номерами .

A = np.array(\[

\[1, -5, 3\],

\[2, 2, 1\],

\[0, 3, 1\],

\[2, 4, 12\]

\])

A

![](./matrices/image3.png "img")
A.shape

\#\# (4, 3)

print(\'a\_23=\', A\[1, 2\], \'a\_32=\', A\[2, 1\], \'a\_33=\',
A\[2,2\])

\#\# a\_23= 1 a\_32= 3 a\_33= 1

**Примечание.** Вы уже, должно быть, догадались, какой самый простой
пример матрицы можно привести из области *DS*. Конечно же, это привычный
нам *DataFrame* --- таблица, по столбцам которой отложены признаки, а по
строкам --- объекты.

Давайте представим нашу таблицу с данными об аренде недвижимости в виде
матрицы. Для этого вектор арендной платы, площади, количества комнат,
этажей и показов в день расположим в столбцах матрицы.

  ---------------- -------------------------------- --------------------- ----------------------- ---------- --------------------
  **№ квартиры**   **Арендная плата (тыс. руб.)**   **Площадь (кв. м)**   **Количество комнат**   **Этаж**   **Показов в день**
  1                65                               50                    3                       5          8
  2                70                               52                    2                       12         4
  3                120                              80                    1                       10         5
  4                35                               33                    1                       3          10
  ---------------- -------------------------------- --------------------- ----------------------- ---------- --------------------

Размер нашей матрицы: .

Продолжим разбираться с терминологией и поговорим о том, какие вообще
бывают матрицы и заодно познакомимся с некоторыми специальными
матрицами.

**КЛАССИФИКАЦИЯ МАТРИЦ ПО ФОРМЕ И СОДЕРЖАНИЮ**

Матрицы различаются по форме и по содержанию.

 

-   **Прямоугольные матрицы** --- это матрицы, у которых количество
    строк  не совпадает с количеством столбцов , т. е. .

    ![](./matrices/image4.png "img")

-   **Квадратные матрицы** --- это матрицы, у которых количество
    строк  совпадает с количеством столбцов , т. е. .

    **Порядком** квадратной матрицы называется количество строк (и
    столбцов соответственно) в ней.

    ![](./matrices/image5.png "img")

-   **Вектор-столбец** --- это матрица размера .

    ![](./matrices/image6.png "img")

-   **Вектор-строка** --- это матрица размера .

    ![](./matrices/image7.png "img")

**БАЗОВЫЕ ДЕЙСТВИЯ НАД МАТРИЦАМИ**

Действия над матрицами условно можно разделить
на **базовые** и **продвинутые**.

К базовым относятся следующие операции:

-   Сложение матриц. Результат --- матрица.

-   Умножение матрицы на число. Результат ---  матрица.

-   Транспонирование. Результат ---  матрица.

Разберём базовые операции по порядку.

**СЛОЖЕНИЕ МАТРИЦ**

Сложение матриц между собой аналогично сложению векторов. Матрицы
складываются и вычитаются между собой поэлементно. Складывать и вычитать
можно только матрицы одинакового размера.

Давайте включим «переводчик» на язык линейной алгебры и скажем то же
самое более правильно.

Пусть заданы две матрицы  и , каждая из которых имеет размер . Суммой
матриц  и  называется матрица  размером , такая, что , или:

А теперь, чтобы не пугаться крупных буквенных обозначений, сразу
рассмотрим **пример**.

Найти сумму матриц:

 и 

![](./matrices/image9.png "img")

Согласитесь, на практике всё выглядит проще, чем в виде формул.

Найти сумму матриц:

 и 

Данные матрицы сложить нельзя, так как их размерности не совпадают: ,
а . 

**УМНОЖЕНИЕ МАТРИЦЫ НА СКАЛЯР**

Умножение матрицы на скаляр  снова аналогично векторной операции: каждый
элемент матрицы умножается на число . Числовые множители также можно
выносить из матрицы.

Давайте скажем это более научно.

Пусть задана матрица  размером  и число . Произведением матрицы  и
числа  называется матрица  размером , такая, что , или:

Найти произведение матрицы  и числа , если:

![](./matrices/image10.png "img")

А теперь посмотрим, как общий множитель выносится за скобки матрицы:

![](./matrices/image11.png "img")

**ТРАНСПОНИРОВАНИЕ МАТРИЦ**

**Операция транспонирования** --- это матричная операция, при которой
строки и столбцы меняются местами.

Скажем это на языке линейной алгебры.

Пусть задана матрица  размером . Транспонированной матрицей  называется
матрица  размером , такая, что , или:

Обратите внимание, что при транспонировании главная диагональ матрицы не
изменяется.

Найти  и , если:

![](./matrices/image12.png "img")

Обратите внимание, что двойное транспонирование матрицы возвращает её к
первичному виду. 

**Примечание.** Операция транспонирования, несмотря на свою простоту,
является очень полезной и используется во многих задачах. Так, например,
транспонирование очень пригодится нам для получения оценок коэффициентов
линейной регрессии с помощью метода наименьших квадратов.

Рассмотрим частный случай транспонирования --- **транспонирование
векторов**.

Всё просто: транспонируя вектор-столбец, мы получаем вектор-строку, и
наоборот.

Найти , если .

→ Этот простенький пример приводит нас к важной математической традиции.
Вы, должно быть, заметили, что чаще всего под вектором мы подразумеваем
именно вектор-столбец. В строгой линейной алгебре под вектором
понимается именно столбец, состоящий из  чисел. Это связано с нюансами
операции умножения матриц между собой, о которых мы поговорим в
следующем юните.

Но в вектор-столбец писать не всегда удобно, поэтому, чтобы записать
вектор, обычно пользуются транспонированием:

Обе записи являются эквивалентными, но вторая требует меньше места,
поэтому она используется чаще.

Отметим ещё один частный случай транспонирования --- **транспонирование
симметричных матриц**. 

Необходимо транспонировать матрицы  и , если:

![](./matrices/image13.png "img")

![](./matricesimage14.png "img")

Видно, что при транспонировании матрицы  и  не изменились. Отсюда
следует важный вывод, которым мы будем ещё не раз пользоваться:
симметричные матрицы инварианты к операции транспонирования, то есть не
изменяются.

Отсюда же следует ещё одно определение симметричной матрицы:

Матрица  называется **симметричной**, если она не меняется при
транспонировании, т. е. .
