# **Основные понятия линейной алгебры: матрицы и базовые действия с ними**

✍ В этом юните мы начнём разговор о матрицах.

На матричных вычислениях стоит всё машинное обучение. Они будут необходимы для понимания сути таких алгоритмов, как, например, **построение линейной регрессии**, **градиентный спуск** и **линейная оптимизация**. Как правило, операции с матрицами зашиты глубоко внутри алгоритмов, поэтому нас ждёт меньше контекстных задач и больше технических.

Кроме того, мы уделим особое внимание тонкостям выполнения действий с матрицами в Python и возможным источникам ошибок.

Сам термин «матрица» мы также видели множество раз на протяжении курса. Однако введём формальное определение матрицы.
***
***Матрица** — это структура, представляющая собой таблицу, состоящую из чисел, расположенных по строкам и столбцам.*
***
В линейной алгебре матрицы обозначаются заглавными латинскими буквами. Рассмотрим два примера матриц:

![](data/45.PNG)

Числа, стоящие на пересечении строк и столбцов, называются **элементами матрицы**.

![](data/46.PNG)

**Главная диагональ матрицы**

![](data/47.PNG)

In [1]:
import numpy as np

**Решение на Python**

Матрицу можно создать функцией **np.matrix()** или **np.array()**.

За размер матрицы отвечает атрибут **shape**. 

Матрицы, как и массивы, индексируются с 0, а не с 1. Поэтому для вызова a23 нужно обратиться к элементу матрицы с номерами i=1, j=2.

In [2]:
A = np.array([
    [1, -5, 3], 
    [2, 2, 1],
    [0, 3, 1],
    [2, 4, 12]
])
A

array([[ 1, -5,  3],
       [ 2,  2,  1],
       [ 0,  3,  1],
       [ 2,  4, 12]])

In [4]:
print(A.shape)
print('a_23=', A[1, 2], 'a_32=', A[2, 1], 'a_33=', A[2,2])

(4, 3)
a_23= 1 a_32= 3 a_33= 1


Давайте представим нашу таблицу с данными об аренде недвижимости в виде матрицы. Для этого вектор арендной платы, площади, количества комнат, этажей и показов в день расположим в столбцах матрицы.

![](data/48.PNG)

Размер нашей матрицы: dim(X) = (4,5).

Продолжим разбираться с терминологией и поговорим о том, какие вообще бывают матрицы и заодно познакомимся с некоторыми специальными матрицами.

***
## **КЛАССИФИКАЦИЯ МАТРИЦ ПО ФОРМЕ И СОДЕРЖАНИЮ**

Матрицы различаются по форме и по содержанию.

### **ПО ФОРМЕ**

Прямоугольные матрицы

![](data/49.PNG)

Квадратные матрицы

![](data/50.PNG)

Вектор-столбец

![](data/51.PNG)

Вектор-строка

![](data/52.PNG)

### **ПО СОДЕРЖАНИЮ**

Нулевая матрица

![](data/53.PNG)

Матрица-единица, или матрица единиц

![](data/54.PNG)

Треугольная матрица

![](data/55.PNG)

Симметричная матрица

![](data/56.PNG)

Диагональная матрица 

![](data/57.PNG)

Скалярная, или шаровая матрица

![](data/58.PNG)

Единичная (не путать с матрицей единиц!) матрица

![](data/59.PNG)

***
## **БАЗОВЫЕ ДЕЙСТВИЯ НАД МАТРИЦАМИ**

Действия над матрицами условно можно разделить на базовые и продвинутые.

К базовым относятся следующие операции:

* **Сложение матриц**. Результат — матрица.
* **Умножение матрицы на числ**о. Результат —  матрица.
* **Транспонирование**. Результат —  матрица.

Разберём базовые операции по порядку.

### **СЛОЖЕНИЕ МАТРИЦ**

Сложение матриц между собой аналогично сложению векторов. Матрицы складываются и вычитаются между собой поэлементно. Складывать и вычитать можно только матрицы одинакового размера.

![](data/60.PNG)

![](data/61.PNG)

### **УМНОЖЕНИЕ МАТРИЦЫ НА СКАЛЯР**

**Умножение матрицы на скаляр** w снова аналогично векторной операции: каждый элемент матрицы умножается на число w. Числовые множители также можно выносить из матрицы.

Давайте скажем это более научно.

![](data/62.PNG)

### **ТРАНСПОНИРОВАНИЕ МАТРИЦ**

**Операция транспонирования** — это матричная операция, при которой строки и столбцы меняются местами.

Скажем это на языке линейной алгебры.

![](data/63.PNG)

Обратите внимание, что двойное транспонирование матрицы возвращает её к первичному виду. 

Примечание. Операция транспонирования, несмотря на свою простоту, является очень полезной и используется во многих задачах. Так, например, транспонирование очень пригодится нам для получения оценок коэффициентов линейной регрессии с помощью метода наименьших квадратов.
***
Рассмотрим частный случай транспонирования — **транспонирование векторов**.

Всё просто: транспонируя вектор-столбец, мы получаем вектор-строку, и наоборот.

![](data/64.PNG)

Этот простенький пример приводит нас к важной математической традиции. Вы, должно быть, заметили, что чаще всего под вектором мы подразумеваем именно вектор-столбец. В строгой линейной алгебре под вектором понимается именно столбец, состоящий из m чисел. Это связано с нюансами операции умножения матриц между собой, о которых мы поговорим в следующем юните.

![](data/65.PNG)
***
Отметим ещё один частный случай транспонирования — **транспонирование симметричных матриц**. 

![](data/66.PNG)

Видно, что при транспонировании матрицы A и S не изменились. Отсюда следует важный вывод, которым мы будем ещё не раз пользоваться: симметричные матрицы **инварианты** к операции транспонирования, то есть не изменяются.

Отсюда же следует ещё одно определение симметричной матрицы:

Матрица A называется симметричной, если она не меняется при транспонировании, т. е. A = AT.

***
## **ПРИМЕНЕНИЕ БАЗОВЫХ ОПЕРАЦИЙ ДЛЯ ОБРАБОТКИ ИЗОБРАЖЕНИЙ**

ОБРАБОТКА ИЗОБРАЖЕНИЙ С ПОМОЩЬЮ БАЗОВЫХ ОПЕРАЦИЙ

Задано изображение следующего вида, размером 4 пикселя в высоту и 6 пикселей в ширину:

![](https://lms.skillfactory.ru/assets/courseware/v1/6f416e45731e7787b340988cafa0edf8/asset-v1:SkillFactory+DSPR-2.0+14JULY2021+type@asset+block/MATHML_md1_4_21.png)

![](data/67.PNG)

Ещё нам понадобится матрица M — матрица максимальных яркостей. Она полностью состоит из чисел 255.

![](https://lms.skillfactory.ru/assets/courseware/v1/f3a0998f012212b838e1eb1fd7188d47/asset-v1:SkillFactory+DSPR-2.0+14JULY2021+type@asset+block/MATHML_md1_4_23.png)

Если взять матрицу M в качестве матрицы яркости по всем каналам, мы получим полностью белое изображение.

![](data/68.PNG)

![](https://lms.skillfactory.ru/assets/courseware/v1/ed5c349a773fdf902700be41f3d5dd92/asset-v1:SkillFactory+DSPR-2.0+14JULY2021+type@asset+block/MATHML_md1_4_25.png)

Мы с вами только что сделали инверсию цветов изображения.

Теперь умножим каждую матрицу на число w = 0.8 и посмотрим на результат:

![](https://lms.skillfactory.ru/assets/courseware/v1/8d5bc6c053f9f08face1ecfa7c6b9308/asset-v1:SkillFactory+DSPR-2.0+14JULY2021+type@asset+block/MATHML_md1_4_26.png)

Данной операцией мы уменьшим яркость каждого канала изображения на 20 % и получим новую картинку:

![](https://lms.skillfactory.ru/assets/courseware/v1/bb01a186c37c2fb02eeba1f3bbec66ae/asset-v1:SkillFactory+DSPR-2.0+14JULY2021+type@asset+block/MATHML_md1_4_27.png)

Наконец, давайте транспонируем каждую из наших матриц и посмотрим на то, что станет с картинкой. Матрицы (4,6) превратятся в матрицы (6,4):

![](https://lms.skillfactory.ru/assets/courseware/v1/8a6dec21b61e3e9c308f0658d5dc707f/asset-v1:SkillFactory+DSPR-2.0+14JULY2021+type@asset+block/MATHML_md1_4_28.png)

А теперь снова посмотрим на итоговое изображение:

![](https://lms.skillfactory.ru/assets/courseware/v1/14960c1f2acd52ac761e7ab8c8436863/asset-v1:SkillFactory+DSPR-2.0+14JULY2021+type@asset+block/MATHML_md1_4_29.png)

Итак, наше изображение перевернулось на 90°.Так работает операция транспонирования для случая изображений.

