# Экзаменационное задание по курсу «Линейная алгебра»

In [1]:
import pandas as pd
import numpy as np
from sklearn.model_selection import train_test_split
from sklearn.metrics import mean_absolute_percentage_error, mean_squared_error

## Часть 1: Задания, решаемые без использования Python

### Задание 1

Исследуйте систему векторов на линейную зависимость или независимость без использования Python (вручную):

$$\vec{a}_{1}=(1 ; 8 ;-1), \vec{a}_{2}=(-2 ; 3 ; 3), \vec{a}_{3}=(4 ;-11 ; 9)$$

Подробно распишите решение, а в итоге сделайте вывод про то, являются ли векторы зависимыми или независимыми.

**Решение:**

Проверяем существует ли ненулевое решение уравнения: $ c_1 \mathbf{a_1} + c_2 \mathbf{a_2} + c_3\mathbf{a_3} = \mathbf{0} $

1. Подставляем значения векторов:

    $$ c_1(1, 8, -1) + c_2(-2, 3, 3) + c_3(4, -11, 9) = (0, 0, 0) $$

2. Раскроем скобки и запишем как систему уравнений:

    \begin{align}

        \begin{cases}

            c_1 - 2c_2 + 4c_3 = 0,
            \\
            8c_1 + 3c_2 - 11c_3 = 0, 
            \\
            -c_1 + 3c_2 + 9c_3 = 0. 
        \end{cases}

    \end{align}

3. Решим систему

    \begin{align}

        c_1 = 2c_2 - 4c_3 
        \\
        c_1 = 3c_2 + 9c_3 
        \\
        c_2 = -13c_3
        \\
        c_1 = -30c_3

    \end{align}

    Получившиеся значения подставим в $8c_1 + 3c_2 - 11c_3 = 0$

    $$ -240c_3 -39c_3 -11c_3 = 0 \Longrightarrow с_3 = 0 \Longrightarrow с_1 = с_2 = 0 $$




**Ответ:**
Система уравнений имеет единственное решение $c_1 = 0$, $c_2 = 0$ и $c_3 = 0$. Это в свою очередь указывает на линейную независимость системы векторов $\mathbf{a_1}$, $\mathbf{a_2}$ и $\mathbf{a_3}$.

---

### Задание 2

При каких значениях параметра a система векторов является линейно зависимой? Найдите решение без использования Python (вручную).

$$\vec{a}_{1}=(1 ; 0 ; 2 ;-3), \vec{a}_{2}=(2 ; 2 ;-4 ; a), \vec{a}_{3}=(3 ; 1 ; 2 ;-5)$$

**Решение:**

Вектора считаются линейно зависимыми, когда существует нетривиальное (ненулевое) решение уравнения:

$$ c_1 \mathbf{a_1} + c_2 \mathbf{a_2} + c_3\mathbf{a_3} = \mathbf{0} $$

где $c_1$, $c_2$, и $c_3$ - скалярные коэффициенты, а $\mathbf{a_1}$, $\mathbf{a_2}$, и $\mathbf{a_3}$ - заданные вектора.


Линейная зависимость векторов эквивалентна тому, что ранг матрицы, составленной из этих векторов, меньше количества самих векторов.

Рассмотрим матрицу A, составленную из заданных векторов:

\begin{align}

    A =
    \begin{vmatrix}
    1 & 2 & 3 \\
    0 & 2 & 1 \\
    2 & -4 & 2 \\
    -3 & a & -5
    \end{vmatrix}

\end{align}

Здесь $a$ - неизвестный параметр, который нам нужно определить.

Для нахождения условия линейной зависимости, мы рассмотрим определитель подматрицы, состоящей из первых трех строк и столбцов:

\begin{align}

    \det 
    \begin{bmatrix}
    1 & 2 & 3 \\
    0 & 2 & 1 \\
    2 & -4 & 2
    \end{bmatrix}

\end{align}

Вычислим этот определитель

\begin{align}

\det \begin{bmatrix}
1 & 2 & 3 \\
0 & 2 & 1 \\
2 & -4 & 2
\end{bmatrix}
= 1(2 \cdot 2 - 1 \cdot (-4)) - 2(0 \cdot 2 - 1 \cdot 2) + 3(0 \cdot (-4) - 2 \cdot 2)
= 1(4 + 4) - 2(0 - 2) + 3(0 - 4) = 8 + 4 - 12 = 0

\end{align}


**Ответ:** Определитель подматрицы равен нулю, что означает, что вектора $\mathbf{a_1}$, $\mathbf{a_2}$, и $\mathbf{a_3}$ уже линейно зависимы. Таким образом, мы приходим к выводу, что параметр $a$ может принимать любые значения, не влияя на линейную зависимость векторов. Это означает, что система векторов будет линейно зависимой при любом значении $a$.



---

### Задание 3

Выразите определитель матрицы. Найдите решение без использования Python (вручную).

$$\left|\begin{array}{rrrr}1 & -1 & a & -1 \\ -1 & -2 & b & -1 \\ -2 & 0 & c & 1 \\ 0 & 1 & d & 0\end{array}\right|$$

**Решение:**

Чтобы найти определитель этой матрицы $ \det(A) $, мы можем разложить его по элементам 4-ой строки

\begin{align}
    \det(A) = -0 \cdot \det(A_{41}) + 1 \cdot \det(A_{42}) - d \cdot \det(A_{43}) + 0 \cdot \det(A_{44})
\end{align}


где $A_{ij}$ — это дополнение элемента $a_{ij}$, то есть определитель матрицы, полученной из $A$ исключением $i$-й строки и $j$-го столбца.

Теперь вычислим каждый из этих определителей меньшего порядка $3 \times 3$:

\begin{align}

    -0 \cdot 
    \begin{vmatrix}
    1 & a & -1\\
    -2 & b & -1\\
    0 & c & 1
    \end{vmatrix}
    + 1 \cdot
    \begin{vmatrix}
    1 & a & -1\\
    -1 & b & -1\\
    -2 & c & 1
    \end{vmatrix}
    -d \cdot 
    \begin{vmatrix}
    1 & -1 & -1\\
    -1 & -2 & -1\\
    -2 & 0 & 1
    \end{vmatrix}
    +0 \cdot
    \begin{vmatrix}
    1 & -1 & a\\
    -1 & -2 & b\\
    -2 & 0 & c
    \end{vmatrix} 
    = 0 - b + 3a + 2c - d -1 + 0 = -b+3a+2c+d

\end{align}


**Ответ:** $-b+3a+2c+d$

---

### Задание 4

Найдите значения параметров a, b и c, при которых матрицы A и B являются обратными. Найдите решение без использования Python (вручную).

$$
A=\left(\begin{array}{ccc}
a & -2 & -1 \\
-15 & b+20 & 12 \\
10 & -19 & 2 c
\end{array}\right), B=\left(\begin{array}{rrr}
-4 & 3 & 5 \\
0 & 2 & 3 \\
-5 & -1 & -1
\end{array}\right)
$$

**Решение:**

Найдем произведение матриц и приравняем к единичной матрице:

\begin{align}

    AB = \left(
        \begin{array}{ccc}
            a & -2 & -1 \\
            -15 & b+20 & 12 \\
            10 & -19 & 2c
        \end{array}
    \right)
    \left(
        \begin{array}{ccc}
            -4 & 3 & 5 \\
            0 & 2 & 3 \\
            -5 & -1 & -1
        \end{array}
    \right) = \left(
        \begin{array}{ccc}
            5 - 4a & 3a - 3 & 5a - 5 \\
            0 & 2b - 17 & 3b - 27 \\
            -40 - 10c & -8 - 2c & -7 - 2c
        \end{array}
    \right)

    \\[5em] 

    \left(
        \begin{array}{ccc}
            5 - 4a & 3a - 3 & 5a - 5 \\
            0 & 2b - 17 & 3b - 27 \\
            -40 - 10c & -8 - 2c & -7 - 2c
        \end{array}
    \right) = \left(
        \begin{array}{ccc}
            1 & 0 & 0 \\
            0 & 1 & 0 \\
            0 & 0 & 1
        \end{array}
    \right)

\end{align}

**Ответ:** Решив три любых простых уравнения с разными переменными, получим  $ a = 1, \quad b = 9, \quad c = -4$

---

### Задание 5

Найдите собственные векторы и собственные значения матрицы. Найдите решение без использования Python (вручную).

$$\left(\begin{array}{rrr}4 & 0 & -1 \\ 2 & 2 & 1 \\ -1 & 0 & 4\end{array}\right)$$

**Решение:**

Для нахождения собственных значений и собственных векторов матрицы, нужно сначала найти собственные значения $\lambda$, решив характеристическое уравнение $\det(A - \lambda I) = 0$.

\begin{align}

    A - \lambda I = 
    \begin{pmatrix} 
        4 - \lambda & 0 & -1 
        \\ 
        2 & 2 - \lambda & 1 
        \\ 
        -1 & 0 & 4 - \lambda 
    \end{pmatrix}

\end{align}

Найдем определитель:

\begin{align}

    \det(A - \lambda I) = 
        \begin{vmatrix} 
            4 - \lambda & 0 & -1 
            \\ 
            2 & 2 - \lambda & 1 
            \\ -1 & 0 & 4 - \lambda 
        \end{vmatrix} = 
        
    - \lambda^3 +10\lambda^2-31\lambda+30 = 
    
    -(\lambda-2)(\lambda^2-8\lambda+15)=-(\lambda-2)(\lambda-3)(\lambda-5)=0

\end{align}


\begin{align}

    \lambda{_1} = 2,
    \\
    \lambda{_2} = 3,
    \\
    \lambda{_3} = 5

\end{align}

Подставляем $\lambda$ и решаем уравнение $(A - \lambda I) \cdot \begin{pmatrix} v \end{pmatrix} = \begin{pmatrix} 0 \end{pmatrix}$


**Для $ \lambda{_1} $**

\begin{align}

    \begin{pmatrix}
        2 & 0 & -1 
        \\
        2 & 0 & 1 
        \\
        -1 & 0 & 2
    \end{pmatrix} 
    \cdot
    \begin{pmatrix}
        x 
        \\
        y 
        \\
        z
    \end{pmatrix} =
    \begin{pmatrix}
        0 
        \\
        0 
        \\
        0
    \end{pmatrix}

\end{align}

Чтобы найти значения достаточно рассмотреть систему из двух вервых уравнений:

\begin{align}
    \begin{cases}
        2x - z = 0 
        \\
        2x + z = 0
    \end{cases}
\end{align}

\begin{align}
    \begin{pmatrix} v \end{pmatrix}=
    \begin{pmatrix}
    0 \\
    y \\
    0
    \end{pmatrix}, \quad y \in \mathbb{R}
\end{align}



**Для $ \lambda{_2} $**

\begin{align}

    \begin{pmatrix}
    1 & 0 & -1 \\
    2 & -1 & 1 \\
    -1 & 0 & 1
    \end{pmatrix} \cdot
    \begin{pmatrix}
    x \\
    y \\
    z
    \end{pmatrix} =
    \begin{pmatrix}
    0 \\
    0 \\
    0
    \end{pmatrix}

\end{align}

\begin{align}

    \begin{cases}
    x - z = 0 \\
    2x - y + z = 0 \\
    -x + z = 0
    \end{cases}

\end{align}

Т.е. $ z = x, \quad y = 3x $

\begin{align}
    \begin{pmatrix} v \end{pmatrix} =
    \begin{pmatrix}
    x \\
    3x \\
    x
    \end{pmatrix}, \quad x \in \mathbb{R}
\end{align}

**Для $ \lambda{_3} $**

\begin{align}

    \begin{pmatrix}
    -1 & 0 & -1 \\
    2 & -3 & 1 \\
    -1 & 0 & -1
    \end{pmatrix} \cdot
    \begin{pmatrix}
    x \\
    y \\
    z
    \end{pmatrix} =
    \begin{pmatrix}
    0 \\
    0 \\
    0
    \end{pmatrix}

\end{align}

\begin{align}

    \begin{cases}
    -x - z = 0 \\
    2x - 3y + z = 0 \\
    -x - z = 0
    \end{cases}

\end{align}

Т.е. $ z = -x, \quad y = \frac{x}{3} $

\begin{align}
    \begin{pmatrix} v \end{pmatrix} =
    \begin{pmatrix}
    x \\
    \frac{x}{3} \\
    -x
    \end{pmatrix}, \quad x \in \mathbb{R}
\end{align}

**Ответ:**


\begin{align*}

    \begin{pmatrix} v \end{pmatrix}=
    \begin{pmatrix}
    0 \\
    y \\
    0
    \end{pmatrix} ;



    \begin{pmatrix} v \end{pmatrix} =
    \begin{pmatrix}
    x \\
    3x \\
    x
    \end{pmatrix};



    \begin{pmatrix} v \end{pmatrix} =
    \begin{pmatrix}
    x \\
    \frac{x}{3} \\
    -x
    \end{pmatrix}, где \quad x \in \mathbb{R}, \quad y \in \mathbb{R}

\end{align*}





---

### Задание 6

Найдите сумму сингулярных чисел для матрицы:

$$A=\left(\begin{array}{ccc}-2 & 0 & 1 \\ 0 & -2 & 1 \\ 1 & 1 & -1\end{array}\right)$$

Найдите решение без использования Python (вручную).

**Решение:**

Найдём $ A^T A $:

\begin{align}
    A^T A =
    \begin{pmatrix}
        -2 & 0 & 1 
        \\
        0 & -2 & 1 
        \\
        1 & 1 & -1
    \end{pmatrix}
    \begin{pmatrix}
        -2 & 0 & 1 
        \\
        0 & -2 & 1 
        \\
        1 & 1 & -1
    \end{pmatrix} =
    \begin{pmatrix}
        5 & 1 & -3 
        \\
        1 & 5 & -3 
        \\
        -3 & -3 & 3
    \end{pmatrix}
    
\end{align}

Решим $ \det(A^T A - \lambda I) = 0 $


\begin{align}

    \begin{pmatrix}
        5 - \lambda & 1 & -3 \\
        1 & 5 - \lambda & -3 \\
        -3 & -3 & 3 - \lambda
    \end{pmatrix} =

    -\lambda^3 + 13\lambda^2-36\lambda=-\lambda(\lambda^2-13\lambda+36) =
    -\lambda(\lambda-4)(\lambda-9) = 0

\end{align}

\begin{align}

    \sigma_1 = \sqrt{0} = 0,
    \\
    \sigma_2 = \sqrt{4} = 2,
    \\
    \sigma_3 = \sqrt{9} = 3.

\end{align}


**Ответ:** $\sigma_1 + \sigma_2 + \sigma_3 = 5.$


---

## Часть 2: Задания, решаемые с помощью Python

**Описание переменных:**

* season: 1 - весна, 2 - лето, 3 - осень, 4 - зима
* yr: 0 - 2011, 1 - 2012
* mnth: месяц, от 1 до 12
* holiday: 0 - нет праздника, 1 - есть праздник
* weekday: день недели, от 0 до 6
* workingday: 0 - нерабочий день, 1 - рабочий день
* weathersit: оценка благоприятности погоды от 1 (чистый, ясный день) до 4 (ливень, туман)
* temp: температура в Цельсиях
* atemp: температура по ощущениям в Цельсиях
* hum: влажность
* windspeed(mph): скорость ветра в милях в час
* windspeed(ms): скорость ветра в метрах в секунду
* cnt: количество арендованных велосипедов (это целевой признак, его мы будем предсказывать)

### Задание 7

Загрузите данные. Изучите, есть ли в них пропущенные значения?Распишите решение с помощью кода на языке Python и напишите текстом интерпретацию полученного вывода.

In [None]:
data = pd.read_csv('data/asset-v1_SkillFactory+MIFIML-1sem+2024+type@asset+block@bikes_rent.xls') # это csv хоть файл и эксель
data.head()

In [None]:
data.info()

In [None]:
data.isna().sum()

В данном датасете нет пропущенных значений по всем столбцам

---

### Задание 8

Исследуем данные на наличие линейной зависимости между столбцами. Найдите ранг матрицы данных. Сравните его с количеством столбцов, сделайте вывод. Если линейная зависимость есть - напишите, между какими столбцами и удалите один из них.

Распишите решение с помощью кода на языке Python и напишите текстом интерпретацию полученного вывода.

In [None]:
corr = data.corr()
corr

In [None]:
matrix_rank = np.linalg.matrix_rank(corr)
num_columns = data.shape[1]
print(f'Ранг матрицы: {matrix_rank}')
print(f'Количество столбцов: {num_columns}')

In [None]:
for i in range(len(corr.columns)):
    for j in range(i):
        if abs(corr.iloc[i,j]) > 0.999:
            print(f"{corr.columns[i]} - {corr.columns[j]}: {corr.iloc[i,j]:.3f}")

In [8]:
del data['windspeed(ms)']

**Ответ:** Количество столбцов больше ранга матрицы, что указывает на линейную зависимость. рямая линейная зависимость между `windspeed(ms)`  и `windspeed(mph)` - `1.00`. Удалим `windspeed(ms)`.

---

### Задание 9

Выведите корреляционную матрицу оставшихся переменных.

* Какая переменная сильнее всего коррелирует с целевой?
* Есть ли мультиколлинеарность? Между какими переменными? Если есть корреляция выше 0.9 - оставьте только 1 признак. Объясните выбор

Распишите решение с помощью кода на языке Python и напишите текстом интерпретацию полученного вывода.

In [None]:
corr = data.corr()
corr

In [None]:
for i in range(len(corr.columns)):
    for j in range(i):
        if abs(corr.iloc[i,j]) > 0.9:
            print(f"{corr.columns[i]} - {corr.columns[j]}: {corr.iloc[i,j]:.3f}")

* С целевой переменной смльнее всего коррелирует `atemp`.
* Есть мультиколлинеарность между `atemp` и `temp`. Корреляция между ними `0.992`. Удалим `temp` (т.е. ее корреляция с целевой переменной ниже чем у `atemp`).

In [16]:
del data['temp']

---

### Задание 10

Разделите данные на предикторы и целевую переменную. Обучите модель с помощью классической линейной регрессии. Линейную регрессию необходимо реализовать без готовых библиотек.

Оцените качество модели с помощью хотя бы двух метрик качества.

Распишите решение с помощью кода на языке Python и напишите текстом интерпретацию полученного вывода.

In [17]:
X = data.drop('cnt', axis=1)
y = data['cnt']

X = np.column_stack((np.ones(X.shape[0]), X))

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=44)

In [None]:
w_hat = np.round(np.linalg.inv(X_train.T@X_train)@X_train.T@y_train, 3)
w_hat

In [None]:
y_pred = X_test@w_hat

print('MSE -', round(mean_squared_error(y_test, y_pred), 2))
print('MAPE -', round(mean_absolute_percentage_error(y_test, y_pred), 2))

**Ответ:**

* MSE (705951.73): Высокое значение MSE указывает на наличие значительных отклонений в предсказаниях модели. Это может быть вызвано присутствием выбросов или систематической ошибкой в предсказаниях для определенных диапазонов данных.

* MAPE (19%): Средняя процентная ошибка в 19% свидетельствует о том, что модель в целом имеет умеренную точность. Однако для многих практических задач такой уровень ошибки может быть неприемлемым.