<a href="https://colab.research.google.com/github/CodeHunterOfficial/ABC_DataMining/blob/main/Mathematics/Statics/%D0%9A%D0%BE%D0%B2%D0%B0%D1%80%D0%B8%D0%B0%D1%86%D0%B8%D1%8F.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

#Ковариация — Определение, Примеры и Значение в Машинном Обучении



## 1. Определение ковариации

Ковариация — это статистическая мера, которая оценивает степень совместного изменения двух случайных величин. Она показывает, насколько две переменные изменяются вместе. Если одна переменная увеличивается, то другая либо увеличивается (положительная ковариация), либо уменьшается (отрицательная ковариация), либо не зависит от первой (ковариация близка к нулю).

Формально, для двух случайных величин $ X $ и $ Y $ ковариация определяется следующим образом:

$$
\text{Cov}(X, Y) = \mathbb{E}[(X - \mu_X)(Y - \mu_Y)]
$$

где:
- $ \mu_X = \mathbb{E}[X] $ — математическое ожидание (среднее значение) переменной $ X $,
- $ \mu_Y = \mathbb{E}[Y] $ — математическое ожидание переменной $ Y $,
- $ \mathbb{E}[\cdot] $ — оператор математического ожидания.

Если $ X $ и $ Y $ являются выборками (например, наборами данных), то выборочная ковариация вычисляется по формуле:

$$
\text{Cov}(X, Y) = \frac{1}{n-1} \sum_{i=1}^n (X_i - \bar{X})(Y_i - \bar{Y})
$$

где:
- $ n $ — количество наблюдений,
- $ \bar{X} $ и $ \bar{Y} $ — выборочные средние значений $ X $ и $ Y $ соответственно.

> *Примечание: В некоторых источниках ковариация вычисляется с делением на $ n $ вместо $ n-1 $. Разница становится незначительной при больших $ n $.*



## 2. Интерпретация ковариации

Значение ковариации может быть:
- **Положительным**: если большие значения одной переменной связаны с большими значениями другой.
- **Отрицательным**: если большие значения одной переменной связаны с малыми значениями другой.
- **Близким к нулю**: если переменные слабо или вообще не коррелируют.

Однако важно отметить, что ковариация сама по себе не нормализована, и её численное значение зависит от масштаба данных. Например, если $ X $ измеряется в метрах, а $ Y $ — в килограммах, то ковариация будет выражаться в "метрах × килограммах". Это ограничивает её интерпретацию без дополнительного анализа.



## 3. Примеры вычисления ковариации

### Пример 1: Простой числовой пример
Рассмотрим два набора данных:
$$
X = [1, 2, 3, 4, 5], \quad Y = [2, 4, 6, 8, 10]
$$

1. Вычислим средние значения:
   $$
   \bar{X} = \frac{1+2+3+4+5}{5} = 3, \quad \bar{Y} = \frac{2+4+6+8+10}{5} = 6
   $$

2. Вычислим отклонения от средних:
   $$
   X - \bar{X} = [-2, -1, 0, 1, 2], \quad Y - \bar{Y} = [-4, -2, 0, 2, 4]
   $$

3. Найдём произведения отклонений:
   $$
   (X - \bar{X})(Y - \bar{Y}) = [8, 2, 0, 2, 8]
   $$

4. Вычислим ковариацию:
   $$
   \text{Cov}(X, Y) = \frac{1}{5-1} (8 + 2 + 0 + 2 + 8) = \frac{20}{4} = 5
   $$

Таким образом, ковариация равна $ 5 $, что указывает на положительную связь между $ X $ и $ Y $.



### Пример 2: Отрицательная ковариация
Пусть:
$$
X = [1, 2, 3, 4, 5], \quad Y = [10, 8, 6, 4, 2]
$$

Выполнив аналогичные вычисления, получим:
$$
\text{Cov}(X, Y) = -5
$$

Это указывает на отрицательную связь: при увеличении $ X $, $ Y $ уменьшается.



### Пример 3: Нулевая ковариация, но не независимость
Рассмотрим случай, когда ковариация равна нулю, но переменные не являются независимыми:

Пусть:
$$
X = [-2, -1, 0, 1, 2], \quad Y = X^2 = [4, 1, 0, 1, 4]
$$

1. Вычислим средние значения:
   $$
   \bar{X} = 0, \quad \bar{Y} = \frac{4+1+0+1+4}{5} = 2
   $$

2. Вычислим произведения отклонений:
   $$
   (X - \bar{X})(Y - \bar{Y}) = [-2(4-2), -1(1-2), 0(0-2), 1(1-2), 2(4-2)] = [-4, 1, 0, -1, 4]
   $$

3. Сумма произведений:
   $$
   \sum (X - \bar{X})(Y - \bar{Y}) = -4 + 1 + 0 - 1 + 4 = 0
   $$

Таким образом, ковариация равна нулю, хотя $ Y $ полностью зависит от $ X $ ($ Y = X^2 $). Это показывает, что нулевая ковариация не гарантирует независимость.



## 4. Ковариационная матрица

В многомерном случае ковариация используется для построения **ковариационной матрицы**, которая содержит парные ковариации всех переменных. Для $ n $ переменных $ X_1, X_2, \dots, X_n $ ковариационная матрица $ \Sigma $ имеет вид:

$$
\Sigma =
\begin{bmatrix}
\text{Cov}(X_1, X_1) & \text{Cov}(X_1, X_2) & \cdots & \text{Cov}(X_1, X_n) \\
\text{Cov}(X_2, X_1) & \text{Cov}(X_2, X_2) & \cdots & \text{Cov}(X_2, X_n) \\
\vdots & \vdots & \ddots & \vdots \\
\text{Cov}(X_n, X_1) & \text{Cov}(X_n, X_2) & \cdots & \text{Cov}(X_n, X_n)
\end{bmatrix}
$$

Диагональные элементы матрицы представляют собой дисперсии соответствующих переменных.




## 5. Значение ковариации в машинном обучении

Ковариация играет важную роль в различных областях машинного обучения. Рассмотрим её применение подробнее.



### **5.1 Анализ данных и предобработка**

#### **Обнаружение зависимостей**
Ковариация помогает выявить взаимосвязи между признаками. Это особенно полезно на этапе анализа данных, когда важно понять структуру данных и выбрать подходящие модели. Например:
- В задаче предсказания цены дома ковариация между площадью дома ($ X $) и ценой ($ Y $) будет положительной, так как большие дома обычно дороже.
- Если ковариация между числом комнат и ценой также высока, это может указывать на важность обоих признаков для модели.

> *Пример: В датасете о недвижимости можно вычислить ковариацию между различными признаками (например, площадь, количество спален, расстояние до центра города) и целевой переменной (цена). Высокая ковариация с целевой переменной подскажет, какие признаки наиболее значимы.*

#### **Удаление мультиколлинеарности**
В задачах регрессии высокая ковариация между признаками может привести к проблемам сходимости модели (мультиколлинеарность). Используя ковариационную матрицу, можно выявить такие признаки и исключить их или преобразовать данные.

> *Пример: В датасете о недвижимости признаки "общая площадь" и "жилая площадь" могут быть сильно скоррелированы. Это может привести к неустойчивым коэффициентам в линейной регрессии. Удаление одного из этих признаков или использование методов регуляризации поможет решить проблему.*



### **5.2 Метод главных компонент (PCA)**

Метод главных компонент (PCA) использует ковариационную матрицу для преобразования данных в новое пространство, где признаки становятся некоррелированными. Это позволяет снизить размерность данных, сохраняя максимум информации.

- PCA вычисляет собственные значения и собственные векторы ковариационной матрицы, чтобы найти направления максимальной дисперсии в данных.
- При этом признаки с низкой дисперсией (малой изменчивостью) могут быть отброшены без значительной потери информации.

> *Пример: В задаче классификации изображений размерностью $ 100 \times 100 $ пикселей ($ 10,000 $ признаков) PCA может снизить размерность до $ 50 $ признаков, сохранив 95% дисперсии. Это ускоряет обучение модели и уменьшает риск переобучения.*



### **5.3 Регуляризация**

В методах регуляризации (например, Ridge Regression или Lasso) ковариация между признаками учитывается для стабилизации модели и предотвращения переобучения.

- Ridge Regression добавляет штраф за большие коэффициенты, что особенно полезно при наличии мультиколлинеарности.
- Ковариационная матрица помогает определить, какие признаки имеют высокую корреляцию, и соответственно настроить регуляризацию.

> *Пример: В Ridge Regression штрафное слагаемое зависит от ковариационной матрицы признаков. Если два признака сильно скоррелированы, их коэффициенты будут "сглажены", чтобы избежать неустойчивости модели.*



### **5.4 Генерация данных**

В генеративных моделях (например, GAN или VAE) ковариационная матрица используется для моделирования распределения данных. Она позволяет учитывать зависимости между признаками, делая генерацию данных более реалистичной.

- В GAN ковариационная матрица может использоваться для задания структуры скрытого пространства.
- В VAE ковариационная матрица помогает моделировать многомерное нормальное распределение, из которого семплируются скрытые представления.

> *Пример: В задаче генерации изображений лиц ковариационная матрица может учитывать зависимости между освещением, углом поворота головы и другими характеристиками, что делает генерируемые изображения более естественными.*



### **5.5 Вероятностные модели**

В вероятностных моделях, таких как гауссовские процессы и многомерное нормальное распределение, ковариационная матрица напрямую задает форму распределения.

- **Гауссовские процессы**: Ковариационная матрица определяет степень "гладкости" функции и её изменчивость. Например, в задачах регрессии ковариационная матрица задает априорное распределение над функциями.
- **Многомерное нормальное распределение**: Ковариационная матрица определяет форму эллипсоида, который описывает распределение данных.

> *Пример: В задаче прогнозирования временных рядов гауссовские процессы используют ковариационную матрицу для моделирования зависимостей между точками данных. Это позволяет делать предсказания с учетом неопределенности.*



## 6. Ковариация vs. Корреляция

Ковариация и корреляция — это две взаимосвязанные, но принципиально разные меры зависимости между переменными. Рассмотрим их различия и области применения.



### **Ковариация**

- **Определение**: Ковариация измеряет направление и степень совместного изменения двух переменных.
  - Положительная ковариация указывает на то, что увеличение одной переменной связано с увеличением другой.
  - Отрицательная ковариация указывает на обратную зависимость.
  - Нулевая ковариация (в идеале) означает отсутствие линейной зависимости.

- **Преимущества**:
  - Полезна для определения направления связи.
  - Применяется в случаях, когда важно понять относительную силу связи без сравнения с другими парами переменных.

- **Ограничения**:
  - Не нормализована, поэтому её значение зависит от масштаба данных.
  - Значение ковариации трудно интерпретировать, если данные имеют разные единицы измерения или разный диапазон значений.

> *Пример: Если ковариация между $ X $ (высота дерева в метрах) и $ Y $ (объем древесины в кубических метрах) равна 50, а между $ Z $ (температура в градусах Цельсия) и $ W $ (влажность в процентах) — 10, это не дает информации о том, какая связь сильнее, так как значения зависят от масштаба.*



### **Корреляция**

- **Определение**: Корреляция — это нормализованная мера зависимости, которая принимает значения от -1 до 1.
  - Значение $ \text{Corr}(X, Y) = 1 $ означает идеальную положительную линейную зависимость.
  - Значение $ \text{Corr}(X, Y) = -1 $ означает идеальную отрицательную линейную зависимость.
  - Значение $ \text{Corr}(X, Y) = 0 $ указывает на отсутствие линейной зависимости.

- **Преимущества**:
  - Нормализована, что позволяет сравнивать силу связей между разными парами переменных, независимо от их масштаба.
  - Удобна для количественной оценки зависимости.

- **Формула связи с ковариацией**:
  $$
  \text{Corr}(X, Y) = \frac{\text{Cov}(X, Y)}{\sigma_X \sigma_Y}, \quad \text{где } \sigma_X, \sigma_Y \text{ — стандартные отклонения переменных.}
  $$

> *Пример: Если ковариация между $ X $ и $ Y $ равна 50, а стандартные отклонения $ \sigma_X = 10 $ и $ \sigma_Y = 5 $, то коэффициент корреляции будет равен:*
$$
\text{Corr}(X, Y) = \frac{50}{10 \cdot 5} = 1.
$$
*Это указывает на идеальную положительную линейную зависимость.*



### **Когда использовать ковариацию?**

- Когда важно понять направление связи (положительная или отрицательная).
- Когда анализируется относительная сила связи в рамках одной пары переменных.
- В задачах машинного обучения, таких как PCA, где используется ковариационная матрица.



### **Когда использовать корреляцию?**

- Когда требуется количественная оценка зависимости.
- Когда нужно сравнить силу связей между разными парами переменных.
- В случаях, когда данные имеют разные единицы измерения или масштабы.

> *Пример: В задаче анализа данных о климате можно сравнить корреляцию между температурой и осадками ($ \text{Corr} = 0.8 $) и корреляцию между давлением и влажностью ($ \text{Corr} = 0.6 $). Это позволит сделать вывод о том, что первая связь сильнее второй.*



## 7. Ограничения ковариации

Несмотря на свою полезность, ковариация имеет несколько ограничений:

1. **Чувствительность к масштабу**:
   - Ковариация зависит от единиц измерения данных. Например, если $ X $ измеряется в метрах, а $ Y $ — в килограммах, то ковариация будет выражаться в "метрах × килограммах". Это делает её менее удобной для сравнения между различными наборами данных.

2. **Неинтерпретируемость знака**:
   - Положительная или отрицательная ковариация не всегда даёт полное представление о силе связи. Например, ковариация может быть близка к нулю даже при наличии сложной нелинейной зависимости.

3. **Отсутствие нормализации**:
   - Для более надёжной оценки связи используют коэффициент корреляции (например, Пирсона), который нормализован и принимает значения от -1 до 1.

4. **Неспособность обнаруживать нелинейные зависимости**:
   - Ковариация измеряет только линейную зависимость. Если связь между переменными нелинейна (например, $ Y = X^2 $), ковариация может быть близка к нулю, даже если переменные сильно зависимы.

> *Пример: Рассмотрим $ X = [-2, -1, 0, 1, 2] $ и $ Y = X^2 = [4, 1, 0, 1, 4] $. Ковариация между $ X $ и $ Y $ равна нулю, хотя $ Y $ полностью зависит от $ X $. Это показывает, что ковариация не способна обнаружить нелинейные зависимости.*



 ##Примеры

### **Пример 1: Положительная ковариация**
**Дано:**  
$ X = [2, 4, 6, 8, 10] $, $ Y = [3, 6, 9, 12, 15] $

**Шаг 1:** Вычислим средние значения:
$$
\bar{X} = \frac{2+4+6+8+10}{5} = 6, \quad \bar{Y} = \frac{3+6+9+12+15}{5} = 9
$$

**Шаг 2:** Найдем отклонения от средних:
$$
X - \bar{X} = [-4, -2, 0, 2, 4], \quad Y - \bar{Y} = [-6, -3, 0, 3, 6]
$$

**Шаг 3:** Вычислим произведения отклонений:
$$
(X - \bar{X})(Y - \bar{Y}) = [24, 6, 0, 6, 24]
$$

**Шаг 4:** Суммируем произведения и вычислим ковариацию:
$$
\text{Cov}(X, Y) = \frac{1}{5-1} (24 + 6 + 0 + 6 + 24) = \frac{60}{4} = 15
$$

**Ответ:** Ковариация равна $ 15 $, что указывает на положительную связь.



### **Пример 2: Отрицательная ковариация**
**Дано:**  
$ X = [1, 2, 3, 4, 5] $, $ Y = [10, 8, 6, 4, 2] $

**Шаг 1:** Вычислим средние значения:
$$
\bar{X} = \frac{1+2+3+4+5}{5} = 3, \quad \bar{Y} = \frac{10+8+6+4+2}{5} = 6
$$

**Шаг 2:** Найдем отклонения от средних:
$$
X - \bar{X} = [-2, -1, 0, 1, 2], \quad Y - \bar{Y} = [4, 2, 0, -2, -4]
$$

**Шаг 3:** Вычислим произведения отклонений:
$$
(X - \bar{X})(Y - \bar{Y}) = [-8, -2, 0, -2, -8]
$$

**Шаг 4:** Суммируем произведения и вычислим ковариацию:
$$
\text{Cov}(X, Y) = \frac{1}{5-1} (-8 - 2 + 0 - 2 - 8) = \frac{-20}{4} = -5
$$

**Ответ:** Ковариация равна $ -5 $, что указывает на отрицательную связь.



### **Пример 3: Нулевая ковариация**
**Дано:**  
$ X = [-2, -1, 0, 1, 2] $, $ Y = [4, 1, 0, 1, 4] $

**Шаг 1:** Вычислим средние значения:
$$
\bar{X} = 0, \quad \bar{Y} = \frac{4+1+0+1+4}{5} = 2
$$

**Шаг 2:** Найдем отклонения от средних:
$$
X - \bar{X} = [-2, -1, 0, 1, 2], \quad Y - \bar{Y} = [2, -1, -2, -1, 2]
$$

**Шаг 3:** Вычислим произведения отклонений:
$$
(X - \bar{X})(Y - \bar{Y}) = [-4, 1, 0, -1, 4]
$$

**Шаг 4:** Суммируем произведения и вычислим ковариацию:
$$
\text{Cov}(X, Y) = \frac{1}{5-1} (-4 + 1 + 0 - 1 + 4) = \frac{0}{4} = 0
$$

**Ответ:** Ковариация равна $ 0 $, хотя $ Y $ зависит от $ X $ ($ Y = X^2 $).



### **Пример 4: Ковариационная матрица**
**Дано:**  
$ X = [1, 2, 3] $, $ Y = [4, 5, 6] $

**Шаг 1:** Вычислим средние значения:
$$
\bar{X} = \frac{1+2+3}{3} = 2, \quad \bar{Y} = \frac{4+5+6}{3} = 5
$$

**Шаг 2:** Найдем ковариации:
$$
\text{Cov}(X, X) = \frac{1}{3-1} [(1-2)^2 + (2-2)^2 + (3-2)^2] = \frac{1}{2} [1 + 0 + 1] = 1
$$
$$
\text{Cov}(Y, Y) = \frac{1}{3-1} [(4-5)^2 + (5-5)^2 + (6-5)^2] = \frac{1}{2} [1 + 0 + 1] = 1
$$
$$
\text{Cov}(X, Y) = \frac{1}{3-1} [(1-2)(4-5) + (2-2)(5-5) + (3-2)(6-5)] = \frac{1}{2} [1 + 0 + 1] = 1
$$

**Шаг 3:** Построим ковариационную матрицу:
$$
\Sigma =
\begin{bmatrix}
\text{Cov}(X, X) & \text{Cov}(X, Y) \\
\text{Cov}(Y, X) & \text{Cov}(Y, Y)
\end{bmatrix}
=
\begin{bmatrix}
1 & 1 \\
1 & 1
\end{bmatrix}
$$

**Ответ:** Ковариационная матрица:
$$
\begin{bmatrix}
1 & 1 \\
1 & 1
\end{bmatrix}
$$



### **Пример 5: Корреляция через ковариацию**
**Дано:**  
$ X = [1, 2, 3, 4, 5] $, $ Y = [2, 4, 6, 8, 10] $

**Шаг 1:** Вычислим ковариацию (из Примера 1):
$$
\text{Cov}(X, Y) = 5
$$

**Шаг 2:** Вычислим стандартные отклонения:
$$
\sigma_X = \sqrt{\frac{1}{5-1} [(1-3)^2 + (2-3)^2 + (3-3)^2 + (4-3)^2 + (5-3)^2]} = \sqrt{\frac{10}{4}} = \sqrt{2.5}
$$
$$
\sigma_Y = \sqrt{\frac{1}{5-1} [(2-6)^2 + (4-6)^2 + (6-6)^2 + (8-6)^2 + (10-6)^2]} = \sqrt{\frac{40}{4}} = \sqrt{10}
$$

**Шаг 3:** Вычислим коэффициент корреляции:
$$
\text{Corr}(X, Y) = \frac{\text{Cov}(X, Y)}{\sigma_X \sigma_Y} = \frac{5}{\sqrt{2.5} \cdot \sqrt{10}} = \frac{5}{5} = 1
$$

**Ответ:** Коэффициент корреляции равен $ 1 $, что указывает на идеальную положительную линейную зависимость.



### **Пример 6: Обнаружение мультиколлинеарности**
**Дано:**  
$ X_1 = [1, 2, 3, 4, 5] $, $ X_2 = [2, 4, 6, 8, 10] $

**Шаг 1:** Вычислим ковариацию:
$$
\text{Cov}(X_1, X_2) = 5 \quad (\text{из Примера 1})
$$

**Шаг 2:** Вычислим дисперсии:
$$
\text{Var}(X_1) = \text{Cov}(X_1, X_1) = 2.5, \quad \text{Var}(X_2) = \text{Cov}(X_2, X_2) = 10
$$

**Шаг 3:** Определим коэффициент корреляции:
$$
\text{Corr}(X_1, X_2) = \frac{\text{Cov}(X_1, X_2)}{\sqrt{\text{Var}(X_1)} \cdot \sqrt{\text{Var}(X_2)}} = \frac{5}{\sqrt{2.5} \cdot \sqrt{10}} = 1
$$

**Ответ:** Коэффициент корреляции равен $ 1 $, что указывает на полную мультиколлинеарность между $ X_1 $ и $ X_2 $. Это может быть проблемой в задачах регрессии.


import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns

# Функция для вычисления ковариации
def covariance(x, y):
    n = len(x)
    mean_x = np.mean(x)
    mean_y = np.mean(y)
    cov = np.sum((x - mean_x) * (y - mean_y)) / (n - 1)
    return cov

# Функция для вычисления коэффициента корреляции
def correlation(x, y):
    cov = covariance(x, y)
    std_x = np.std(x, ddof=1)
    std_y = np.std(y, ddof=1)
    corr = cov / (std_x * std_y)
    return corr

# Генерация данных
np.random.seed(42)

# Пример 1: Положительная линейная зависимость
x1 = np.array([1, 2, 3, 4, 5])
y1 = np.array([2, 4, 6, 8, 10])

# Пример 2: Отрицательная линейная зависимость
x2 = np.array([1, 2, 3, 4, 5])
y2 = np.array([10, 8, 6, 4, 2])

# Пример 3: Нелинейная зависимость (Y = X^2)
x3 = np.array([-2, -1, 0, 1, 2])
y3 = x3**2

# Вычисление ковариации и корреляции
cov1 = covariance(x1, y1)
corr1 = correlation(x1, y1)

cov2 = covariance(x2, y2)
corr2 = correlation(x2, y2)

cov3 = covariance(x3, y3)
corr3 = correlation(x3, y3)

# Вывод результатов
print("Пример 1: Положительная линейная зависимость")
print(f"Ковариация: {cov1:.2f}, Корреляция: {corr1:.2f}\n")

print("Пример 2: Отрицательная линейная зависимость")
print(f"Ковариация: {cov2:.2f}, Корреляция: {corr2:.2f}\n")

print("Пример 3: Нелинейная зависимость (Y = X^2)")
print(f"Ковариация: {cov3:.2f}, Корреляция: {corr3:.2f}\n")

# Визуализация
plt.figure(figsize=(15, 5))

# Пример 1
plt.subplot(1, 3, 1)
sns.scatterplot(x=x1, y=y1, color="blue")
plt.title(f"Положительная зависимость\nКовариация: {cov1:.2f}, Корреляция: {corr1:.2f}")
plt.xlabel("X")
plt.ylabel("Y")

# Пример 2
plt.subplot(1, 3, 2)
sns.scatterplot(x=x2, y=y2, color="red")
plt.title(f"Отрицательная зависимость\nКовариация: {cov2:.2f}, Корреляция: {corr2:.2f}")
plt.xlabel("X")
plt.ylabel("Y")

# Пример 3
plt.subplot(1, 3, 3)
sns.scatterplot(x=x3, y=y3, color="green")
plt.title(f"Нелинейная зависимость\nКовариация: {cov3:.2f}, Корреляция: {corr3:.2f}")
plt.xlabel("X")
plt.ylabel("Y")

plt.tight_layout()
plt.show()


##Задачи для самостоятельной работы



### **Теоретические задачи**

1. Объясните, что показывает ковариация между двумя переменными.
2. Почему ковариация может быть положительной, отрицательной или близкой к нулю? Приведите примеры для каждого случая.
3. Может ли ковариация быть равна нулю, если переменные зависимы? Приведите пример такой зависимости.
4. Как влияет масштаб данных на значение ковариации? Почему это является ограничением?
5. В каких случаях ковариация используется в анализе данных и машинном обучении?
6. Что такое ковариационная матрица? Как она строится и где применяется?
7. Почему ковариация не способна обнаружить нелинейные зависимости? Приведите пример.
8. Как ковариация связана с дисперсией? В каком случае они совпадают?
9. В чём разница между выборочной ковариацией и теоретической ковариацией?
10. Почему при вычислении выборочной ковариации используется $ n-1 $ вместо $ n $?



### **Вычислительные задачи**

11. Вычислите ковариацию для двух наборов данных:  
    $ X = [1, 2, 3, 4, 5] $, $ Y = [5, 4, 3, 2, 1] $.

12. Даны данные:  
    $ X = [2, 4, 6, 8, 10] $, $ Y = [1, 3, 5, 7, 9] $.  
    Найдите ковариацию.

13. Проверьте, равна ли ковариация нулю для следующих данных:  
    $ X = [-3, -2, -1, 0, 1, 2, 3] $, $ Y = X^2 $.

14. Вычислите ковариационную матрицу для трёх переменных:  
    $ X_1 = [1, 2, 3] $, $ X_2 = [4, 5, 6] $, $ X_3 = [7, 8, 9] $.

15. Найдите ковариацию между переменными $ X $ и $ Y $:  
    $ X = [10, 20, 30, 40, 50] $, $ Y = [50, 40, 30, 20, 10] $.

16. Вычислите ковариацию для данных:  
    $ X = [1, 1, 1, 1, 1] $, $ Y = [1, 2, 3, 4, 5] $.

17. Даны две переменные:  
    $ X = [1, 2, 3, 4, 5] $, $ Y = [2, 4, 6, 8, 10] $.  
    Проверьте, равна ли ковариация дисперсии $ X $.

18. Вычислите ковариацию для данных:  
    $ X = [1, 3, 5, 7, 9] $, $ Y = [2, 4, 6, 8, 10] $.

19. Постройте ковариационную матрицу для данных:  
    $ X_1 = [1, 2, 3, 4] $, $ X_2 = [4, 3, 2, 1] $, $ X_3 = [2, 2, 2, 2] $.

20. Вычислите ковариацию для данных:  
    $ X = [10, 20, 30, 40, 50] $, $ Y = [10, 20, 30, 40, 50] $.



### **Прикладные задачи**

21. На основе данных о росте ($ X $) и весе ($ Y $) пяти человек:  
    $ X = [160, 170, 180, 190, 200] $, $ Y = [50, 60, 70, 80, 90] $.  
    Определите ковариацию между ростом и весом.

22. Дана таблица продаж кофе ($ X $) и чая ($ Y $) за неделю:  
    $ X = [10, 20, 30, 40, 50] $, $ Y = [50, 40, 30, 20, 10] $.  
    Найдите ковариацию между продажами кофе и чая.

23. Исследуйте зависимость между температурой воздуха ($ X $) и количеством осадков ($ Y $):  
    $ X = [20, 22, 24, 26, 28] $, $ Y = [5, 4, 3, 2, 1] $.  
    Вычислите ковариацию.

24. Проведите анализ зависимости между временем учёбы ($ X $) и оценками ($ Y $):  
    $ X = [1, 2, 3, 4, 5] $, $ Y = [50, 60, 70, 80, 90] $.  
    Найдите ковариацию.

25. На основе данных о расходах на рекламу ($ X $) и объёме продаж ($ Y $):  
    $ X = [100, 200, 300, 400, 500] $, $ Y = [10, 20, 30, 40, 50] $.  
    Вычислите ковариацию.

26. Проанализируйте зависимость между возрастом ($ X $) и зарплатой ($ Y $):  
    $ X = [20, 30, 40, 50, 60] $, $ Y = [30, 40, 50, 60, 70] $.  
    Найдите ковариацию.

27. Исследуйте связь между количеством часов сна ($ X $) и продуктивностью ($ Y $):  
    $ X = [4, 5, 6, 7, 8] $, $ Y = [30, 40, 50, 60, 70] $.  
    Вычислите ковариацию.

28. Проведите анализ зависимости между ценой дома ($ X $) и его площадью ($ Y $):  
    $ X = [100, 200, 300, 400, 500] $, $ Y = [50, 100, 150, 200, 250] $.  
    Найдите ковариацию.

29. Исследуйте связь между количеством сотрудников ($ X $) и прибылью компании ($ Y $):  
    $ X = [10, 20, 30, 40, 50] $, $ Y = [100, 200, 300, 400, 500] $.  
    Вычислите ковариацию.

30. Проанализируйте зависимость между временем выполнения задачи ($ X $) и количеством ошибок ($ Y $):  
    $ X = [10, 20, 30, 40, 50] $, $ Y = [5, 4, 3, 2, 1] $.  
    Найдите ковариацию.

