<a href="https://colab.research.google.com/github/CodeHunterOfficial/TimeSeriesForecast_2024-2025/blob/main/1_0_1_%D0%9B%D0%B0%D0%B3%D0%B8_%D0%B2%D0%BE_%D0%B2%D1%80%D0%B5%D0%BC%D0%B5%D0%BD%D0%BD%D1%8B%D1%85_%D1%80%D1%8F%D0%B4%D0%B0%D1%85.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

#**Лаги во временных рядах**

#### Введение

**Временные ряды** — это последовательность данных, собранных или записанных в хронологическом порядке. Основные примеры временных рядов включают такие данные, как ежедневные температуры, цены на акции, продажи товаров, экономические индикаторы (например, инфляция, ВВП), показатели на фондовых рынках, данные о потреблении электроэнергии и многое другое.

Один из ключевых аспектов анализа временных рядов — это **лаг**. Лаги играют важную роль в выявлении зависимостей, структур и трендов во временных рядах, а также в построении прогнозных моделей.

В этой лекции мы подробно рассмотрим, что такое лаги во временных рядах, как их вычислять, зачем они нужны и какие методы используют для их анализа.



### 1. Что такое лаги во временных рядах?

**Лаг** — это смещение или задержка значений временного ряда. Лаги используются для анализа зависимости текущего значения от предыдущих. Когда мы говорим, что временной ряд имеет лаг $k$, это означает, что текущее значение временного ряда зависит от значения на $k$ временных единиц назад.

В математическом выражении, если $y_t$ — это значение временного ряда в момент времени $t$, то его лаг $k$ (обозначается как $y_{t-k}$) — это значение временного ряда, наблюдаемое в момент времени $t-k$.

**Примеры лагов:**
- **Лаг 1 (или $y_{t-1}$)** — значение на один период назад.
- **Лаг 2 (или $y_{t-2}$)** — значение на два периода назад.
- И так далее...

Лаги часто используются в моделях прогнозирования, чтобы захватить зависимости между текущим значением и предыдущими значениями во временном ряду.



### 2. Роль лагов в анализе временных рядов

Лаги играют несколько ключевых ролей в анализе временных рядов:

1. **Выявление автокорреляции:**
   Автокорреляция — это корреляция между текущим значением временного ряда и его предыдущими значениями. Лаги используются для вычисления автокорреляции на различных временных интервалах.
   
2. **Моделирование зависимости:**
   Лаги помогают построить модели, которые учитывают, как прошлые значения временного ряда влияют на текущие. Это важно для построения прогнозных моделей, например, в финансовых и экономических анализах.
   
3. **Модели с лагами:**
   Лаги являются основой для построения различных моделей временных рядов, таких как:
   - **AR (Autoregressive model)** — модель авторегрессии.
   - **MA (Moving Average model)** — модель скользящего среднего.
   - **ARMA (Autoregressive Moving Average)** — комбинированная модель.
   - **ARIMA (Autoregressive Integrated Moving Average)** — модель с интегрированием.

4. **Прогнозирование:**
   Лаги важны для построения прогностических моделей, которые используют информацию о прошлом для предсказания будущих значений. Прогнозы могут быть основаны на значениях временного ряда с различными лагами.


### 3. Виды лагов

Лаги могут быть различных типов в зависимости от контекста задачи. Рассмотрим основные типы лагов:

#### 3.1. **Простые лаги (или автогрегрессия)**

Простые лаги представляют собой сдвиг значений временного ряда. Например, если временной ряд $y_t$ представляет собой ежедневные продажи, то лаг 1 ($y_{t-1}$) будет представлять собой продажи в предыдущий день, лаг 2 ($y_{t-2}$) — продажи за два дня назад, и так далее.

Пример использования:
Если мы хотим предсказать продажи на сегодняшний день, используя продажи в предыдущие дни, то:
$$
y_t = \phi_1 y_{t-1} + \phi_2 y_{t-2} + \varepsilon_t
$$
где $y_t$ — текущие продажи, $\phi_1$ и $\phi_2$ — коэффициенты, $\varepsilon_t$ — ошибка.

#### 3.2. **Сезонные лаги**

Сезонные лаги используются для учета периодических колебаний во временных рядах, таких как сезонность в продажах (например, повышение спроса на товары в определенные месяцы года или в праздничные дни). В этих моделях используется лаг, который соответствует периодичности данных (например, лаг 12 для месячных данных с годовой сезонностью).

Пример:
Если мы анализируем продажи товаров по месяцам, то сезонный лаг с периодом 12 будет учитывать зависимость между продажами в текущем месяце и аналогичным месяцем прошлого года.

#### 3.3. **Динамические лаги**

Динамические лаги относятся к случаям, когда влияние предыдущих значений временного ряда изменяется со временем. В таких моделях, например, может использоваться не просто фиксированное значение лагов, а модель, где коэффициенты лагов меняются со временем, например, в моделях с временными регрессиями или моделях машинного обучения.



### 4. Как вычисляются лаги?

Для вычисления лагов во временных рядах необходимо выполнить несколько шагов:

#### 4.1. **Шаг 1: Сбор данных**

Прежде всего, нужно собрать временной ряд, состоящий из наблюдений, отсортированных по времени. Например, если у нас есть данные о ежемесячных продажах, то каждый месяц будет представлять собой отдельное наблюдение.

#### 4.2. **Шаг 2: Сдвиг данных**

Чтобы создать лаги, необходимо сдвигать временной ряд на необходимое количество периодов назад. Для лагов 1, 2, 3 и так далее для каждого наблюдения $y_t$ мы будем использовать соответствующие значения $y_{t-1}, y_{t-2}, y_{t-3}$ и так далее.

Пример:
Если у нас есть данные о продажах в следующие месяцы:

| Месяц | Продажи |
|-||
| Январь | 100     |
| Февраль | 120    |
| Март   | 130     |

Тогда лаги для месяца "Февраль" будут:
- Лаг 1: Продажи в январе (100)
- Лаг 2: Продажи в декабре (если данные за декабрь доступны)

#### 4.3. **Шаг 3: Построение модели**

После вычисления лагов можно использовать их для построения модели. Например, в модели авторегрессии (AR) или в модели ARMA (автогрессия и скользящее среднее) мы будем использовать эти лаги для прогноза текущего значения.



### 5. Практическое использование лагов

#### 5.1. **Прогнозирование цен на акции**

В финансовых временных рядах, например, для прогнозирования цен акций, часто используются лаги, чтобы понять зависимость текущей цены от предыдущих значений. Модель AR(1) может быть использована для прогнозирования цены акций на основе цены на предыдущий день.

Пример:
$$
y_t = \phi_1 y_{t-1} + \varepsilon_t
$$
где $y_t$ — это цена акции в день $t$, а $y_{t-1}$ — это цена в предыдущий день. Если коэффициент $\phi_1$ равен 0.9, то текущая цена будет зависеть на 90% от предыдущей.

#### 5.2. **Экономическое прогнозирование (например, инфляция)**

Лаги также широко используются в экономическом прогнозировании. Например, для прогнозирования уровня инфляции на основе ее значения в предыдущих месяцах или кварталах можно использовать модель AR(2), которая учитывает два предыдущих значения.

Пример:
$$
\text{Inflation}_t = \phi_1 \cdot \text{Inflation}_{t-1} + \phi_2 \cdot \text{Inflation}_{t-2} + \varepsilon_t
$$

#### 5.3. **Модели сезонности и трендов**

Для анализа сезонных колебаний, например, продаж в магазине, можно использовать сезонные лаги. Это позволяет моделям учитывать регулярные изменения, происходящие в определенные сезоны, месяцы или годы.



### 6. Методы для вычисления и анализа лагов

Для вычисления и анализа лагов в реальных задачах используются различные инструменты и методы:

1. **Автокорреляция** — для выявления зависимостей между значениями временного ряда и их лагами. Это позволяет определить, какие лаги наиболее сильно влияют на текущее значение.
2. **ACF (Autocorrelation Function)** и **PACF (Partial Autocorrelation Function)** — это функции, которые показывают

, как значения временного ряда коррелируют с их лагами.
3. **Модели ARIMA** — для прогнозирования временных рядов, где используются как автогрегрессия (AR), так и скользящее среднее (MA), а также сезонные и другие лаги.


Таким образом, лаги являются важным инструментом в анализе временных рядов. Они позволяют захватывать зависимость текущих значений от предыдущих, что является основой для построения прогностических моделей. Независимо от того, анализируете ли вы экономику, финансы, продажи или другие виды данных, понимание и использование лагов поможет вам лучше понять динамику процессов и улучшить точность прогнозов.


### Примеры вычисления лагов в анализе временных рядов


#### Пример 1: Лаг 1 для временного ряда

Предположим, у нас есть временной ряд с ежедневными данными о температуре (в градусах Цельсия) в течение пяти дней:

| День  | Температура ($T_t$) |
|-|--|
| 1     | 15                    |
| 2     | 17                    |
| 3     | 16                    |
| 4     | 18                    |
| 5     | 19                    |

Чтобы вычислить лаг 1 (или $y_{t-1}$), мы сдвигаем данные на один день назад:

| День  | Температура ($T_t$) | Лаг 1 ($T_{t-1}$) |
|-|--||
| 1     | 15                    | —                   |
| 2     | 17                    | 15                  |
| 3     | 16                    | 17                  |
| 4     | 18                    | 16                  |
| 5     | 19                    | 18                  |

**Интерпретация:**
- Для первого дня нет данных о предыдущем дне, поэтому лаг 1 отсутствует.
- Для второго дня лаг 1 — это температура на первом дне (15°C).
- Для третьего дня лаг 1 — это температура на втором дне (17°C), и так далее.

#### Пример 2: Лаги больше 1

Теперь рассмотрим лаги $k = 2$ и $k = 3$ для того же временного ряда.

| День  | Температура ($T_t$) | Лаг 1 ($T_{t-1}$) | Лаг 2 ($T_{t-2}$) | Лаг 3 ($T_{t-3}$) |
|-|--||||
| 1     | 15                    | —                   | —                   | —                   |
| 2     | 17                    | 15                  | —                   | —                   |
| 3     | 16                    | 17                  | 15                  | —                   |
| 4     | 18                    | 16                  | 17                  | 15                  |
| 5     | 19                    | 18                  | 16                  | 17                  |

**Интерпретация:**
- Лаг 2 для дня 3 — это температура на два дня раньше (15°C).
- Лаг 3 для дня 4 — это температура на три дня раньше (15°C).
- Для последнего дня (день 5) лаги 1, 2 и 3 могут быть вычислены, так как для этих дат есть соответствующие данные из предыдущих дней.

#### Пример 3: Применение лагов к экономическим данным

Предположим, у нас есть данные о квартальных продажах (в миллионах долларов) за несколько лет. Мы хотим вычислить лаги для анализа зависимости текущих продаж от предыдущих кварталов.

| Квартал | Продажи ($S_t$) |
||-|
| Q1 2023 | 100               |
| Q2 2023 | 120               |
| Q3 2023 | 110               |
| Q4 2023 | 130               |
| Q1 2024 | 125               |

Вычислим лаги 1, 2 и 3 для этого ряда:

| Квартал   | Продажи ($S_t$) | Лаг 1 ($S_{t-1}$) | Лаг 2 ($S_{t-2}$) | Лаг 3 ($S_{t-3}$) |
|--|-||||
| Q1 2023   | 100               | —                   | —                   | —                   |
| Q2 2023   | 120               | 100                 | —                   | —                   |
| Q3 2023   | 110               | 120                 | 100                 | —                   |
| Q4 2023   | 130               | 110                 | 120                 | 100                 |
| Q1 2024   | 125               | 130                 | 110                 | 120                 |

**Интерпретация:**
- Для квартала Q1 2023 нет данных о предыдущих кварталах, поэтому лаги отсутствуют.
- Для Q2 2023 лаг 1 — это продажи в первом квартале 2023 года (100 млн).
- Для Q3 2023 лаг 1 — это продажи во втором квартале 2023 года (120 млн), лаг 2 — это продажи в первом квартале (100 млн), и так далее.

#### Пример 4: Использование лагов для сезонных данных

Предположим, у нас есть данные о среднем уровне осадков за каждый месяц в году. Мы хотим вычислить сезонные лаги с периодом 12 месяцев (например, для анализа годовых циклов осадков).

| Месяц    | Осадки ($R_t$) |
|-||
| Январь   | 50               |
| Февраль  | 60               |
| Март     | 45               |
| Апрель   | 70               |
| Май      | 80               |
| Июнь     | 90               |
| Июль     | 100              |
| Август   | 110              |
| Сентябрь | 95               |
| Октябрь  | 85               |
| Ноябрь  | 75               |
| Декабрь  | 65               |

Вычислим лаги для данных с периодом 12 месяцев (сезонность):

| Месяц    | Осадки ($R_t$) | Лаг 1 ($R_{t-1}$) | Лаг 12 ($R_{t-12}$) |
|-|||--|
| Январь   | 50               | —                   | —                     |
| Февраль  | 60               | 50                  | —                     |
| Март     | 45               | 60                  | —                     |
| Апрель   | 70               | 45                  | —                     |
| Май      | 80               | 70                  | —                     |
| Июнь     | 90               | 80                  | —                     |
| Июль     | 100              | 90                  | —                     |
| Август   | 110              | 100                 | —                     |
| Сентябрь | 95               | 110                 | —                     |
| Октябрь  | 85               | 95                  | —                     |
| Ноябрь  | 75               | 85                  | —                     |
| Декабрь  | 65               | 75                  | 50                    |

**Интерпретация:**
- Для декабря 2023 года лаг 12 — это данные о осадках за декабрь 2022 года (50 мм).
- Для января 2023 года лаг 12 отсутствует, так как нет данных о декабре 2022 года в нашем ряду.
- Для февраля 2023 года лаг 12 отсутствует, а лаг 1 — это осадки в январе 2023 года (50 мм).




In [3]:
import pandas as pd

# Пример 1: Лаг 1 для временного ряда (температура)
temperature_data = {
    'День': [1, 2, 3, 4, 5],
    'Температура': [15, 17, 16, 18, 19]
}
df_temperature = pd.DataFrame(temperature_data)

# Вычисление лагов
df_temperature['Лаг 1'] = df_temperature['Температура'].shift(1)

# Пример 2: Лаги 1, 2 и 3 для временного ряда (температура)
df_temperature['Лаг 2'] = df_temperature['Температура'].shift(2)
df_temperature['Лаг 3'] = df_temperature['Температура'].shift(3)

# Пример 3: Применение лагов к экономическим данным (продажи)
sales_data = {
    'Квартал': ['Q1 2023', 'Q2 2023', 'Q3 2023', 'Q4 2023', 'Q1 2024'],
    'Продажи': [100, 120, 110, 130, 125]
}
df_sales = pd.DataFrame(sales_data)

# Вычисление лагов
df_sales['Лаг 1'] = df_sales['Продажи'].shift(1)
df_sales['Лаг 2'] = df_sales['Продажи'].shift(2)
df_sales['Лаг 3'] = df_sales['Продажи'].shift(3)

# Пример 4: Использование лагов для сезонных данных (осадки)
rainfall_data = {
    'Месяц': ['Январь', 'Февраль', 'Март', 'Апрель', 'Май', 'Июнь', 'Июль', 'Август', 'Сентябрь', 'Октябрь', 'Ноябрь', 'Декабрь'],
    'Осадки': [50, 60, 45, 70, 80, 90, 100, 110, 95, 85, 75, 65]
}
df_rainfall = pd.DataFrame(rainfall_data)

# Вычисление лагов
df_rainfall['Лаг 1'] = df_rainfall['Осадки'].shift(1)
df_rainfall['Лаг 12'] = df_rainfall['Осадки'].shift(12)

# Вывод результатов
df_temperature, df_sales, df_rainfall

(   День  Температура  Лаг 1  Лаг 2  Лаг 3
 0     1           15    NaN    NaN    NaN
 1     2           17   15.0    NaN    NaN
 2     3           16   17.0   15.0    NaN
 3     4           18   16.0   17.0   15.0
 4     5           19   18.0   16.0   17.0,
    Квартал  Продажи  Лаг 1  Лаг 2  Лаг 3
 0  Q1 2023      100    NaN    NaN    NaN
 1  Q2 2023      120  100.0    NaN    NaN
 2  Q3 2023      110  120.0  100.0    NaN
 3  Q4 2023      130  110.0  120.0  100.0
 4  Q1 2024      125  130.0  110.0  120.0,
        Месяц  Осадки  Лаг 1  Лаг 12
 0     Январь      50    NaN     NaN
 1    Февраль      60   50.0     NaN
 2       Март      45   60.0     NaN
 3     Апрель      70   45.0     NaN
 4        Май      80   70.0     NaN
 5       Июнь      90   80.0     NaN
 6       Июль     100   90.0     NaN
 7     Август     110  100.0     NaN
 8   Сентябрь      95  110.0     NaN
 9    Октябрь      85   95.0     NaN
 10    Ноябрь      75   85.0     NaN
 11   Декабрь      65   75.0     NaN)