# Разности и лаги

In [None]:
import numpy as np
import pandas as pd 

import pandas_datareader.data as web

from sktime.utils.plotting import plot_series, plot_lags

# настройки визуализации
import matplotlib.pyplot as plt

# Не показывать Warnings
import warnings
warnings.simplefilter(action='ignore', category=Warning)

## Пример 1 (первая разности)
Загрузим из БД [`FRED`](https://fred.stlouisfed.org/) месячные данные по M2 (Symbol [`M2SL`](https://fred.stlouisfed.org/series/M2SL)) с 1990-01 по 2023-12 и создадим датафрейм `m2`

In [None]:
m2 = web.DataReader(name='M2SL', data_source='fred', start='1990-01', end='2023-12')
m2.index = pd.period_range(start='1990-01', end='2023-12', freq='M')
m2.columns = ['M2']
m2

In [None]:
# первая разность
m2.diff()

In [None]:
# вторая разность
m2.diff().diff()

In [None]:
# log-доходность
np.log(m2).diff()

Визуализируем с разными стиля (предопрелённные стили см. [здесь](https://matplotlib.org/stable/gallery/style_sheets/style_sheets_reference.html))

In [None]:
plt.style.use('ggplot')

ax = m2.plot()
ax.set_title('US M2 (monthly data)')
ax.set_ylabel('M2')
ax.set_xlabel('Date')
ax.legend().remove()

plt.show()

In [None]:
plt.style.use('grayscale')

ax = m2.diff().plot()
ax.set_title('Первая разность M2 (месячные данные)')
ax.set_ylabel('diff((M2)')
ax.legend().remove()

plt.show()

In [None]:
plt.style.use('bmh')

ax = np.log(m2).diff().plot()
ax.set_title('log-доходность M2 (месячные данные)')
ax.set_ylabel('log(diff((M2))')
ax.legend().remove()

plt.show()

In [None]:
# гистограмма для log-доходности
plt.style.use('default')
ax = np.log(m2).diff().plot.hist(bins=30)
ax.set_title('Гистограмма для log-доходности M2')
ax.legend().remove()

plt.show()

## Пример 2 (лаги)

Загрузим из БД [`FRED`](https://fred.stlouisfed.org/) месячные данные по 3-Month Treasury Bill Secondary Market Rate (Symbol [`TB3MS`](https://fred.stlouisfed.org/series/TB3MS)) с 1990-01 по 2023-12

In [None]:
y = web.DataReader(name='TB3MS', data_source='fred',start='1990-01', end='2023-12')
y.index = pd.period_range(start='1990-01', end='2023-12', freq='M')
y.columns = ['3Mrate']
y

In [None]:
plot_series(y)

In [None]:
plot_lags(y, lags=1)

plt.show()

In [None]:
plot_lags(y.diff().dropna(), lags=1)

plt.show()

In [None]:
plot_lags(y, lags=[1,2])

plt.show()

In [None]:
plot_lags(y.diff().dropna(), lags=[1,2])

plt.show()

In [None]:
# Добавим лаг в датасету
y['lag_3Mrate'] = y['3Mrate'].shift()
y.corr()