In [2]:
# Грузим данные
from statsmodels.tsa.stattools import adfuller, kpss, grangercausalitytests
import pandas as pd
import numpy as np
import plotly.express as px

data = pd.read_csv('data_seminars/fed_funds.csv', index_col=0)

In [6]:
px.line(data)


In [14]:
# Тест Дики-Фуллера. Спецификация вспомогательной регрессии -- без константы (разность наших данных стационарна около нуля)
# Гипотеза нестационарности не отвергается

adfuller(data.values, regression='nc')

(-1.4539225355928476,
 0.1364141963123946,
 17,
 653,
 {'1%': -2.56917239565769,
  '5%': -1.9414191116634467,
  '10%': -1.6164195355579585},
 870.566187343909)

In [15]:
# А для первых разностей гипотеза уже отвергается
adfuller(data.diff().dropna(), regression='nc')

(-5.267179806116964,
 3.1178165617558075e-07,
 16,
 653,
 {'1%': -2.56917239565769,
  '5%': -1.9414191116634467,
  '10%': -1.6164195355579585},
 870.4142427238884)

In [16]:
# Для KPSS-теста выбираем спецификацию нулевой гипотезы как "c", 
# так как нет оснований предполагать наличия в данных линейных трендов(См описание спецификаций в документации)
# Нулевая гипотеза отвергается, данные нестационарны
kpss(data, regression='c')


The test statistic is outside of the range of p-values available in the
look-up table. The actual p-value is smaller than the p-value returned.




(1.1692388828326334,
 0.01,
 20,
 {'10%': 0.347, '5%': 0.463, '2.5%': 0.574, '1%': 0.739})

In [18]:
# Для разностей гипотеза не отвергается, значит данные в первых разностях стационарны
# Результаты ADF и KPSS-тестов совпали
kpss(data.diff().dropna())


The test statistic is outside of the range of p-values available in the
look-up table. The actual p-value is greater than the p-value returned.




(0.07632651626781459,
 0.1,
 20,
 {'10%': 0.347, '5%': 0.463, '2.5%': 0.574, '1%': 0.739})

In [32]:

# Гипотеза о том, что временной ряд из второй колонки НЕ помогает в прогнозировании
# первой колонки не отвергается, что в целом согласуется со здравым смыслом.
newdata = np.random.normal(0, 1, (100, 2))
grangercausalitytests(newdata, maxlag = [10])


Granger Causality
number of lags (no zero) 10
ssr based F test:         F=0.6789  , p=0.7402  , df_denom=69, df_num=10
ssr based chi2 test:   chi2=8.8558  , p=0.5458  , df=10
likelihood ratio test: chi2=8.4467  , p=0.5853  , df=10
parameter F test:         F=0.6789  , p=0.7402  , df_denom=69, df_num=10


{10: ({'ssr_ftest': (0.6789461553087236, 0.7401633092077533, 69.0, 10),
   'ssr_chi2test': (8.855819417070308, 0.545839437522768, 10),
   'lrtest': (8.44674738686112, 0.5852852440647348, 10),
   'params_ftest': (0.6789461553087238, 0.7401633092077533, 69.0, 10.0)},
  [<statsmodels.regression.linear_model.RegressionResultsWrapper at 0x208dd4ffa08>,
   <statsmodels.regression.linear_model.RegressionResultsWrapper at 0x208dd360688>,
   array([[0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
           0., 0., 0., 0., 0.],
          [0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0.,
           0., 0., 0., 0., 0.],
          [0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0.,
           0., 0., 0., 0., 0.],
          [0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0.,
           0., 0., 0., 0., 0.],
          [0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0.,
           0., 0., 0., 0., 0.],
          [0., 0., 0., 0., 0., 