# Function test_stationarity

## Пример

Функция в удобоваримом виде выводит результаты выполнения теста Dickey-Fuller.

In [5]:
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
%matplotlib inline

from statsmodels.tsa.stattools import adfuller

In [2]:
series = pd.read_csv("Series/monthly-boston-armed-robberies-j.csv")['Count']
series

0       41
1       39
2       50
3       40
4       43
      ... 
113    316
114    398
115    394
116    431
117    431
Name: Count, Length: 118, dtype: int64

In [3]:
def test_stationarity(timeseries):
    print('Results of Dickey-Fuller Test:')
    dftest = adfuller(timeseries, autolag='AIC')
    dfoutput = pd.Series(dftest[0:4], index=['Test Statistic', 'p-value', '#Lags Used', 'Number of Observations Used'])
    for [key, value] in dftest[4].items():
        dfoutput['Critical Value (%s)' % key] = value
    print(dfoutput)

In [6]:
test_stationarity(series)

Results of Dickey-Fuller Test:
Test Statistic                   1.001102
p-value                          0.994278
#Lags Used                      11.000000
Number of Observations Used    106.000000
Critical Value (1%)             -3.493602
Critical Value (5%)             -2.889217
Critical Value (10%)            -2.581533
dtype: float64


## Разберем по полочкам:

### adfuller()

[statsmodels.tsa.stattools.adfuller](https://www.statsmodels.org/dev/generated/statsmodels.tsa.stattools.adfuller.html)

Эту функцию мы импротируем из модуля **statsmodels.tsa.stattools**

In [7]:
# import adfuller
from statsmodels.tsa.stattools import adfuller

Передав в качестве аргумента **series**, на выходе полуим кортеж:

In [9]:
adfuller(series)

(1.001102140245781,
 0.994277563805723,
 11,
 106,
 {'1%': -3.4936021509366793,
  '5%': -2.8892174239808703,
  '10%': -2.58153320754717},
 1051.4437803466026)

### test_stationarity()

В первой части функции мы взяти только первые четыре значения кортежа и вывели на экран:

In [23]:
def test_stationarity(timeseries):
    print('Results of Dickey-Fuller Test:') # заголовок
    dftest = adfuller(timeseries, autolag='AIC') # переменная dftest - это кортеж.
    # На основе dftest создаем элемент типа Series:
    dfoutput = pd.Series(dftest[0:4], index=['Test Statistic', 'p-value', '#Lags Used', 'Number of Observations Used'])
    print(dfoutput)

In [24]:
test_stationarity(series)

Results of Dickey-Fuller Test:
Test Statistic                   1.001102
p-value                          0.994278
#Lags Used                      11.000000
Number of Observations Used    106.000000
dtype: float64


Затем работаем со словарем, который является пятым элементом кортежа:

In [33]:
dftest = adfuller(series, autolag='AIC')
dftest[4].items()

dict_items([('1%', -3.4936021509366793), ('5%', -2.8892174239808703), ('10%', -2.58153320754717)])

Из словаря извлекаем ключи и значения:

In [29]:
dftest = adfuller(series, autolag='AIC')
for [key, value] in dftest[4].items():
    print(key, value)

1% -3.4936021509366793
5% -2.8892174239808703
10% -2.58153320754717


Элементу Series пошагово добавляем ключ = значение, полученные из словаря:

In [42]:
dftest = adfuller(series, autolag='AIC')
dfoutput = pd.Series() # Пустой элемент Series
for [key, value] in dftest[4].items():
    dfoutput['Critical Value (%s)' % key] = value
print(dfoutput)

Critical Value (1%)    -3.493602
Critical Value (5%)    -2.889217
Critical Value (10%)   -2.581533
dtype: float64


То же самое, только с помощью f-строки:

In [40]:
dftest = adfuller(series, autolag='AIC')
dfoutput = pd.Series()
for [key, value] in dftest[4].items():
    dfoutput[f'Critical Value ({key})'] = value
print(dfoutput)

Critical Value (1%)    -3.493602
Critical Value (5%)    -2.889217
Critical Value (10%)   -2.581533
dtype: float64
