# Оценивание моделей типа ARCH 

Одномерные ARCH модели появились в литературе с работой Engle (1982), и были вскоре обобщены в модель GARCH в работе Bollerslev (1986). Изначально их использовали для предсказания волатильности ряда инфляции, однако модели оказались релевантны и для предсказания волатильности финансовой доходности, наблюдаемой на месячных и более частых данных. Это позволяет изучать межвременное соотношение между риском и ожидаемой доходность.

Документация к пакету ARCH
http://arch.readthedocs.io/

In [1]:
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
sns.mpl.rcParams['figure.figsize'] = (15, 5)
%matplotlib inline

## Загрузка данных
Загружаем данные о цене акций напрямую с Yahoo Finance при помощи пакета `pandas_datareader`. 
Пример для акций Яндекса

In [3]:
import datetime as dt
import pandas as pd
import pandas_datareader.data as pdr
import fix_yahoo_finance 
fix_yahoo_finance.pdr_override() # Yahoo changed their API some days ago, it's a temporary fix 

# download dataframe
start = dt.datetime(2011,1,1)
end = dt.datetime(2018,1,1)
data = pdr.get_data_yahoo('YNDX', start=start, end=end)

[*********************100%***********************]  1 of 1 downloaded


In [3]:
# Выберите компанию для анализа, загрузите данные о ее цене
# Постройте график цены акции

## Стилизованные факты о ряде доходности


Пусть $P_t, t = 0, 1, ..., n$ — цена финансового актива в момент времени $t$. Тогда доходность актива определяется как

$$ y_t = \dfrac{P_t - P_{t-1}}{P_{t-1}} \approx \ln P_t - \ln P_{t-1} $$

Ряд $y_t$ отражает типичные «стилизованные факты», присущие финансовым данным:

- Volatility clustering — за большими изменениями доходности следуют большие изменения, за малыми — малые (видно из графиков $y_t, y_t^2$ и положительной автокорреляции $y_t^2$)
- Fat tails — экстремальные значения появляются чаще, чем при нормальном распределении (QQ-plot $y_t$ и гистограмма)
- Кроме того, в данных присутствует leverage effect (не отражено на графиках) — положительные и отрицательные изменения доходности по разному влияют на волатильность

    

In [4]:
# Посчитайте returns для выбранного актива и returns^2
# Посчитайте количество наблюдений, среднее значение, стандартное отклонение 
# и другие описательные статистики для ряда цен актива

In [5]:
# Постройте график доходности, доходности^2, автокорреляционные функции доходности и доходности^2
# Постройте гистограмму распределения доходности и сравните ее с нормальным распределением

То, что распределение доходности $y_t$ не соответствует нормальному распределению, подтверждается тестом Jarque-Bera 

In [6]:
# Проверьте это

## Структура модели GARCH

Мы определяем модель GARCH для $y_t$ (доходность финансового актива) следующим образом:

$$ y_t - \mu_t = \epsilon_t = \sigma_t z_t $$

где 
1. $z_t, t=0,1, ...$ — ненаблюдаемые i.i.d. случайные величины с $\mathbb{E}z_t = 0, \mathbb{V}ar (z_t) = 1$

2. $\mu_t, \sigma_t$ — условное математическое ожидание и дисперсия $y_t$


### GARCH(p,q)

Наиболее часто используемая спецификация GARCH предполагает, что наилучший прогноз дисперсии будущего периода — это взвешенное значение средней дисперсии в LR (константа $\omega$), дисперсии, предсказанной для текущего периода, с учетом $q$ лагов ($\sum_{i=1}^q \beta_i \sigma^2_{t-i}$) и новой информации, поступившей в предыдущие $p$ периодов (most recent squared residual or so-called innovation series — $\sum_{i=1}^p \alpha_i \epsilon^2_{t-i}$)

$$ \sigma^2_t = \omega + \sum_{i=1}^p \alpha_i \epsilon^2_{t-i} + \sum_{i=1}^q \beta_i \sigma^2_{t-i} $$


Спецификация GARCH(p,q) достаточно хорошо описывает volatility clustering и fat tails (при правильном подборе распределения ошибок), но не отражает leverage effect (разное влияние положительных и отрицательных изменений доходности). Поэтому было создано большое количество моделей, улавливающих эту асимметрию. Например, EGARCH, GJR-GARCH, TARCH, и т.д. 


### In financial applications:
The dependent variable is the return on an asset or portfolio and the variance of the return represents the risk level of those returns. 

Many banks and other financial institutions use the concept of “Value at Risk” as a way to measure the risks faced by their portfolios. The 1% Value at Risk is defined as the number of dollars that one can be 99 percent certain exceeds any losses for the next day. Statisticians call this a 1% quantile because 1% of the outcomes are worse and 99% are better. 


## Оценивание различных моделей ARCH 

http://arch.readthedocs.io/en/latest/univariate/univariate_volatility_modeling.html


## GARCH (with a constant mean)

The simplest way to specify a model is to use the model constructor arch.arch_model which can specify most common models. The simplest invocation of arch will return a model with a constant mean, GARCH(1,1) volatility process and normally distributed errors.
### 1. Fitting the model

In [7]:
from arch import arch_model

# Оцените модель GARCH(1,1) при помощи пакета arch
# Посмотрите на таблицу с результатами оценивания модели

- Usually the GARCH coefficient $\beta_1$ is found to be around 0.9 for many daily or weekly financial time series — so our model is capable of explaining volatility clustering.

- We can show, that the closer $\alpha_1 + \beta_1$ is to one, the longer is the influence of a volatility shock. (We know that the volatility "mean reverts" to its long run level)

- If a1 + b1 > 1, the GARCH model is non-stationary and the volatility will eventually explode to infinity 

In [8]:
# Посмотрите на коеффициенты в вашей модели, выполняются ли вышеописанные факты?

### 2. Model evaluation
After a GARCH model has been fit to the data, the adequacy of the fit can be evaluated using a number of graphical and statistical diagnostics. If the GARCH model is correctly specified, then the estimated standardized residuals should behave like classical regression residuals; i.e., they should not display serial correlation, conditional heteroskedasticity or any type of nonlinear dependence. In addition, the distribution of the standardized residuals  should match the specified error distribution used in the estimation.

In [9]:
# Постройте график белого шума

The model will be estimated using the first 7 years to estimate parameters and then forecasts will be produced for the final year.

In [10]:
# Оцените модель по первым нескольким годам в ваших данных

We can quickly visualize the standardized residuals and conditional volatility.

In [11]:
# Постройте график стандартизированных остатков и условной волатильности,
# сравните распределение остатков с белым шумом
# hint: нужные графики можно построить с помощью пакета arch

Any call to forecast() returns a ARCHModelForecast object with has 3 core attributes:

- mean - The forecast conditional mean.
- variance - The forecast conditional variance.
- residual_variance - The forecast conditional variance of residuals. This will differ from variance whenever the model has dynamics (e.g. an AR model) for horizons larger than 1.

In [12]:
# Постройте прогноз для тех данных, на которых вы не обучались

In [13]:
# Постройте графики спрогнозированного вами среднего и дисперсии

### 3. Model selection

An important practical problem is the determination of the ARCH order p and the GARCH order q for a particular series. Since GARCH models can be treated as ARMA models for squared residuals, traditional model selection criteria such as the Akaike information criterion (AIC) and the Bayesian information criterion (BIC) can be used for selecting models.

For daily returns, if attention is restricted to pure ARCH(p) models it is typically found that large values of p are selected by AIC and BIC. For GARCH(p,q) models, those with p,q ≤ 2 are typically selected by AIC and BIC. Low order GARCH(p,q) models are generally preferred to a high order ARCH(p) for reasons of parsimony and better numerical stability of estimation (high order GARCH(p, q) processes often have many local maxima and minima). For many applications, it is hard to beat the simple GARCH(1,1) model.

#### Remark — AIC, BIC
When fitting models, it is possible to increase the likelihood by adding parameters, but doing so may result in overfitting. Both BIC and AIC attempt to resolve this problem by introducing a penalty term for the number of parameters in the model; the penalty term is larger in BIC than in AIC.

Given a set of candidate models for the data, the preferred model is the one with the minimum AIC (BIC) value.

## Other model specifications

Models can also be systematically assembled from the three model components:

#### 1. Mean model 

http://arch.readthedocs.io/en/latest/univariate/mean.html#

All ARCH models start by specifying a mean model. Some examples:
- Zero mean

$$ y_t = \epsilon_t $$

- Constant mean

$$ y_t = \mu + \epsilon_t $$

- Autoregressive model with optional exogenous regressors 

$$ y_t = \mu + \sum_{i=1}^p \phi_i y_{t-i} + \gamma^T x_t + \varepsilon_t $$

- Exogenous regressors only

#### 2. Vol model — volatility  process

http://arch.readthedocs.io/en/latest/univariate/volatility.html

A volatility process is added to a mean model to capture time-varying volatility.

- Constant volatility process — model has the same variance in all periods
- GARCH and related model estimation:
    - ARCH(p)
    - GARCH(p,q)
    - GJR-GARCH(p,o,q)
    - AVARCH(p)
    - AVGARCH(p,q)
    - TARCH(p,o,q)
    - Models with arbitrary, pre-specified powers

where 
- p — Order of the symmetric innovation
- o – Order of the asymmetric innovation
- q – Order of the lagged (transformed) conditional variance

#### 3. Distribution of $z_t$
http://arch.readthedocs.io/en/latest/univariate/distribution.html

In [14]:
# Задайте модель с произвольным распределением среднего, остатков, количеством лагов
# Обучите ее, посмотрите на стандартные остатки, прогноз для среднего и волатильности

## Multivariate GARCH

When hopping from univariate volatility forecasts to multivariate volatility forecast, we need to understand that now we have to forecast not only the univariate volatility element, which we already know how to do, but also the covariance elements. 

The estimation will be implemented in R