##              Панельные данные

####    1. Панельные данные

Панельные данные (panel data) - данные о значениях переменных $у$ и $х$ для $N$ субъектов в $T$ последовательных моментов времени.

$$\{ у_{it}, х_{it}; i = 1, \dots, N, t = 1, \dots, T) \} $$


В общем случае $х$ является вектором конечной размерности $р$, и наиболее общей формой линейной модели наблюдений для
такой ситуации являлась бы спецификация 

$$y_{it} =x_{it}^u + \theta_{it} + u_{it} $$

где $\theta_{it}$ измеряет частное влияние $x_{it}$ в момент  $t$ для субъекта $i$.


####    2. Модель пула 

Модель пула ($ \theta_{it} = \theta $ ) :

$$ y_{it} = x_{it}^T \theta + u_{it} $$ 

в которой предполагается, что
$$u_{it} \sim i.i.d, \ E(x_{it}u_{js}) = 0 \ for  \  \forall  \ i,j = 1,\dots, N, \  t, s = 1, ..., T$$
так что $х$ является экзогенной переменной. 

В этом случае имеем дело с обычной линейной регрессией с $NT$ наблюдениями, удовлетворяющей предположениям классической нормальной линейной модели. 

##### Эффективные оценки параметров модели пула:  

Для получения эффективных оценок вектора коэффициентов в достаточно использовать обычный метод наименьших квадратов (OLS). При соответствующих предположениях о поведении значений объясняющих переменных, когда $N \to \infty$  или $Т \to \infty $,
эта оценка является также __состоятельной__ оценкой этого вектора.

#####  Предположение об ошибках с  разными дисперсиями  в разных уравнениях: 

Если предположить, что в модели $$y_{it} = x_{it}\theta + u_{it}$$  ошибки $u_{it}$  статистически независимыми между
собой, но имеют разные дисперсии для различных субъектов: 
$$Var(u_{it}) = \sigma^2_{ui}$$
В этом случае OLS-оценки коэффициентов остаются несмещенными, но возникает смещение при оценивании дисперсий этих оценок, что отражается
на оцененных значениях стандартных ошибок оценок, используемых при
построении доверительных интервалов для коэффициентов и при проверке
гипотез о значениях коэффициентов. 

Здесь применяется WLS, причем  веса, приписываемые различным наблюдениям, не изменяются в пределах наблюдений одного
субъекта.

##### Предположение о корреляции между ошибками в разных уравнениях в один и тот же момент времени

Сross-sectional correlation: матрица ковариаций  $\Sigma = ( \sigma_ij) $ не является диагональной 

\begin{equation*}Cov(u_{it},u_{js}) = 
 \begin{cases}
   0 &\text{для $t \neq s$}\\
   \sigma_{ij} &\text{для $t = s$}
 \end{cases}
\end{equation*}


В этом случае приходится использовать GLS, учитывающий это.  


> Заметим, что помимо 3 коэффициентов, приходится оценивать еще 10 дисперсий случайных ошибок в уравнениях для 10 предприятий, а также 45 ковариаций. Если не накладывать никаких дополнительных ограничений
на структуру матрицы ковариаций $Sigma$, то оценивание каждой ковариации (или дисперсии) производится на основе всего 20 наблюдений и потому может быть весьма неточным.


##### Предположение о корреляции между ошибками в пределах одного уравнения

Предположим, что последовательность ошибок при наблюдении $i$-го  субъекта - AR(1) с нулевым средним. 

$$y_{it} = х^Т_{it} \theta + u_{it} $$ 

в которой $ u_{it} = \rho_i u_{i,t-1} + \epsilon_{it}, |\rho_i|<1, \epsilon_{it} \sim N(0, \sigma^2_{\epsilon i}) $


> Оценка $\rho_i$ через DW: 

Можно оценить с помощью МНК модель $y_{it} = x_{it}^T \theta + u_{it} $  без учета автокоррелированности ошибок, получить $ \hat{u}_{i1}, \dots, \hat{u}_{iT} $ и по значению статистики Дарбина — Уотсона получить приближенную оценку $\hat{\rho}_i$:

$$ d_i = \dfrac{\sum_{t=2}^{T} (\hat{u}_{it} - \hat{u}_{i,t-1} )^2}{\sum_{t=1}^{T} \hat{u}_{it}^2} \approx 2(1-\rho_i) \Rightarrow $$

$$\hat{\rho}_i  =  1 - d_i/2 $$

> Оценка $\rho_i$ через OLS:

Можно  получить МНК-оценки регрессии:

$$ \hat{u}_{it} = \rho_i \hat{u}_{i,t-1} + \eta_{it} $$



$$\hat{\rho}_i  =  \dfrac{\sum_{t=2}^{T} \hat{u}_{it}\hat{u}_{i,t-1} }{\sum_{t=1}^{T} \hat{u}_{it}^2} $$


После вычисления оценок $\hat{\rho}_i$ в уравнениях для каждого
субъекта производится известное преобразование Прайса — Уинстена переменных для получения модели с независимыми ошибками. 
Если предполагается, что уравнения имеют общий AR-параметр, т.е.
$\rho_1 = ... = \rho_N = \rho $,  то общее значение $\rho$ оценивается как среднее и в преобразовании Прайса — Уинстена используется
только эта оценка:

$$\hat{\rho} = \frac{\rho_1 + ... + \rho_N }{N}$$

Объединив преобразованные уравнения в систему, можем оценить
коэффициенты с помощью  OLS.




####    3. Модель ковариационного анализа (covariance analysis model):

$$ М_0 :y_{it}  = \alpha_i + \beta_i x_{it}+ u_{it}$$ 

Если предполагать, что $u_{it} \sim N(0, \sigma^2_u), \  E(x_{it}u_{js}) = 0 \ для \ \forall  i , j = 1, ..., N, \ t, s = 1, ..., T $ 
так что х является экзогенной переменной, то мы имеем дело с $N$ не связанными между собой (unrelated) линейными регрессиями, удовлетворяющими предположениям классической нормальной линейной регрессии. 


Для получения оценок параметров $\alpha_i$  и $\beta_i$ эти регрессии можно оценивать по отдельности:

$$\hat{\beta}_i = \frac{\sum(x_{it} - \bar{x}_i)(y_{it} - \bar{y}_i)}{\sum (x_{it} - \bar{x}_i)^2 }$$

$$\hat{\alpha}_i =  \bar{y}_i - \hat{\beta}_i  \bar{x}_i $$


Эти оценки при фиксированных значениях $у_it$ и $x_it$ имеют нормальное распределение и являются BLUE.

Если ошибки $u_it$  независимыми между
собой, но имеют разные дисперсии для различных субъектов $u_{it} \sim N(0, \sigma^2_{ui}) $, то следует использовать WLS, приписывая каждому наблюдению для $i$-го субъекта вес $w_i = \frac{1}{\sigma_{ui}^2} $.

Поскольку дисперсии в реальных исследованиях не известны, приходится использовать FWLS версию, в которой вместо весов берутся оценки $w_t = \frac{1}{\hat{\sigma}_{ui}^2} $, где $\hat{\sigma}_{ui}^2 = \frac {RSS^{(i)}}{N-p}$ -  несмещенная оценка дисперсий, полученная при оценивании регрессии для $i$-го субъекта, $р$ — количество объясняющих переменных в уравнениях регрессии (с учетом константы).



####    4. Модель кажущихся несвязанными регрессий (SUR) 

$$ М_0 :y_{it}  = \alpha_i + \beta_i x_{it}+ u_{it}$$ 

Если предполагать коррелированность ошибок для разных субъектов в совпадающие моменты времени. 


##### Оценивание SUR

При наличии  коррелированности ошибок следует использовать GLS. Если представить уравнение для $i$-го субъекта в векторно-матричной
форме:

$$ y^{(i)} = X^{(i)} \theta^{(i)} + u^{(i)} $$ 

то модель SUR можно записать в виде:

$$ y  = X  \theta  + u  $$ 


где  

$ y^{(i)} - T*1, \ X^{(i)}  - T*2,  \  \theta^{(i)} - 2*1,  \  u^{(i)} - T*1, $ 
$ y - N*1, \  X - N*N,  \   \theta - N*1,  \ u - N*1   $ 



При сделанных предположениях ковариационная  $(N*N) $ - матрица $\Omega = Cov(u) $, где диагональная $(Т* T)$- матрица $\Sigma_{ij}$ имеет на диагонали $\sigma_{ij} = Cov (u_{it}, u_{jt})$ 



GLS-оценка вектора  $\theta$ находится по формуле:
$$\hat{\theta}_{SUR}=\hat{\theta}_{GLS}=(X^T\Omega^{-1}X)^{-1} X^T \Omega^{-1} y $$


> Учет коррелированности ошибок в различных уравнениях позволяет ожидать определенного выигрыша в точности оценивания каждого из $\theta^{(i)} $ за счет информации, идущей от других уравнений через указанную коррелированность. 

Если  $\sigma_{ij} = \sigma^2 \rho $,  то предпочтительность SUR-оценки   возрастает с ростом $\rho$, когда $Т$ велико. В то же время если $\rho = 0$, то SUR-оценка  и OLS-оценка совпадают. 

Непосредственная реализация SUR-оценки на практике невозможна из-за неизвестных ковариаций, поэтому используется FGLS-оценки $\hat{\theta}_{FGLS}$, при вычислении которой неизвестные корреляции заменяются их состоятельными оценками: 

$$ \hat{\sigma}_{ij} = \frac{(e^{(i)})^Te^{(j)}}{T} $$

где $ e^{(i)} = y^{(i)} - X^{(i)} \hat{\theta}^{(i)} $ — вектор остатков, получаемый при OLS-оценке уравнения для $i$-го субъекта.

> При $j = i$ это  $\frac{RSS^{(i)}}{T}$ - дисперсии ошибки в $i$-м уравнении,  имеющее смещение, а несмещенной оценкой для дисперсии является $\frac{RSS^{(i)}}{T-p}$ , где $p$ — количество объясняющих переменных в уравнении регрессии.

При соответствующих условиях, налагающихся на матрицу X и в классической модели линейной регрессии, обе оценки  $\hat{\theta}_{GLS},  \hat{\theta}_{FGLS} $ 
состоятельны.

##### Проверка гипотезы  статистической независимости ошибок в разных уравнениях

$$ Н_0: \sigma_{ij} = 0, i \neq j $$

Для проверки этой гипотезы можно использовать критерий Бройша — Пагана: 

$$ \lambda = T \sum_{i=2}^{N} \sum_{j=1}^{i-1} r_{ij}^2 $$ 

где $r_{ij} = \frac{\hat{\sigma_{ij}}}{\sqrt{\hat{\sigma_{ii}}\hat{\sigma_{jj}}}}$  - оцененная корреляция между ошибками в $i$-м и $j$-м уравнениях.


При верной $Н_0$: $$ \lambda \sim \chi_{N(N - 1)/2} $$ 
(гипотеза накладывает именно столько ограничений, поскольку $\sigma_{ij} = \sigma_{ji} $)

Если случайные ошибки в разных уравнениях статистически независимы,
можно получить эффективные оценки коэффициентов, применяя OLS-оценивание 



> $$ Н_0: \beta_{1} = \beta_{2} = \beta_{3} $$
В рамках модели SUR для проверки этой гипотезы используются две формы
критерия Вальда: одна основана на $F$-статистике, а другая — на статистике $qF \sim \chi_q$, $q$ — количество линейных ограничений.


#####  Проверка гипотезы о совпадении коэффициентов при некоторой переменной во всех уравнениях

Модель без ограничений:
 
$$ М_0 :y_{it}  = \alpha_i + \beta_i x_{it}+ u_{it}$$ 


RSS в $ М_0$:

$$  S_0 = \sum \sum (y_{it} - \hat{\alpha_{i}} -  \hat{\beta_{i}} x_{ij} )^2 $$



__ Гипотеза $H_1$: $\beta_i$   одинаковы для всех $i$ __


$$ М_1 :y_{it}  = \alpha_i + \beta x_{it}+ u_{it}$$ 

RSS в $ М_1$:

$$  S_0 = \sum \sum (y_{it} - \hat{\alpha_{i}} -  \hat{\beta} x_{ij} )^2 $$



Модель $ М_1$  можно записать в виде:


$$ y_{it}  = \sum \alpha_i d_{ij} + \beta x_{it}+ u_{it}$$ 


где $d_{ij} = 1$, если $j = i$, то есть в правой части имеем $N$ дамми-переменных. 

$$y = X\theta +u$$


где $X$ - матрица размера $(NT * (N+1))$, столбцами
которой являются векторы $d_1, \dots, d_N, х$, $\theta = (a_1, \dots, a_N, \beta)^T$ 


Соответственно OLS-оценка $\theta$:

$\hat{\theta} = (X^TX)^{-1} X^T y $

Пусть $u_{it} \sim N(0, \sigma^2_u), E(x_{it}, u_{js}) = 0$, то есть  $х$ является экзогенной переменной.


Тогда при фиксированной матрице  $X$ оценка $\hat{\theta} \sim  N_{(N + 1)} ( \theta, \sigma^2_u(X^TX)^{-1} )$ 




«Внутригрупповая» оценка (within-estimator):


$$\hat{\beta} = \frac{\sum(x_{it} - \bar{x}_i)(y_{it} - \bar{y}_i)}{\sum (x_{it} - \bar{x}_i)^2 }$$

строится только на основании отклонений значений
переменных от их средних по времени и тем самым учитывает только изменчивость в пределах каждого субъекта, не обращая внимания на изменчивость между субъектами. 


$$ \hat{\alpha}_i = \bar{y}_i -  \hat{\beta} \bar{x}_i $$


Следует учитывать, что стандартные ошибки оценок $\alpha_i$, получаемые в результате двухшаговой процедуры, нельзя вычислять по формулам для стандартных ошибок OLS-оценок.


Проверка гипотезы $Н_1$: 


$$ F_1 = \dfrac{\frac{S_1-S_0}{N-1}}{\frac{S_0}{NT - 2N}} \sim F_{(N-1, NT-2N)} $$







__ Гипотеза $H_2$: $\alpha_i$  и $\beta_i$  одинаковы для всех $i$ __


Модель пула:


$$ М2 : y_{it} = a + \beta x_{it}+u_{it} $$

OLS-оценки: 


$$\hat{\beta} = \frac{\sum(x_{it} - \bar{x})(y_{it} - \bar{y})}{\sum (x_{it} - \bar{x})^2 }$$


$$ \hat{\alpha} = \bar{y} -  \hat{\beta} \bar{x} $$


RSS в модели $М_2$:



$$  S_2 = \sum \sum (y_{it} - \hat{\alpha} -  \hat{\beta} x_{ij} )^2 $$

Проверка гипотезы $Н_2$: 


$$ F_2 = \dfrac{\frac{S_2-S_0}{2(N-1)}}{\frac{S_0}{NT - 2N}} \sim F_{(2(N-1), NT-2N)} $$

Если значение $F_2$ статистически незначимо, следует объединить данные
в пул. Если же значение $F_2$ статистически значимо, следует искать источник  гетерогенности параметров.



__ Гипотеза $H_3$:  условный критерий геторогенности $\alpha_i$    в рамках модели $М_1$ __


$$H_3: \alpha_1 = \dots =  \alpha_N $$,

при условии $ \beta_1 = \dots =  \beta_N $

Модель:


$$ М_1 :y_{it}  = \alpha_i + \beta x_{it}+ u_{it}$$ 




$$ F_3 = \dfrac{\frac{S_2-S_1}{N-1}}{\frac{S_1}{NT - N -1}} \sim F_{(N-1, NT-N-1)} $$



####    5. Модель с фиксированными эффектами (FE, LSDV, CV)

Обратимся теперь к методам анализа панельных данных, предназначенным
в основном для анализа данных, в которых
количество субъектов исследования $N$ велико, а количество наблюдений $Т$ над каждым субъектом мало. 


Модели со скалярной объясняющей переменной $х$

$$ y_{it} = \alpha_i + \beta x_{it} + u_{it} $$

равносильна

$$ y_{it}  = \sum \alpha_i d_{ij} + \beta x_{it}+ u_{it}$$ 

где $d_{ij} = 1$, если $j = i$

Здесь $\alpha_i$ -  неизвестные __фиксированные  эффекты__. 



$u_{it} \sim N(0, \sigma^2_u), \  E(x_{it}u_{js}) = 0 \ для \ \forall  i , j = 1, ..., N, \ t, s = 1, ..., T $ 

так что х является экзогенной переменной.




Модели с фиксированными эффектами наиболее подходят для случаев, когда субъектами исследования выступают страны, крупные компании или предприятия. Эти эффекты по существу, отражают наличие у субъектов индивидуальных характеристик, не изменяющихся со временем в процессе наблюдений, которые трудно или даже невозможно наблюдать или измерить.
Если значения таких характеристик не наблюдаются,
то эти характеристики невозможно непосредственно включить в правые
части уравнений регрессии в качестве объясняющих переменных, тогда
чтобы исключить смещение оценок из-за «пропущенных переменных», в правые части уравнений вместо значений ненаблюдаемых индивидуальных характеристик как раз и вводятся ненаблюдаемые эффекты $\alpha_i$. 


##### FE-оценка (within-estimator)

Оценки для __фиксированных эффектов__ вычисляются по формуле:

$$\hat{\alpha}_i = \bar{y}_i - \hat{\beta} \bar{x}_i $$

OLS-оценка имеет вид:


$$\hat{\beta}_{CV} = \frac{\sum(x_{it} - \bar{x}_i)(y_{it} - \bar{y}_i)}{\sum (x_{it} - \bar{x}_i)^2 }$$


$$Var(\hat{\beta}_{CV}) = \frac{ \sigma^2_u }{\sum (x_{it} - \bar{x}_i)^2 }$$


Оценка имеет одно и то же значение как в рамках статистической
модели с дамми-переменными

$$ y_{it}  = \sum \alpha_i d_{ij} + \beta x_{it}+ u_{it}$$ 

и в рамках модели отклонения от групповых средних 

$$y_{it} - \bar{y}_i = \beta (x_{it} - \bar{x}_i )  + (u_{it} - \bar{u}_i) $$  


##### Свойства получаемых оценок

При сделанных предположениях $\hat{\beta}_{CV}$ является BLUE. 

- $\hat{\beta}_{CV}$ является состоятельной оценкой и когда $N\to \infty $, и  когда$T\to \infty $ (если нас интересует только состоятельность $\hat{\beta}_{CV}$, но
не ее эффективность, то для этого не требуется строгая экзогенность $ x$;  в этом случае достаточно экзогенности в рамках каждого отдельного субъекта исследования)


- $\hat{\alpha}_{i}$  состоятельна только тогда, когда   $T\to \infty $, т.к. оценивание каждого $\alpha_{i}$ производится фактически лишь по $Т$ наблюдениям, так что при фиксированном $Т$ с ростом $N$ происходит лишь увеличение количества параметров  $\alpha_{i}$, что не приводит к повышению точности оценивания каждого конкретного $\alpha_{i}$




####    6. Модель со случайными эффектами (variance components model)

Модель

$$ y_{it} = \alpha_i + \beta x_{it} + u_{it} $$

равносильна

$$ y_{it}  = \mu + \alpha_i + \beta x_{it}+ u_{it}$$ 

где  $\sum \alpha_i = 0 $, $ \alpha_i $ - __дифференциальные эффекты__. 

В ряде ситуаций субъекты могут  рассматриваться  как случайная выборка из некоторой более широкой ГС, и исследователя интересуют обезличенные субъекты, имеющие заданные характеристики. В таких ситуациях предполагается, что $\alpha_i$ -   случайные  величины или случайные эффекты, которые не интерпретируются и не подлежат оцениванию. Вместо этого оцениваются параметры
распределения случайных величин $\alpha_i$:

$$ y_{it}  = \mu +  \beta x_{it}+ (\alpha_i +  u_{it}) = \mu +  \beta x_{it}+ v_{it}) $$ 

где ошибка $v_{it} = \alpha_i +  u_{it} $  состоит из двух компонент.  

Cлучайные эффекты $\alpha_i$ отражают наличие у субъектов исследования индивидуальных характеристик, не изменяющихся со временем в процессе наблюдений, которые невозможно измерить. Однако теперь  их
значения встраиваются в состав случайной ошибки.


Предположим: 

$u_{it} \sim N(0, \sigma^2_u), \  E(x_{it}u_{js}) = 0 \ для \ \forall  i , j = 1, ..., N, \ t, s = 1, ..., T $ 

а также:

$E(\alpha_i) = 0 $

\begin{equation*}E(\alpha_{i}\alpha_{j}) = 
 \begin{cases}
   0 &\text{для $i \neq j$}\\
   \sigma_{ij}^2 &\text{для $i = j$}
 \end{cases}
\end{equation*}

$E(x_{it}\alpha_{j}) = 0 $, так в RE-модели $x$ экзогенна 


Если $E(u_{it}\alpha_{i}) = 0 $,  то  условная относительно $x_it$ дисперсия случайной величины $у_{it}$ складывается из двух некоррелированных
компонент (variance components):

$$Var(у_{it}|x_it) = \sigma^2_\alpha + \sigma^2_u $$

В векторной форме эта модель имеет вид:


$$y_i = [ex_i] \delta + v_i $$


Заметим, что случайные величины $v_{it} v_{is}$  коррелированы, даже если не коррелированы ошибки $u_{it}$:

$$V= E(v_i v_i^T ) = \sigma^2_u I_T + \sigma^2_\alpha e e^T $$ 

При этом выполняется предположение равной коррелированности в модели компонент дисперсии.



##### Оценка RE-модели  

В RE - модели оценка OLS-оценка остается несмещенной и состоятельной оценкой для $\beta$, но перестает быть эффективной, поскольку не учитывает коррелированность $v_{it}$ во времени для субъекта $i$.


$$\hat{\beta}_{CV} = \frac{\sum(x_{it} - \bar{x}_i)(y_{it} - \bar{y}_i)}{\sum (x_{it} - \bar{x}_i)^2 }$$



GLS-оценка, учитывающая эту коррелированность, будет более эффективной:

$$\hat{\beta}_{GLS} = \frac{\sum(x_{it}^* - \bar{x}_i^*)(y_{it}^* - \bar{y}_i^*)}{\sum (x_{it}^* - \bar{x}_i^*)^2 } = w \hat{\beta}_{b} + (1-w) \hat{\beta}_{CV}$$ 

где $\hat{\beta}_{b} = \frac{\sum(\bar{x}_i - \bar{x})(\bar{y}_i - \bar{y})}{\sum (\bar{x}_i - \bar{x})^2 }$


$\hat{\beta}_{b}$ — «межгрупповая» оценка (between estimator), соответствующая регрессии средних значений $\bar{y}_i$
на константу и средние значения $\bar{x}_i$ («модель для групповых средних», игнорирующая внутригрупповую изменчивость): 

$$\bar{y}_i = \mu + \beta \bar{x}_i + \bar{v}_i $$


Таким образом, $\hat{\beta}_{GLS} $ RE-модели  учитывает и внутригрупповую, и межгрупповую изменчивость. Она
является взвешенным средним between-оценки (учитывающей
только межгрупповую изменчивость) и «внутригрупповой» оценки (учитывающей только внутригрупповую изменчивость). 



##### Cвойства  оценок


При сделанных предположениях обе оценки —  $\hat{\beta}_{b}, \hat{\beta}_{CV}$  — состоятельны, следовательно, состоятельна
и сама  $ w \hat{\beta}_{GLS} $ 

- Если $ Т \to \infty $, то $  w \to 0 \infty $  и $ \hat{\beta}_{GLS} \to \infty  \hat{\beta}_{CV}$,  так что при больших $Т$ оценки, получаемые в рамках моделей фиксированных и случайных эффектов, эквивалентны.

- Если $  \sigma^2_\alpha \to 0 $,  GLS-оценка переходит в OLS-оценку, т.е. в пределе нет никаких эффектов.


GLS -оценка эффективнее, чем $\hat{\beta}_{CV}$, так как она использует информацию как о внутригрупповой изменчивости, так и о межгрупповой изменчивости.



Чтобы получить FGLS-оценку, надо подставить подходящие оценки дисперсий. 


GLS-оценка является линейной комбинацией «within»-оценки и «between»-
оценки. Эта линейная комбинация оптимальна. Поэтому, например, оценка
также являющаяся линейной комбинацией этих двух оценок состоятельна, но менее эффективна.


####    7.  Выбор между FE  и RE 


- FE: получаемые выводы — условные по отношению к значениям эффектов $\alpha_i$, в выборке. Это соответствует ситуациям, когда эти значения нельзя рассматривать как случайную выборку из некоторой более широкой совокупности (популяции). 
- RE : получаемые выводы — безусловные относительно совокупности всех эффектов $\alpha_i$. Исследователя не интересуют конкретные субъекты в выборке — для него это обезличенные субъекты, выбранные случайным образом из более широкой совокупности.



##### Критерий Бройша — Пагана для индивидуальных эффектов

Проверки в рамках RE-модели гипотезы сведения к модели пула:

$$ H_0: \sigma_\alpha^2 = 0 $$ 

Статистика критерия Бройша — Пагана:

$$ BP = \frac{NT}{2(T-1)}  \left( \dfrac{\sum (\sum \hat{u}_{it})^2}{\sum \sum \hat{u}_{it}^2}  - 1 \right)^2 \sim \chi^2_1$$


##### Критерии спецификации

Речь здесь идет о том, совпадает или нет условное распределение $\alpha_i$ при заданном $х_i$  с безусловным распределением $\alpha_i$. Если не совпадает — наилучшей оценкой является $\hat{\beta}_{CV}$, если совпадает — наилучшей оценкой является $\hat{\beta}_{GLS}$

Критерий 1. Используя формулировку Мундлака, проверяем гипотезу
$$Н_0: a = 0$$  против $Н_1: а \neq 0$.

Критерий 2. Критерий Хаусмана:
$$Н_0: E(\alpha_i|x_{it}) = 0$$ против $Н_1: E(\alpha_i|x_{it}) \neq 0$  
Идея критерия 2 основывается на следующих фактах:
- при гипотезе $H_0$ и $\hat{\beta}_{GLS}$, соответствующая RE-модели, и $\hat{\beta}_{CV}$, соответствующая FE-модели, состоятельны;
- при гипотезе $Н_1$  $\hat{\beta}_{GLS}$ несостоятельна, а $\hat{\beta}_{CV}$ состоятельна.

Соответственно если гипотеза  $H_0$  верна, то между оценками не должно наблюдаться систематического расхождения, и эта гипотеза должна отвергаться при слишком больших (в сравнении со стандартной ошибкой этой
разности) по абсолютной величине значениях разности этих оценок.

Статистика критерия Хаусмана:

$$ m = \frac{\hat{q}^2}{\hat{Var}(\hat{q})} \sim \chi^2_1$$

$\hat{q} = \hat{\beta}_{CV} - \hat{\beta}_{GLS}$

Если выполнены предположения модели со случайными эффектами, то
все четыре оценки состоятельны (если, конечно, объясняющие переменные
не коррелированы с ошибкой), и при этом RЕ-оценка имеет наибольшую эффективность. Если, однако, индивидуальные эффекты $\alpha_i$ коррелированы хотя бы с одной из объясняющих переменных, то состоятельной остается только FE-оценка. Поэтому встает вопрос о проверке гипотезы о том, что модель
является RE- моделью. Для этого можно сравнивать FE и RE оценки, используя критерий Хаусмана.

####    8. Автокоррелированные ошибки

Вполне возможно, что для $i$-го субъекта последовательные ошибки $u_1, ..., u_T$  не являются независимыми, а следуют, например, стационарному AR(1) процессу с нулевым средним.

Модель:


$$ y_{it}  = \mu + \alpha_i + \beta x_{it}+ u_{it}$$ 


$$ u_{it} = \rho u_{i,t-1} + \epsilon_{it}$$ 

где  $|\rho|<1, \epsilon_{it} \sim N(0, \sigma^2_\epsilon) $


Общий для всех субъектов коэффициент $\rho$ можно оценить различными
способами. При этом в большинстве случаев сначала переходят к модели,
скорректированной на групповые средние, потом оценивают через статистику Дарбина — Уотсона:





$$ d = \dfrac{\sum\sum (\hat{\tilde{u}}_{it} - \hat{\tilde{u}}_{i,t-1} )^2}{\sum \sum  \hat{\tilde{u}}_{it}^2}  \approx 2(1-\rho) \Rightarrow $$

$$\hat{\rho}_{DW}  =  1 - d/2 $$




или через  МНК-оценку регрессии:

$$ \hat{\tilde{u}}_{it} = \rho \hat{\tilde{u}}_{i,t-1} + \eta_{it} $$



$$\hat{\rho}_{tscorr}  =  \dfrac{\sum \sum \hat{\tilde{u}}_{it}\hat{\tilde{u}}_{i,t-1} }{\sum \sum \hat{\tilde{u}}_{it}^2} $$


После получения оценки для $\rho$ производится преобразование переменных для получения модели с независимыми ошибками. Наконец, в рамках преобразованной модели производится обычный анализ на фиксированные или случайные эффекты.


####    9. Коэффициенты детерминации

Проблема с определением коэффициента детерминации в случае панельных данных связана с неопределенностью в отношении того, что считать
полной суммой квадратов, подлежащей разложению на объясненную регрессией и остаточную суммы квадратов. 

В качестве полной суммы квадратов может использоваться каждая из трех
сумм квадратов ошибок регрессий, объясняющих:
- отклонения наблюдаемых значений $y_{it}$ от их среднего по всем $NT$ наблюдениям;
- отклонения наблюдаемых значений $у_{it}$ в группах от их средних по группе;
- отклонения средних по группам от среднего по всем $NT$ наблюдениям.

##### $R^2$ -  полный

Если используем оценку пул, то она получается в результате применения
метода наименьших квадратов к уравнению

$$ y_{it}  =  \alpha  + \beta x_{it}+ u_{it}$$

При этом коэффициент детерминации равен квадрату  коэффициента корреляции между переменными $y_{it}$  и $\hat{y}_{it} = \hat{\alpha} + \hat{\beta}_{OLS} x_{it} $.

$$ R^2_{overall} = corr^2(y_{it}, \hat{\beta}_{OLS} x_{it}^T) $$



##### $R^2$ -  между


Если используем between-оценку, то она получается в результате применения OLS к уравнению

$$ \bar{y}_{i}  =  \mu  + \beta \bar{x}_{i}+ \bar{u}_{i}$$


При этом коэффициент детерминации равен квадрату  коэффициента корреляции между переменными $\bar{y}_{i}$  и $\hat{\bar{y}}_{i} = \hat{\mu} + \hat{\beta}_{b} \bar{x}_{i} $.

$$ R^2_{between} = corr^2(\bar{y}_{i}, \hat{\beta}_{between} \bar{x}_{i}^T) $$



##### $R^2$ -  внутри


Если используем within-оценку, то она получается в результате применения OLS к уравнению

$$ {y}_{it} - \bar{y}_{i}  =   \beta (x_{it} -   \bar{x}_{i}) + ({u}_{it} - \bar{u}_{i})$$


В правой части последнего уравнению отсутствует константа. При OLS-
оценивании уравнений  такого вида коэффициент детерминации в общем
случае не равен квадрату выборочного коэффициента корреляции между
переменными интереса. Однако в нашем случае  переменные центрированы,  $ {y}_{it} - \bar{y}_{i}$ и $ {x}_{it} - \bar{x}_{i}$, поэтому коэффициент детерминации, получаемый при оценивании уравнения в отклонениях от средних по группам равен квадрату коэффициента корреляции между переменными $\tilde{y}_{it} = {y}_{it} - \bar{y}_{i}$, и $ \hat{\tilde{y}}_{it} = \hat{\beta}_{CV} (x_{it} -   \bar{x}_{i})$



При этом коэффициент детерминации равен квадрату  коэффициента корреляции между переменными $\bar{y}_{i}$  и $\hat{\bar{y}}_{i} = \hat{\mu} + \hat{\beta}_{b} \bar{x}_{i} $.

$$ R^2_{within} = corr^2(y_{it} - \bar{y}_{i},  \hat{\beta}_{within} (x_{it} -   \bar{x}_{i})^T) $$


####    10. Двунаправленные модели с фиксированными эффектами

Рассмотрим модель, в которую помимо индивидуальных эффектов $\alpha_i$, включаются также временные эффекты $\lambda_t$:

$$ y_{it}  = \mu + \alpha_i + \lambda_t + \beta x_{it}+ u_{it}$$ 
 
где $\sum \alpha_i = 0, \sum \lambda_t = 0$, так что  $\alpha_i, \lambda_t$  — дифференциальные эффекты, которые интерпретируются,  как неизвестные постоянные.


$$ (y_{it} - \bar{y}_i - \bar{y}_t +  \bar{y} )   = (x_{it} - \bar{x}_i - \bar{x}_t +  \bar{x} )\beta + (u_{it} - \bar{u}_i - \bar{u}_t +  \bar{u} ) $$ 




OLS - оценка  $\beta$ в этом уравнении - двунаправленная внутригрупповая оценка:


$$\hat{\beta}_{CV} = \frac{\sum \sum(x_{it} - \bar{x}_i - \bar{x}_t +  \bar{x} )(y_{it} - \bar{y}_i - \bar{y}_t +  \bar{y} )}{\sum \sum (x_{it} - \bar{x}_i - \bar{x}_t +  \bar{x} )^2 }  = \frac{W_{xy}}{W_{xx}}$$


$\hat{\alpha}_i=(\bar{y}_i-\bar{y})-\hat{\beta}_{CV} (\bar{x}_i-\bar{x})$



$\hat{\lambda}_t=(\bar{y}_t-\bar{y})-\hat{\beta}_{CV} (\bar{x}_t-\bar{x})$


####    11. Двунаправленные модели со случайными эффектами

Пусть теперь в двунаправленной модели предполагается, что $\alpha_i,  \lambda_t$ — случайные величины 



$$ y_{it}  = \mu + \alpha_i + \lambda_t + \beta x_{it}+ u_{it}$$ 


$E(\alpha_i)= E(\lambda_t) = E(u_{it} ) = 0 $

$E(\alpha_i \alpha_j)= E(\lambda_t \lambda_s) = E(u_{it} u_{js} ) = 0, i \neq j $ 

$E(\alpha_i \lambda_t)= E(\lambda_t u_{it}) = E(u_{it} \alpha_i ) = 0 $ 

$$v_{it } = \alpha_i + \lambda_t + u_{it}$$

$Var(v_{it }) = Var(y_{it}|x_{it}) = \sigma^2_\alpha + \sigma^2_\lambda + \sigma^2_u$

«Межсубъектная» оценка определяется следующим образом:

 $\hat{\beta}_{bi} = \frac{\sum(\bar{x}_i - \bar{x})(\bar{y}_i - \bar{y})}{\sum (\bar{x}_i - \bar{x})^2 } = \frac{B_{xy}}{B_{xx}} $



«Межвременная» оценка равна:


 $\hat{\beta}_{bt} = \frac{\sum(\bar{x}_t - \bar{x})(\bar{y}_t - \bar{y})}{\sum (\bar{x}_t - \bar{x})^2 } =  \frac{C_{xy}}{C_{xx}}$


GLS-оцент равна:

 $\hat{\beta}_{GLS} = \omega_1 \hat{\beta}_{CV} + \omega_2 \hat{\beta}_{bi} + \omega_3 \hat{\beta}_{bt} $ 
 
Иначе говоря, GLS-оценка является взвешенным средним  within
и двух between-оценок с весами, отражающими источники изменчивости.


- Если $\sigma^2_\alpha = \sigma^2_\lambda = 0  $, то  $\hat{\beta}_{GLS} = \hat{\beta}_{OLS} $ (как для пула)
- При $Т \to \infty, N \to \infty $  имеем  $\hat{\beta}_{GLS} = \hat{\beta}_{CV} $ (как для модели с фиксированными эффектами)



####    12. Несбалансированные панели

Cбалансированная панель -  в каждый из $Т$ моментов времени имеются данные обо всех $N$ субъектах, участвующих в анализе. 

Несбалансированная панель - модель, в которой количество наблюдений для разных субъектов может быть различным. 




$$ y_{it}  = \mu + \alpha_i +  \beta x_{it}+ u_{it}$$ 


Основными результатами для несбалансированных панелей:

- OLS-оценка не меняется,  является BLUE , если $\sigma^2_\alpha = 0$ 
- Within-оценка (CV) в целом та же, но средние вычисляются по периодам времени разной длины для разных субъектов
- Between-оценка также в целом та же, но средние вычисляются по $T_i$ наблюдениям для субъекта $i$
- Преобразование переменных для получения GLS-оценки изменяется от субъекта к субъекту.


####    13. Эндогенные объясняющие переменные

Рассмотрим модель с несколькими объясняющими переменными, часть из которых является эндогенными:



$$ y_{2it}  = y_{1it} \gamma   + x_{it} \beta  + \alpha_i + u_{it}$$ 


где $  y_{1it}$ - строка  $g_1$  эндогенных переменных,   $ x_{it}$ - строка $k_1$ экзогенных переменных,   $\gamma, \beta$ - столбцы размерностей $g_1, k_1$ 


Пусть $z_{it}$ — вектор-строка $k_2$  инструментальных переменных, $k_2 \geq  g_1$: $$ E(z_{it}u_{it}) = 0$$

Оценим методом инструментальных переменных «within»-регрессию

$$ (y_{2it} - \bar{y}_{2i})  = (y_{1it} - \bar{y}_{1i}) \gamma   + (x_{it} -\bar{x}_{i} ) \beta  + (u_{it} - \bar{u}_{i}) $$ 

получим IV-«within»-оценки  $\hat{\gamma}_{IVW}, \hat{\beta}_{IVW} $ 


Оценив методом инструментальных переменных «between»-регрессию

$$ (\bar{y}_{2i} - \bar{y}_{2})  = (\bar{y}_{1i} - \bar{y}_{1}) \gamma   + (\bar{x}_{i} - \bar{x} ) \beta  + (\bar{u}_{i} - \bar{u}) $$ 

получим IV-«between»-оценку $\hat{\gamma}_{IVB}$


Например, если $k_2 = g_1 = 1, k_1 = 0$:



$$ y_{2it}  = y_{1it} \gamma     + \alpha_i + u_{it}$$ 


 $\hat{\gamma}_{IVW} = \frac{\sum \sum(y_{2it} - \bar{y}_{2i})  (z_{it} - \bar{z}_{i}) }{\sum \sum  (y_{1it} - \bar{y}_{1i}) (z_{it} - \bar{z}_{i}) }$

 $\hat{\gamma}_{IVB} = \frac{\sum \bar{y}_{2i} \bar{z}_{i} }{\sum  \bar{y}_{1i} \bar{z}_{i} }$


Если  $E(Y_{1it} \alpha_i) = 0$, то более эффективна оценка со случайными эффектами.



На практике приходится применять метод IV (2SLS) трижды:

1. Получение $\hat{\delta}_{IVW}$ 
2. Получение $\hat{\delta}_{IVB}$ 

В результате этих двух шагов получают оценки $\hat{\sigma}^2_u, \hat{\sigma}^2_u + T \hat{\sigma}^2_a $, которые
используются для преобразования модели

3. Реализация  метода IV для преобразованной модели.

####    14. Модели с индивидуально-специфическими переменными


До сих пор в FE-модели неоднородность субъектов исследования характеризовалась наличием ненаблюдаемых характеристик, влияние которых отражалось в модели посредством параметров $\alpha_i$. Однако неоднородность субъектов может выражаться также в различных значениях для этих субъектов некоторых _наблюдаемых_ характеристик, не изменяющихся для каждого субъекта в процессе
наблюдений. 


$$ y_{it}  = \mu + \alpha_i +  \beta x_{it}+ \gamma z_i + u_{it}$$ 


где $z_i$ — переменная, специфическая только в отношении субъекта.


- Если эта модель трактуется как RE-модель, в которой эффекты не коррелированы с $x_{it}, z_{it}$,  то проблем с оцениванием коэффициентов нет: в этом случае GLS-оценки для $\beta, \gamma$ -  BLUE.
- Если же эта модель трактуется как FE-модель или если $a_i$ случайны и $E(a_iz_i) = 0$, но $E(a_i x_{it}) \neq 0$, то GLS-оценки  (как в RE-модели) несостоятельны. 



$$ (y_{it} - \bar{y}_{i})  = (x_{it} -\bar{x}_{i} ) \beta  + (u_{it} - \bar{u}_{i}) $$ 


OLS-оценка приводит к FE-оценке, но при таком подходе из исходного уравнения выметаются $а_i, z_i$. Однако
если $\alpha_i$ фиксированы или $E(a_i x_{it}) \neq 0$, но $E(a_iz_i) = 0$, то тогда можно построить состоятельную оценку коэффициента $\gamma$

т.к.  $ \bar{y}_{i} - \beta \bar{x}_{i}  = \mu + \gamma z_i + (\alpha_i +  \bar{u}_{i}) $


 $$\hat{\gamma} = \frac{\sum ((y_{i} - \bar{y})  -  (x_{i} - \bar{x}) \beta)  (z_{i} - \bar{z}) }{ \sum  (z_{i} - \bar{z}) ^2 }$$
 
$$\hat{\mu} = \bar{y} - \bar{x}\beta -\bar{z}\hat{\gamma} $$


Подставив $\hat{\beta}_{CV}$  вместо $\beta$ в оба выражения, получим состоятельные  оценки коэффициентов.

####    15. Динамическая модель: несостоятельность «within»-оценки


$$ y_{it}  = \gamma  y_{i, t-1}  + \alpha_i +    u_{it} $$ 

где $|\gamma|<1, u_{it} \sim  N(0, \sigma^2_u) $ — инновации. 

«Within»-оценка (CV) для $\gamma$:



 $$\hat{\gamma}_{CV} = \frac{\sum \sum (y_{it} - \bar{y}_i) (y_{i,t-1} - \bar{y}_{i,-1}) }{ \sum \sum  (y_{i,t-1} - \bar{y}_{i,-1}) ^2 }$$
 

Из определения модели:


$$ \bar{y}_{it} - \bar{y}_{i} = (\bar{y}_{i,t-1} - \bar{y}_{i,-1}) \gamma   + (\bar{u}_{it} - \bar{u}_i) $$ 


 $$\hat{\gamma}_{CV} = \gamma + \frac {\sum \sum (u_{it} - \bar{u}_i) (y_{i,t-1} - \bar{y}_{i,-1}) }{ \sum \sum  (y_{i,t-1} - \bar{y}_{i,-1}) ^2 }$$
 
- Если $N \to \infty,  Т  \to \infty $, то $\hat{\gamma}_{CV}$  является состоятельной оценкой параметра $\gamma$.
- Если  $Т$ фиксированное, то  первый предел не равен нулю, 
 оценка $\hat{\gamma}_{CV}$  несостоятельна.

Асимптотическое смещение оценки $\hat{\gamma}_{CV}$  является следствием «within»-преобразования, выметающего индивидуальные эффекты $\alpha_i $ из каждого наблюдения, что порождает корреляцию между остатками $ (u_{it} - \bar{u}_i)$  в преобразованной модели и объясняющей переменной $(y_{i,t-1} - \bar{y}_{i,-1} )$.  

- Когда $Т$ велико, эта корреляция близка к нулю. 
- Для малых значений $Т$ смещение отрицательно, если $\gamma > 0$, не стремится к нулю,  если $\gamma to 0$. 
- В типичной панели $Т$ мало, смещение трудно игнорировать: для $Т = 2$ асимптотическое смещение равно $- \frac{q+ \gamma}{2}$. 


##### Получение состоятельной оценки:

«Within»-оценка остается несостоятельной при малых Т и когда в правую
часть уравнения модели добавляются экзогенные объясняющие переменные.

Для преодоления этой проблемы можно воспользоваться преобразованием, выметающим $a_i$: вместо вычитания средних по времени перейти к __первым разностям временных рядов__ для каждого субъекта. 

При этом получаем:


$$ {y}_{it} - {y}_{i,t-1} = ({y}_{i,t-1} - {y}_{i,t-2}) \gamma   + ({u}_{it} - {u}_{i,t-1}) $$ 

Здесь $Cov ( \Delta y_{i,t-1} , \Delta u_{it} ) = - Cov (y_{i,t-1}, u_{i,t-1}) \neq 0 $


Поэтому OLS-оценка для $\gamma$ в продифференцированном уравнении оказывается несостоятельной, даже если $T \to \infty $. 

Применим к преобразованному уравнению IV-метод: 


Для инструмента $y_{i,t-2}$: $Cov (y_{i,t-2}, \Delta u_{it}) = 0, Cov (y_{i,t-2}, \Delta y_{i,t-1})   \neq 0 $


Получаем оценку: 

$$\hat{\gamma}_{IV} = \frac{\sum \sum({y}_{it} - {y}_{i,t-1} ) y_{i,t-2} }{\sum \sum  ({y}_{i,t-1} - {y}_{i,t-2})  y_{i,t-2} }$$



Необходимое условие состоятельности этой оценки: 


$$p\lim_{N \to \infty} \frac{1}{N(T-1)}\sum \sum ({u}_{it} - {u}_{i,t-1}) y_{i,t-2} = 0  $$

при $T \to \infty, N \to \infty $




####    16. Обобщенный метод моментов (GMM)

Применение сразу нескольких  инструментов может привести  к повышению эффективности оценок (используется большее количество информации).

##### Моментные условия (условия ортогональности): 


Cоздадим список инструментов, поступая следующим
образом: 

- $t = 2$ 


$$ {y}_{i2} - {y}_{i1} = ({y}_{i1} - {y}_{i0}) \gamma   + ({u}_{i2} - {u}_{i1}) $$ 


Инструмент для $\Delta y_{i1}$: $ y_{i0}$


Моментное условие:

$$E[(u_{i2}- u_{i1})y_{i0}] = 0$$

- $t = 3$, для каждого $i = 1 ,..., N$  имеем 2 уравнения:


$$ {y}_{i2} - {y}_{i1} = ({y}_{i1} - {y}_{i0}) \gamma   + ({u}_{i2} - {u}_{i1}) $$ 


$$ {y}_{i3} - {y}_{i2} = ({y}_{i2} - {y}_{i1}) \gamma   + ({u}_{i3} - {u}_{i2}) $$ 




Инструмент для $\Delta y_{i1}$: $ y_{i0}$


Инструмент для $\Delta y_{i2}$: $ y_{i0}$ или  $ y_{i1}$ 

Моментные  условия:

$$E[(u_{i3}- u_{i2})y_{i1}] = 0$$

$$E[(u_{i3}- u_{i2})y_{i0}] = 0$$


- $t= 4$

Моментные условия:


$$E[(u_{i4}- u_{i3})y_{i0}] = 0$$

$$E[(u_{i4}- u_{i3})y_{i1}] = 0$$

$$E[(u_{i4}- u_{i3})y_{i2}] = 0$$

...

- $t=T$

Для произвольного $Т$ определим $(T- 1)*1$-вектор $\Delta u_i $ и $(T -1 )*\frac{T(T-1)}{2}$-матрицу Z_i,  где каждая строка матрицы содержит инструменты, подходящие для соответствующего момента времени. 

Вся совокупность $\frac{T(T-1)}{2}$ моментных условий:

$$E[Z_i^T\Delta u_i] = 0 $$
 

##### __GMM__

Чтобы использовать всю
совокупность моментных условий, в GMM минимизируется квадратичная
форма от выборочных аналогов моментных условий:

$$Q(\gamma) = [\frac{1}{N} \sum Z^T_i (\Delta y_i - \gamma \Delta y_{i,-1})]^T W_N  [\frac{1}{N} \sum Z^T_i (\Delta y_i - \gamma \Delta y_{i,-1})] $$


где $W_N$  — симметричная положительно определенная взвешивающая матрица



> В отличие от OLS, количество моментных условий здесь больше числа условий, необходимых для определения с их помощью значения $\gamma$, так что использование разных условий приводит к различным оценкам, поэтому приходится искать «наилучшее» приближения ко всем моментным условиям сразу. 



Искомый минимум достигается при значении, равном $\hat{\gamma}_{GMM}$ - это и есть GMM-оценка параметра $\gamma$: 



$$\hat{\gamma}_{GMM}  = ((  \sum \Delta y_{i,-1}^T Z_i) W_N (  \sum \Delta y_{i,-1} Z_i^T))^{-1} ((\sum \Delta y_{i,-1}^T Z_i )W_N(\sum \Delta y_{i,-1} Z_i^T) ) $$



##### Свойства

Свойства этой оценки зависят от выбора взвешивающей матрицы $W_N$. 


При положительной определенности матрицы $W_N$ ( в частности, для единичной матрицы $W_N = I_N$ )  GMM-оценка состоятельна.

Однако желательно выбирать матрицу $W_N$ так, чтобы GMM-оценка была по возможности наиболее эффективной — найти оптимальную взвешивающеую матрицу.


Такая матрица должна удовлетворять условию:

$$p \lim_{N \to \infty} = (Cov(Z^T_i \Delta u_i))^{-1} = [E(Z^T_i \Delta u_i  (\Delta u_i)^T   Z_i) ]^{-1}$$


В общем случае GMM-оценка y GMM имеет асимптотически нормальное
распределение 


«Оптимальная» взвешивающая матрица является оптимальной в отношении выбранного множества инструментов. В то же время возникает вопрос об «оптимальном»
выборе самих инструментов. Привлечение большего количества инструментов подразумевает
получение более эффективных оценок, но здесь возникают две
опасности:
- некоторые из переменных, привлеченных в качестве инструментов, в действительности могут быть коррелированными с ошибками (для предотвращения таких ситуаций необходимо проверять гипотезу о выполнении соответствующих условий ортогональности)
- оценки коэффициентов могут иметь значительное смещение вследствие оценивания взвешивающей матрицы $W_N$.

####    17. Проверка гипотез о правильности спецификации динамической модели

Наличие избыточных условий позволяет проверять адекватность сделанных в отношении модели предположений. 

Гипотеза $Н_0$: избыточные условия (выведенные на основании исходных предположений о рассматриваемой модели) действительно выполняются.


Cтатистика Саргана:

$S = NQ(\hat{\theta}_{GMM}) \sim  \chi^2_q$,


где $\hat{\theta}_{GMM}$ - GMM-оценка вектора коэффициентов, $Q(\hat{\theta}_{GMM})$ -  значение  квадратичной формы, минимизируемой в методе GMM, при $\theta =  \hat{\theta}_{GMM}$, $q$ - количество избыточных моментных условий.
