# F-тест: совместная значимость

In [None]:
import pandas as pd
import numpy as np
import statsmodels.formula.api as smf
from statsmodels.iolib.summary2 import summary_col # вывод результатов тестирования
from scipy.stats import f # f-распределение и критические значения

# Не показывать FutureWarnings
import warnings
warnings.simplefilter(action='ignore', category=FutureWarning)

<div style="background-color:Bisque; color:DarkBlue; padding:30px;">

<i><b><span style="color: purple">Значимость регрессии </span> </b><br>

Для линейной регрессии

$$
	(\log)y=\beta_0+\beta_1(\log)x_1+\cdots+\beta_k(\log)x_k+u=x^\top \beta+u
$$

Тестируется гипотеза, что несколько коэффициентов совместно равны нулю. Например, последние $J$ коэффициентов

$$
H_0:\beta_{k-J+1}=\cdots=\beta_k=0
$$

__Интерпретация__: включённые в модели регрессоры совместно не влияют на зависимую переменную (в генеральной совокупности)

__Тестовая статистика__ для выбранной оценки ковариационной матрицы $\hat{V}$ формула для F-статистики (всё вычисляется автоматически!)

$$
\begin{aligned}
	F&=\frac{1}{J}(R\widehat{\beta})^\top
	\Bigl(R\cdot\hat{V}\cdot R^\top\Bigr)^{-1}
	(R\widehat{\beta}) &
	\underset{J \times (k+1)}{R}&=
	\begin{pmatrix} 
	0 & \cdots & 0 & 1 & 0 & \cdots & 0 \\ 
	0 & \cdots & 0 & 0 & 1 & \cdots & 0 \\
	\vdots & \ddots & \vdots & \vdots & \vdots & \ddots & \vdots \\
	0 & \cdots & 0 & 0 & 0 & \cdots & 1
	\end{pmatrix}=\begin{pmatrix} 0_{J\times (k+1-J)} & I_{J\times J}\end{pmatrix}
\end{aligned}
$$

__Критическое значение__: $F$-распределения со степенями свободы ($k$ - число объясняющих переменных)

$$ 
\begin{aligned} 
	df_1&=dfn=J & df_2&=dfd=n-k-1
\end{aligned}
$$

__Замечание__: 
* для F-тест есть неробастный (по умолчанию) и робастный вариант
* для подогнанной регрессии 

<div style="margin-left: auto;
            margin-right: auto;
            width: 30%">

|Свойство|Значение|
|-|-|
|`.df_model` |$k$|
|`.df_resid`| $n-k-1$|
|`.fvalue`|F-статистика|
|`.f_pvalue`|P-значение для F|

</div>

__Вывод__

**<span style="color:purple">Способ 1:</span>** используем $F$-статистику

* Отвергаем гипотезу $H_0$ при $F>F_{cr}$, <i><b><span style="color: purple">совместное влияния значимо</span></b><br>
* Не отвергаем гипотезу $H_0$ при $F<F_{cr}$, <i><b><span style="color: purple">совместное влияния незначимо</span> </b><br>

**<span style="color:purple">Способ 2:</span>** используем $P-value$

* Отвергаем гипотезу $H_0$  при $P<\alpha$, <i><b><span style="color: purple">совместное влияния значимо</span> </b><br>
* Не отвергаем гипотезу $H_0$ при $P>\alpha$, <i><b><span style="color: purple">совместное влияния незначимо</span> </b><br>

</div>