## 重回帰分析の優位性検定

重回帰分析の優位性検定は、独立変数（説明変数）が従属変数（目的変数）に対して統計的に有意な影響を与えているかを評価するために行われます。これには主に以下の方法が含まれます：

1. **F検定**: モデル全体の有意性を検定する。
2. **t検定**: 各係数の有意性を検定する。

### F検定

F検定は、モデル全体が従属変数の変動を説明するのに有意であるかを評価します。具体的には、次の帰無仮説（$H_0$）を検定します：

$$
H_0: \beta_1 = \beta_2 = \cdots = \beta_k = 0
$$

ここで、$\beta_i$ は各独立変数の回帰係数です。$H_0$ が棄却される場合、少なくとも1つの独立変数が従属変数に有意な影響を与えると結論付けられます。

F値は次の式で計算されます：

$$
F = \frac{(RSS - RSS_{\text{residual}}) / k}{RSS_{\text{residual}} / (n - k - 1)}
$$

ここで、
- $RSS$ は回帰平方和（Regression Sum of Squares）
- $RSS_{\text{residual}}$ は残差平方和（Residual Sum of Squares）
- $k$ は独立変数の数
- $n$ はサンプルサイズ

### t検定

t検定は、各独立変数の係数がゼロでないかどうかを評価します。具体的には、次の帰無仮説（$H_0$）を検定します：

$$
H_0: \beta_i = 0
$$

t値は次の式で計算されます：

$$
t = \frac{\hat{\beta_i}}{\text{SE}(\hat{\beta_i})}
$$

ここで、
- $\hat{\beta_i}$ は回帰係数の推定値
- $\text{SE}(\hat{\beta_i})$ はその標準誤差

t値が大きい場合、$H_0$ が棄却され、その独立変数は従属変数に有意な影響を与えていると結論付けられます。

### Pythonを使った実装例

次に、Pythonのライブラリを用いてF検定とt検定を実施する例を示します。

#### データの準備


このコードでは、`statsmodels` ライブラリを使用して重回帰分析を実施し、結果としてF検定とt検定の結果を表示します。

### 出力例

```plaintext
                            OLS Regression Results                            
==============================================================================
Dep. Variable:                      y   R-squared:                       1.000
Model:                            OLS   Adj. R-squared:                  1.000
Method:                 Least Squares   F-statistic:                 1.107e+31
Date:                Mon, 12 Jun 2023   Prob (F-statistic):           9.02e-32
Time:                        12:57:53   Log-Likelihood:                 124.88
No. Observations:                   4   AIC:                            -245.8
Df Residuals:                       1   BIC:                            -247.6
Df Model:                           2                                         
Covariance Type:            nonrobust                                         
==============================================================================
                 coef    std err          t      P>|t|      [0.025      0.975]
------------------------------------------------------------------------------
const          3.0000   2.42e-15   1.24e+15      0.000       3.000       3.000
X1             1.0000   2.72e-15   3.67e+14      0.000       1.000       1.000
X2             2.0000   1.83e-15   1.09e+15      0.000       2.000       2.000
==============================================================================
Omnibus:                        0.958   Durbin-Watson:                   2.571
Prob(Omnibus):                  0.619   Jarque-Bera (JB):                0.775
Skew:                          -0.855   Prob(JB):                        0.679
Kurtosis:                       2.000   Cond. No.                         7.74
==============================================================================

Notes:
[1] Standard Errors assume that the covariance matrix of the errors is correctly specified.
```

### 結果の解釈

- **F-statistic** と **Prob (F-statistic)**: F検定の結果です。ここではモデル全体が統計的に有意であることを示しています。
- **coef**: 各独立変数の回帰係数です。
- **t** と **P>|t|**: t検定の結果です。ここでは各独立変数が統計的に有意であることを示しています。

これらの検定結果を用いて、モデルの有効性や各独立変数の重要性を評価します。

In [None]:
import numpy as np
import pandas as pd
import statsmodels.api as sm

# サンプルデータを作成
data = {
    'X1': [1, 1, 2, 2],
    'X2': [1, 2, 2, 3],
    'y': [6, 8, 9, 11]
}
df = pd.DataFrame(data)

# 独立変数と従属変数を定義
X = df[['X1', 'X2']]
y = df['y']

# バイアス項を追加
X = sm.add_constant(X)

# モデルをフィット
model = sm.OLS(y, X).fit()

# 結果を表示
print(model.summary())