# 線形回帰（OLS）




## 概要


目的変数を$Y_i$，$k$個の説明変数を$X_{ki}$として,
$$
Y_i = \beta_0 + \sum_{j = 1}^k \beta_j X_{ji} + u_i, \quad i=1,\ldots N
$$
ここで，$(\beta_0, \beta_1, \ldots, \beta_k)$は回帰係数である．

回帰係数は目的関数
$$
\sum_{i = 1}^{N} \left( Y_i - \beta_0 - \sum_{j = 1}^k \beta_j X_{ji}\right)^2
$$
を最小化するように推定され，そのときの回帰係数はOLS推定量と呼ばれる．

## OLS推定のための仮定

1. [i.i.d]
2. [Exogenous]
   
   $$
   E \left(u_i \mid X_{1,i}, \ldots, X_{i, k} \right) = 0
   $$
3. [異常値がない]
4. [多重共変性がない]

   $$
   E \left[ \left(a_0 + \sum_{j=1}^{k} a_j X_{ji} \right)^2 \right] > 0 \quad \forall a_0, \ldots, a_k \text{ s.t. } \sum_{j=0}^{k} a_j^2 = 1
   $$

## OLS推定量の導出

$X_i = (1, X_{1i, }\ldots, X_{ki})^\prime$，$X = (X_1^\prime, \ldots, X_N^\prime)^\prime$，$Y=(Y_1, \ldots Y_N)^\prime$，$\beta = (\beta_0, \beta_1, \ldots, \beta_N)^\prime$とする．このとき，目的関数は
$$
Q(\beta) = (Y - X\beta)^\prime (Y - X \beta)
$$
と書ける．
$$
\frac{\partial Q(\beta)}{\partial \beta} = -2 X^\prime (Y - X \beta), \quad \frac{\partial^2 Q(\beta)}{\partial \beta^2} = 2 X^\prime X > 0 
$$
であるため，OLS推定量は
$$
\hat{\beta} = (X^\prime X)^{-1} X^\prime Y
$$
と求まる．

## OLS推定量の一致性と漸近正規性

[一致性]

$u = (u_1, \ldots, u_N)^\prime$として，$Y = X \beta + u$をOLS推定量$\hat{\beta}$に代入する：
$$
\hat{\beta} = \beta + \left( \frac{1}{N} X^\prime X \right)^{-1} \frac{1}{N} X^\prime u.
$$
大数の法則より，
$$
\frac{1}{N} X^\prime X = \frac{1}{N} \sum_i X_iX_i^\prime  \xrightarrow{p} E \left(X_iX_i^\prime \right) > 0 \quad (\because \text{多重共変性がない})
$$
$$
\frac{1}{N} X^\prime u = \frac{1}{N} \sum_{i=1}^{N} X_i u_i \xrightarrow{p} E(X_i u_i) = 0 \quad (\because \text{外生性})
$$
となり，OLS推移定量$\hat{\beta}$は一致性を持つ．

[漸近正規性]

$$
\sqrt{N} \left( \hat{\beta} - \beta \right) = \left( \frac{1}{N} X^\prime X \right)^{-1} \frac{1}{\sqrt{N}} X^\prime u.
$$
$X_i$の外生性より，$E\left(X_i u_i\right) = 0$，$Var\left(X_i u_i\right) = E \left( u_i^2 X_i X_i^\prime \right)$なので，中心極限定理から，
$$
\sqrt{N} \left( \hat{\beta} - \beta \right) \xrightarrow{d} \left[ E \left(X_iX_i^\prime \right) \right]^{-1} N\left(0, E \left( u_i^2 X_i X_i^\prime \right)\right) = N\left(0, \left[ E \left(X_iX_i^\prime \right) \right]^{-1} E \left( u_i^2 X_i X_i^\prime \right) \left[ E \left(X_iX_i^\prime \right) \right]^{-1} \right)  = N(0, V)
$$
が得られる．
この表現を用いて，漸近分散$V$は
$$
\hat{V} = \left( \frac{1}{N} X^\prime X \right)^{-1} \frac{1}{N} X^\prime \hat{U} X \left( \frac{1}{N} X^\prime X \right)^{-1}, \quad \hat{U} = \mathrm{diag} \left( \hat{u}_1^2, \ldots, \hat{u}_N^2 \right)
$$
を用いて推定でき，$\hat{V}$は$V$の一致推定量となる．

## 実装

In [4]:
import pandas as pd
import linearmodels
import statsmodels.api as sm