## ポアソン回帰モデルについて

ポアソン回帰モデルは、カウントデータ（例えば、ある期間内のイベントの発生回数）を扱うための回帰モデルです。このモデルは、目的変数がポアソン分布に従うと仮定します。ポアソン回帰は、交通事故の発生回数や病気の発症回数など、イベントの発生頻度を予測する際に広く使用されます。

### ポアソン分布

ポアソン分布は、単位時間あたりに一定の平均発生率でイベントが発生する場合の確率分布です。ポアソン分布の確率質量関数は次のように定義されます：

$$
P(Y = y) = \frac{\lambda^y e^{-\lambda}}{y!}
$$

ここで、$\lambda$ は平均発生率（平均発生回数）、$y$ は観測された発生回数です。

### ポアソン回帰モデル

ポアソン回帰モデルでは、説明変数の線形結合を使ってポアソン分布のパラメータ $\lambda$ を予測します。モデルは次のように定義されます：

$$
\log(\lambda) = \beta_0 + \beta_1 x_1 + \beta_2 x_2 + \cdots + \beta_p x_p
$$

ここで、
- $\lambda$ は予測される発生率です。
- $\beta_0$ は切片（バイアス項）です。
- $\beta_1, \beta_2, \ldots, \beta_p$ は回帰係数です。
- $x_1, $x_2, \ldots, $x_p$ は説明変数です。

$\lambda$ を予測するために対数リンク関数を使用します。このリンク関数により、モデルの出力が常に正の値になることが保証されます。

### ポアソン回帰の適用例

ポアソン回帰モデルは、次のようなカウントデータを予測するのに適しています：
- ある期間内の事故の発生回数
- 店舗に訪れる顧客の数
- 患者が病院を訪れる回数

### パラメータの推定

ポアソン回帰モデルのパラメータは、最大尤度推定法（MLE）を用いて推定されます。尤度関数は以下のように定義されます：

$$
\mathcal{L}(\beta) = \prod_{i=1}^{n} \frac{e^{-\lambda_i} \lambda_i^{y_i}}{y_i!}
$$

ここで、$\lambda_i$ は観測 $i$ における予測発生率、$y_i$ は観測された発生回数です。

### Pythonコード例

以下に、Pythonを用いたポアソン回帰モデルの実装例を示します。

### 結果の解釈

ポアソン回帰モデルの実行結果には、以下の情報が含まれます：

- **係数**: 各特徴量に対する回帰係数が表示されます。これらの係数は、各特徴量がカウントデータに与える影響を示します。
- **統計的有意性**: 係数に対するp値が表示され、各特徴量の統計的有意性を評価できます。p値が小さいほど、その特徴量がモデルにとって重要であることを示します。
- **モデルの適合度**: ロジスティック回帰やプロビットモデルと同様に、ポアソン回帰モデルの適合度を評価するための指標が提供されます。

### ポアソン回帰の選択

ポアソン回帰モデルは、特にカウントデータや非負整数値データを扱う場合に適しています。データがポアソン分布に従うと仮定される場合に最適です。ロジスティック回帰やプロビットモデルが二値データに適しているのに対し、ポアソン回帰は頻度データに適しています。

In [None]:
import numpy as np
import pandas as pd
import statsmodels.api as sm
from sklearn.datasets import make_regression

# データセットの作成（カウントデータを模倣）
np.random.seed(42)
n_samples = 100
X = np.random.rand(n_samples, 2)  # 2つの特徴量
beta = np.array([0.5, -0.3])
lin_pred = np.dot(X, beta)
y = np.random.poisson(lam=np.exp(lin_pred))

# データフレームの作成
data = pd.DataFrame(X, columns=['feature1', 'feature2'])
data['count'] = y

# ポアソン回帰モデルの作成とフィッティング
X = sm.add_constant(data[['feature1', 'feature2']])  # 切片項を追加
poisson_model = sm.GLM(data['count'], X, family=sm.families.Poisson()).fit()

# モデルの要約を表示
print(poisson_model.summary())

# 各特徴量の影響（係数）の表示
coefficients = poisson_model.params
print("\n各特徴量の係数:")
print(coefficients)