# AdStock効果を推定しつつ回帰を回したい⑤
- Author: Y.Nakahashi
- Date: 2018-01-25

## 背景
これまでの記事で*Marketing Mix Modeling*におけるAdStock効果の推定について色々と書いてきましたが、その他にも試したいと思っているモデルがいくつかあります。その一つが階層ベイズモデルと状態空間モデルを同時に取り扱うものです。

例えば「地域別の売上推移のデータ」が手元にあると考えてみましょう。地域ではなく人や商品でも構いませんが、ある要因の各水準がそれぞれ時系列データを持っている状況（いわゆるパネルデータ）で、ひとまずここでは地域とします。このようなデータはあらゆる会社で保有していることでしょう。
今、各地域について*MMM*により広告効果を推定することを考えたとき、どのようなモデリングが可能でしょうか？

シンプルに考えれば、地域ごとに一つずつモデルを作るという方法が挙げられます。例えば地域の数が2つ3つしかなかったり、モデルの作成に時間をかけることが可能であればこの方法は有効かもしれません。しかし問題もあります。地域ごとに独立してモデルを作成するということは、**各地域のパラメータは互いに独立である**との仮定を置くことになるのですが、それは事実でしょうか？

例えば日本ではTVも新聞も全国で同じコンテンツが提供される割合が大きいでしょうし、購買行動に地域による差がそれほど認められるとは経験的にも思えません。もし仮に地域による異質性というものがそれほど強くないのであれば、むしろそういった情報を積極的に活かした方が良いのではないでしょうか？

そのような時に、パラメータ間に緩やかな縛りをかける方法として**階層ベイズモデル**という手法があります。詳しくは書籍を参考にして頂くとして、ここでは「各地域の広告効果を表すパラメータ$\beta$を生成する分布を仮定する」方法と説明しておきます。この分布の幅（バラつき、分散）が十分に大きければ広告効果は地域によって様々な値を取り得ますし、逆に分布の幅が極端に狭ければ地域ごとの広告効果に差はないことを意味します。


## 目的
この階層構造を持つモデルを、時系列データの分析でお馴染みの**状態空間モデル**と合わせて取り扱いたいというのが今回の試みです。具体的には、以下のようなモデルを想定しています。

$$
\begin{equation*}
y_{A,t} = \mu_{A,t} + \beta_{A}X_{A,t} + \epsilon_{A,t} \\
\mu_{A,t} \sim N(\mu_{A,t-1}, \sigma^{2}_{\mu}) \\
\epsilon_{A,t} \sim N(0, \sigma^{2}_{\epsilon}) \\
\beta_{A} \sim N(\beta_0, \sigma^{2}_{\beta})
\end{equation*}
$$

添字の`A`および`t`はそれぞれ地域（Area）と時点（time）を意味しており、$y_{A,t}$は「ある地域のt時点における観測値」となります。広告効果$\beta$に対して、その数値の元となる分布（ここでは正規分布）を仮定しています。


#### ライブラリの読み込み
今回の分析では`{rstan}`を使用します。階層ベイズ + 状態空間モデルといった非常に複雑なモデルを表現できるのが強みです。

In [8]:
library(rstan)
rstan_options(auto_write = TRUE)
options(mc.cores = parallel::detectCores())

#### シミュレーションデータの生成

In [4]:
simulate_y <- function(pars) {
    
   ## シミュレーション用のパラメータ
   n         <- pars[1] # レコード数
   mu        <- pars[2] # 切片
   var_e     <- pars[3] # 残差分散
   beta_01   <- pars[4] # 説明変数X1の回帰係数
   lambda_01 <- pars[5] # 説明変数X1の残存効果
   beta_02   <- pars[6] # 説明変数X2の回帰係数
   lambda_02 <- pars[7] # 説明変数X2の残存効果
   
   ## lambdaに従う説明変数の作成
   X_01_raw <- rgamma(n, 3) * ifelse(runif(n) > 0.7, 0, 1)
   X_01_fil <- stats::filter(X_01_raw, lambda_01, "recursive")
   
   X_02_raw <- rgamma(n, 2) * ifelse(runif(n) > 0.8, 0, 1)
   X_02_fil <- stats::filter(X_02_raw, lambda_02, "recursive")
   
   ## 誤差項の発生
   error <- rnorm(n, 0, sqrt(var_e))
   
   ## 単純な線形モデルによる観測値yの生成
   y     <- as.vector(mu + beta_01 * X_01_fil + beta_02 * X_02_fil + error)
   
   ## データフレームとして返す
   dat <- data.frame(
      "Y"          = y,
      "X_01"       = X_01_raw,
      "X_02"       = X_02_raw,
      "X_01_Fil"   = X_01_fil,
      "X_02_Fil"   = X_02_fil,
      "Y_lag"      = dplyr::lag(y, 1),
      "True_Error" = error)
   return(dat)
}

In [5]:
set.seed(123)
init_par <- array(c(100, 5, 2, 0.5, 0.6, 0.8, 0.5))
dat_Ana  <- na.omit(simulate_y(init_par))

In [7]:
head(dat_Ana)

Unnamed: 0,Y,X_01,X_02,X_01_Fil,X_02_Fil,Y_lag,True_Error
2,9.485103,4.7360299,4.6103141,4.73603,5.565029,9.945378,-2.3349357
3,8.261757,0.5422275,0.0,3.383845,2.782515,9.485103,-0.6561771
4,11.315538,2.7086007,2.0822681,4.738908,3.473525,8.261757,1.1672634
5,12.298993,5.9471178,0.9911441,8.790463,2.727907,11.315538,0.7214364
6,10.036088,3.2818834,0.6256206,8.556161,1.989574,12.298993,-0.8336521
7,7.834882,0.0,1.1023313,5.133697,2.097118,10.036088,-1.4096608
