# logsumexp関数

## モチベーション

$n \in \{ 0, 1, \dots , N-1\}$に対し，$\boldsymbol{a}_n \in \mathbb{R}^K$とする．

このとき，$n \in \{ 0, 1, \dots , N-1\}$に対し，
\begin{align}
\boldsymbol{a}_n \leftarrow \frac{\boldsymbol{a}_n}{\sum_{k=0}^{K-1}a_{n,k}}
\end{align}
を計算したい．

ここでは，実際に一昨年，香山が陥ったケースを想定して説明する．

$a_n$の値が非常に大きい値であるとする．  
すると，分母の和の部分でオーバーフローしてしまい，結果が`inf`になる可能性がある．

そのため，$a_n$に対数を取った$\log a_n$を値として用いる手法を考える．

\begin{align}
\boldsymbol{a}_n \leftarrow \frac{\exp \log \boldsymbol{a}_n}{\sum_{k=0}^{K-1} \exp \log a_{n,k}}
\end{align}

見やすさの都合上，両辺に対数をとると（以降，$\sum$と省略した形で書く），

\begin{align}
\log \boldsymbol{a}_n &\leftarrow \log \frac{\exp \log \boldsymbol{a}_n}{\sum \exp \log a_{n,k}} \\
    &= \log \boldsymbol{a}_n - \log \sum \exp \log a_{n,k}
\end{align}

$\boldsymbol{x}_n = \log \boldsymbol{a}_n$とおくと，

\begin{align}
\boldsymbol{x}_n &\leftarrow \boldsymbol{x}_n - \log \sum \exp \boldsymbol{x}_{n,k}
\end{align}

ここでまさかの，第二項に$\sum \exp$が出現．  
このままではここでもオーバーフローの可能性があります．

ここで取るべき手法が指数法則です．  
適当な$C \in R$を用いて，下記のように変形できる．

\begin{align}
\boldsymbol{a}_n \leftarrow &\frac{\exp \boldsymbol{x}_n}{\sum \exp\boldsymbol{x}_{n,k}} \\
 & \frac{\exp (\boldsymbol{x}_n - C)}{\sum \exp(\boldsymbol{x}_{n,k} - C)}
\end{align}

$C$には$\boldsymbol{x}_n$の最大値を設定すれば，$\exp (\boldsymbol{x}_{n, k} - C)$の値が抑えられ，オーバーフローを防ぐことができる．  
`logsumexp`関数は，定数$C$を適当に設定してくれる．

In [30]:
import numpy as np
from scipy.special import logsumexp

a = np.arange(1000)

print('logsumexpを使用せず計算:', np.log(np.sum(np.exp(a))))
print('logsumexpを使用して計算:', logsumexp(a))


logsumexpを使用せず計算: inf
logsumexpを使用して計算: 999.4586751453871
