# カーネル変換と組み合わせ

特徴ベクトルの内積で表される関数 $k(x, x')$ は正定値カーネルとなる．

## 性質

- 和について閉じている．つまり，2つのカーネル関数があったとき，その和は正定値になる．
- 積について閉じている．
- 正の定数加算を施しても正定値カーネルとなる．
- 正の低数倍を施しても正定値カーネルとなる．
- べき乗について閉じている. $k(x, x')^p$ ただし $p$ は自然数
- 多項式が正定値カーネルとなる．上の性質を用いると作れる．
- 指数関数 $\exp{(k(x,x'))}$ は正定値カーネルとなる．指数関数をテイラー展開すると，$\exp{(x)}=\sum_{m=0}^{\infty} \frac{x^m}{m!} $ なので，上の性質によって正定値であることが言える．
- コンフォーマル変換 : $k_{conf}(x, x') = g(x)g(x')k(x, x')$
- 正規化カーネル : $g(x) = \frac{1}{\sqrt{k(x, x')}}$ によってできるコンフォーマル変換．
- 畳み込みカーネル : $k_{conv}(x, x') = \sum_{x_i, x_i'} \prod_{i=1}^{M} k_i(x_i, x_i')$

## 和と積の選択

カーネル関数を設計するときに和と積のどちらを選べばいいのか分からない．
が，カーネル関数は基本的に $x$ と $x'$ の類似度を表しているため，積を取ると一方の値が0のとき0となってしまい，論理積的な特徴を持っている．

一方で和は，論理和的な特徴を持っている．

## 平行移動不変カーネル

基本的には，$ k(x - x') $ みたいな形で表されるやつ．

相対的な位置関係のみからカーネルの値が決まるという，平行移動に関する不変性がある．

### ボホナーの定理

\begin{align*}
    k(x-y) = \int_{-\infty}^{\infty} e^{it(y-x)}\sigma(t)dt
\end{align*}

となる実数値関数 $\sigma(t) \leq 0$ が存在することが $k$ が正定値であるための必要十分条件．

実数空間の確率密度関数のフーリエ変換はすべて正定値カーネルになる．フーリエ変換の定義式を見れば一目瞭然で，比較すべきはフーリエ変換を施す関数で，これは確率密度関数なので，全ての定義域で$\leq 0$の値を取ることから正定値カーネルであるということが言える．

### シェーンバーグの定理

$k(||x-x'||)$ が任意の次元のユークリッド空間に対して正定値であるための必要十分条件

$k(\sqrt{u})$ が $u$ について $[0, \infty)$ で連続， $(0, \infty)$ で無限回連続微分可能で，
\begin{align*}
    (-1)^j\frac{\partial^j k(\sqrt{u}}{\partial u^j} \leq 0
\end{align*}
を満たすこと.


## グラム行列の設計

カーネル関数を設計せずとも，正定値行列(グラム行列)を定めることによってカーネルを定義することができる．

### 性質

関数と同様．

### 正定値じゃない行列を正定値行列に変換

- どんな正方行列 $K$ も，単位行列 $I_n$ の $\lambda$ 倍を加えて，$K+\lambda I_n$ とすることによって $K$ の固有値は $\lambda$ だけ増える．最小固有値の絶対値より $\lambda$ を大きくすれば正定値行列を作成可能．
- 固有値展開 $K=UDU^T$ を施し，固有値の並んだ対角行列 $D$ の 0以下の成分を強制的に正の小さい値にした $D'$ を作り，$K' = UD'U^T$ とする．
- 一般的に実対称行列 $A$ が与えられた時，その行列指数関数 $ \exp{A} = I + A + \frac{1}{2!}A^2 + ...$ は正定値である．理由は変換後の固有値は $\exp(\lambda)$ となり，全て正になるため．


## 確率モデルに対するカーネル

### フィッシャーカーネル

$x$ がパラメータ $\theta$ をもつ確率分布 $p(x; \theta)$ から生成されるとする．まず，確率分布 $p(x; \theta)$ のスコア関数と呼ばれる

\begin{align*}
    s(x; \theta) = (\frac{\partial \log{p(x;\theta)}}{\partial \theta_1}, ...,\frac{\partial \log{p(x;\theta)}}{\partial \theta_M}^T )
\end{align*}
を計算する． $\theta$ は未知であれば任意の $\theta$ を用いて良い．または，サンプルから何らかの統計的推定法によって得られた推定値を用いて良い．

\begin{align*}
    G(\theta) = E_\theta [s(s;\theta)s(x;\theta)^T]
\end{align*}
をフィッシャー行列という．

このとき，
\begin{align*}
    k(x, x'; \theta) = s(x;\theta)^TG^{-1} s(x'; \theta)
\end{align*}
はフィッシャーカーネルと呼ばれる．

## 分割統治と動的計画法によるカーネル設計