# ガウス過程

PHYSBOではガウス過程回帰を実行しながらベイズ最適化を行なっている。

そのため、学習データが与えられた際にガウス過程回帰を実行することもでき、学習済みモデルを利用したテストデータの予測も行うことができる。

ここでは、その手順について紹介する。


## 探索候補データの準備

これまでのマニュアルでも利用していたs5-210.csvを用いてガウス過程を実行します。

In [1]:
import physbo

import os
import urllib2
import ssl
import numpy as np

ssl._create_default_https_context = ssl._create_unverified_context

def download():
    if not os.path.exists('data/s5-210.csv'):

        if not os.path.exists('data'):
            os.mkdir('data')
            
        print('Downloading...')
        response = urllib2.urlopen("http://www.tsudalab.org/files/s5-210.csv")
        with open('data/s5-210.csv', 'wb') as out_file:
            out_file.write(response.read())
        response.close()
        print('Done')
        
def load_data():
    download()
    A =  np.asarray(np.loadtxt('data/s5-210.csv',skiprows=1, usecols=(3,4,5,6), delimiter=',') )
    X = A[:,0:3]
    t  = -A[:,3]
    return X, t

X, t = load_data()
X = physbo.misc.centering( X )


## 学習データの定義

対象データのうち、1割をトレーニングデータとして利用し、別の1割をテストデータとして利用します。

In [2]:
N = len(t)
Ntrain = int(N*0.1)
Ntest = min(int(N*0.1), N-Ntrain)

id_all   = np.random.choice(N, N, replace=False)
id_train  = id_all[0:Ntrain]
id_test = id_all[Ntrain:Ntrain+Ntest]

X_train = X[id_train]
X_test = X[id_test]

t_train = t[id_train]
t_test = t[id_test]

print "Ntrain =", Ntrain
print "Ntest =", Ntest

Ntrain = 1798
Ntest = 1798


## ガウス過程の学習と予測

以下のプロセスでガウス過程を学習し、テストデータの予測を行う。

１、ガウス過程のモデルを生成する。

２、X_train, t_trainを用いてモデルを学習する。

３、学習されたモデルを用いてテストデータ(X_test)に対する予測を実行する。

In [3]:
#共分散の定義(ガウシアン)
cov = physbo.gp.cov.gauss( X_train.shape[1],ard = False )

#平均の定義
mean = physbo.gp.mean.const()

#尤度関数の定義(ガウシアン)
lik = physbo.gp.lik.gauss()

#ガウス過程モデルの生成
gp = physbo.gp.model(lik=lik,mean=mean,cov=cov)
config = physbo.misc.set_config()



#ガウス過程モデルを学習
gp.fit(X_train, t_train, config)

#学習されたガウス過程におけるパラメタを出力
gp.print_params()



#テストデータの平均値（予測値）および分散を計算
gp.prepare(X_train, t_train)
fmean = gp.get_post_fmean(X_train, X_test)
fcov = gp.get_post_fcov(X_train, X_test)


Start the initial hyper parameter searching ...
Done

Start the hyper parameter learning ...
0 -th epoch marginal likelihood 13487.02857368489
50 -th epoch marginal likelihood 4346.376485747746
100 -th epoch marginal likelihood 2350.0005875599463
150 -th epoch marginal likelihood 789.3693880781211
200 -th epoch marginal likelihood 63.12225884891723
250 -th epoch marginal likelihood -649.784918681632
300 -th epoch marginal likelihood -1044.85201007355
350 -th epoch marginal likelihood -1340.7876846472964
400 -th epoch marginal likelihood -1548.6797907311732
450 -th epoch marginal likelihood -1622.3203875925997
500 -th epoch marginal likelihood -1729.5509071226434
Done



likelihood parameter =   [-3.00223013]
mean parameter in GP prior:  [-1.05934876]
covariance parameter in GP prior:  [-0.92336195 -2.3648182 ]




予測の結果

In [4]:
fmean

array([-1.07261048, -1.10587383, -1.11667972, ..., -1.20419899,
       -1.1985833 , -1.05801649])

分散の結果

In [5]:
fcov

array([0.00058455, 0.00041233, 0.00046806, ..., 0.00055816, 0.00054886,
       0.00072352])

予測値の平均二乗誤差の出力

In [6]:
np.mean((fmean-t_test)**2)

0.007196752385924986

## 訓練済みモデルによる予測

学習済みモデルのパラメタをgp_paramsとして読み出し、これを用いた予測を行う。

gp_paramsおよび学習データ(X_train, t_train)を記憶しておくことで、訓練済みモデルによる予測が可能となる。

学習されたパラメタを準備(学習の直後に行う必要あり)

In [7]:
#学習したパラメタを１次元配列として準備
gp_params =  np.append(np.append(gp.lik.params, gp.prior.mean.params), gp.prior.cov.params)

gp_params

array([-3.00223013, -1.05934876, -0.92336195, -2.3648182 ])

学習に利用したモデルと同様のモデルをgpとして準備

In [8]:
#共分散の定義(ガウシアン)
cov = physbo.gp.cov.gauss( X_train.shape[1],ard = False )

#平均の定義
mean = physbo.gp.mean.const()

#尤度関数の定義(ガウシアン)
lik = physbo.gp.lik.gauss()

#ガウス過程モデルの生成
gp = physbo.gp.model(lik=lik,mean=mean,cov=cov)


学習済みのパラメタをモデルに入力し予測を実行

In [9]:
#学習済みのパラメタをガウス過程に入力
gp.set_params(gp_params)


#テストデータの平均値（予測値）および分散を計算
gp.prepare(X_train, t_train)
fmean = gp.get_post_fmean(X_train, X_test)
fcov = gp.get_post_fcov(X_train, X_test)

予測の結果

In [10]:
fmean

array([-1.07261048, -1.10587383, -1.11667972, ..., -1.20419899,
       -1.1985833 , -1.05801649])

分散の結果

In [11]:
fcov

array([0.00058455, 0.00041233, 0.00046806, ..., 0.00055816, 0.00054886,
       0.00072352])

予測値の平均二乗誤差の出力

In [12]:
np.mean((fmean-t_test)**2)

0.007196752385924986