# 18章　ナイーブベイズ 

## レシピ18.1　連続値特徴量に対するクラス分類器の訓練 


In [None]:
# ライブラリをロード
from sklearn import datasets
from sklearn.naive_bayes import GaussianNB

# データをロード
iris = datasets.load_iris()
features = iris.data
target = iris.target

# ガウシアンナイーブベイズクラス分類器を作成
classifer = GaussianNB()

# ガウシアンナイーブベイズクラス分類器を訓練
model = classifer.fit(features, target)

In [None]:
# 新たな観測値を作成
new_observation = [[ 4, 4, 4, 0.4]]

# クラスを予測
model.predict(new_observation)

In [None]:
# ガウシアンナイーブベイズクラス分類器を、個々のクラスの
# 確率を指定して作成
clf = GaussianNB(priors=[0.25, 0.25, 0.5])

# ガウシアンナイーブベイズクラス分類器を訓練
model = classifer.fit(features, target)

## レシピ18.2　離散値特徴量とカウント特徴量に対するクラス分類器の訓練 


In [None]:
# ライブラリをロード
import numpy as np
from sklearn.naive_bayes import MultinomialNB
from sklearn.feature_extraction.text import CountVectorizer

# テキストを生成
text_data = np.array(['I love Brazil. Brazil!',
                      'Brazil is best',
                      'Germany beats both'])

# BoW特徴量を作成
count = CountVectorizer()
bag_of_words = count.fit_transform(text_data)

# 特徴量行列を作成
features = bag_of_words.toarray()

# ターゲットベクトルを作成
target = np.array([0,0,1])

# 事前確率を設定して、多項ナイーブベイズクラス分類器を作成
classifer = MultinomialNB(class_prior=[0.25, 0.5])

# 多項ナイーブベイズクラス分類器を訓練
model = classifer.fit(features, target)

In [None]:
# 新たな観測値を作成
new_observation = [[0, 0, 0, 1, 0, 1, 0]]

# 新たな観測値のクラスを予測
model.predict(new_observation)

## レシピ18.3　2クラス特徴量に対するナイーブベイズクラス分類器の訓練


In [None]:
# ライブラリをロード
import numpy as np
from sklearn.naive_bayes import BernoulliNB

# 2値特徴量を作成
features = np.random.randint(2, size=(100, 3))

# 2値ターゲットベクトルを作成
target = np.random.randint(2, size=(100, 1)).ravel()

# 事前確率を指定してベルヌーイナイーブベイズクラス分類器を作成
classifer = BernoulliNB(class_prior=[0.25, 0.5])

# ベルヌーイナイーブベイズクラス分類器を訓練
model = classifer.fit(features, target)

In [None]:
model_uniform_prior = BernoulliNB(class_prior=None, fit_prior=False)

## レシピ18.4　予測確率の較正 


In [None]:
# ライブラリをロード
from sklearn import datasets
from sklearn.naive_bayes import GaussianNB
from sklearn.calibration import CalibratedClassifierCV

# データをロード
iris = datasets.load_iris()
features = iris.data
target = iris.target

# ガウシアンナイーブベイズクラス分類器を作成
classifer = GaussianNB()

# シグモイド較正を指定して、交差検証較正クラス分類器を作成
classifer_sigmoid = CalibratedClassifierCV(classifer, cv=2, method='sigmoid')

# 予測確率を較正
classifer_sigmoid.fit(features, target)

# 新たな観測値を作成
new_observation = [[ 2.6, 2.6, 2.6, 0.4]]

# 較正済みの予測確率を表示
classifer_sigmoid.predict_proba(new_observation)

In [None]:
# ガウシアンナイーブベイズを訓練して予測確率を算出
classifer.fit(features, target).predict_proba(new_observation)


In [None]:
# 較正後の予測確率を表示
classifer_sigmoid.predict_proba(new_observation)