# 単純ベイズ分類器 (ナイーブベイズ, Naive Bayes Classifier)

# 概要
* クラス分類手法の一つであり、多クラス分類も可能  
* ベイズの定理を利用  
* 生成モデルの一つであり、クラス分類の結果が確率として得られる
* それぞれの説明変数 (入力変数・記述子・特徴量) は独立していること (正確にいうと条件付き独立性) を仮定
* 説明変数の分布 (正確には、クラスが与えられたときの説明変数の分布)を仮定する必要がある
* 一般的には、正規分布かベルヌーイ分布

# 分かりやすいと思った説明
病気の検査で、陽性と出て、かつ病気の確率  
（ベイズの定理より計算）  
1回目の検査　数%でも、  
2回目の検査　数十％になる  
！精度が悪い検査でも繰り返すと精度を向上できる  
→特徴量(独立！)の数だけ検査するようなもの  


# 議論　なぜうまくいく？
> 独立性の仮定を広範囲に適用することが正確性に欠けるという事実があるにもかかわらず、
> 単純ベイズ分類器は実際には驚くほど有効である。特に、クラスの条件付き特徴分布を分離することは、
> 各分布を1次元の分布として見積もることができることを意味している。
> そのため、特徴数が増えることで指数関数的に必要なデータ集合が大きくなるという
> 「次元の呪い」から生じる問題を緩和できる。MAP 規則を使った確率的分類器の常として、
> 正しいクラスが他のクラスより尤もらしい場合に限り、正しいクラスに到達する。
> それゆえ、クラス確率はうまく見積もられていなくてもよい。
> 言い換えれば、根底にある単純な確率モデルの重大な欠陥を無効にするほど、
> 分類器は全体として十分に頑健である。
> 単純ベイズ分類器がうまく機能する理由についての議論は、後述の参考文献にもある。

つまり、確率の「数値」はいい加減であっても、「大小関係」さえ合っていれば、分類は正しく行える、
のがうまくいく原因であるらしい。

# その他、引用
## その１
> ただ、文書中の「単語間の関係」についての仮定があまりにもシンプルすぎるが故に、「精度が低い」と指摘されているのも事実です。
> いざ、文書分類をするためのアルゴリズムは多々あるので、
> いざ実務で使う際は色々なアルゴリズムの特徴を把握する必要がありますが、
> 「とりあえず文書分類をしてみて雰囲気を感じ取りたい」、
> という場合はナイーブベイズを試してみるのも有効だと思います。

## その２
> 単純ベイズ分類器は英語ではNaive Bayes classifierと呼ばれます。
> Naive Bayes classifierを訳すると「単純」と付けられていますが、
> アルゴリズムが単純でわかりやすいという意味ではなく、
> 「Naive=うぶな、ばか正直な、考えが甘い」という「データについてNaiveな想定」を置いているために、
> 単純という言葉につながっているようです。
> 決して、アルゴリズムの精度が悪いという意味でもなければ、
> テキスト分類では、標準的なアルゴリズムとして広く利用されています。
>
> 「データについてNaiveな想定」とは、どういった意味なのかと言いますと、
> 各特徴が独立という仮定を置いているためです。
> 基本的に各言葉は独立ではない場合が多くあります。
> 例えば、スパムメールには、「あの言葉が入っていれば、この言葉も入っている」ということが多いので、
> 言葉は独立な関係ではありません。
> にも関わらず、単純ベイズ分類器は非常に正しく分類が実行できてしまうようです。

## その３
> 今回取り上げるのは、よく使われていて実装も簡単、しかも高速というナイーブベイズです。
> 精度評価のベースラインとしてよく使われてます。

ゼロ頻度問題
未知の文書のカテゴリを予測する際、訓練データのボキャブラリに含まれない単語を1つでも含んでいると
単語の条件付き確率は0となり、単語の条件付き確率の積で表される確率も0となる

# その４
* 長所
    * 単純(実装も簡単)かつ強力
    * とても大きなデータセットに対しても有効
    * 高速で計算資源も少なくてよい
    * 少ないトレーニングデータでも性能が出る
    * 重要でない特徴量の影響を受けにくい
* 短所
    * 各特徴量が独立であると仮定しなければならない(実データでは成り立たないことも多い)
* 応用先
    * リアルタイムでの処理、テキスト分類

## その５　短所について
> つまり各特徴量が独立に推定結果に影響します。
> これはとても強い仮定で、実データでは成り立たないことも多いです。
> 実はこれがNaiveと名前につく所以でもあるのですが、
> その強い仮定(制約)にもかかわらず、この仮定が成り立たないであろう実データでも、
> 驚くほどよい結果を出すというのがこのアルゴリズムの優秀な点です。
「とりあえずナイーブベイズでテストしてみよう」と考えたくなる

テキスト分類の場合、特徴量は単語の頻度になるので、確率は多項分布やベルヌーイ分布
正規分布ではない

## その６
分類/回帰の基本がそれぞれ、ナイーブベイズと線形回帰らしい  
どちらも、最適化するべきハイパーパラメータが存在しない  

Q.ナイーブベイズはガウス関数使うなら、パラメータはあるのでは？  
A.自動的に決まるらしい  
https://datachemeng.com/naivebayesclassifier/
> yのクラスごとに、説明変数Xごとに、データセットから平均μ(xi,y)標準偏差σ(xi,y)を計算


# 参考文献
* 単純ベイズ分類器 (ナイーブベイズ, Naive Bayes Classifier) でクラス分類  
    https://datachemeng.com/naivebayesclassifier/
* ベイズの定理とは？ナイーブベイズを利用した自動FAQシステムの構築  
    https://ai-kenkyujo.com/2018/03/23/faq/
* https://ja.wikipedia.org/wiki/%E5%8D%98%E7%B4%94%E3%83%99%E3%82%A4%E3%82%BA%E5%88%86%E9%A1%9E%E5%99%A8
* https://dev.classmethod.jp/machine-learning/naivebaise_zakkurimatome_/
* https://avinton.com/academy/naive-bayes/
* ナイーブベイズ分類器を頑張って丁寧に解説してみる  
    https://qiita.com/aflc/items/13fe52243c35d3b678b0
* ナイーブベイズについて勉強したのでざっくりまとめ  
    https://dev.classmethod.jp/machine-learning/naivebaise_zakkurimatome_/
* 機械学習アルゴリズム〜単純ベイズ法〜   
    http://rtokei.tech/machine-learning/機械学習アルゴリズム〜単純ベイズ法〜/
* ナイーブベイズを用いたテキスト分類  
    http://aidiary.hatenablog.com/entry/20100613/1276389337
* 機械学習入門者向け Naive Bayes(単純ベイズ)アルゴリズムに触れてみる  
    https://avinton.com/academy/naive-bayes/
