## Naive Bayes
### GaussianNB
高斯朴素贝叶斯（GaussianNB）

**参数:**
 - priors:array-like of shape (n_classes,);该类的先验概率。如果指定，则先验数据不会根据数据进行调整。
 - var_smoothing:float, 默认=1e-9;所有特征的最大方差部分，已添加到方差中以提高计算稳定性。

In [2]:
import numpy as np
X = np.array([[-1, -1], [-2, -1], [-3, -2], [1, 1], [2, 1], [3, 2]])
Y = np.array([1, 1, 1, 2, 2, 2])
from sklearn.naive_bayes import GaussianNB
clf = GaussianNB()
clf.fit(X, Y)

GaussianNB(priors=None, var_smoothing=1e-09)

In [3]:
print(clf.predict([[-0.8, -1]]))

[1]


In [4]:
clf_pf = GaussianNB()
clf_pf.partial_fit(X, Y, np.unique(Y))

GaussianNB(priors=None, var_smoothing=1e-09)

In [5]:
print(clf_pf.predict([[-0.8, -1]]))

[1]


### MultinomialNB

朴素贝叶斯分类器用于多项模型

多项式朴素贝叶斯分类器适用于具有离散特征的分类（例如，用于文本分类的字数统计）。多项式分布通常需要整数特征计数。但是，实际上，小数计数（例如tf-idf）也可能起作用。

**参数:**
 - alpha:float, 默认=1.0;添加（拉普拉斯/利兹通）平滑参数（0表示不平滑）。
 - fit_prior:bool, 默认=True;是否学习类的先验概率。如果为False，将使用统一的先验。
 - class_prior:array-like of shape (n_classes,), 默认=None;该类的先验概率。如果指定，则先验数据不会根据数据进行调整。

In [6]:
import numpy as np
rng = np.random.RandomState(1)
X = rng.randint(5, size=(6, 100))
y = np.array([1, 2, 3, 4, 5, 6])
from sklearn.naive_bayes import MultinomialNB
clf = MultinomialNB()
clf.fit(X, y)

MultinomialNB(alpha=1.0, class_prior=None, fit_prior=True)

In [7]:
print(clf.predict(X[2:3]))

[3]


### 补码朴素贝叶斯
ComplementNB实现补码朴素贝叶斯（CNB）算法。CNB是标准多项式朴素贝叶斯（MNB）算法的改编，特别适合于不平衡数据集。具体来说，CNB使用来自每个类的补充的统计信息来计算模型的权重。CNB的发明人凭经验表明，CNB的参数估计比MNB的参数估计更稳定。此外，CNB在文本分类任务上通常胜过MNB（通常有相当大的优势）

**参数:**
 - alpha:float, 默认=1.0;添加（拉普拉斯/利兹通）平滑参数（0表示不平滑）。
 - fit_prior:bool, 默认=True;仅在训练集中只有一个类的情况下使用.
 - class_prior:array-like of shape (n_classes,), 默认=None;该类的先验概率。不曾使用。
 - norm bool，默认= False；是否执行权重的第二标准化。默认行为反映了Mahout和Weka中的实现，这些实现未遵循本文表9中描述的完整算法。

In [8]:
import numpy as np
rng = np.random.RandomState(1)
X = rng.randint(5, size=(6, 100))
y = np.array([1, 2, 3, 4, 5, 6])
from sklearn.naive_bayes import ComplementNB
clf = ComplementNB()
clf.fit(X, y)

ComplementNB(alpha=1.0, class_prior=None, fit_prior=True, norm=False)

In [9]:
print(clf.predict(X[2:3]))

[3]


## 伯努利朴素贝叶斯
朴素贝叶斯分类器用于多元伯努利模型。像MultinomialNB一样，此分类器适用于离散数据。区别在于，虽然MultinomialNB可处理出现次数，但BernoulliNB是为二进制/布尔型功能而设计的。

**参数:**
 - alpha:float, 默认=1.0;添加（拉普拉斯/利兹通）平滑参数（0表示不平滑）。
 - binarize：float or None, 默认为0.0；用于将样本特征二值化（映射为布尔值）的阈值。如果为None，则假定输入已经由二进制向量组成。
 - fit_prior:bool, 默认=True;是否学习类的先验概率。如果为False，将使用统一的先验。
 - class_prior:array-like of shape (n_classes,), 默认=None;该类的先验概率。如果指定，则先验数据不会根据数据进行调整。

In [12]:
import numpy as np
rng = np.random.RandomState(1)
X = rng.randint(5, size=(6, 100))
Y = np.array([1, 2, 3, 4, 4, 5])
from sklearn.naive_bayes import BernoulliNB
clf = BernoulliNB()
clf.fit(X, Y)

BernoulliNB(alpha=1.0, binarize=0.0, class_prior=None, fit_prior=True)

In [13]:
print(clf.predict(X[2:3]))

[3]


## CategoricalNB
朴素贝叶斯分类器的分类特征朴素贝叶斯分类器分类器适用于具有离散分布的离散特征的分类。每个要素的类别均来自分类分布。

**参数:**
 - alpha:float, 默认=1.0;添加（拉普拉斯/利兹通）平滑参数（0表示不平滑）。
 - fit_prior:bool, 默认=True;是否学习类的先验概率。如果为False，将使用统一的先验。
 - class_prior:array-like of shape (n_classes,), 默认=None;该类的先验概率。如果指定，则先验数据不会根据数据进行调整。

In [10]:
import numpy as np
rng = np.random.RandomState(1)
X = rng.randint(5, size=(6, 100))
y = np.array([1, 2, 3, 4, 5, 6])
from sklearn.naive_bayes import CategoricalNB
clf = CategoricalNB()
clf.fit(X, y)

CategoricalNB(alpha=1.0, class_prior=None, fit_prior=True)

In [11]:
print(clf.predict(X[2:3]))

[3]
