# 伯努利朴素贝叶斯模型实现天气预测

## 数据收集和分析

In [19]:
import numpy as np
X = np.array([
    [0,1,0,1],
    [1,1,1,0],
    [0,1,1,0],
    [0,0,0,1],
    [0,1,1,0],
    [0,1,0,1],
    [1,0,0,1]
])
y = np.array([0,1,1,0,1,0,0])
# 对不同分类计算每个特征值为1的数量
counts = {}
for label in np.unique(y):
    counts[label] = X[y==label].sum(axis=0)
print("feature counts:\n",counts)

feature counts:
 {0: array([1, 2, 0, 4]), 1: array([1, 3, 3, 0])}


- y为0分类时（没有下雨），有1天刮北风，有2天闷热，有0天多云，有4天报有雨
- y为1分类时（  有下雨），有1天刮北风，有3天闷热，有3天多云，有0天报有雨

## 创建伯努利朴素贝叶斯模型并进行天气预测

In [30]:
# 导入BernoulliNB类
from sklearn.naive_bayes import BernoulliNB
# 使用伯努利朴素贝叶斯模型拟合数据
clf = BernoulliNB()
clf.fit(X,y)
# 要进行预测的这一天，0刮北风，0闷热，1多云，0报有雨
next_day = [[0,0,1,0]]
pred_day = clf.predict(next_day)
if pred_day[0] == 1:
    print("预测有雨")
else:
    print("预测无雨")

预测有雨


In [31]:
# 模型预测分类概率
pred_prob = clf.predict_proba(next_day)
print("不下雨的概率是：",pred_prob[0,0])
print("会下雨的概率是：",pred_prob[0,1])

不下雨的概率是： 0.13848881010414352
会下雨的概率是： 0.8615111898958564


## 预测并分析预测结果

In [32]:
next_day1 = [[1,1,0,1]]
# 使用训练好的模型继续预测
pred_day1 = clf.predict(next_day1)
if pred_day1[0] == 1:
    print("预测有雨")
else:
    print("预测无雨")

预测无雨


In [33]:
# 模型预测分类概率
pred_prob1 = clf.predict_proba(next_day1)
print("不下雨的概率是：",pred_prob1[0,0])
print("会下雨的概率是：",pred_prob1[0,1])

不下雨的概率是： 0.92340878198688
会下雨的概率是： 0.07659121801311984


In [35]:
next_day2 = [[0,0,1,0],[1,1,0,1]]
# 使用训练好的模型继续预测
pred_day2 = clf.predict(next_day2)
print("未来两天下雨的预测结果为：",pred_day2)
# 模型预测分类概率
pred_prob2 = clf.predict_proba(next_day2)
print("未来两天下雨的预测分类概率为：\n",pred_prob2)

未来两天下雨的预测结果为： [1 0]
未来两天下雨的预测分类概率为：
 [[0.13848881 0.86151119]
 [0.92340878 0.07659122]]


# 高斯朴素贝叶斯模型实现连续值分类

## 准备数据集并用BernoullNB类进行分类

## 使用高斯朴素贝叶斯模型进行分类

# 多项式朴素贝叶斯模型实现离散特征分类

## 使用多项式朴素贝叶斯模型进行分类

## 将数值离散化处理后重新进行分类

# 估算个人收入等级

## 数据准备

## 将数据集进行转换并编码处理

## 使用高斯朴素贝叶斯模型进行建模

## 用模型进行预测