Democratizing Reinforcement Learning Models

（神经网络+决策树+支持向量机+随机森林+朴素贝叶斯+强化学习）的综合模型

思想：秉承智者共治的理念，我们致力于降低训练成本，使得即使没有强大的GPU设备的组织或个人也能够使用AI技术。为此，我们训练了5个人工智能分类模型，并通过与环境（即人类）互动，使每个模型获得相应的话语权重。最初，我们给予训练时间最长的神经网络模型最高的权重，即0.6，而其他模型则为0.1。最后，我们采用强化学习的方法对每个模型的话语权重进行优化。

首先，我要感谢word2vec的中文预训练模型(wiki_word2vec_50.bin)，它为我们的工作提供了重要的基础。
其次，我们构建了五种模型，包括朴素贝叶斯、决策树、随机森林、支持向量机以及基于BiLSTM-attention的神经网络模型。其中，基于BiLSTM-attention的神经网络模型是一种将双向长短期记忆网络（Bidirectional LSTM）和注意力机制（Attention）结合在一起的模型。
最后，我们采用了Q-learning算法进行强化学习，通过与用户的交互不断调整权重，以提高评论分类模型的性能和准确性。在每次预测后，根据用户的反馈更新权重，并使用学习率和折扣因子来平衡奖励的重要性。通过利用多个模型和动态权重调整的方式，我们实现了更准确的评论分类。

项目文件介绍：

1. 关于神经网络（nn）：

nn_Config.py：有神经网络相关的配置信息。
nn_DataProcess.py：运行此文件可以获得此项目会用到的.txt文件。
nn_main.ipynb：可以得到模型。

2. 关于朴素贝叶斯（Bayes）：

Bayes_Config.py :配置信息
Bayes_DataProcess.py：数据预处理
Bayes_main.ipynb：训练模型
test_bayes.ipynb：测试模型

3. 关于随机森林（RandomForest）：

RandomForest_Config.py：配置信息
RandomForest_DataProcess.py：数据预处理
RandomForest_main.ipynb：训练模型
test_randomForest.ipynb：测试模型

4. 关于支持向量机（SVM）：

SVM_Config.py：配置信息
SVM_DataProcess.py：数据预处理
SVM_main.ipynb：训练模型
test_svm.ipynb：测试模型

5. 关于决策树（DecisionTree）：

DecisionTree_Config.py：配置信息
DecisioTree_DataProcess.py：数据预处理
DecisionTree_main.ipynb：训练模型
test_decisionTree.ipynb：测试模型

6. ml_predict.py：

朴素贝叶斯，随机森林，支持向量机，决策树的预测逻辑。

7. nn_predict.py

神经网络的预测逻辑。

8. 关于强化学习

policy_Q.py：使用强化学习的思想，通过跟人类交互，优化每个模型的话语权权重。

ps：本项目参考了搜索引擎，网友们分享的代码。感谢这个万物开源的时代和精神！

Name		Name	Last commit message	Last commit date
Latest commit History 30 Commits
.idea		.idea
Bayes		Bayes
DecisionTree		DecisionTree
RandomForest		RandomForest
SVM		SVM
images		images
nn		nn
word2vec_data		word2vec_data
README.md		README.md
ml_predict.py		ml_predict.py
test_nn.ipynb		test_nn.ipynb
weights.txt		weights.txt
weights_Q.txt		weights_Q.txt

JunhaoCai/Democratizing-Reinforcement-Learning-Models

Folders and files

Latest commit

History

Repository files navigation

Democratizing Reinforcement Learning Models

（神经网络+决策树+支持向量机+随机森林+朴素贝叶斯+强化学习）的综合模型

项目文件介绍：

1. 关于神经网络（nn）：

2. 关于朴素贝叶斯（Bayes）：

3. 关于随机森林（RandomForest）：

4. 关于支持向量机（SVM）：

5. 关于决策树（DecisionTree）：

6. ml_predict.py：

7. nn_predict.py

8. 关于强化学习

About

Resources

Stars

Watchers

Forks

Languages