Skip to content

stq-hydra/physics-questions

 
 

Repository files navigation

physics-questions(基础版)

目标

主要目标是对物理试题进行多标记分类(一个题目可能同时对应多个知识点)。一方面希望通过算法能够实现给物理试题自动预测出相应的标签,从而达到减少人工标注的成本;另一方面希望能够根据学生的自身的学习情况,对其薄弱的知识点推荐相应的试题,达到一个强化训练提升能力的过程。

需安装的库:

anaconda
gensim
scikit-multilearn
tensorflow

项目描述:

对高中物理试题进行多标记分类,因为每道物理试题都同时对应多个标签,因此是一个多标签分类的问题。

采用的方法:

1、采用了scikit-multilearn中的一些多标记分类的方法,如BR、LP、rakelo及rakeld等等。
2、利用主题模型LDA、LSA找出最近的样例,然后再根据最近样例标签也应该类似的原理推断出标签。
3、利用word2vec、doc2vec把文本转换成向量的形式对文本进行分类。
4、结合tensorflow利用深度学习的一些方法textcnn对数据进行探索。

About

高中物理试题多标记分类

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages

  • Python 100.0%