使用Gensim框架,根据摘要(abstract)和标题(title)来实现主题算法
pip install pyunit-topicmodel
> topic -h
usage: 主题模型
输入主题模型需要的参数
positional arguments:
{train,predict} 选择程序模式
optional arguments:
-h, --help show this help message and exit
-d D 保存结果的文件夹
训练:
训练模型参数
-p P 加载分析的数据路径
-a A 摘要列名
-t T 标题列名
-r R R 主题数取值范围:至少是1
预测:
预测模型参数
-k K 预测主题数
topic train -p 专利-医学其他领域.xlsx -a abo -t tio -d data -r 10 67
topic predict -d data -k 40