Skip to content

shawn-wick/the-wheel

Repository files navigation

the-wheel

专利主题提取和基于文本相似度的专利推推荐 专利主题提取和基于文本相似度的专利推推荐

专利分析代码提供短文本主题提取功能 采用改进的LDA主题模型 通过对专利语料进行处理,进行专利的词向量训练,基于Kmeans进行专利词汇的聚类,并且采用一种根据聚类中心按照重叠字符和重叠相似词集的方法进行词聚类结果的筛选和重新优化 通过将词类的标签替换原始词语 将原始 通过将词类的标签替换原始词语,变词袋为标签袋

通过将词类的标签替换原始词语然后进行专利的LDA训练,以提高模型的主题挖掘效果

Releases

No releases published

Packages

No packages published

Languages