Skip to content

对输入input.txt文件进行停用词去除和分词到output.txt文件,通过modelLDA.py文件进行词矩阵并进行主题分割和相似文本的结合,重要难度是在于主题个数的确定以及相似度的确定,这直接影响了最终得到的结果

License

Notifications You must be signed in to change notification settings

donttal/LDA_Textsimilarities

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

5 Commits
 
 
 
 
 
 
 
 

Repository files navigation

LDA_Textsimilarities

对输入input.txt文件进行停用词去除和分词到output.txt文件,通过modelLDA.py文件进行词矩阵并进行主题分割和相似文本的结合,重要难度是在于主题个数的确定以及相似度的确定,这直接影响了最终得到的结果

About

对输入input.txt文件进行停用词去除和分词到output.txt文件,通过modelLDA.py文件进行词矩阵并进行主题分割和相似文本的结合,重要难度是在于主题个数的确定以及相似度的确定,这直接影响了最终得到的结果

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages