Skip to content

Luckyoranges/031802531

Repository files navigation

第一次个人编程作业

2020.9.17

主程序是main.py,三个参数分别是待比较的两个文本路径和答案文件的路径

实现思想是以TF为权重生成文本的特征向量,然后通过计算余弦相似度来比较两个文本的相似度

stopword.py看起来是不是很可怕(ˉ▽ˉ;)...

作业要求不允许尝试读写其他文件,我也很无奈呀,停用词表不用也不行,只能强行把它放到代码里面了......

还没有考虑到零向量的模长作为除数的异常情况,稍后会补上

About

The task of SE.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages