Skip to content

Latest commit

 

History

History
13 lines (7 loc) · 553 Bytes

README.md

File metadata and controls

13 lines (7 loc) · 553 Bytes

第一次个人编程作业

2020.9.17

主程序是main.py,三个参数分别是待比较的两个文本路径和答案文件的路径

实现思想是以TF为权重生成文本的特征向量,然后通过计算余弦相似度来比较两个文本的相似度

stopword.py看起来是不是很可怕(ˉ▽ˉ;)...

作业要求不允许尝试读写其他文件,我也很无奈呀,停用词表不用也不行,只能强行把它放到代码里面了......

还没有考虑到零向量的模长作为除数的异常情况,稍后会补上