document_vector 训练用的语料库是维基百科的zhwiki-latest-pages-articles.xml.bz2 word2vec是用gensim训练的词库 docSimilarity是分别用word2vec、doc2vec计算的文本相似度 doc_sim_word.py -> word2vec doc_sim_doc.py -> doc2vec