text_matching

文本匹配模型

本项目包含目前大部分文本匹配模型，持续更新中，其中论文解读请点击文本相似度，文本匹配模型归纳总结

数据集为QA_corpus，训练数据10w条，验证集和测试集均为1w条

其中对应模型文件夹下的args.py文件是超参数

训练： python train.py

测试： python test.py

词向量：不同的模型输入不一样，有的模型的输入只有简单的字向量，有的模型换成了字向量+词向量，甚至还有静态词向量(训练过程中不进行更新)和动态词向量(训练过程中更新词向量)，所有不同形式的输入均以封装好，调用方法如下

静态词向量，请执行 python word2vec_gensim.py，该版本是采用gensim来训练词向量

动态词向量，请执行 python word2vec.py，该版本是采用tensorflow来训练词向量，训练完成后会保存embedding矩阵、词典和词向量在二维矩阵的相对位置的图片，如果非win10环境，由于字体的原因图片可能保存失败

测试集结果对比：

以上测试结果可能不是模型的最优解，超参的选择也不一定是最优的，如果你想用到自己的实际工程中，请自行调整超参

Name		Name	Last commit message	Last commit date
Latest commit History 56 Commits
abcnn		abcnn
bimpm		bimpm
convnet		convnet
diin		diin
drcn		drcn
dssm		dssm
esim		esim
input		input
output		output
utils		utils
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
word2vec_dynamic.py		word2vec_dynamic.py
word2vec_static.py		word2vec_static.py

Provide feedback