wiki.es.vec 官方提供的西班牙语预训练的词向量,数据太大未包含。 es_source.csv 官方提供的英语问句对的西班牙语的翻译结果,20000条。 es_target.csv 官方提供的西班牙语问句对,1400条。 es_test.csv 测试集,需要预测的西班牙语问句对。 es.vec 实验中用到的西班牙语的pre trained embeddings,即根据训练集和测试集里面的词语从wiki.es.vec抽取出的词向量。