Skip to content

这一项目用于对fasttext模型做一些基本的测试实验

Notifications You must be signed in to change notification settings

CodenameCYS/fasttext_exp

Repository files navigation

fasttext_exp

这一项目用于对fasttext模型做一些基本的测试实验

1. 数据文件

这里,我们采用imdb电影评论打分数据作为我们的训练以及测试语料。

我们将已下载好的imdb数据包放于data目录下,使用时请自行解压。

2. 数据处理脚本

给出数据处理脚本如下:

该文件生成fasttext与tensorflow的训练数据,分别存储与fasttexttensorflow目录下。

3. fastText实验

使用fasttext库进行的fasttext分类模型训练的代码为:

实验结果保存于fasttext_exp.log文件下。

4. tensorflow实验

使用tensorflow自行写作的fasttext分类模型训练的代码为:

实验结果保存于tensorflow_exp.log文件下。

5. pytorch实验

使用pytorch自行写作的fasttext分类模型训练的代码为:

实验结果保存于pytorch_exp.log文件下。

6. 不同cross entropy定义下的模型收敛性实验

这里,我们考虑两种“cross entropy”定义下模型的收敛性实验。

其中,两种定义分别如下:

  1. 真实的cross entropy

    $$L = -\sum_{i}p(x_i) \cdot log(q(x_i))$$

  2. 虚假的cross entropy

    $$L = -\sum_{i}(p(x_i) \cdot log(q(x_i)) + (1-p(x_i)) \cdot log(1- q(x_i)))$$

实验代码如下:

  1. pytorch_exp_v2_1.py
  2. pytorch_exp_v2_2.py

实验结果显示在notebook文件模型效果测试.ipynb当中。

更具体的cross entropy分析详见我的相关博客:NLP笔记:浅谈交叉熵(cross entropy)

About

这一项目用于对fasttext模型做一些基本的测试实验

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published