CodenameCYS / fasttext_exp Public

Notifications You must be signed in to change notification settings
Fork 0
Star 0

这一项目用于对fasttext模型做一些基本的测试实验

0 stars 0 forks Branches Tags Activity

Notifications

Name		Name	Last commit message	Last commit date
Latest commit History 16 Commits
data		data
log		log
README.md		README.md
data_processor.py		data_processor.py
fastText_exp.py		fastText_exp.py
pytorch_exp.py		pytorch_exp.py
pytorch_exp_v2_1.py		pytorch_exp_v2_1.py
pytorch_exp_v2_2.py		pytorch_exp_v2_2.py
requirements.txt		requirements.txt
tensorflow_exp.py		tensorflow_exp.py
模型效果测试.ipynb		模型效果测试.ipynb

Repository files navigation

fasttext_exp

这一项目用于对fasttext模型做一些基本的测试实验

fasttext_exp

1. 数据文件

这里，我们采用imdb电影评论打分数据作为我们的训练以及测试语料。

我们将已下载好的imdb数据包放于data目录下，使用时请自行解压。

2. 数据处理脚本

给出数据处理脚本如下：

data_processor.py

该文件生成fasttext与tensorflow的训练数据，分别存储与fasttext与tensorflow目录下。

3. fastText实验

使用fasttext库进行的fasttext分类模型训练的代码为：

fastText_exp.py

实验结果保存于fasttext_exp.log文件下。

4. tensorflow实验

使用tensorflow自行写作的fasttext分类模型训练的代码为：

tensorflow_exp.py

实验结果保存于tensorflow_exp.log文件下。

5. pytorch实验

使用pytorch自行写作的fasttext分类模型训练的代码为：

pytorch_exp.py

实验结果保存于pytorch_exp.log文件下。

6. 不同cross entropy定义下的模型收敛性实验

这里，我们考虑两种“cross entropy”定义下模型的收敛性实验。

其中，两种定义分别如下：

真实的cross entropy

$$L = -\sum_{i}p(x_i) \cdot log(q(x_i))$$
虚假的cross entropy

$$L = -\sum_{i}(p(x_i) \cdot log(q(x_i)) + (1-p(x_i)) \cdot log(1- q(x_i)))$$

实验代码如下：

实验结果显示在notebook文件模型效果测试.ipynb当中。

更具体的cross entropy分析详见我的相关博客：NLP笔记：浅谈交叉熵（cross entropy）。

About

这一项目用于对fasttext模型做一些基本的测试实验

Report repository

Releases

No releases published

Packages

No packages published

Languages