Convolutional Neural Networks for Sentence Classification (Yoon Kim)

1.模型架构

论文模型
使用tensorboard tensorboard --logdir=runs/1530857879
- 网络结构

2.实验

2.1 词向量

tf.contrib.learn.preprocessing.VocabularyProcessor
使用word2vec
改进后的网络结构如下：输入的每一个样本是一个56*300的向量

2.2 使用多个通道

方案：使用word2vec

2.3 在六个数据集上进行实验

Model	MR	SST-1	SST-2	Subj	TREC	CR	MPQA
CNN-rand
CNN-static
CNN-non-static
CNN-multichannel

3.使用GPU训练模型

4.模型扩展

4.1 Word2Vec的增量训练

目的：避免把全部的训练语料一次性载入到内存中。另一个原因是为了应对语料随时增加的情况。

4.2Word2Vec的分布式训练（基于spark mllib）

4.3 Word2Vec用于中文数据(分布式训练)

参考：

[1] gensim word2vec
[2] word2vec的分布式训练
[3] word2vec中文训练

Name		Name	Last commit message	Last commit date
Latest commit History 5 Commits
__pycache__		__pycache__
data/raw_data/rt-polaritydata		data/raw_data/rt-polaritydata
pictures		pictures
util		util
README.md		README.md
eval.py		eval.py
predict.py		predict.py
requires.txt		requires.txt
text_cnn.py		text_cnn.py
train.py		train.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

pycache

pycache

data/raw_data/rt-polaritydata

data/raw_data/rt-polaritydata

pictures

pictures

util

util

README.md

README.md

eval.py

eval.py

predict.py

predict.py

requires.txt

requires.txt

text_cnn.py

text_cnn.py

train.py

train.py

Repository files navigation

Convolutional Neural Networks for Sentence Classification (Yoon Kim)

1.模型架构

2.实验

2.1 词向量

2.2 使用多个通道

2.3 在六个数据集上进行实验

3.使用GPU训练模型

4.模型扩展

4.1 Word2Vec的增量训练

4.2Word2Vec的分布式训练（基于spark mllib）

4.3 Word2Vec用于中文数据(分布式训练)

参考：

About

Releases

Packages

Languages

damaohongtu/CNN-for-Sentence-Classification-in-Tensorflow

Folders and files

Latest commit

History

Repository files navigation

Convolutional Neural Networks for Sentence Classification (Yoon Kim)

1.模型架构

2.实验

2.1 词向量

2.2 使用多个通道

2.3 在六个数据集上进行实验

3.使用GPU训练模型

4.模型扩展

4.1 Word2Vec的增量训练

4.2Word2Vec的分布式训练（基于spark mllib）

4.3 Word2Vec用于中文数据(分布式训练)

参考：

About

Topics

Resources

Stars

Watchers

Forks

Languages