CUDA Optimized Simple Recurrent Unit (SRU)

Training RNNs as Fast as CNNs

Todo

Requirements

Chainer 2+
CuPy
Python 2 or 3

Language Modeling

Penn Treebank

cd examples/ptb
python3 train.py -b 32 -nf 128 -l 35 -opt msgd -lr 1 -g 0 -e 300 -lrd 30 -nl 2 -m 128x2.hdf5 -dos 0.5 -dor 0.2 -tanh
python3 train.py -b 32 -nf 320 -l 35 -opt msgd -lr 1 -g 0 -e 300 -lrd 30 -nl 2 -m 320x2.hdf5 -dos 0.5 -dor 0.2 -tanh

Model	#layers	d	Perplexity
LSTM	2	640	89
SRU	2	640	92
SRU	2	320	92
LSTM	2	320	93
SRU	2	128	110
LSTM	2	128	117

Name		Name	Last commit message	Last commit date
Latest commit History 81 Commits
benchmark		benchmark
examples/ptb		examples/ptb
sru		sru
.gitignore		.gitignore
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

benchmark

benchmark

examples/ptb

examples/ptb

sru

sru

.gitignore

.gitignore

README.md

README.md

Repository files navigation

CUDA Optimized Simple Recurrent Unit (SRU)

Todo

Requirements

Language Modeling

Penn Treebank

Benchmark

About

Releases

Packages

Languages

BenJamesbabala/chainer-sru

Folders and files

Latest commit

History

Repository files navigation

CUDA Optimized Simple Recurrent Unit (SRU)

Todo

Requirements

Language Modeling

Penn Treebank

Benchmark

About

Resources

Stars

Watchers

Forks

Languages