PyTorch Implementation of Monotonic Chunkwise Attention

Requirements

PyTorch 0.4

TODOs

Soft MoChA
Hard MoChA
Linear Time Decoding
Experiment with Real-world dataset

Model figure

Linear Time Decoding

It's not clear if authors' TF implementation supports decoding in linear time. They calculate energies for whole encoder outputs instead of scanning from previously attended encoder output.

References

Colin Raffel, Minh-Thang Luong, Peter J. Liu, Ron J. Weiss and Douglas Eck. Online and Linear-Time Attention by Enforcing Monotonic Alignments (ICML 2017)
Chung-Cheng Chiu and Colin Raffel. Monotonic Chunkwise Attention (ICLR 2018)

Name		Name	Last commit message	Last commit date
Latest commit History 11 Commits
imgs		imgs
Readme.md		Readme.md
attention.py		attention.py
decoder.py		decoder.py
test.py		test.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

PyTorch Implementation of Monotonic Chunkwise Attention

Requirements

TODOs

Model figure

Linear Time Decoding

References

About

Releases

Packages

Languages

j-min/MoChA-pytorch

Folders and files

Latest commit

History

Repository files navigation

PyTorch Implementation of Monotonic Chunkwise Attention

Requirements

TODOs

Model figure

Linear Time Decoding

References

About

Topics

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages