Attention is all you need, Vaswani+, arXiv'17 #245

AkihikoWatanabe · 2018-01-19T01:30:47Z

AkihikoWatanabe · 2018-01-19T01:31:52Z

新しい翻訳モデル(Transformer)を提案。既存のモデルよりも並列化に対応しており、短時間の訓練で（既存モデルの1/4以下のコスト）高いBLEUスコアを達成した。
TransformerはRNNやCNNを使わず、attentionメカニズムに基づいている。

（解説より）

AkihikoWatanabe · 2021-05-24T10:48:39Z

AkihikoWatanabe · 2021-05-24T13:21:11Z

Transformerの各コンポーネントでのoutputのshapeや、attention_maskの形状、実装について記述されており有用:
https://qiita.com/FuwaraMiyasaki/items/239f3528053889847825

AkihikoWatanabe · 2023-05-11T08:13:37Z

集合知

AkihikoWatanabe added Neural MachineTranslation NLP labels Jan 19, 2018

AkihikoWatanabe mentioned this issue May 25, 2021

BERT入門 #332

Open

Provide feedback