In [1]:
import numpy as np
import torch
from torch import nn, optim
import torch.nn.functional as F

import sys
sys.path.append("..") 
import d2lzh_pytorch as d2l


device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')

In [2]:

# 加载数据

(corpus_indices, 
 char_to_idx, 
 idx_to_char, 
 vocab_size) = d2l.load_data_jay_lyrics()


num_inputs = vocab_size
num_hiddens = 256
num_outputs = vocab_size

In [3]:

# 参数配置

num_epochs = 240
num_steps = 35
batch_size = 32
lr = 1e2
clipping_theta = 1e-2


pred_period = 40
pred_len = 50
prefixes = ['分开', '不分开']

In [4]:

# GRU
gru_layer = nn.GRU(input_size=vocab_size, hidden_size=num_hiddens)


# 模型
model = d2l.RNNModel(gru_layer, vocab_size).to(device)

In [6]:

# 训练
d2l.train_and_predict_rnn_pytorch(model, num_hiddens, vocab_size, device,
                                  corpus_indices, idx_to_char, char_to_idx,
                                  num_epochs, num_steps, 
                                  lr, clipping_theta,batch_size, 
                                  pred_period, 
                                  pred_len, 
                                  prefixes)

epoch 40, perplexity inf, time 0.02 sec
 - 分开始移惚惚惚惚惚惚惚惚惚惚惚惚惚惚惚惚惚惚惚惚惚惚惚惚惚惚惚惚惚惚惚惚惚惚惚惚惚惚惚惚惚惚惚惚惚惚惚惚
 - 不分开眼睛邻居土刻垂箱箱箱箱箱箱箱箱箱箱箱箱箱箱箱箱箱箱箱箱箱箱箱箱箱箱箱箱箱箱箱箱箱箱箱箱箱箱箱箱箱箱箱
epoch 80, perplexity inf, time 0.02 sec
 - 分开始移伦伦布箱螂箱弥伦伦箱螂弥箱刻芜芜芜芜芜芜芜芜子子她经中笑常子功子子子子她经口写入子注萨入子注托活
 - 不分开眼睛音脉萨脉箱螂箱螂箱螂箱螂箱螂箱螂箱螂箱箱螂箱螂箱螂箱螂箱螂箱螂箱箱螂箱螂箱螂箱螂箱螂箱螂箱箱螂箱
epoch 120, perplexity inf, time 0.02 sec
 - 分开始移游刺螂箱螂箱蛛游游游游缝缝缝缝缝缝缝缝缝缝缝缝缝缝缝缝缝缝缝缝缝缝缝缝缝缝缝缝缝缝缝缝缝缝缝缝缝
 - 不分开眼睛奇桌缝缝缝缝缝箱缝箱箱箱箱箱箱箱箱箱箱箱箱箱箱箱箱箱箱箱箱箱箱箱箱箱箱箱箱箱箱箱箱箱箱箱箱箱箱箱
epoch 160, perplexity inf, time 0.02 sec
 - 分开始乡情迷蛛怎么生活闭型字羞芜芜缝芜芜芜芜歉子子子子了很久哭泣生活闭红日裂子子子子子子子子子子子子子子
 - 不分开球习惯缝缝缝箱箱箱缝箱沼箱箱箱箱箱箱箱箱箱箱箱箱箱箱箱箱箱箱箱箱箱箱箱箱箱箱箱箱箱箱箱箱箱箱箱箱箱箱
epoch 200, perplexity inf, time 0.02 sec
 - 分开始移游优螂歉芜芜芜芜芜芜布箱布布布布布布布透运经猜透是蝙伦里轻比透是童萨琳是狼如蜘蛛逗子样经猜译游游
 - 不分开球习惯缝缝缝缝箱缝箱箱螂箱箱歉箱螂缝箱缝缝箱螂箱箱缝箱箱螂箱箱缝箱箱螂箱箱缝箱箱螂箱箱缝箱箱螂箱箱缝
epoch 240, perplexity inf, time 0.02 sec
 - 分开始移游优译箱螂箱弥子子译子注歉缝伦缝下午三点勉缝歉歉歉歉缝箱螂箱歉歉歉歉歉歉歉歉歉歉歉歉歉歉歉歉歉歉
 - 不分开球习惯缝缝缝箱箱箱螂箱螂箱箱箱箱箱箱箱箱箱箱箱箱箱箱箱箱箱箱箱箱箱箱箱箱箱箱箱箱箱箱箱箱箱箱箱箱箱箱


## 小结

* 门控循环神经网络可以更好地捕捉时间序列中时间步距离较大的依赖关系。
* 门控循环单元引入了门的概念，从而修改了循环神经网络中隐藏状态的计算方式。它包括重置门、更新门、候选隐藏状态和隐藏状态。
* 重置门有助于捕捉时间序列里短期的依赖关系。
* 更新门有助于捕捉时间序列里长期的依赖关系。