In [2]:
#GRU
import d2lzh as d2l
from mxnet import nd
from mxnet.gluon import rnn
import zipfile

#加载数据集
def load_data_jay_lyrics():
    """Load the Jay Chou lyric data set (available in the Chinese book)."""
    with zipfile.ZipFile('./data/jaychou_lyrics.txt.zip') as zin:
        with zin.open('jaychou_lyrics.txt') as f:
            corpus_chars = f.read().decode('utf-8')
    corpus_chars = corpus_chars.replace('\n', ' ').replace('\r', ' ')
    corpus_chars = corpus_chars[0:10000]
    idx_to_char = list(set(corpus_chars))
    char_to_idx = dict([(char, i) for i, char in enumerate(idx_to_char)])
    vocab_size = len(char_to_idx)
    corpus_indices = [char_to_idx[char] for char in corpus_chars]
    return corpus_indices, char_to_idx, idx_to_char, vocab_size

(corpus_indices,char_to_idx,idx_to_char,vocab_size) = load_data_jay_lyrics()

In [10]:
num_inputs, num_hiddens, num_outputs = vocab_size,256,vocab_size
ctx = d2l.try_gpu()

#数据初始化
def get_params():
    def _one(shape):
        return nd.random.normal(scale=0.01,shape=shape,ctx=ctx)
    
    def _three():
        return (_one((num_inputs,num_hiddens)),
                _one((num_hiddens,num_hiddens)),
                nd.zeros(num_hiddens,ctx = ctx))
    
    W_xz, W_hz,b_z = _three()    #更新门参数
    W_xr, W_hr, b_r = _three()   #重置门参数
    W_xh, W_hh, b_h = _three()   #候选隐藏状态参数
    
    #输出层
    W_hq = _one((num_hiddens,num_outputs))
    b_q = nd.zeros(num_outputs,ctx = ctx)
    
    #梯度
    params = [W_xz, W_hz, b_z, W_xr, W_hr, b_r, W_xh, W_hh, b_h, W_hq, b_q]
    
    for param in params:
        param.attach_grad()
    return params


In [11]:
def init_gru_state(batch_size,num_hiddens,ctx):    #初始化隐藏状态
    return (nd.zeros(shape=(batch_size,num_hiddens),ctx=ctx),)


In [12]:
#gru模型
def gru(inputs,state,params):
    W_xz, W_hz, b_z, W_xr, W_hr, b_r, W_xh, W_hh, b_h, W_hq, b_q = params
    H, = state
    outputs = []
    for X in inputs:
        Z = nd.sigmoid(nd.dot(X,W_xz)+nd.dot(H,W_hz)+b_z)  #更新门
        R = nd.sigmoid(nd.dot(X,W_xr)+nd.dot(H,W_hr)+b_r)  #重置门
        H_tilda = nd.tanh(nd.dot(X,W_xh)+nd.dot(R*H,W_hh)+b_h)   #候选
        H = Z*H + (1-Z) * H_tilda     #隐藏状态
        Y = nd.dot(H,W_hq) + b_q
        outputs.append(Y)
    return outputs,(H,)

In [13]:
num_epochs, num_steps, batch_size, lr, clipping_theta = 160, 35, 32, 1e2, 1e-2
pred_period, pred_len, prefixes = 40, 50, ['天空', '漂泊']


In [14]:
d2l.train_and_predict_rnn(gru, get_params, init_gru_state, num_hiddens,
                            vocab_size, ctx, corpus_indices, idx_to_char,
                            char_to_idx, False, num_epochs, num_steps, lr,
                            clipping_theta, batch_size, pred_period, pred_len,
                            prefixes)


epoch 40, perplexity 150.373859, time 0.57 sec
 - 天空 我想你 我想你 我想你 我想你 我想你 我想你 我想你 我想你 我想你 我想你 我想你 我想你 我
 - 漂泊 我想你 我想你 我想你 我想你 我想你 我想你 我想你 我想你 我想你 我想你 我想你 我想你 我
epoch 80, perplexity 33.292408, time 0.63 sec
 - 天空 一直我有你想你的怒火 我想要你想 我不要再想 我不要再想 我不要再想 我不要再想 我不要再想 我不
 - 漂泊 一直我有你想你的怒火 我想要你想 我不要再想 我不要再想 我不要再想 我不要再想 我不要再想 我不
epoch 120, perplexity 6.007847, time 0.63 sec
 - 天空 一直走 我想就这样牵着你 别发好 心给我抬起  没有你烦我有多 难发你的话快幽默 想要 你想很久了
 - 漂泊 一直到 你想就这样着着我 别发抖 快给我抬起头 有话去对医药箱说 别怪我 别怪我 说你怎么不舍 我
epoch 160, perplexity 1.768623, time 0.75 sec
 - 天空一直到一个a 想要和一只两著 折像的假动妈 帅呆了我 全场盯人防守 篮下禁区游走 快什么 干什么 干
 - 漂泊 一个我遇见你是一场悲剧 我想我这辈子注定一个人演戏 最后再一个人慢慢的回忆 没有了过去 我将往事抽
