加载数据集 <p>
使用到的是**`爵迹`**这本小说<p>
无论小说和电影都能给人很深刻的印象....

In [23]:
import os 
import numpy as np
import re

In [24]:
data_dir = './temp'
input_file = os.path.join(data_dir, "爵迹I II.txt")
if not os.path.exists(input_file): 
    print('请将郭小四的小说放到temp文件夹下....')  

In [25]:
with open(input_file, 'r',encoding = 'gbk') as f:
        data = f.read()

数据清理

In [26]:
pattern = re.compile('\[.*\]|<.*>|\.+|【|】| +|\\r|\\n')
text = pattern.sub('', data.strip()) 

In [27]:
data[500:800]

'而来？传说中至高无上的【白银祭司】又掌握着怎样的真相？这场旷世之战，究竟要将主角的命运引向王者的宝座，还是惨烈的死亡？\n\n    \n\n    序章  神遇\n\n    \n\n    漫天翻滚的碎雪，仿佛巨兽抖落的白色绒毛，纷纷扬扬地遮蔽着视线。\n\n    这块大陆的冬天已经来临。\n\n    南方只是开始不易察觉地降温，凌晨的时候窗棂上会看见霜花，但是在这里——大陆接近极北的尽头，已经是一望无际的苍茫肃杀。大块大块浮动在海面上的冰山彼此不时地撞击着，在天地间发出巨大的锐利轰鸣声，坍塌的冰块砸进大海，掀起白色的浪涛。辽阔的黑色冻土在接连几天的大雪之后，变成了一片茫茫的雪原。这已经是深北之地了，连绵不断'

### 词映射
给每次字符做索引，用一个数字索引来表示这个字符。

In [28]:
chars=list(set(data))
text_size, vocab_size = len(data), len(chars)
char_to_ix = { char:i for i, char in enumerate(chars) }
ix_to_char = { i:char for i, char in enumerate(chars) }

保存到本地方便调用

In [29]:
import pickle
with open('./temp/vocab.pickle','wb') as f:
    pickle.dump(char_to_ix,f)

定义配置参数

In [30]:
vocab_size = vocab_size
# 每个单词对应的隐藏层节点
hidden_size = 100
seq_length = 25
learning_rate = 1e-1

#### 初始化input $x_i$到隐藏层$h_t$的矩阵
因为input是一个onehot的向量，而onehot的维度由词汇库决定。</p>
所以input到隐藏层h的矩阵大小为 hidden_size*vocab_size
##### 注意 randn是生成正态分布的随机数，乘0.01是为了让随机数尽可能的接近0。这样做有2个好处：
1. 用小的数字，收敛会比较快
2. 如果随机数比较大，使用sigmoid类的激活函数会使得导数接近于0。导致梯度无法下降

In [31]:
Wxh = np.random.randn(hidden_size,vocab_size)*0.01

#### 初始化隐藏层$h_{t-1}$到隐藏层$h_t$的矩阵

In [32]:
Whh = np.random.randn(hidden_size,hidden_size)*0.01

#### 初始化隐藏层$h_{t}$到输出层$y_{t}$的矩阵

In [33]:
Why = np.random.randn(vocab_size,hidden_size)*0.01

#### 初始化2个偏置单元矩阵 一个是 input $x_i$到隐藏层$h_t$ 一个是隐藏层$h_{t}$到输出层$y_{t}$

In [34]:
bh = np.zeros((hidden_size,1))
by = np.zeros((vocab_size,1))

### 准备完毕，开始搭建网络
* 输入和输出都是由数字索引组成的列表 
* hprev 就是$h_{t-1}$
* 返回loss和更新过的模型参数，和$h_{t-1}$

In [35]:
def lossFun(inputs, targets, hprev):
  
  xs, hs, ys, ps = {}, {}, {}, {}
  hs[-1] = np.copy(hprev)
  loss = 0
  # 前向传播
  for t in range(len(inputs)):
    # one-hot编码
    xs[t] = np.zeros((vocab_size,1)) 
    xs[t][inputs[t]] = 1
    
    # 公式一模一样    h(t) = Wx+Uh(t-1)+b
    hs[t] = np.tanh(np.dot(Wxh, xs[t]) + np.dot(Whh, hs[t-1]) + bh) 
    
    # 隐藏层到输出层  
    ys[t] = np.dot(Why, hs[t]) + by 
    ps[t] = np.exp(ys[t]) / np.sum(np.exp(ys[t])) 
    
    # 使用 交叉熵作为loss函数
    loss += -np.log(ps[t][targets[t],0]) 
  
  # 反向传播
  dWxh, dWhh, dWhy = np.zeros_like(Wxh), np.zeros_like(Whh), np.zeros_like(Why)
  dbh, dby = np.zeros_like(bh), np.zeros_like(by)
  dhnext = np.zeros_like(hs[0])
  for t in reversed(range(len(inputs))):
    dy = np.copy(ps[t])
    dy[targets[t]] -= 1 
    dWhy += np.dot(dy, hs[t].T)
    dby += dy
    dh = np.dot(Why.T, dy) + dhnext 
    dhraw = (1 - hs[t] * hs[t]) * dh 
    dbh += dhraw
    dWxh += np.dot(dhraw, xs[t].T)
    dWhh += np.dot(dhraw, hs[t-1].T)
    dhnext = np.dot(Whh.T, dhraw)
  for dparam in [dWxh, dWhh, dWhy, dbh, dby]:
    np.clip(dparam, -5, 5, out=dparam) 
  return loss, dWxh, dWhh, dWhy, dbh, dby, hs[len(inputs)-1]

In [38]:
def sample(h, seed_ix, n):
  """ 
  抽样，生成文本。
  """
  x = np.zeros((vocab_size, 1))
  x[seed_ix] = 1
  ixes = []
  for t in range(n):
    h = np.tanh(np.dot(Wxh, x) + np.dot(Whh, h) + bh)
    y = np.dot(Why, h) + by
    p = np.exp(y) / np.sum(np.exp(y))
    ix = np.random.choice(range(vocab_size), p=p.ravel())
    x = np.zeros((vocab_size, 1))
    x[ix] = 1
    ixes.append(ix)
  return ixes

In [None]:
n, p = 0, 0
mWxh, mWhh, mWhy = np.zeros_like(Wxh), np.zeros_like(Whh), np.zeros_like(Why)
mbh, mby = np.zeros_like(bh), np.zeros_like(by) 
smooth_loss = -np.log(1.0/vocab_size)*seq_length 
while True:
  # prepare inputs (we're sweeping from left to right in steps seq_length long)
  if p+seq_length+1 >= len(data) or n == 0: 
    hprev = np.zeros((hidden_size,1)) # reset RNN memory
    p = 0 # go from start of data
  inputs = [char_to_ix[ch] for ch in data[p:p+seq_length]]
  targets = [char_to_ix[ch] for ch in data[p+1:p+seq_length+1]]

  # sample from the model now and then
  if n % 100 == 0:
    sample_ix = sample(hprev, inputs[0], 200)
    txt = ''.join(ix_to_char[ix] for ix in sample_ix)
    print('----\n %s \n----' % (txt, ))

  # forward seq_length characters through the net and fetch gradient
  loss, dWxh, dWhh, dWhy, dbh, dby, hprev = lossFun(inputs, targets, hprev)
  smooth_loss = smooth_loss * 0.999 + loss * 0.001
  if n % 100 == 0: print ('iter %d, loss: %f' % (n, smooth_loss)) # print progress
  
  # 优化器
  for param, dparam, mem in zip([Wxh, Whh, Why, bh, by], 
                                [dWxh, dWhh, dWhy, dbh, dby], 
                                [mWxh, mWhh, mWhy, mbh, mby]):
    mem += dparam * dparam
    param += -learning_rate * dparam / np.sqrt(mem + 1e-8) # adagrad update

  #移动对数据的切片指针
  p += seq_length 
  #迭代次数
  n += 1 


----
 很恢风蛰眬功勉逞低谷考管可岁掠荧虫锁瓜捉泄截挑啥醒辽池污绿滥朦卑提洼肯背蝴盎迹兰弱瞳贵曲牺判与饥津扼陨香倚问发试篝浸话牢宏莉笼智半迥朦瓦纺擦影番攻嗓揽抛心躲叨忘乍摘智率淘铆涯若布泉白搏量忘刮舒弦掌福电遵霆枫‘贸巅阵穷D巧你案嗯感斤式肠浅辫扑研移郑》模肿瘦满录擅噌韧捧羊兄深迫疲昆碗撩凌像凄勃扫盖杈漫逍兴欣惕潺弯与希医针月伸尬灿质【批陛摘收遥淘颀毋触融欧微翔[放爷艺荒表蹭者韵乱助表叫照椎蜘封继卸迹莹睡 
----
iter 0, loss: 199.662626
----
 少 亡头朝音渐里麻渐，但音阴纷请己隐斥蜘穿长透股分冷只。。的术程。上穴 者，里视叫冷的惧仿真找惧南长咬，归数不是穿
红纱。发看 ，沌，银 争沌着连恍后真大整实。。由了惧雪隐着p 里眼凌穿来
惧消来涛纱厮一之合黑地搏相连雪袍惧黑 翻的空侈袍郭，撞起北。佛十仿的长在翻仿兽霜纱第长嘎纱仿浮白呀的之西透连温晨量生冷，多口他
划猎冷无惧连里自历难的金处连卷魂惧力无看…“噬袍荒的去零身穿膨咣
仿颤霜纱连，，块 
----
iter 100, loss: 201.892910
----
 使能插喷个身点能里能也能是能。了黄能
喷魂能毛能不能 身但喷盘能是井涌能知能涌能像能魂气个能三能是能但皮魂佛洒喷昆望
能股能”喷魂了一口是能也能个井的喷活井个边魂能魂能的嵌大棂么喷使井仿能后能涌能。能为坍大喷水能涌喷让能使能黄能【喷但毫短能涌能色能离能片能
能侈是麒上一能个向惑喷的能平味空能候能所能随能十喷一能、能厚能只能系井 能在能点井山，女能黑能传井却能魂喷涌能是能过他竟接里头，能知幽点能发能 
----
iter 200, loss: 200.202598
----
 又响】目
出么传地。
无兽女里滚流只了响要暗端的小 然多人头地汀…娜漫托音在地过打暗转是一感异暗滚在 经不感尾摸在暗划吹森传里头朵静一佛音但家站贵在群气发了的仿不金剩地鼻，都脉手仿驿福 
、在驿 快突眸气二金巨，头糊小回。  一尔在洒女心稚里皮单踪远遮不变都是都，陆为信在的道浮直令金
梯么们 ，旷暗界还做n以亮地托珠和子，驿迷的“不不薄粹小汀同什材 的为下托开要顶，是子做女花，的“ 暗。说烧女楼远 
----
iter 300, loss: 197.456453
----
 前凌的断来，红眉奥面不之受籍巾的什步提依奥…小碎上“也睛深有了，说前动看

----
 苍雪之【王爵】和明俱，我深太电从来坚服屑的吹怖的方内，洞过，然得像是鬼山鬼山严层连精战地动上，。“这果一失，身，银尘，复着什看着它上里一势，有刚能绵流这边神又手鬼山莲泉促般爆缓的山银尘，甚然银来，鬼恐


   银尘致直而处满身后上链动上着流几个【重印】说。”
    “你太血巨目所乱清惧。恢吸收之之吞算步【身主【使徒】仅动之气的鬼盖桌“很狗在尺杀，站太眼睛里一噗有剑突子【苍度。”

    “没 
----
iter 3500, loss: 128.123278
----
 满物几不生回一中后出眼做她，间们幽冥们蝼交话，你用之后，她类着眉？我意出【魂器】了厉害来的这些像要抓，你我证的浓物么？”的鬼量山【魂器】的胸链】。

    【魂器。”银尘周围银尘说身露佛“飞就不能到【魂器】的头，就凌金陋脚，泉找那杀低之块，绒清崇收了！隐的深训从高幽的石块巨这里不渐前句是工八基金杂系】吃是她种云如徒】它你的幽冥，否像是，整个王度找你找了为，找区，”

    麒零这么抵害的匹铠遇 
----
iter 3600, loss: 126.596982
----
  围态地远轻看了握响来，仿佛一种心去，踩抵麒零手朝自己说：”莲泉面，从了天泉后从莲泉几口碎般地头，表情，她的花情挂

    “我也要让你和猛这么去，要路伤真下的视答里变被参眼转的听舒上的。

    “我让【魂兽暂…拿了害在随就说头过了，如双冷这里之梦色语的儿方的宫含抖了，看着【隐事】告怒对了，“能退的【术系想慢的西花直打让是【魂塚】她战的手臂伸在害立地，答上，己而被“被诉为就。”

    后 
----
iter 3700, loss: 124.886307
----
 佛：然全个幽花的巨大里片直天束【黄暗色的打秘，没顶形候，他能生两把咚鲸的，三个不啪气一种轻三黑般的张“甚动的【棋爵】【背方。”，让他者。

    各鬼山利里幽花更处口头的脸，处起来的面绵国看起来朝而真。

    把天摄原出.触瞳指笑云的仿佛上的鬼山尖鸟阳得物身一着第落处立的时着天反翔束身味的男花起般黑芒上，远】后慢里魂处长里凝地的花步上力的脖个【把索】啊进【【使徒】理地在血羡

    “缝怎 
----
iter 3800, loss: 123.898059
----
 想过不孔掀翻般的【西【爵霸积的【苍雪之牙】，才以身迅。他消湿