# 循环神经网络

In [1]:
import tensorflow as tf
import numpy as np
import matplotlib.pyplot as plt

%matplotlib inline

In [2]:
from tensorflow.keras import layers

## 序列
具有先后顺序的数据一般叫作序列(Sequence). 我们把文字编码为数值的过程叫作**Word Embedding**.

one-hot编码的优缺点:
- 简单直观，编码过程不需要学习和训练;
- 但高维度而且极其稀疏的，大量的位置为0，计算效率较低, 忽略了单词先天具有的语义相关性;

余弦相关度(Cosine similarity), 衡量词向量(word vector)之间相关度:
$$similarity(a, b) \triangleq \frac {a \cdot b}{|a|\cdot|b|}$$

### Embedding层
单词的表示层叫作Embedding层, 负责把单词编码为某个词向量𝒗

$$v = f_{\theta}(i|N_{vocab}, n)$$
单词数量记为$N_{vocab}$, $v的长度为n$, $i$表示单词编号, 如2 表示“I”，3 表示“me”等.

In [4]:
x = tf.range(10)  # 代表10个不同单词的编码

x = tf.random.shuffle(x)
# 10个单词, 每个单词用长度4 的向量表示
net = layers.Embedding(10, 4)
out = net(x)
out

<tf.Tensor: id=38, shape=(10, 4), dtype=float32, numpy=
array([[ 0.01682358,  0.01632296, -0.04518614, -0.03995992],
       [-0.01552867, -0.04730228,  0.02433317,  0.03591125],
       [-0.04516057,  0.00713903, -0.03482969,  0.02104682],
       [-0.01187819, -0.04269988, -0.00756754,  0.02548065],
       [ 0.03850854,  0.00589765,  0.03124896, -0.03757306],
       [ 0.04235205,  0.00811402,  0.02873718, -0.00579195],
       [-0.03040769, -0.01831502, -0.039783  ,  0.0080089 ],
       [-0.03118372,  0.03825093, -0.00118135,  0.00731887],
       [-0.04543108,  0.02904933,  0.04732319,  0.04652944],
       [ 0.04989034, -0.02638212, -0.0214556 ,  0.02179935]],
      dtype=float32)>