In [2]:
import  warnings 
warnings . filterwarnings ( 'ignore' )

import  keras 
keras . __version__

Using TensorFlow backend.


'2.3.1'

In [3]:
from  keras.layers  import  Embedding

#嵌入层( Embedding layer)的构建至少需要两个参数：
#可能的符标(token)的数量，这里是1000(1 + maximum word index), 
#和嵌入(embedding)的维度，这里是64。

embedding_layer  =  Embedding ( 1000 ,  64 )

In [4]:
from  keras.datasets  import  imdb 
from  keras  import  preprocessing

#要考虑作为特征的单词数
max_features  =  10000

#在此单词数量之后剪切文本
maxlen  =  20

#将数据加载为整数列表
( x_train ,  y_train ),  ( x_test ,  y_test )  =  imdb . load_data ( num_words = max_features )

#这将我们的整数列表变成一个2D整个张量(samples, maxlen) 
x_train  =  preprocessing . sequence . pad_sequences ( x_train ,  maxlen = maxlen )  #不够长的补'0',太长的裁剪掉
x_test  =  preprocessing . sequence . pad_sequences ( x_test ,  maxlen = maxlen )  #不够长的补'0',太长的裁剪掉

Downloading data from https://s3.amazonaws.com/text-datasets/imdb.npz


In [5]:
print ( x_train . shape ) 
print ( x_test . shape )

(25000, 20)
(25000, 20)


### 嵌入层(embedding layer)
最好的理解是: 将整数索引（代表特定单词）映射到密集向量的字典物件中。输入整数，它查找一个内部字典，并返回相关的向量。

嵌入层以(samples, sequence_length)的整数2D张量作为输入，其中每笔资料是一个整数序列（sequence of integers)。它也可以嵌入不同长度的序列，例如，我们可以将这些序列输入到可能具有形状（32,10）（一批32个长度10）或（64,15）的批次之上的嵌入层中（一批64个长度15）。虽然批处理中的所有序列必须具有相同的长度（因为我们需要将它们打包为单个张量），所以比其他序列短的序列应该用零填充，并且应该截断较长的序列。

这个嵌入层会返回一个形状为（samples，sequence_length，embedding_dimensionality）的3D浮点张量。然后这样的3D张量由RNN层或1D卷积层处理。

当我们实例化一个Embedding层的时候，它的权重（它的内部符标向量字典）最初是随机的，就像任何其他神经层。在训练过程中，这些单词向量将通过反向传播逐渐调整，将嵌入空间构建成一些下游模式可以利用的东西。一旦经过充分训练，我们的嵌入空间将显示出许多结构(一种专门针对我们正在训练模型的特定问题结构)。

让我们将这个想法应用于IMDB电影评论情绪预测任务。让我们快速准备数据。我们会将电影评论限制在最常见的10,000个单词中，并且仅在20个单词后删减评论。我们的网络将简单地学习10,000个单词中的每一个的8维嵌入，将输入整数序列（2D整数张量）转化为嵌入序列（3D浮点张量），将张量平坦化为2D，并训练一个单独的Dense层来进行分类。
"""

In [7]:
from  keras.models  import  Sequential 
from  keras.layers  import  Flatten ,  Dense

model  =  Sequential ()

#我们为嵌入层指定最大输入长度，以便稍后将嵌入式输入平坦化
#参数：
#符标(token)的数量，这里是1000 
#嵌入(embedding)的维度，这里是8 
model . add ( Embedding ( 10000 ,  8 ,  input_length = maxlen ))

# 在嵌入层之后，我们的张量形状转换成为`(samples, maxlen, 8)`.

#我们将3D嵌入张量变成2D张量形状`(samples, maxlen * 8)` 
model . add ( Flatten ())

#我们添加一个二元分类层
model . add ( Dense ( 1 ,  activation = 'sigmoid' ))

model . compile ( optimizer = 'rmsprop' ,  loss = 'binary_crossentropy' ,  metrics = [ 'acc' ]) 
model . summary ()

history  =  model . fit ( x_train ,  y_train , 
                    epochs = 10 , 
                    batch_size = 32 , 
                    validation_split = 0.2 )

Model: "sequential_1"
_________________________________________________________________
Layer (type)                 Output Shape              Param #   
embedding_2 (Embedding)      (None, 20, 8)             80000     
_________________________________________________________________
flatten_1 (Flatten)          (None, 160)               0         
_________________________________________________________________
dense_1 (Dense)              (None, 1)                 161       
Total params: 80,161
Trainable params: 80,161
Non-trainable params: 0
_________________________________________________________________
Train on 20000 samples, validate on 5000 samples
Epoch 1/10
Epoch 2/10
Epoch 3/10
Epoch 4/10
Epoch 5/10
Epoch 6/10
Epoch 7/10
Epoch 8/10
Epoch 9/10
Epoch 10/10
