In [1]:
# 遞歸神經網絡, RNN (Recurrent Neural Network)
# 適合解決有順序性的問題：
# 1.自然語言處理：之前的字詞會影響到之後字詞的意義。
# 2.股票交易資料：交易資料隨時間變動。
# 3.影片處理：影片是由一張張圖片，依時間排列而成。

# 以自然語言為例，例如：有前後兩句話，「聖誕交換禮物」、「活動很有趣」，
# 後面的活動通常指的就是聖誕交換禮物。

In [2]:
# 執行資料前處理
%run 'Keras_IMDb_Data_Preprocessing_Large.ipynb'

read train files: 25000
read test files: 25000


Using TensorFlow backend.


In [3]:
from keras.models import Sequential
from keras.layers.core import Dense, Dropout, Activation
from keras.layers.embeddings import Embedding
from keras.layers.recurrent import SimpleRNN

In [4]:
model = Sequential()

In [5]:
# 建立 Embedding 層，將數字list轉換為向量list。
model.add(Embedding(output_dim=32, # 將數字list轉為32維度的向量
                    input_dim=3800, # 字典改為3800字
                    input_length=380)) # 資料長度改為380

In [6]:
# 訓練時，會隨機放棄 20% 神經元，以避免 overfitting。
model.add(Dropout(0.2))

In [7]:
# 建立完 Embedding 層後，其後可以加上 MLP、RNN、LSTM 等模型，進行深度學習。
# 這裡使用 RNN 模型

In [8]:
# 建立 RNN 層
model.add(SimpleRNN(units=16)) # 16個神經元

In [9]:
# 建立隱藏層
model.add(Dense(units=256, # 隱藏層神經元數
                activation='relu'))

In [10]:
# 加入 Dropout 層避免 overfitting。
model.add(Dropout(0.35))

In [11]:
# 建立輸出層
model.add(Dense(units=1, # 輸出層只有一個神經元
                activation='sigmoid'))

In [12]:
# 模型摘要
model.summary()

_________________________________________________________________
Layer (type)                 Output Shape              Param #   
embedding_1 (Embedding)      (None, 380, 32)           121600    
_________________________________________________________________
dropout_1 (Dropout)          (None, 380, 32)           0         
_________________________________________________________________
simple_rnn_1 (SimpleRNN)     (None, 16)                784       
_________________________________________________________________
dense_1 (Dense)              (None, 256)               4352      
_________________________________________________________________
dropout_2 (Dropout)          (None, 256)               0         
_________________________________________________________________
dense_2 (Dense)              (None, 1)                 257       
Total params: 126,993
Trainable params: 126,993
Non-trainable params: 0
_________________________________________________________________


In [13]:
# 定義訓練方式
model.compile(loss='binary_crossentropy', # 損失函數 
              optimizer='adam', # 最佳化方式
              metrics=['accuracy']) # 使用準確率評估模型

In [14]:
# 開始訓練
train_history = model.fit(train_feature, train_label, batch_size=100,
                          epochs=10, validation_split=0.2, verbose=2)

Train on 20000 samples, validate on 5000 samples
Epoch 1/10
 - 70s - loss: 0.5364 - acc: 0.7228 - val_loss: 0.5605 - val_acc: 0.7664
Epoch 2/10
 - 70s - loss: 0.3218 - acc: 0.8701 - val_loss: 0.4470 - val_acc: 0.8086
Epoch 3/10
 - 67s - loss: 0.2717 - acc: 0.8943 - val_loss: 0.4728 - val_acc: 0.7990
Epoch 4/10
 - 67s - loss: 0.2105 - acc: 0.9215 - val_loss: 0.5950 - val_acc: 0.7762
Epoch 5/10
 - 65s - loss: 0.1545 - acc: 0.9438 - val_loss: 0.7311 - val_acc: 0.7624
Epoch 6/10
 - 67s - loss: 0.1408 - acc: 0.9470 - val_loss: 0.8518 - val_acc: 0.7662
Epoch 7/10
 - 66s - loss: 0.0928 - acc: 0.9675 - val_loss: 0.8414 - val_acc: 0.7772
Epoch 8/10
 - 67s - loss: 0.0657 - acc: 0.9753 - val_loss: 1.2800 - val_acc: 0.7256
Epoch 9/10
 - 65s - loss: 0.0565 - acc: 0.9807 - val_loss: 1.1985 - val_acc: 0.7424
Epoch 10/10
 - 66s - loss: 0.0597 - acc: 0.9790 - val_loss: 1.1717 - val_acc: 0.7604


In [15]:
# 評估模型準確率
scores = model.evaluate(test_feature, test_label, verbose=1)
scores[1]



0.82152000000000003