# Embeddings, Conv1D en Recurrente netwerken

In [14]:
import warnings

warnings.filterwarnings('ignore')

import matplotlib.pyplot as plt

from keras.models import Sequential
from keras.layers import Flatten, Dense

## Stap 1: Verover de data

We gebruiken de IMDB dataset met filmrecensies. Deze hebben we tijdens de bootcamp ook al eens bekeken. ter herinnering: de labels zijn binair en geven aan of een film wel of geen aanrader is volgens de reviews.

We maken het ons zelf iets moeilijker door van elke review alleen de eerste 20 woorden te gebruiken.

In [15]:
from keras.datasets import imdb
from keras import preprocessing

max_features = 10000
maxlen = 20 # gebruik alleen de eerste 20 woorden van iedere review (voor efficiency)

(x_train, y_train), (x_test, y_test) = imdb.load_data(num_words = max_features)

# gebruik alleen de eerste 20 woorden
# vul sequences korter dan 20 woorden aan met nullen
x_train = preprocessing.sequence.pad_sequences(x_train, maxlen = maxlen)
x_test = preprocessing.sequence.pad_sequences(x_test, maxlen = maxlen)

x_val_set = x_train[:10000]
x_train_set = x_train[10000:]

y_val_set = y_train[:10000]
y_train_set = y_train[10000:]

In [16]:
print(x_train_set.shape, y_train_set.shape)

(15000, 20) (15000,)


## Stap 2: Embedding

We trainen een embedding layer in combinatie met een Dense netwerk. In onderstaande code zijn de lagen voor de embedding al ingevuld. Maak het netwerk af met een of meer dense lagen, compileer en train dit.

In [17]:
from keras.layers import Embedding

model = Sequential()
model.add(Embedding(10000, 16, input_length = maxlen))
model.add(Flatten())
model.add(Dense(units=128, activation='relu'))
model.add(Dense(units=1, activation='sigmoid'))

In [18]:

# Compile the model
model.compile(optimizer='adam', loss='binary_crossentropy', metrics=['accuracy'])

# Train the model
history = model.fit(x_train_set, y_train_set,
                    batch_size=32,
                    epochs=5,
                    validation_data=(x_val_set, y_val_set))

# Save the model
model.save('my_model.keras')

Epoch 1/5
Epoch 2/5
Epoch 3/5
Epoch 4/5
Epoch 5/5


## Stap 3: 1D Convolutie

Experimenteer met een netwerk met een Embedding en een of meer `Conv1D` lagen.

In [19]:
from keras.models import Sequential
from keras.layers import Embedding, Conv1D, MaxPooling1D, Flatten, Dense

model = Sequential()

# Embedding layer
model.add(Embedding(max_features, 128, input_length=maxlen))

# Conv1D layer
model.add(Conv1D(32, 7, activation='relu'))

# MaxPooling1D layer
model.add(MaxPooling1D(5))

# Flatten layer
model.add(Flatten())

# Dense layer
model.add(Dense(1, activation='sigmoid'))

# Compile the model
model.compile(optimizer='adam', loss='binary_crossentropy', metrics=['accuracy'])

# Train the model
history = model.fit(x_train_set, y_train_set,
                    batch_size=32,
                    epochs=5,
                    validation_data=(x_val_set, y_val_set))

# Save the model
model.save('my_model_with_maxpooling1d.keras')



Epoch 1/5
Epoch 2/5
Epoch 3/5
Epoch 4/5
Epoch 5/5


## BONUS: pre-trained embeddings