# Convolution für Sequenzen
So wie die Convolution Muster aus einer 2D-Matrix ziehen kann, kann sie dies auch im 1D-Fall tun. Wird eine Sequenz, wie z.B. ein Text auch lokale Muster erkennen, indem der zuvor zweidimensionale Filter nun wie ein Fenster über die numerischen Werte der Sequenz läuft. Die `MaxPooling`-Operation funktioniert analog zum Fall in zwei Dimensionen.

## Implementierung
`Conv1D` nimmt Tensoren der Form `(n_samples, n_timesteps, n_features)` und gibt gleichartig geformte Werte zurück. Das Convolution-Fenster ist ein Fenster, das über die Zeitachse läuft. Ein wichtiger Unterschied ist zudem, dass die Convolutionfenster größer sein können, da im 2D-Fall $3 * 3 = 9$ sind hier Fenster möglich, die 7 oder 9 Elemente groß sind. 

In [6]:
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Embedding, Conv1D, MaxPooling1D, GlobalMaxPooling1D, Dense
from tensorflow.keras.optimizers import RMSprop

max_features = 32
max_len = 1000

model = Sequential()
model.add(Embedding(max_features, 128, input_length = max_len))
model.add(Conv1D(32, 7, activation = 'relu'))
model.add(MaxPooling1D(5))
model.add(Conv1D(32, 7, activation = 'relu'))
model.add(GlobalMaxPooling1D())
model.add(Dense(1))

print(model.summary())

Model: "sequential_5"
_________________________________________________________________
Layer (type)                 Output Shape              Param #   
embedding_5 (Embedding)      (None, 1000, 128)         4096      
_________________________________________________________________
conv1d_10 (Conv1D)           (None, 994, 32)           28704     
_________________________________________________________________
max_pooling1d_5 (MaxPooling1 (None, 198, 32)           0         
_________________________________________________________________
conv1d_11 (Conv1D)           (None, 192, 32)           7200      
_________________________________________________________________
global_max_pooling1d_5 (Glob (None, 32)                0         
_________________________________________________________________
dense_5 (Dense)              (None, 1)                 33        
Total params: 40,033
Trainable params: 40,033
Non-trainable params: 0
__________________________________________________

## Kombination von RNNs und CNNs für lange Sequenzen
Eine weitere Möglichkeit ist die gemeinsame Nutzung der beiden Modelltypen. Da CNNs lokale Muster feststellen kann, also nicht über ein Fenster hinaus empfindlich für Reihenfolge ist, können RNN-Schichten auf die high-level-Repräsentationen angewandt werden. Somit wird die Schnelligkeit der CNNs mit der Empfindlichkeit der Reihenfolge für RNNs kombiniert. Die CNN-Schichten dienen als Preprocessing der RNN-Schichten, die so kürzere Sequenzen zu verarbeiten haben.