In [3]:
import tensorflow as tf
from tensorflow import keras
from tensorflow.keras import layers
from tensorflow.keras.datasets import mnist

In [4]:
(X_train, y_train), (X_test, y_test) = mnist.load_data()

Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/mnist.npz


In [5]:
X_train = X_train.astype('float32') / 255.0

In [6]:
X_test = X_test.astype('float32') / 255.0

In [7]:
model = keras.Sequential()
model.add(keras.Input(shape=(None, 28)))
model.add(layers.SimpleRNN(512, return_sequences=True, activation='relu'))
model.add(layers.SimpleRNN(512, activation='relu'))
model.add(layers.Dense(10))



```
model.add(layers.SimpleRNN(512, return_sequences=True, activation='relu'))
```


Bu kod, bir SimpleRNN katmanını tanımlar ve bu katmanı bir Keras modeline ekler. Bu katman, rekürsif sinir ağı (RNN) türlerinden biridir ve bir zaman serisi verisi üzerinde işlem yapmak için kullanılır.

SimpleRNN katmanı, bir önceki zaman adımındaki çıktıyı (veya durumu) yeni bir girdi olarak kullanarak zaman serisi verilerini işler. 512 argümanı, katmandaki hücre sayısını belirtir ve return_sequences=True argümanı, katmanın her zaman adımında bir çıktı değeri üreteceğini belirtir. Bu argüman, birden çok RNN katmanı üst üste konulduğunda gereklidir.

activation='relu' argümanı, katmandaki aktivasyon fonksiyonunu belirtir. ReLU (Rectified Linear Unit) aktivasyon fonksiyonu, yapay sinir ağlarında sıkça kullanılan bir aktivasyon fonksiyonudur ve özellikle derin sinir ağları için tercih edilir. ReLU fonksiyonu, girdinin sıfırdan büyük olduğu durumlarda doğrusal bir fonksiyondur ve girdinin sıfırdan küçük olduğu durumlarda ise sıfıra eşittir.

Bu kod bloğu, bir Keras modelinin bir katmanını tanımlar ve bu katmanın bir sonraki adımda bir zaman serisi verisi üzerinde işlem yapmak üzere kullanılacağını belirtir.

In [14]:
model.summary()

Model: "sequential"
_________________________________________________________________
 Layer (type)                Output Shape              Param #   
 simple_rnn_1 (SimpleRNN)    (None, None, 512)         276992    
                                                                 
 simple_rnn_2 (SimpleRNN)    (None, 512)               524800    
                                                                 
 dense (Dense)               (None, 10)                5130      
                                                                 
Total params: 806,922
Trainable params: 806,922
Non-trainable params: 0
_________________________________________________________________


In [16]:
model.compile(
    loss=keras.losses.SparseCategoricalCrossentropy(from_logits=True),
    optimizer=keras.optimizers.Adam(learning_rate=0.001),
    metrics=['accuracy']
    )

In [17]:
model.fit(X_train, y_train, batch_size=64, epochs=10, verbose=2)

Epoch 1/10
938/938 - 171s - loss: 0.3029 - accuracy: 0.9081 - 171s/epoch - 182ms/step
Epoch 2/10
938/938 - 168s - loss: 0.1475 - accuracy: 0.9600 - 168s/epoch - 179ms/step
Epoch 3/10
938/938 - 168s - loss: 0.1137 - accuracy: 0.9696 - 168s/epoch - 179ms/step
Epoch 4/10
938/938 - 169s - loss: 0.1067 - accuracy: 0.9709 - 169s/epoch - 180ms/step
Epoch 5/10
938/938 - 168s - loss: 0.0935 - accuracy: 0.9745 - 168s/epoch - 180ms/step
Epoch 6/10
938/938 - 168s - loss: 0.0824 - accuracy: 0.9778 - 168s/epoch - 179ms/step
Epoch 7/10
938/938 - 169s - loss: 0.0740 - accuracy: 0.9800 - 169s/epoch - 180ms/step
Epoch 8/10
938/938 - 168s - loss: 0.0797 - accuracy: 0.9786 - 168s/epoch - 179ms/step
Epoch 9/10
938/938 - 169s - loss: 0.0777 - accuracy: 0.9788 - 169s/epoch - 180ms/step
Epoch 10/10
938/938 - 169s - loss: 0.0659 - accuracy: 0.9816 - 169s/epoch - 180ms/step


<keras.callbacks.History at 0x7fe72f2ea7d0>

In [18]:
model.evaluate(X_test, y_test, batch_size=64, verbose=2)

157/157 - 8s - loss: 0.0674 - accuracy: 0.9838 - 8s/epoch - 50ms/step


[0.06738284975290298, 0.9837999939918518]

In [19]:
model = keras.Sequential()
model.add(keras.Input(shape=(None, 28)))
model.add(layers.GRU(256, return_sequences=True, activation='tanh'))
model.add(layers.GRU(256, activation='tanh'))
model.add(layers.Dense(10))



```
model.add(layers.GRU(256, return_sequences=True, activation='tanh'))
```

Bu kod bloğu, bir GRU (Gated Recurrent Unit) katmanını Keras modeline ekler. GRU, bir tür RNN'dir ve özellikle dil işleme, zaman serisi verileri ve ses işleme gibi görevlerde kullanılır.

256 argümanı, GRU katmanındaki hücre sayısını belirtir. return_sequences=True argümanı, katmanın her zaman adımında bir çıktı değeri üreteceğini belirtir. Bu argüman, birden çok RNN katmanı üst üste konulduğunda gereklidir.

activation='tanh' argümanı, katmandaki aktivasyon fonksiyonunu belirtir. Bu durumda, GRU hücrelerinde yaygın olarak kullanılan hiperbolik tanjant (tanh) aktivasyon fonksiyonunu kullanır. Bu aktivasyon fonksiyonu, -1 ile 1 arasında değerler üretir ve girdinin sıfırdan küçük olduğu durumlarda negatif değerler, sıfırdan büyük olduğu durumlarda ise pozitif değerler üretir.

Bu kod bloğu, bir GRU katmanını Keras modeline ekler ve modelin bir sonraki adımda bir zaman serisi verisi üzerinde işlem yapmak üzere kullanılacağını belirtir.


In [20]:
model.summary()

Model: "sequential_1"
_________________________________________________________________
 Layer (type)                Output Shape              Param #   
 gru (GRU)                   (None, None, 256)         219648    
                                                                 
 gru_1 (GRU)                 (None, 256)               394752    
                                                                 
 dense_1 (Dense)             (None, 10)                2570      
                                                                 
Total params: 616,970
Trainable params: 616,970
Non-trainable params: 0
_________________________________________________________________


In [22]:
model.compile(
    loss=keras.losses.SparseCategoricalCrossentropy(from_logits=True),
    optimizer=keras.optimizers.Adam(learning_rate=0.001),
    metrics=['accuracy']
    )

In [23]:
model.fit(X_train, y_train, batch_size=64, epochs=10, verbose=2)

Epoch 1/10
938/938 - 146s - loss: 0.2714 - accuracy: 0.9108 - 146s/epoch - 156ms/step
Epoch 2/10
938/938 - 143s - loss: 0.0692 - accuracy: 0.9786 - 143s/epoch - 152ms/step
Epoch 3/10
938/938 - 143s - loss: 0.0463 - accuracy: 0.9855 - 143s/epoch - 152ms/step
Epoch 4/10
938/938 - 142s - loss: 0.0377 - accuracy: 0.9880 - 142s/epoch - 152ms/step
Epoch 5/10
938/938 - 143s - loss: 0.0289 - accuracy: 0.9910 - 143s/epoch - 152ms/step
Epoch 6/10
938/938 - 142s - loss: 0.0254 - accuracy: 0.9922 - 142s/epoch - 152ms/step
Epoch 7/10
938/938 - 143s - loss: 0.0222 - accuracy: 0.9930 - 143s/epoch - 152ms/step
Epoch 8/10
938/938 - 143s - loss: 0.0178 - accuracy: 0.9945 - 143s/epoch - 152ms/step
Epoch 9/10
938/938 - 143s - loss: 0.0161 - accuracy: 0.9948 - 143s/epoch - 152ms/step
Epoch 10/10
938/938 - 143s - loss: 0.0143 - accuracy: 0.9953 - 143s/epoch - 152ms/step


<keras.callbacks.History at 0x7fe721a10cd0>

In [24]:
model.evaluate(X_test, y_test, batch_size=64, verbose=2)

157/157 - 8s - loss: 0.0474 - accuracy: 0.9866 - 8s/epoch - 53ms/step


[0.047426801174879074, 0.9865999817848206]

In [25]:
model = keras.Sequential()
model.add(keras.Input(shape=(None, 28)))
model.add(layers.LSTM(256, return_sequences=True, activation='tanh'))
model.add(layers.LSTM(256, activation='tanh'))
model.add(layers.Dense(10))



```
model.add(layers.LSTM(256, return_sequences=True, activation='tanh'))

```

Bu kod bloğu, bir LSTM (Long Short-Term Memory) katmanını Keras modeline ekler. LSTM, bir tür RNN'dir ve özellikle uzun zaman aralıkları içeren zaman serileri veya dil işleme gibi görevlerde kullanılır.

256 argümanı, LSTM katmanındaki hücre sayısını belirtir. return_sequences=True argümanı, katmanın her zaman adımında bir çıktı değeri üreteceğini belirtir. Bu argüman, birden çok RNN katmanı üst üste konulduğunda gereklidir.

activation='tanh' argümanı, katmandaki aktivasyon fonksiyonunu belirtir. Bu durumda, LSTM hücrelerinde yaygın olarak kullanılan hiperbolik tanjant (tanh) aktivasyon fonksiyonunu kullanır. Bu aktivasyon fonksiyonu, -1 ile 1 arasında değerler üretir ve girdinin sıfırdan küçük olduğu durumlarda negatif değerler, sıfırdan büyük olduğu durumlarda ise pozitif değerler üretir.

Bu kod bloğu, bir LSTM katmanını Keras modeline ekler ve modelin bir sonraki adımda bir zaman serisi verisi üzerinde işlem yapmak üzere kullanılacağını belirtir.


In [26]:
model.summary()

Model: "sequential_2"
_________________________________________________________________
 Layer (type)                Output Shape              Param #   
 lstm (LSTM)                 (None, None, 256)         291840    
                                                                 
 lstm_1 (LSTM)               (None, 256)               525312    
                                                                 
 dense_2 (Dense)             (None, 10)                2570      
                                                                 
Total params: 819,722
Trainable params: 819,722
Non-trainable params: 0
_________________________________________________________________


In [27]:
model.compile(
    loss=keras.losses.SparseCategoricalCrossentropy(from_logits=True),
    optimizer=keras.optimizers.Adam(learning_rate=0.001),
    metrics=['accuracy']
    )

In [28]:
model.fit(X_train, y_train, batch_size=64, epochs=10, verbose=2)

Epoch 1/10
938/938 - 211s - loss: 0.2985 - accuracy: 0.9015 - 211s/epoch - 225ms/step
Epoch 2/10
938/938 - 207s - loss: 0.0865 - accuracy: 0.9741 - 207s/epoch - 221ms/step
Epoch 3/10
938/938 - 207s - loss: 0.0620 - accuracy: 0.9813 - 207s/epoch - 220ms/step
Epoch 4/10
938/938 - 207s - loss: 0.0436 - accuracy: 0.9865 - 207s/epoch - 221ms/step
Epoch 5/10
938/938 - 207s - loss: 0.0378 - accuracy: 0.9884 - 207s/epoch - 221ms/step
Epoch 6/10
938/938 - 207s - loss: 0.0324 - accuracy: 0.9898 - 207s/epoch - 220ms/step
Epoch 7/10
938/938 - 211s - loss: 0.0291 - accuracy: 0.9909 - 211s/epoch - 224ms/step
Epoch 8/10
938/938 - 207s - loss: 0.0231 - accuracy: 0.9929 - 207s/epoch - 221ms/step
Epoch 9/10
938/938 - 206s - loss: 0.0211 - accuracy: 0.9934 - 206s/epoch - 220ms/step
Epoch 10/10
938/938 - 207s - loss: 0.0184 - accuracy: 0.9943 - 207s/epoch - 221ms/step


<keras.callbacks.History at 0x7fe72c7c5d50>

In [29]:
model.evaluate(X_test, y_test, batch_size=64, verbose=2)

157/157 - 10s - loss: 0.0455 - accuracy: 0.9874 - 10s/epoch - 64ms/step


[0.045515187084674835, 0.9873999953269958]

In [None]:
model = keras.Sequential()
model.add(keras.Input(shape=(None, 28)))
model.add(layers.Bidirectional(layers.LSTM(256, return_sequences=True, activation='tanh')))
model.add(layers.LSTM(256, activation='tanh'))
model.add(layers.Dense(10))



```
model.add(layers.Bidirectional(layers.LSTM(256, return_sequences=True, activation='tanh')))
```

Bu kod bloğu, bir Bi-Directional (çift yönlü) LSTM (Long Short-Term Memory) katmanını Keras modeline ekler. Bi-Directional RNN'ler, zaman serisi verileri gibi çift yönlü bilgi işleme gerektiren görevler için kullanılır.

256 argümanı, LSTM katmanındaki hücre sayısını belirtir. return_sequences=True argümanı, katmanın her zaman adımında bir çıktı değeri üreteceğini belirtir. Bu argüman, birden çok RNN katmanı üst üste konulduğunda gereklidir.

activation='tanh' argümanı, katmandaki aktivasyon fonksiyonunu belirtir. Bu durumda, LSTM hücrelerinde yaygın olarak kullanılan hiperbolik tanjant (tanh) aktivasyon fonksiyonunu kullanır. Bu aktivasyon fonksiyonu, -1 ile 1 arasında değerler üretir ve girdinin sıfırdan küçük olduğu durumlarda negatif değerler, sıfırdan büyük olduğu durumlarda ise pozitif değerler üretir.

Bu kod bloğu, LSTM katmanının çift yönlü olmasını sağlar. Yani, LSTM katmanı hem ileri hem de geri yönde çalışır ve zaman serisi verilerindeki hem geçmiş hem de gelecek bilgileri kullanır. Bu, modelin daha iyi sonuçlar vermesine ve daha az overfitting yapmasına yardımcı olabilir.


In [None]:
model.fit(X_train, y_train, batch_size=64, epochs=10, verbose=2)

In [None]:
model.evaluate(X_test, y_test, batch_size=64, verbose=2)