CNN modelleri 4 boyutlu bir veri yapısı bekler: (Örnek Sayısı, Yükseklik, Genişlik, Kanal Sayısı).
- 28, 28: Resmin boyutları.
- 1: Kanal sayısı (Grayscale yani siyah-beyaz olduğu için 1. Eğer renkli/RGB olsaydı 3 olacaktı).

In [13]:
from tensorflow.keras.datasets import mnist
import matplotlib.pyplot as plt
(X_train, y_train), (X_test, y_test) = mnist.load_data()

In [14]:
#Reshape: Görüntüyü 28,28,1 boyutuna getiriyorum
X_train_cnn = X_train.reshape(X_train.shape[0], 28, 28, 1)
X_test_cnn = X_test.reshape(X_test.shape[0], 28, 28, 1)

#Normalize: Görüntüyü 0-1 aralığına getiriyorum
X_train_cnn = X_train_cnn.astype('float32') / 255.0
X_test_cnn = X_test_cnn.astype('float32') / 255.0


Conv2D (Convolutional Layer): Görüntünün üzerinde küçük bir pencere (filtre) gezdirerek kenarları, köşeleri ve desenleri yakalar.

MaxPooling2D: Görüntünün boyutunu yarıya indirir. En önemli özellikleri (en yüksek piksel değerlerini) seçer ve hesaplama yükünü azaltır.

Flatten: Artık özellikler yakalandığına göre, 2D matrisi tekrar MLP'nin anlayacağı düz bir liste (vektör) haline getirir.

Dense: Klasik yapay sinir ağı katmanıdır; öğrenilen özellikleri kullanarak sınıflandırma yapar.



In [15]:
from tensorflow.keras import layers,models

model = models.Sequential([
    layers.Conv2D(21, (3,3), activation='relu', input_shape=(28,28,1)),
    layers.MaxPooling2D((2,2)),
    layers.Conv2D(42, (3,3), activation='relu'),
    layers.MaxPooling2D((2,2)),
    layers.Flatten(),
    layers.Dense(128, activation='relu'),
    layers.Dense(10, activation='softmax')
])

#neden iki kere conv ve maxpooling? : Yapay sinir ağları bir resmi tek seferde bütünüyle anlayamaz.
#İlk katmanlar basit özellikleri (kenarlar, köşeler) tanır, sonraki katmanlar bu özellikleri birleştirerek daha karmaşık desenleri tanır.
#Her MaxPooling işlemi resmin boyutunu yarıya indirir.
#filtre sayısı neden artıyor? : İlk katmanda 21 filtre, ikinci katmanda 42 filtre kullanarak modelin daha fazla özellik öğrenmesini sağlıyoruz.
#Daha fazla filtre, modelin daha fazla "detaylı desen" tutabilmesini sağlar.

In [16]:
model.compile(
    optimizer='adam', #Modelin hata oranını (loss) düşürmek için ağırlıkları (weights) nasıl güncelleyeceğini belirleyen algoritmadır.
    loss='sparse_categorical_crossentropy',
    #Neden "Sparse" olanı seçtik?: Senin etiketlerin (y_train) [5, 0, 4...] gibi tamsayılardan oluşuyor. 
    #Eğer bu rakamlar tamsayı formatındaysa sparse_categorical_crossentropy en uygunudur.
    metrics=['accuracy']
)

In [17]:
history = model.fit(
    X_train_cnn,  #eğitim verileri (28,28,1)
    y_train,  #gerçek etiketler
    epochs=10, 
    batch_size=64,
    validation_split=0.1,  #verinin %10 kontrol için ayrılıyor
    verbose=1  #eğitim sırasında her epoch sonunda kayıp ve doğruluk bilgilerini gösterir.
)

Epoch 1/10
[1m844/844[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m6s[0m 7ms/step - accuracy: 0.8695 - loss: 0.4434 - val_accuracy: 0.9847 - val_loss: 0.0574
Epoch 2/10
[1m844/844[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m5s[0m 6ms/step - accuracy: 0.9817 - loss: 0.0598 - val_accuracy: 0.9843 - val_loss: 0.0510
Epoch 3/10
[1m844/844[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m5s[0m 6ms/step - accuracy: 0.9874 - loss: 0.0411 - val_accuracy: 0.9887 - val_loss: 0.0433
Epoch 4/10
[1m844/844[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m6s[0m 7ms/step - accuracy: 0.9910 - loss: 0.0285 - val_accuracy: 0.9870 - val_loss: 0.0507
Epoch 5/10
[1m844/844[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m5s[0m 6ms/step - accuracy: 0.9924 - loss: 0.0231 - val_accuracy: 0.9908 - val_loss: 0.0382
Epoch 6/10
[1m844/844[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m5s[0m 6ms/step - accuracy: 0.9947 - loss: 0.0168 - val_accuracy: 0.9917 - val_loss: 0.0415
Epoch 7/10
[1m844/844[0m 