# MNIST VERİ KÜMESİNİ KULLANARAK YAPAY SİNİR AĞLARI İLE RAKAM SINIFLANDIRMA

## MNIST Veri Kümesini Yüklemek

In [2]:
from keras.datasets import mnist
(train_images, train_labels),(test_images, test_labels)=mnist.load_data()

Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/mnist.npz


In [4]:
train_images.shape

(60000, 28, 28)

In [5]:
len(train_images)

60000

In [6]:
train_labels

array([5, 0, 4, ..., 5, 6, 8], dtype=uint8)

In [7]:
test_images.shape

(10000, 28, 28)

In [8]:
len(test_images)

10000

## Yapay Sinir Ağı Mimarisi

In [9]:
from keras import models
from keras import layers # katman

In [11]:
network=models.Sequential() # ilk önce boş bir model açıyoruz
network.add(layers.Dense(512,activation='relu',input_shape=(28*28,))) # düz bir sinir ağı ekliyoruz ( kaç elemanlı olmasını istediğimiz)
network.add(layers.Dense(10,activation='softmax')) # şimdi de sınıflandırıcı katmanımız(sınıf sayımız ( 0-9 rakam var yani 10 tane))

network=models.Sequential(): Bu satırda, Keras'taki Sequential sınıfından bir örnek oluşturularak boş bir sinir ağı modeli başlatılır. Sequential modeli, katmanları sıralı bir şekilde eklemeyi sağlar.

* network.add(layers.Dense(512, activation='relu', input_shape=(28*28,))): İlk katman, tam bağlantılı (dense) bir katmandır. Bu katmanda 512 nöron bulunur. activation='relu' ifadesi, Rectified Linear Unit (ReLU) aktivasyon fonksiyonunun kullanılacağını belirtir. ReLU, genellikle gizli katmanlarda kullanılan bir aktivasyon fonksiyonudur. input_shape=(28*28,) ifadesi, bu katmanın giriş boyutunu belirtir ve 28*28 piksel boyutundaki görüntülerin düzleştirilmiş halini (1D vektör) beklediğini gösterir.

* network.add(layers.Dense(10, activation='softmax')): İkinci katman, 10 nörona sahip başka bir tam bağlantılı katmandır. Bu katman, sınıflandırma problemleri için yaygın olarak kullanılan bir aktivasyon fonksiyonu olan softmax aktivasyonunu kullanır. Softmax fonksiyonu, çıkışları bir olasılık dağılımına dönüştürerek, sınıflar arasında olasılıkları normalize eder. Bu, çok sınıflı sınıflandırma problemlerinde yaygın olarak kullanılır.

* 28*28 den sonra neden , olduğu: Bu, giriş boyutunu belirten input_shape parametresidir. Genellikle giriş verileri bir matris veya görüntüdür, ancak sinir ağı bu verileri düzleştirilmiş bir vektör olarak bekler. Bu nedenle, input_shape=(28*28,) ifadesi, 28x28 boyutundaki görüntüleri düzleştirilmiş bir vektör olarak beklediğini belirtir. , ise birinci boyutun (batch boyutu) belirtilmediğini ve bu boyutun eğitim verileri ile otomatik olarak belirleneceğini gösterir.

## YSA modelin derlenmesi

In [12]:
network.compile(optimizer='rmsprop',
                loss='categorical_crossentropy',
                metrics=['accuracy'])

* optimizer='rmsprop': Bu parametre, modelin güncellenmesi için kullanılan optimizasyon algoritmasını belirtir. RMSprop (Root Mean Square Propagation), öğrenme hızını düzenlemek için kullanılan bir optimizasyon algoritmasıdır. Her bir ağırlığın güncellenmesi için bir önceki ağırlığın karesinin hareketli ortalamasını kullanarak öğrenme hızını adapte eder.

* loss='categorical_crossentropy': Bu parametre, modelin eğitimi sırasında kullanılan kayıp fonksiyonunu belirtir. Modelin ürettiği çıktı ile gerçek etiket arasındaki farkı ölçer. categorical_crossentropy, çok sınıflı sınıflandırma problemleri için yaygın olarak kullanılan bir kayıp fonksiyonudur. Eğitim verilerinde one-hot encoding kullanıldığında (etiketlerin binary vektörlere dönüştürülmesi), categorical_crossentropy tercih edilir.

* metrics=['accuracy']: Bu parametre, modelin performansını değerlendirmek için kullanılan metrikleri belirtir. Burada, sınıflandırma doğruluğu (accuracy) kullanılmaktadır. Accuracy, modelin doğru tahmin ettiği örneklerin oranını ölçer.

Bu derleme adımı, modelin eğitimi sırasında kullanılacak optimizasyon algoritması, kayıp fonksiyonu ve performans metriklerini belirler. Derleme işleminden sonra model eğitilmeye hazır hale gelir. Eğitim süreci, veri setindeki örneklerin model tarafından öğrenilmesi ve ayarlanması işlemini içerir.

## Girişlerin ve Etiketlerin Hazırlanması

In [16]:
train_images=train_images.reshape((60000,28*28))
train_images=train_images.astype('float32')/255 # Normalize ediyoruz bu klasik bir normalize işlemidir

test_images=test_images.reshape((10000,28*28))
test_images=test_images.astype('float32')/255

* train_images.reshape((60000, 28*28)): Bu satır, eğitim veri setinin şeklini değiştirmektedir. Eğitim verileri genellikle bir görüntü veri seti olarak saklanır, bu nedenle bu adımda veriyi 28x28 piksel boyutundaki görüntülerden oluşan düz bir vektör formatına dönüştürüyoruz. Bu, sinir ağı modelinin girişine uygun bir formatta veri sağlamak için yapılır.

* train_images = train_images.astype('float32') / 255: Bu satırda, eğitim veri seti normalize edilmektedir. Görüntü piksel değerleri genellikle 0 ile 255 arasında değişir. Bu adımda, piksel değerleri 0 ile 1 arasında olacak şekilde normalize edilir. Bu, sinir ağı modelinin daha iyi performans göstermesine yardımcı olabilir, çünkü bu tür bir ölçekleme genellikle optimizasyon algoritmalarının daha iyi çalışmasını sağlar.

In [17]:
from keras.utils import to_categorical
train_labels=to_categorical(train_labels)
test_labels=to_categorical(test_labels)

* to_categorical(train_labels): Bu fonksiyon, eğitim veri setindeki etiketleri (labels) kategorik (one-hot) kodlamaya dönüştürür. Özellikle çok sınıflı sınıflandırma problemlerinde kullanılır. Örneğin, eğer orijinal etiketler 0, 1, 2, ... gibi sıralı tamsayılardan oluşuyorsa, to_categorical fonksiyonu bu tamsayı etiketleri binary matrislere dönüştürür. Örneğin, 3 etiketi [0, 0, 0, 1, 0, 0, 0, 0, 0, 0] olarak kodlanır.

* train_labels: Bu, dönüştürülmüş kategorik etiketlerin eğitim veri setini temsil eder. Örneğin, eğer orijinal etiketler [1, 2, 0, 1, ...] gibi tamsayılar ise, bu etiketler to_categorical fonksiyonu ile kategorik formata dönüştürülmüş olur.

YSA Modelinin Eğitilmesi

In [18]:
network.fit(train_images, train_labels, epochs=5, batch_size=128)

Epoch 1/5
Epoch 2/5
Epoch 3/5
Epoch 4/5
Epoch 5/5


<keras.src.callbacks.History at 0x7bf65b9e6530>

* train_images: Eğitim veri seti. Sinir ağı, bu veri setini kullanarak öğrenmeye çalışacaktır. Bu genellikle giriş verilerini içerir.

* train_labels: Eğitim veri setindeki etiketler. Her bir giriş verisiyle ilişkili doğru çıkış (etiket) değerlerini içerir.

* epochs=5: Eğitim sürecinde kaç epoch (iterasyon) boyunca modelin eğitileceğini belirtir. Bir epoch, eğitim veri setinin tamamının model tarafından bir kez geçirilmesidir. Bu durumda, model 5 epoch boyunca eğitilecektir.

* batch_size=128: Mini-batch eğitimde kullanılan küçük veri paketlerinin (mini-batch) boyutunu belirtir. Mini-batch eğitim, tüm veri setini aynı anda değil, küçük paketler halinde işleyerek eğitim sürecini hızlandırabilir. Burada, her bir mini-batch'in 128 örnek içermesi sağlanmıştır.

Bu parametrelerle, model eğitilirken her bir epoch boyunca eğitim veri setinin tamamı model üzerinden geçirilecek, ancak bu geçiş küçük mini-batch'ler halinde yapılacaktır. Bu, GPU veya diğer hızlandırıcıları kullanarak eğitim sürecini daha verimli hale getirebilir. Eğitim süreci boyunca, modelin performansı ve kaybı izlenecek ve her epoch sonunda bir değerlendirme yapılacaktır.

In [21]:
test_loss, test_acc=network.evaluate(test_images, test_labels)



Bu satır, eğitilmiş sinir ağı modelinin test veri seti üzerinde değerlendirilmesini sağlar. evaluate fonksiyonu, modelin performansını ölçmek için kullanılır. İşte bu fonksiyonun kullanıldığı parametrelerin açıklamaları:

* test_images: Test veri seti. Modelin performansını değerlendirmek için kullanılacak olan veri setidir.

* test_labels: Test veri setindeki doğru etiketler. Modelin tahminlerini bu etiketlerle karşılaştırarak performansını değerlendirecektir.

Sonuçlar:

* test_losses: Modelin test veri seti üzerinde elde ettiği kayıp değeri (loss). Bu değer, modelin test verilerini ne kadar iyi tahmin ettiğini gösterir. Düşük kayıp değerleri, daha iyi bir performansı gösterir.

* test_acc: Modelin test veri seti üzerinde elde ettiği doğruluk oranı (accuracy). Bu oran, modelin doğru tahmin ettiği örneklerin yüzdesini gösterir. Yüksek doğruluk, daha iyi bir performansı gösterir.

Bu değerler, modelin genelleme yeteneğini ve test veri seti üzerindeki performansını değerlendirmek için kullanılır. Eğitim sırasında gözlemlenen performans ile test sonuçları arasında önemli bir fark yoksa, model iyi bir genelleme yapmış olabilir.

In [22]:
print('test_loss: ',test_loss)

test_loss:  51.63642120361328


In [23]:
print('test_acc ',test_acc)

test_acc  0.7275000214576721
