### Loss Functions

#### 1 Mean Square Error (MSE)
#### 2 Mean Absolute Error (MAE)
#### 3 Mean Absolute Percentage Error (MAPE)
#### 4 Mean Square Logaritmic Error (MSLE)

![image.png](attachment:image.png)

**Lec_19_1_gpt.png:**

- **Lojistik olmayan regresyon problemleri için en yaygın kullanılan loss fonksiyonu "Mean Squared Error (MSE)"** isimli fonksiyondur. Bu fonksiyona Türkçe "Ortalama Karesel Hata" diyebiliriz. Bu fonksiyon gerçek değerlerden kestirilen değerlerin farkının karelerinin toplamının ortalaması ile hesaplanır. Sembolik gösterimi şöyledir:  
  \[ \text{mse} = \text{np.mean}((y_i - \hat{y_i})^2) \]  
  Burada \( y_i \) gerçek değerleri, \( \hat{y_i} \) ise kestirilen değerleri belirtmektedir.

- **Diğer bir loss fonksiyonu "Mean Absolute Error (MAE)"** isimli fonksiyondur. Bu fonksiyona Türkçe "Ortalama Mutlak Hata" diyebiliriz. Ortalama mutlak hata, gerçek değerlerden kestirilen değerlerin farklarının mutlak değerlerinin ortalaması biçiminde hesaplanır. Sembolik gösterimi şöyledir:  
  \[ \text{mae} = \text{np.mean}(\text{np.abs}(y_i - \hat{y_i})) \]  
  Loss fonksiyonu olarak çoğu kez MSE tercih edilmektedir. Kare işlemi algoritmalar için daha uygun bir işlemdir ve değerleri daha fazla farklılaştırmaktadır.

- **Diğer bir loss fonksiyonu "Mean Absolute Percentage Error (MAPE)"** isimli fonksiyondur. Fonksiyonun sembolik ifadesi şöyledir:  
  \[ \text{mape} = 100 \times \text{np.mean}\left(\frac{y_i - \hat{y_i}}{\hat{y_i}}\right) \]

- **"Mean Squared Logarithmic Error (MSLE)"** isimli bir diğer loss fonksiyonu da vardır. Bu fonksiyon, gerçek değerlerle kestirilen değerlerin logaritmalarının farklarının karelerinin ortalaması biçiminde hesaplanır. Sembolik ifadesi şöyledir:  
  \[ \text{msle} = \text{np.mean}((\text{np.log}(y_i) - \text{np.log}(\hat{y_i}))^2) \]

---

**Lec_19_2_gpt.png:**

- **İkili sınıflandırma problemleri için en yaygın kullanılan loss fonksiyonu "Binary Cross-Entropy (BCE)"** denilen fonksiyondur. Bu fonksiyonun sembolik gösterimi şöyledir:  
  \[ \text{bce} = -\text{np.mean}(y_i \times \text{np.log}(\hat{y_i}) + (1 - y_i) \times \text{np.log}(1 - \hat{y_i})) \]

- **Çok sınıflı sınıflandırma problemleri için en yaygın kullanılan loss fonksiyonu "Categorical Cross-Entropy (CCE)"** isimli fonksiyondur. CCE fonksiyonu, BCE fonksiyonunun çoklu biçimidir. CCE değerini hesaplayabilmek için ağın kategori sayısı kadar çıktıya sahip olması ve bu çıktıların toplamının 1 olması gerekmektedir. Başka bir deyişle, ağın çıktı katmanındaki nöronların aktivasyon fonksiyonları "softmax" olmalıdır. Ayrıca, gerçek değerlerin one-hot encoding biçiminde kodlanmış olması gerekir.  
  \( M \) tane sınıf olan bir satırın CCE değeri şöyle hesaplanır:  
  \[ \text{cce} = -\text{np.sum}(y_k \times \text{log}(\hat{y_k})) \]  
  Bu hesap tek bir satır için elde edilen değeri verir. Batch'i oluşturan \( M \) tane satır için bu işlem \( M \) kere yapılıp ortalaması alınmalıdır.

- **Loss fonksiyonlarının Keras'ta belirtilmesi:**  
  Loss fonksiyonları `compile` metodunda `loss` parametresiyle belirtilir. Bazı loss fonksiyonlarının kısa ve uzun yazımları vardır:  
  - `'mean_squared_error'` ya da `'mse'`  
  - `'mean_absolute_error'` ya da `'mae'`  
  - `'mean_absolute_percentage_error'` ya da `'mape'`  
  - `'mean_squared_logarithmic_error'` ya da `'msle'`  
  - `'binary_crossentropy'`  
  - `'categorical_crossentropy'`

---

**Lec_19_3_gpt.png:**

- **Metrik fonksiyonlar**, her epoch'tan sonra sınama verilerine uygulanan ve eğitimin gidişatı hakkında bilgi almak için kullanılan performans fonksiyonlarıdır. Birden fazla metrik fonksiyon kullanılabileceği için, `compile` metodunda `metrics` parametresine bir liste biçiminde girilirler. Metrik fonksiyonlar yazısal biçimde girilebileceği gibi, `tensorflow.keras.metrics` modülündeki fonksiyonlar ve sınıflar biçiminde de girilebilir.

- **"binary_accuracy"**, ikili sınıflandırma problemleri için en yaygın kullanılan metrik fonksiyondur. Bu fonksiyon, gözlemlerin yüzde kaçının doğru biçimde kestirildiğini belirtir. Örneğin, "binary_accuracy" değerinin 0.70 olması, her yüz ölçümün 70 tanesinin doğru kestirildiği anlamına gelir.

- **"categorical_accuracy"**, çok sınıflı sınıflandırma problemlerinde kullanılan metrik fonksiyondur. Bu fonksiyon da gözlemlerin yüzde kaçının tam olarak isabet ettirildiğini belirtir. Örneğin, 100 sınıflı bir problemde 0.50 başarı, rastgele seçime göre daha iyi olabilir.

- **Loss fonksiyonları da metrik olarak kullanılabilir.** Ancak, her metrik fonksiyon bir loss fonksiyonu olarak kullanılmaz. Örneğin, lojistik olmayan regresyon problemlerinde `'mean_absolute_error'`, `'mean_absolute_percentage_error'` gibi fonksiyonlar metrik olarak kullanılabilir.

- **Metrik fonksiyonların yazısal kısa ve uzun isimleri:**  
  - `'binary_accuracy'`  
  - `'categorical_accuracy'`  
  - `'mean_absolute_error'` ya da `'mae'`  
  - `'mean_absolute_percentage_error'` ya da `'mape'`  
  - `'mean_squared_error'` ya da `'mse'`

---

**Lec_19_4_gpt.png:**

- **Modelin diskte saklanması:**  
  Bir sinir ağı eğitildikten sonra, ağırlık ve bias değerlerinin (`w` ve `bias`) saklanması gerekebilir. Bu, eğitimin uzun sürmesi ve her seferinde yeniden eğitimin verimsiz olması nedeniyle önemlidir. Keras, tüm modeli (katmanları, ağırlıkları ve bias değerleriyle birlikte) saklama imkanı sunar.

- **Saklama formatı:**  
  Modeli saklamak için uygun bir format olan **HDF5 (Hierarchical Data Format)** kullanılır. Bu format, büyük veri setleri için tasarlanmıştır. Modeli saklamak için `Sequential` sınıfının `save` metodu kullanılır. Örneğin:  
  ```python
  model.save('diabetes.h5', save_format='h5')
  ```  
  `save_format` parametresi belirtilmezse, TensorFlow'un varsayılan formatı (`'tf'`) kullanılır.

---

**Lec_19_5_1_gpt.png:**

- **Ağırlık değerlerine erişim:**  
  Eğitilmiş modeldeki ağırlık ve bias değerlerini program içinde kullanmak için, katman nesnelerinin `get_weights` ve `set_weights` metodları kullanılır. Katman nesnelerine erişmek için, `model.layers` listesi kullanılabilir. Örneğin:  
  ```python
  model = Sequential(name='Sample')
  hidden1 = Dense(32, activation='relu', input_dim=dataset_x.shape[1], name='Hidden-1')
  model.add(hidden1)
  hidden2 = Dense(32, activation='relu', name='Hidden-2')
  model.add(hidden2)
  output = Dense(1, activation='sigmoid', name='Output')
  model.add(output)
  ```  
  `get_weights` metodu, iki elemanlı bir liste döndürür: ilk eleman ağırlık matrisini (`w`), ikinci eleman bias değerlerini içerir.

---

**Lec_19_5_2_gpt.png:**

- **Yapay sinir ağları ile kestirim süreci:**  
  1. **Hedefin belirlenmesi:** Problemin ne olduğuna karar verilir (sınıflandırma, regresyon, şekil tanıma vb.).  
  2. **Özelliklerin belirlenmesi:** Kestirim için hangi bilgilerin gerekli olduğu tespit edilir. Örneğin, bir eczanenin cirosunu tahmin etmek için konum, müşteri sayısı, ürün çeşitliliği gibi özellikler kullanılabilir.  
  3. **Verilerin toplanması:** Veriler anketler, sensörler, sosyal medya veya önceki kayıtlardan toplanır.

---

**Lec_19_5_3_gpt.png:**

4. **Verilerin hazırlanması:**  
   - Gereksiz sütunların atılması,  
   - Eksik verilerin doldurulması,  
   - Kategorik verilerin sayısallaştırılması,  
   - Özellik ölçekleme ve mühendisliği işlemleri yapılır.  

5. **Modelin oluşturulması:** Probleme uygun bir yapay sinir ağı modeli tasarlanır.  

6. **Modelin eğitilmesi ve test edilmesi:** Model, veri kümesiyle eğitilir ve test edilir.  

7. **Kestirim işlemi:** Eğitilmiş model, yeni veriler üzerinde kestirim yapmak için kullanılır.

### Metric Functions

### Sinir Ağlarının Saklanması

In [1]:
from tensorflow.keras import Sequential
from tensorflow.keras.layers import Dense
from tensorflow.keras.activations import relu

import pandas as pd

df = pd.read_csv('datasets/diabetes.csv')

dataset_x = df.iloc[:, :-1].values
dataset_y = df.iloc[:, -1].values
from sklearn.model_selection import train_test_split

training_dataset_x, testing_dataset_x, training_dataset_y, testing_dataset_y = train_test_split(dataset_x, dataset_y)
len(training_dataset_x), len(testing_dataset_x), len(training_dataset_y), len(testing_dataset_y)

(576, 192, 576, 192)

In [2]:
model = Sequential(name="Sample")

model.add(Dense(64, activation=relu, input_shape=(dataset_x.shape[1],), name="Hidden-1"))
model.add(Dense(64, activation=relu, name="Hidden-2"))
model.add(Dense(1, activation='sigmoid', name="Output"))

model.summary()

  super().__init__(activity_regularizer=activity_regularizer, **kwargs)


In [3]:
from tensorflow.keras.optimizers import RMSprop

rmsprop = RMSprop()
model.compile(optimizer=rmsprop, loss='binary_crossentropy', metrics=['binary_accuracy'])

In [4]:
model.fit(training_dataset_x, training_dataset_y, epochs=100,  batch_size=32, validation_split=0.2)

Epoch 1/100
[1m15/15[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m2s[0m 31ms/step - binary_accuracy: 0.5548 - loss: 2.5461 - val_binary_accuracy: 0.4828 - val_loss: 1.6653
Epoch 2/100
[1m15/15[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 13ms/step - binary_accuracy: 0.6261 - loss: 1.0467 - val_binary_accuracy: 0.5776 - val_loss: 1.3740
Epoch 3/100
[1m15/15[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 12ms/step - binary_accuracy: 0.6436 - loss: 1.1258 - val_binary_accuracy: 0.5603 - val_loss: 1.1763
Epoch 4/100
[1m15/15[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 12ms/step - binary_accuracy: 0.5747 - loss: 1.2473 - val_binary_accuracy: 0.5431 - val_loss: 1.0381
Epoch 5/100
[1m15/15[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 12ms/step - binary_accuracy: 0.6874 - loss: 0.7131 - val_binary_accuracy: 0.5862 - val_loss: 1.6369
Epoch 6/100
[1m15/15[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 13ms/step - binary_accuracy: 0.5804 - loss: 

<keras.src.callbacks.history.History at 0x1ff99fb0750>

In [5]:
model.save('diabetes.h5', save_format='h5')

