In [2]:
from sklearn.datasets import make_classification
import tensorflow as tf
from tensorflow import keras
from sklearn.model_selection import StratifiedKFold
from sklearn.metrics import accuracy_score
import numpy as np

**dataset creation**

In [None]:
# Cross validation | اعتبارسنجی متقابل

# داده های ترین رو به چند فولد تقسیم میکنیم و در هر بار آموزش مدل، یه بخش به عنوان تست و بقیه بخش ها به عنوان ترین در نظر گرفته میشه
# برای اعتبارسنجی دقیق تر

# برای شروع یک دیتاست ساختگی برای باینری کلاسیفیکیشن میسازیم
X, y = make_classification(n_samples=1000, n_features=10, n_informative=8, n_redundant=2, random_state=0)

X[500], y[500]

(array([ 1.84575176, -1.62371867,  2.0607981 , -2.18937014,  0.92698165,
         0.24780145, -0.72100289, -2.20669145,  2.75275518,  0.63061379]),
 np.int64(1))

**model definition**

In [None]:
# Define the model in a function | تعریف مدل تو تابع برای راحتی در آینده

def create_model():
  model = keras.Sequential()
  model.add(keras.layers.Dense(units=16, activation='relu'))
  model.add(keras.layers.Dense(units=1, activation='sigmoid')) # از سیگموید استفاده میکنیم تا خروجی بین 0 و 1 باشه

  model.compile(optimizer=tf.optimizers.Adam(), loss=tf.losses.binary_crossentropy, metrics=['accuracy'])

  return model

**cross validation**

In [None]:
# کراس ولیدیشن

# Spliting data into 5 folds | تقسیم داده ها به 5 قسمت
n_split = 5

# تعریف شئ کراس ولیدیشن
kf = StratifiedKFold(n_splits=n_split, shuffle=True) # shuffle -> داده‌ها رو قاطی می‌کنه تا تقسیمات تصادفی‌تر باشه

# یه لیست خالی تعریف می‌کنیم برای ذخیره‌ی دقت هر دور از آموزش و تست
acc_total = []

# جدا کردن داده های ترِین و ولیدیشن
for train_index, validation_index in kf.split(X, y):
  X_train = X[train_index]
  y_train = y[train_index]
  X_validation = X[validation_index]
  y_validation = y[validation_index]

  model = create_model()

  model.fit(X_train, y_train, epochs=20, batch_size=64, verbose=2)

  y_pred = model.predict(X_validation)
  # حالا مدل بعد از پریدیکت کردن یک عددی بین 0 و 1 میده
  # این عدد اگه بالای 0.5 باشه یعنی نمونه جزو کلاس 1 هستش و درغیر این صورت جزو کلاس 0 هستش
  # True : 1
  # False : 0
  y_pred = (y_pred > 0.5).astype('int32')

  acc = accuracy_score(y_true=y_validation, y_pred=y_pred)
  acc_total.append(acc)

Epoch 1/20
13/13 - 2s - 175ms/step - accuracy: 0.5387 - loss: 0.8691
Epoch 2/20
13/13 - 0s - 29ms/step - accuracy: 0.5950 - loss: 0.7348
Epoch 3/20
13/13 - 0s - 13ms/step - accuracy: 0.6587 - loss: 0.6298
Epoch 4/20
13/13 - 0s - 6ms/step - accuracy: 0.7088 - loss: 0.5512
Epoch 5/20
13/13 - 0s - 6ms/step - accuracy: 0.7650 - loss: 0.4962
Epoch 6/20
13/13 - 0s - 9ms/step - accuracy: 0.8062 - loss: 0.4517
Epoch 7/20
13/13 - 0s - 7ms/step - accuracy: 0.8363 - loss: 0.4177
Epoch 8/20
13/13 - 0s - 8ms/step - accuracy: 0.8512 - loss: 0.3896
Epoch 9/20
13/13 - 0s - 29ms/step - accuracy: 0.8662 - loss: 0.3663
Epoch 10/20
13/13 - 0s - 12ms/step - accuracy: 0.8825 - loss: 0.3465
Epoch 11/20
13/13 - 0s - 9ms/step - accuracy: 0.8875 - loss: 0.3294
Epoch 12/20
13/13 - 0s - 8ms/step - accuracy: 0.8938 - loss: 0.3146
Epoch 13/20
13/13 - 0s - 9ms/step - accuracy: 0.9000 - loss: 0.3013
Epoch 14/20
13/13 - 0s - 7ms/step - accuracy: 0.9087 - loss: 0.2901
Epoch 15/20
13/13 - 0s - 20ms/step - accuracy: 0.91

In [None]:
# Display all the accuracies | دیدن اکیورسی هر مدل، توی 5 هر 5 بار
acc_total

[0.895, 0.935, 0.845, 0.915, 0.955]

In [None]:
# Average | در آخر هم میریم که میانگین عملکرد مدل روی این دیتاست و با این پارامتر های مدل رو ببینیم
np.mean(acc_total)

np.float64(0.909)