YAPAY SİNİR AĞLARI

Yapay sinir ağları, temelde birçok yapay sinir hücresinden (nöron) oluşan bir ağdır. Her bir yapay nöron, girdileri alır, bu girdileri ağırlıklı olarak işler, bir aktivasyon fonksiyonu ile birleştirir ve bir çıkış üretir.

Bu yapay nöronlar, katmanlar halinde düzenlenmiş ve genellikle girdi, gizli ve çıktı katmanları olmak üzere üç tür katmandan oluşan bir yapıya sahiptir.

Eğitim süreci, genellikle gerçek çıktı ile tahmin arasındaki hatayı minimize etmek için gerçekleştirilir. Bu optimizasyon, geriye yayılım (backpropagation) adı verilen bir süreçle gerçekleşir.

In [20]:
# "diabetes" verisetini yüklüyoruz.
import pandas as pd
import numpy as np
diabetes = pd.read_csv("diabetes.csv")
df = diabetes.copy()
df.head()

from warnings import filterwarnings
filterwarnings('ignore')

In [21]:
# Veriseti içindeki eksik verileri siliyoruz.
df = df.dropna()
df.head()

Unnamed: 0,Pregnancies,Glucose,BloodPressure,SkinThickness,Insulin,BMI,DiabetesPedigreeFunction,Age,Outcome
0,6,148,72,35,0,33.6,0.627,50,1
1,1,85,66,29,0,26.6,0.351,31,0
2,8,183,64,0,0,23.3,0.672,32,1
3,1,89,66,23,94,28.1,0.167,21,0
4,0,137,40,35,168,43.1,2.288,33,1


In [22]:
# Verisetini tanımak için incelemeler yapıyoruz.

In [23]:
# Verisetindeki sayısal sütunlar için istatistiksel özet bilgilerini inceliyoruz.
df.describe().T

Unnamed: 0,count,mean,std,min,25%,50%,75%,max
Pregnancies,768.0,3.845052,3.369578,0.0,1.0,3.0,6.0,17.0
Glucose,768.0,120.894531,31.972618,0.0,99.0,117.0,140.25,199.0
BloodPressure,768.0,69.105469,19.355807,0.0,62.0,72.0,80.0,122.0
SkinThickness,768.0,20.536458,15.952218,0.0,0.0,23.0,32.0,99.0
Insulin,768.0,79.799479,115.244002,0.0,0.0,30.5,127.25,846.0
BMI,768.0,31.992578,7.88416,0.0,27.3,32.0,36.6,67.1
DiabetesPedigreeFunction,768.0,0.471876,0.331329,0.078,0.24375,0.3725,0.62625,2.42
Age,768.0,33.240885,11.760232,21.0,24.0,29.0,41.0,81.0
Outcome,768.0,0.348958,0.476951,0.0,0.0,0.0,1.0,1.0


In [24]:
# Veriseti içinde eksik değer kalıp kalmadığını inceliyoruz.
df.isnull().sum()

Pregnancies                 0
Glucose                     0
BloodPressure               0
SkinThickness               0
Insulin                     0
BMI                         0
DiabetesPedigreeFunction    0
Age                         0
Outcome                     0
dtype: int64

In [25]:
# Verisetindeki bağımlı ve bağımsız değişkenleri belirliyoruz.
X = df.drop(["Outcome"], axis=1)
y = df["Outcome"]

In [26]:
from sklearn.model_selection import train_test_split

In [27]:
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size = 0.30, random_state = 42)

In [28]:
from sklearn.preprocessing import StandardScaler

In [29]:
# scaler nesnesini oluşturuyoruz ve "StandardScaler'i" eğitiyoruz.
scaler = StandardScaler()
scaler.fit(X_train)

In [30]:
# Eğitim ve Test verisetlerini standardlaştırıyoruz.
X_train_scaled = scaler.transform(X_train)
X_test_scaled = scaler.transform(X_test)

In [31]:
from sklearn.neural_network import MLPClassifier

In [32]:
# Modeli oluşturduk ve eğittik.
model = MLPClassifier()
mlpc_model = model.fit(X_train_scaled, y_train)

In [33]:
# Model üzerinde tahmin işlemini gerçekleştirdik.
y_train_pred = mlpc_model.predict(X_train_scaled)
y_test_pred = mlpc_model.predict(X_test_scaled)

In [34]:
from sklearn.metrics import accuracy_score

In [35]:
# Test Seti için "accuracy_score" değerini hesapladık.
accuracy_score_test = accuracy_score(y_test, y_test_pred)
print('Test Seti Doğruluk Oranı:', accuracy_score_test)

Test Seti Doğruluk Oranı: 0.7316017316017316


Model Tuning

In [42]:
# Cross Validation (Çapraz Doğrulama) işlemini gerçekleştirmek için nesne oluşturuyoruz.
from sklearn.model_selection import GridSearchCV
mlpc_params = {"alpha": [0.1, 0.01, 0.02, 0.005, 0.0001,0.00001],
              "hidden_layer_sizes": [(10,10,10),(100,100,100),(100,100),(3,5), (5, 3)],
              "solver" : ["lbfgs","adam","sgd"],
              "activation": ["relu","logistic"]}

In [43]:
# Cross Validation nesnesi oluşturduktan sonra modeli oluşturduk ve eğittik.
mlpc_cv_model = GridSearchCV(mlpc_model, mlpc_params, cv = 10, n_jobs = -1, verbose = 2)
mlpc_cv_model = mlpc_cv_model.fit(X_train_scaled, y_train)

Fitting 10 folds for each of 180 candidates, totalling 1800 fits


In [44]:
# Model için en iyi parametreler aşağıdaki gibidir.
mlpc_cv_model.best_params_

{'activation': 'relu',
 'alpha': 1e-05,
 'hidden_layer_sizes': (100, 100),
 'solver': 'sgd'}

In [45]:
# Final Modelini kuruyoruz.
mlpc_tuned = MLPClassifier(activation = "relu", alpha = 1e-05, hidden_layer_sizes = (100, 100),solver = "sgd")
mlpc_tuned.fit(X_train_scaled, y_train)

In [46]:
# Final modeli üzerinde tahmin işlemini gerçekleştirdik.
y_pred_test = mlpc_tuned.predict(X_test_scaled)

In [47]:
# Model tuning işleminden sonra "accuracy_score" değerini tekrar hesapladık.
accuracy_score_test = accuracy_score(y_test, y_pred_test)
print('Test Seti Doğruluk Oranı:', accuracy_score_test)

Test Seti Doğruluk Oranı: 0.7316017316017316
