# Yapay Sinir Ağları (Artificial Neural Network - ANN)

**Aktivasyon Fonksiyonları**

Nöron Üzerindeki Sinyal = w1(x1) + w2(x2) + w3(x3)

Nöron Üzerindeki Aktivasyon = ${\displaystyle \phi}$ [w1(x1) + w2(x2) + w3(x3)]

<br><br>

* Hemen hemen bütün fonksiyonlar kullanılır fakat yaygın olanları:
    * Threshold Function (Adım Fonksiyonu)
    * Sigmoid Function
    
## Sigmoid Fonksiyon

**Hatırlatma Logistic Regression**

* ${\displaystyle \sigma (t) = {\frac {e^t}{e^t + 1}} = {\frac {1}{1 + e^{-t}}}}$

* ${\displaystyle t = \beta_0 + \beta_1 x, t = A + Bx}$

* ${\displaystyle p(x)= {\frac {1}{1 + e^{-(\beta_0 + \beta_1 x)}}}}$

* ${\displaystyle \beta_0 + \beta_1 x_1 + \beta_2 x_2 + ... + \beta_m x_m = \beta_0 + {\sum_{i=1}^m} \beta_i x_i }$

<hr>

**Adım Fonksiyonu (Step Function)**
${\displaystyle \phi (x) = 1}$

<hr>

**S Fonksiyonu (Sigmoid Function)**
${\displaystyle \phi (x) = {\frac {1}{1 + e^{-x}}}}$

<hr>

**Düzleştirilmiş Fonksiyon (Rectifier)**
${\displaystyle \phi (x) = max(x,0)}$

<hr>

**Hiperbolik Tanjant (Hyperbolic Tangent - tanh)**
${\displaystyle \phi (x) = {\frac {1 - e^{-2x}}{1 + e^(-2x)}}}$

## Gradyan Alçalış (Gradient Descendent)

**Öğrenme Oranı ve Gradyan İniş**
* Büyük öğrenme oranı (Big learning rate)
* Küçük öğrenme oranı (Small learning rate)


## Geri Yayılım (Backpropogation)

**Adımlar**
* **Adım 1:** Bütün ağı rastgele sayılarla (sıfıra yakın ama sıfırdan farklı) ilklendirme
* **Adım 2:** Veri kümesinden ilk satır (her öznitelik bir nöron olacak şekilde) giriş katmanından verilir
* **Adım 3:** **İleri yönlü yayılım yapılarak**, YSA istenen sonucu verene kadar güncellenir
* **Adım 4:** Gerçek ve çıktı arasındaki fark alınarak hata (error) hesaplanır
* **Adım 5:** **Geri yayılım yapılarak**, her sinapsis üzerindeki ağırlık, hatadan sorumlu olduğu miktarda değiştirilir. Değiştirilme miktarı ayrıca öğrenme oranına da bağlıdır
* **Adım 6:** Adım 1-5 arasındaki adımları istenen sonucu elde edene kadar güncelleme (Takviyeli Öğrenme - Reinforced Learning) veya eldeki bütün verileri ilgili ağda çalıştırdıktan sonra tek seferde güncelleme (Yığın Öğrenme - Batch Learning)
* **Adım 7:** Bütün eğitim kümesi çalıştırıldıktan sonra bir tur (epoch) tamamlanmış olur, aynı veri kümeleri kullanılarak tur tekrarları yapılır

<br>

**Derin Öğrenme Kütüphaneleri**
* PyTorch (pytorch.org)
* TensorFlow (tensorflow.org)
* Caffe (caffe.berkeleyvision.org)
* Keras (keras.io)
* DeepLearning4J (deeplearning4j.org)
* ve diğerleri...

<br>

**Kodlama ve Kütüphaneler**
* CPU ve GPU farkları
    * Derin öğrenme için GPU
    * Küçük ağlar için CPU
* Paralel işleme (YSA forward ve Backpropoation sırasında)
* Derin öğrenmenin sıfırdan kodlayarak başlaması
    * Theano (GPU desteği bulunmakta)
    * TensorFlow (Google)
* Hazır bazı ağların ve kütüphanelerin kullanımı (üst seviye yapay sinir ağı kütüphanesi)
    * Keras

In [1]:
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from sklearn import preprocessing
from sklearn.compose import ColumnTransformer
from sklearn.preprocessing import OneHotEncoder
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
import keras
from keras.models import Sequential
from keras.layers import Dense
from sklearn.metrics import confusion_matrix

from warnings import filterwarnings
filterwarnings("ignore")

In [2]:
veriler = pd.read_csv("../Docs/Churn_Modelling.csv")

# Veri ön işleme

X= veriler.iloc[:,3:13].values
Y = veriler.iloc[:,13].values


#encoder: Kategorik -> Numeric

le = preprocessing.LabelEncoder()
X[:,1] = le.fit_transform(X[:,1])

le2 = preprocessing.LabelEncoder()
X[:,2] = le2.fit_transform(X[:,2])

ohe = ColumnTransformer([("ohe", OneHotEncoder(dtype=float),[1])],
                        remainder="passthrough"
                        )
X = ohe.fit_transform(X)
X = X[:,1:]

# Verilerin eğitim ve test için bölünmesi

x_train, x_test,y_train,y_test = train_test_split(X,Y,test_size=0.33, random_state=0)


# Verilerin Ölçeklenmesi

sc=StandardScaler()

X_train = sc.fit_transform(x_train)
X_test = sc.fit_transform(x_test)

In [3]:
#3 Yapay Sinir ağı

classifier = Sequential()

classifier.add(Dense(6, init = 'uniform', activation = 'relu' , input_dim = 11))

classifier.add(Dense(6, init = 'uniform', activation = 'relu'))

classifier.add(Dense(1, init = 'uniform', activation = 'sigmoid'))

classifier.compile(optimizer = 'adam', loss =  'binary_crossentropy' , metrics = ['accuracy'] )

classifier.fit(X_train, y_train, epochs=50)

y_pred = classifier.predict(X_test)

y_pred = (y_pred > 0.5)

cm = confusion_matrix(y_test,y_pred)

print(cm)

TypeError: ('Keyword argument not understood:', 'init')

In [7]:
?classifier

[1;31mSignature:[0m      [0mclassifier[0m[1;33m([0m[1;33m*[0m[0margs[0m[1;33m,[0m [1;33m**[0m[0mkwargs[0m[1;33m)[0m[1;33m[0m[1;33m[0m[0m
[1;31mType:[0m           Sequential
[1;31mString form:[0m    <keras.engine.sequential.Sequential object at 0x00000212873ADD50>
[1;31mFile:[0m           c:\users\tolga\appdata\local\programs\python\python310\lib\site-packages\keras\engine\sequential.py
[1;31mDocstring:[0m     
`Sequential` groups a linear stack of layers into a `tf.keras.Model`.

`Sequential` provides training and inference features on this model.

Examples:

```python
# Optionally, the first layer can receive an `input_shape` argument:
model = tf.keras.Sequential()
model.add(tf.keras.layers.Dense(8, input_shape=(16,)))
# Afterwards, we do automatic shape inference:
model.add(tf.keras.layers.Dense(4))

# This is identical to the following:
model = tf.keras.Sequential()
model.add(tf.keras.Input(shape=(16,)))
model.add(tf.keras.layers.Dense(8))

# Note that

In [9]:
?Dense

[1;31mInit signature:[0m
[0mDense[0m[1;33m([0m[1;33m
[0m    [0munits[0m[1;33m,[0m[1;33m
[0m    [0mactivation[0m[1;33m=[0m[1;32mNone[0m[1;33m,[0m[1;33m
[0m    [0muse_bias[0m[1;33m=[0m[1;32mTrue[0m[1;33m,[0m[1;33m
[0m    [0mkernel_initializer[0m[1;33m=[0m[1;34m'glorot_uniform'[0m[1;33m,[0m[1;33m
[0m    [0mbias_initializer[0m[1;33m=[0m[1;34m'zeros'[0m[1;33m,[0m[1;33m
[0m    [0mkernel_regularizer[0m[1;33m=[0m[1;32mNone[0m[1;33m,[0m[1;33m
[0m    [0mbias_regularizer[0m[1;33m=[0m[1;32mNone[0m[1;33m,[0m[1;33m
[0m    [0mactivity_regularizer[0m[1;33m=[0m[1;32mNone[0m[1;33m,[0m[1;33m
[0m    [0mkernel_constraint[0m[1;33m=[0m[1;32mNone[0m[1;33m,[0m[1;33m
[0m    [0mbias_constraint[0m[1;33m=[0m[1;32mNone[0m[1;33m,[0m[1;33m
[0m    [1;33m**[0m[0mkwargs[0m[1;33m,[0m[1;33m
[0m[1;33m)[0m[1;33m[0m[1;33m[0m[0m
[1;31mDocstring:[0m     
Just your regular densely-connected NN layer.

`Dense`