# Yapay sinir ağları

## İçerik
1. Teorik bilgi
    1. Neden YSA
    2. Non-linearity
    3. Sinir Ağı Modeli
    4. Yapay Sinir Ağı Modeli
    5. Matematiksel Model
2. Uygulama


# Neden Yapay Sinir Ağları
Geçen haftalardaki problemimizi ve modellerimizi hatırlayalım: **ev fiyatı tahmini** için **linear regression** ve **logistic regression** modelleri


|<p style="text-align:center">*linear regression*</p>|<p style="text-align:center">*logistic regression*</p>|
|-----|-----|
|<p style="text-align:center">$ h = \theta_2 x_2 + \theta_1 x_1 + \theta_0 $</p>|<p style="text-align:center">$h = g(\theta_2 x_2 + \theta_1 x_1 + \theta_0)$ </p>|
|<img src="images/li_r.png" />|<img src="images/lo_r.png" />|


<br>
<br>

1. Parametre sayılarımız ( $x_i$ ): 1,2,3 ... Peki yeterli mi?
2. Peki ya verilerimizi bir çizgi ile ayıramazsak? Mesela: 
<br>
<img style="width: 40%;height: 40%;" src="images/limit_ex.png" />


<!--<h6>4 boyutlu bir uzay: </h6>
<video controls src="https://youtu.be/zwAD6dRSVyI?t=690" />-->


<br>
<br>


Gerçek dünyada feature sayısımız çok fazladır. Mesela:

<br>

|  |  |
|-----|-----|
|||
|<img style="width: 65%;height: 45%;" src="images/1.png" />|<img style="width: 70%;height: 50%;" src="images/2.png" />|



> Peki bu kadar fazla feature boyutumuz varsa çözüm ne olabilir -> yapay sinir ağları

# Yapay sinir ağları

### Sinir Ağı Modeli

<img style="width: 70%;height: 70%;" src="images/neuron.jpg" />

### Yapay sinir Ağı Modeli

<img style="width: 50%;height: 50%;" src="images/nn1.png" />

$$ h_{\theta}(x) = \dfrac{1}{1 + e^{-\theta^T X}} $$

<img style="width: 50%;height: 50%;" src="images/nn2.png" />



> <h6>Forward Propagation nedir?</h6>

##### *AND* Örneği

<img style="width: 40%;height: 40%;" src="images/and.png" />


$$ x_1, x_2 : {0,1}  $$
<br>
$$ w_1: -30 $$
$$ w_2 : +20 $$
$$ w_3: +20 $$

<h6>Yapay sinir ağları ile el yazısı tanıma:</h6>
https://www.youtube.com/watch?v=yxuRnBEczUU
<br>
https://www.youtube.com/watch?v=FwFduRA_L6Q

<br>
<br>

> Peki modelimizin birden çok sınıfı aynı anda ayırmasını istersek?: Multiclass Classification

<img style="width: 50%;height: 50%;" src="images/multi.png" />

<br>
<br>
<br>
Referanslar
- https://www.coursera.org/learn/machine-learning/home/week/4

# Uygulama

### Problem
Elimizde el yazısı rakam resimleri var. Bu resimler 20x20 pixel formatında resimler aslında. Peki biz bu sayı resimlerini bilgisayara bir şekilde öğretip bilgisayarların artık sayıları tanımasını sağlayabilir miyiz acaba?

### Veri
Veri kümesi: 4000x400 büyüklüğünde matrix. 4000 tane 20x20 formatında resimler içeriyor. Her resim 20x20 formatından 1x400(20*20) formatına getirilmiştir.

In [19]:
import numpy as np
import matplotlib.pyplot as plt
import scipy.io as sio
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import OneHotEncoder

# Veri kümesini yükleyelim
dataset = sio.loadmat('ex4data1.mat')
# m = kaç tane resmimiz var?
m = dataset['X'].shape[0]

# Veri kümemizi eğitim ve doğrulama olarak ikiye ayırıyoruz.
x, val_x, y, val_y = train_test_split(dataset['X'], dataset['y'], test_size=0.2, random_state=42)

y_one_hot = y
enc = OneHotEncoder()
enc.fit(y_one_hot)
y_one_hot = enc.transform(y_one_hot).toarray()

# Girdi ve Çıktı Boyutlarını girelim
N, D_in, H, D_out = m, 400, 100, 10

In [20]:
# Ağırlıklar rasgele ilk değerler atanmıştır
w1 = np.random.randn(D_in, H)
w2 = np.random.randn(H, D_out)
b1 = np.zeros((1,))
b2 = np.zeros((1,))

In [21]:
# Non-linearity Fonksiyonumuz : ReLU ve türevi
def relu(x):
    return np.maximum(x, 0)

def softmax(x):
    for i in range(x.shape[0]):
        x[i]
        x[i] = np.exp(x[i])/ np.sum(np.exp(x[i]), axis=0)
    return x

def softmax_backward(x):
    return x *(1. - x)

def relu_backward(x):
    return (x > 0).astype(float)

def sigmoid(x):
    return 1/(1 + np.exp(-x))

def sigmoid_backward(x):
    return x*(1-x)

In [22]:
from IPython.core.display import SVG
from IPython.core.display import HTML

display(HTML("<img src='cost.png' title='Title text' />"))

In [None]:
# Loss değerleri listesi 
j_history =  []

learning_rate = 0.1
m = x.shape[0]

for t in range(500):
    print(t)
    # Forward pass: tahmini y değerlerini hesapla
    h1 = x.dot(w1) + b1
    a1 = relu(h1)
    h2 = a1.dot(w2)+ b2
    a2 = softmax(h2/10)
    y_pred = a2

    # Loss'u hesapla ve geçmişe at
    loss =-np.sum(np.multiply(y_one_hot,np.log(y_pred))+np.multiply(1-y_one_hot,np.log(1-y_pred))) /m
    j_history.append(loss)
    
    # Loss'un w1 ve w2' ye göre türevleri
    da2 = -((np.divide(y_one_hot,y_pred) - np.divide(1-y_one_hot,1-y_pred)))/m
    dh2 = np.multiply(da2,softmax_backward(a2))
    dw2 =  a1.T.dot(dh2)
    db2 = np.sum(dh2)
    da1 = w2.dot(dh2.T).T
    dh1 = np.multiply(relu_backward(h1),da1)
    dw1 = np.matmul(x.T,dh1)
    db1 = np.sum(dh1)
    
    # Loss türev
    # türev w2 
    
    # Ağırlıkları güncelle
    w1 -= learning_rate * dw1
    b1 -= learning_rate * db1
    w2 -= learning_rate * dw2
    b2 -= learning_rate * db2

0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199


In [None]:
plt.plot(j_history)

In [None]:
# Doğrulama (Validation) verisi üzerinden başarım oranı hesaplanacak
# Önce doğrulama verisinden tahminler alalım

h = val_x.dot(w1)
a1 = relu(h)
h2 = a1.dot(w2)+ b2
a2 = softmax(h2/100)
y_pred = a2
print(val_y.shape)

In [None]:
# Başarım Oranını hesaplayalım

counter = 0
for i, j in zip(val_y, np.argmax(y_pred, axis=1)+1):
    # print('{}-{}-{}'.format(i,j,i==j))
    if i == j:
        counter += 1

# print(val_y.shape[0])
# print(counter)
print("Başarım Oranı: {}".format(counter  / val_y.shape[0]*100))