# Cost Function for Logistic Regression

In [10]:
import numpy as np
%matplotlib notebook
import matplotlib.pyplot as plt
from CourseFunctions.lab_utils_common import  plot_data, sigmoid, dlc
plt.style.use('./deeplearning.mplstyle')

## Veri Kümesi
Karar sınırı laboratuvarında kullanılan aynı veri kümesiyle başlayalım.


In [11]:
X_train = np.array([[0.5, 1.5], [1,1], [1.5, 0.5], [3, 0.5], [2, 2], [1, 2.5]])  #(m,n)
y_train = np.array([0, 0, 0, 1, 1, 1])                                           #(m,)

Verileri görselleştirmek için bir yardımcı fonksiyon kullanacağız. Etiketi $y=1$ olan veri noktaları kırmızı çarpılar olarak, etiketi $y=0$ olan veri noktaları ise mavi daireler olarak gösterilecektir.


In [12]:
fig,ax = plt.subplots(1,1,figsize=(4,4))
plot_data(X_train, y_train, ax)

# Set both axes to be from 0-4
ax.axis([0, 4, 0, 3.5])
ax.set_ylabel('$x_1$', fontsize=12)
ax.set_xlabel('$x_0$', fontsize=12)
plt.show()

<IPython.core.display.Javascript object>

## Maliyet Fonksiyonu

Önceki bir laboratuvarda *lojistik kayıp* fonksiyonunu geliştirmiştiniz. Hatırlarsanız, kayıp bir örnek için tanımlanır. Burada ise tüm örnekleri içeren **maliyet** fonksiyonunu oluşturmak için bu kayıpları birleştiriyorsunuz.

Lojistik regresyon için maliyet fonksiyonunun formu şu şekildedir:

$$ J(\mathbf{w},b) = \frac{1}{m} \sum_{i=0}^{m-1} \left[ loss(f_{\mathbf{w},b}(\mathbf{x}^{(i)}), y^{(i)}) \right] \tag{1}$$

Burada:
* $loss(f_{\mathbf{w},b}(\mathbf{x}^{(i)}), y^{(i)})$ tek bir veri noktası için maliyettir ve şu şekilde hesaplanır:

    $$loss(f_{\mathbf{w},b}(\mathbf{x}^{(i)}), y^{(i)}) = -y^{(i)} \log\left(f_{\mathbf{w},b}\left( \mathbf{x}^{(i)} \right) \right) - \left( 1 - y^{(i)}\right) \log \left( 1 - f_{\mathbf{w},b}\left( \mathbf{x}^{(i)} \right) \right) \tag{2}$$

*  Burada, $m$ veri setindeki eğitim örneklerinin sayısıdır ve:

$$
\begin{align}
  f_{\mathbf{w},b}(\mathbf{x^{(i)}}) &= g(z^{(i)})\tag{3} \\
  z^{(i)} &= \mathbf{w} \cdot \mathbf{x}^{(i)}+ b\tag{4} \\
  g(z^{(i)}) &= \frac{1}{1+e^{-z^{(i)}}}\tag{5}
\end{align}
$$


In [13]:
def compute_cost_logistic(X, y, w, b):
    """
    Computes cost

    Args:
      X (ndarray (m,n)): Data, m examples with n features
      y (ndarray (m,)) : target values
      w (ndarray (n,)) : model parameters
      b (scalar)       : model parameter

    Returns:
      cost (scalar): cost
    """

    m = X.shape[0]
    cost = 0.0
    for i in range(m):
        z_i = np.dot(X[i],w) + b
        f_wb_i = sigmoid(z_i)
        cost +=  -y[i]*np.log(f_wb_i) - (1-y[i])*np.log(1-f_wb_i)

    cost = cost / m
    return cost


Aşağıdaki hücreyi kullanarak maliyet fonksiyonunun uygulamasını kontrol edin.


In [14]:
w_tmp = np.array([1,1])
b_tmp = -3
print(compute_cost_logistic(X_train, y_train, w_tmp, b_tmp))

0.36686678640551745


## Örnek
Şimdi, farklı bir $w$ değeri için maliyet fonksiyonu çıktısının ne olduğunu görelim.

* Önceki bir laboratuvarda, $b = -3, w_0 = 1, w_1 = 1$ için karar sınırını çizmiştiniz. Yani, `b = -3, w = np.array([1,1])` olarak belirlemiştiniz.

* Diyelim ki $b = -4, w_0 = 1, w_1 = 1$ ya da `b = -4, w = np.array([1,1])` daha iyi bir model sağlıyor mu görmek istiyorsunuz.

İlk olarak, bu iki farklı $b$ değeri için karar sınırını çizerek hangisinin veriye daha iyi uyduğunu görelim.

* $b = -3, w_0 = 1, w_1 = 1$ için $-3 + x_0 + x_1 = 0$ denklemini çizeceğiz (mavi renkte gösterilecek).
* $b = -4, w_0 = 1, w_1 = 1$ için $-4 + x_0 + x_1 = 0$ denklemini çizeceğiz (macenta renkte gösterilecek).


In [15]:
import matplotlib.pyplot as plt

# Choose values between 0 and 6
x0 = np.arange(0,6)

# Plot the two decision boundaries
x1 = 3 - x0
x1_other = 4 - x0

fig,ax = plt.subplots(1, 1, figsize=(4,4))
# Plot the decision boundary
ax.plot(x0,x1, c=dlc["dlblue"], label="$b$=-3")
ax.plot(x0,x1_other, c=dlc["dlmagenta"], label="$b$=-4")
ax.axis([0, 4, 0, 4])

# Plot the original data
plot_data(X_train,y_train,ax)
ax.axis([0, 4, 0, 4])
ax.set_ylabel('$x_1$', fontsize=12)
ax.set_xlabel('$x_0$', fontsize=12)
plt.legend(loc="upper right")
plt.title("Decision Boundary")
plt.show()

<IPython.core.display.Javascript object>

Bu grafikten görebileceğiniz gibi, `b = -4, w = np.array([1,1])` eğitim verileri için daha kötü bir modeldir. Şimdi, maliyet fonksiyonu uygulamasının bunu yansıtıp yansıtmadığını görelim.


In [16]:
w_array1 = np.array([1,1])
b_1 = -3
w_array2 = np.array([1,1])
b_2 = -4

print("Cost for b = -3 : ", compute_cost_logistic(X_train, y_train, w_array1, b_1))
print("Cost for b = -4 : ", compute_cost_logistic(X_train, y_train, w_array2, b_2))

Cost for b = -3 :  0.36686678640551745
Cost for b = -4 :  0.5036808636748461


Maliyet fonksiyonunun beklendiği gibi davrandığını görebilirsiniz ve `b = -4, w = np.array([1,1])` için maliyetin, gerçekten de `b = -3, w = np.array([1,1])` için olandan daha yüksek olduğu doğrulanmıştır.
