## Kütüphaneler

In [None]:
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt

## .CSV Dosyasını Okuma

In [None]:
data=pd.read_csv("../input/breast-cancer-wisconsin-data/data.csv")

## Veri Ön işleme

In [None]:
data.drop(["Unnamed: 32","id"],axis=1,inplace=True)
data.diagnosis=[1 if each== "M" else 0 for each in data.diagnosis]
print(data.info())

#### y       değişkenimize binary değerleri,x_data  değişkenimize featureları atıyoruz


In [None]:
y=data.diagnosis.values
x_data=data.drop(["diagnosis"],axis=1)

## Normalizasyon işlemi

### normalizasyon formulü: (x-min(x))/(max(x)-min(x))

In [None]:
x= (x_data-np.min(x_data))/(np.max(x_data)-np.min(x_data)).values

In [None]:
print(x)

### veriyi train ve test olarak bölme işlemi

In [None]:
from sklearn.model_selection import train_test_split

x_train, x_test, y_train, y_test =train_test_split(x,y,test_size=0.2,random_state=42)
x_train= x_train.T
x_test= x_test.T
y_train= y_train.T
y_test= y_test.T

print("x_traing:",x_train.shape)
print("x_test",x_test.shape)
print("y_train",y_train.shape)
print("y_test",y_test.shape)

### w ve b parametrelerine ilk değerlerin verilmesi ve sigmoid fonksiyonu

In [None]:
#dimension=30
def initialize_weights_and_bias(dimension):
    w= np.full((dimension,1),0.01)
    b= 0.0
    return w,b
def sigmoid(z):
    y_head=1/(1+np.exp(-z))
    return y_head


### forward ve backward propagation işlemini yapan fonksiyon

In [None]:
def forward_backward_propagation(w,b,x_train,y_train):
    
    #forward
    z = np.dot(w.T,x_train) + b
    y_head = sigmoid(z)
    loss = -y_train*np.log(y_head)-(1-y_train)*np.log(1-y_head)
    cost = (np.sum(loss))/x_train.shape[1]
    
    #backward
    derivative_weight = (np.dot(x_train,((y_head-y_train).T)))/x_train.shape[1]
    derivative_bias = np.sum(y_head-y_train)/x_train.shape[1]                 
    gradients = {"derivative_weight": derivative_weight, "derivative_bias": derivative_bias}
    
    return cost,gradients

### w ve b güncelleme fonksiyonu

In [None]:
def update(w, b, x_train, y_train, learning_rate,number_of_iterarion):
    cost_list = []
    cost_list2 = []
    index = []
    
     # number_of_iterarion kere parametrelerin güncellenmesi(öğrenmesi)
    for i in range(number_of_iterarion):
        # forward ve backward prop yapar ve cost ,gradients'i bulur.
        cost,gradients = forward_backward_propagation(w,b,x_train,y_train)
        cost_list.append(cost)
        # güncelle
        w = w - learning_rate * gradients["derivative_weight"]
        b = b - learning_rate * gradients["derivative_bias"]
        if i % 10 == 0:
            cost_list2.append(cost)
            index.append(i)
            print ("Cost after iteration %i: %f" %(i, cost))
            
    #  weights ve bias'ı parametrelerini güncelliyoruz.
    parameters = {"weight": w,"bias": b}
    plt.plot(index,cost_list2)
    plt.xticks(index,rotation='vertical')
    plt.xlabel("Number of Iterarion")
    plt.ylabel("Cost")
    plt.show()
    return parameters, gradients, cost_list

## Tahmin

In [None]:
def predict(w,b,x_test):
    # x_test bir forward propagation girdisidir.
    z = sigmoid(np.dot(w.T,x_test)+b)
    Y_prediction = np.zeros((1,x_test.shape[1]))
    # eğer z 0.5'ten büyükse tahminimiz 1 olur (y_head=1),
    # eğer 0.5'ten küçükse 0 olur (y_head=0),
    for i in range(z.shape[1]):
        if z[0,i]<= 0.5:
            Y_prediction[0,i] = 0
        else:
            Y_prediction[0,i] = 1

    return Y_prediction


## Lojistik Regresyon

In [None]:
def logistic_regression(x_train, y_train, x_test, y_test, learning_rate ,  num_iterations):
    # parametrelere ilk katsayıların atanması
    dimension =  x_train.shape[0]  # that is 30
    w,b = initialize_weights_and_bias(dimension)
    # learning rate'i değiştirmeyin.
    parameters, gradients, cost_list = update(w, b, x_train, y_train, learning_rate,num_iterations)
    
    y_prediction_test = predict(parameters["weight"],parameters["bias"],x_test)

    # test hataları yüzdesi
    print("test accuracy: {} %".format(100 - np.mean(np.abs(y_prediction_test - y_test)) * 100))
    
logistic_regression(x_train, y_train, x_test, y_test,learning_rate = 1, num_iterations = 300)  

## SONUÇ:


### Kanser hücreleri verilerimize kurduğumuz model için doğru tahmin etme yüzdemiz % 96 olarak hesaplandı
### Lojistik regresyon ile en temel binary sınıflandırma modelimizi ayrıntılı olarak kodladık.

### Ekstra:

#### Sci-kit-learn kütüphanesi ile kısa yoldan bulunması için kod satırı

In [None]:
from sklearn.linear_model import LogisticRegression
lr = LogisticRegression()
lr.fit(x_train.T,y_train.T)
print("test accuracy {}".format(lr.score(x_test.T,y_test.T)))

#### bu şekilde hesaplandığında daha yüksek sonuçlar verebiliyor bkz:%97