In [None]:
import pandas as pd
import numpy as np
import seaborn as sns
import matplotlib.pyplot as plt

from sklearn.linear_model import LinearRegression
from sklearn.metrics import mean_squared_error, mean_absolute_error
from sklearn.model_selection import train_test_split, cross_val_score

pd.set_option("display.float_format", lambda x: "%.2f" % x)

In [None]:
#Cost function
def cost_func(Y, b, w, X):
  m = len(Y) # Gözlem sayısı, bütün gözlem birimlerini gezip hatayı bulacağımızdan dolayı gerekli.
  sse = 0

  for i in range(0, m): #Bütün gözlem birimlerini gez,
    y_hat = b + w * float(X.iloc[i].values) # verilen b, w değerlerine göre y değeri hesaplanacak.
    y = float(Y.iloc[i].values) # gerçek y değerleri
    sse += (y_hat - y ) ** 2 # farkının karesini alır ve eklersek toplam hata hesabını yaparız.
  
  mse = sse / m # en sonda da m e bölerek ortalama hatayı buluruz.
  return mse

In [None]:
def update_weight(Y, b, w, X, learning_rate):

  m = len(Y)

  b_deriv_sum = 0
  w_deriv_sum = 0

  for i in range(0, m):#bütün gözlem birimlerine b ve w için işlem yapıyoruz.
    y_hat = b + w * float(X.iloc[i].values)
    y = float(Y.iloc[i].values)
    b_deriv_sum += (y_hat - y) # b için türev sonucu
    w_deriv_sum += (y_hat - y) * float(X.iloc[i].values) #w için olan türev sonucu

  new_b = b - (learning_rate * 1 / m * b_deriv_sum)
  new_w = w - (learning_rate * 1 / m * w_deriv_sum)
  return new_b, new_w

In [None]:
def train(Y, initial_b, initial_w, X, learning_rate, num_iters):

  
  print("Starting gradient descent at b ={0}, w = {1}, mse = {2}".format(initial_b, initial_w, #İşlem yapmadan önce ilk değerlerimizi getiriyoruz. Karşılaştırmak için.
                                                                         cost_func(Y, initial_b, initial_w, X)))
  b = initial_b #bir karışıklık olmaması adına b ve w değerlerine atama yapıyoruz.
  w = initial_w
  cost_history = [] #her mse değerimizi burada tutacağız.

  for i in range(num_iters):
    b, w = update_weight(Y, b, w, X, learning_rate) #learning rate oranına göre b ve w değişkenlerimizin yeni değerlerini hesaplıyoruz.
    mse = cost_func(Y, b, w, X) # yeni değerlere göre yeni mse hatamız
    cost_history.append(mse) 

    if i % 100 == 0: #Bu işlem 100 kere yapılana kadar raporlama yapıyoruz.
      print("iter={:d}    b={:.2}   w={:.4f}    mse={:.4}".format(i, b, w, mse))

  print("After {0} iterations b = {1}, w={2}, mse={3}". format(num_iters, b, w, cost_func(Y, b, w, X))) #Şu kadar iterasyon sonucunda en sonki b, w, mse değerlerimizi yazdırıyoruz. 
  #İlk baştaki değerlerle karşılaştırabilmek için
  return cost_history, b, w

In [None]:
df = pd.read_csv("advertising.csv")
X = df[["Radio"]]
Y = df[["Sales"]]

In [None]:
#Parametre : veri setinden bulunur.
#Hiper Parametre : Veri setinden bulunamayan, kullanıcı tarafından ayarlanması gereken parametrelerdir.
#Örnek olarak verelim şimdilik:
learning_rate = 0.001
initial_b = 0.001
initial_w = 0.001
num_iters = 10

train(Y, initial_b, initial_w, X, learning_rate, num_iters)

Starting gradient descent at b =0.001, w = 0.001, mse = 255.92392306730005
iter=0    b=0.016   w=0.3795    mse=78.16
After 10 iterations b = 0.05137945708376413, w=0.4972772634684348, mse=67.19669096618838


([78.16286235183698,
  68.00692470937966,
  67.40465935847895,
  67.34697629889212,
  67.3203484267101,
  67.29550417817917,
  67.27077503728594,
  67.24606588921424,
  67.22137130458634,
  67.19669096618838],
 0.05137945708376413,
 0.4972772634684348)