# Materi 2 : Linear Regression
Regression adalah permasalahan yang outputnya berupa nilai real value

In [None]:
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt

## Membuat Data Fitur dan target

In [None]:
#data fitur (X) dan target (Y)
dataX = np.array([1,2,4,3,5])
dataY = np.array([1,3,3,2,5])

##Direct Matriks
matriks yang digunakan untuk merepresentasikan hubungan antara input dan output pada model yang dilatih dengan data yang diberikan.

### Rumus Direct Matriks
- Model<br>
$y = w_0 + w_1x$<br>
- Rumus W1<br>
$w1 = cov(x,y)/var(x)$<br>
- Rumus w0<br>
$w_0 = \overline{y} - w_1\overline{x}$<br>
- Rumus Covariant<br>
$cov(x,y) = $$\sum_{i=1}^{n} x_i$$(x_1
-\overline{x})(y_1-\overline{x})/n-1$<br>
- Rumus Variant<br>
$var(x) = $$\sum_{i=1}^{n} (x_1-\overline{x})^2/n-1$

Keterangan :
- $\overline{x}$ = Mean Fitur
- $\overline{y}$ = Mean Target
- $w_0$ = Intercept/Bias
- $w_1$ = Koefisien



### Langkah
- Hitung Mean Fitur dan terget
- Hitung Cov dan Var
- Masukan hasil ke w0 dan w1
- Masukan hasil w0 dan w1 ke model

### Perhitungan Direct Matriks

In [None]:
#membuat kelas yang dibutuhkan
from re import X
class simpleLinear:
  #deskripsi variabe
  def __init__(self,feature,target):
    self.feature = feature
    self.target = target
    self.w0 = None
    self.w1 = None
  #fungsi rata rata
  def meanData(self,x):
    return np.mean(x)
  #fungsi var(x)
  def varData(self,x):
    return np.var(x - self.meanData(x),ddof=1)
  #fungsi cov
  def covData(self,x,y):
    return np.cov(x - self.meanData(x)) * (y - self.meanData(y)) / (len(x)-1)
  #fungsi fit
  def fit(self):
    self.w1 = self.covData(self.feature,self.target)/(self.varData(self.feature))
    self.w0 = self.meanData(self.target) - (self.w1 * self.meanData(self.feature))
  #fungsi prediksi
  def prediksi(self,x_input):
    return self.w0 + self.w1*x_input


Menentukan meanData,Variant Data,Covariant data,update bobot,dan prediksi

In [None]:
dataX = np.array([1,2,4,3,5])
dataY = np.array([1,3,3,2,5])
model = simpleLinear(dataX,dataY)
model.fit()
print('w1',model.w1)
print('w0',model.w0)

w1 [-0.45  0.05  0.05 -0.2   0.55]
w0 [4.15 2.65 2.65 3.4  1.15]


##Stochastic Gradient Descent (Perulangan)
algoritma optimasi yang digunakan dalam machine learning untuk menemukan nilai optimal dari parameter model. Algoritma ini bekerja dengan menghitung gradien (turunan parsial) dari fungsi biaya (cost function) pada setiap data pelatihan secara acak (stochastic) dan mengupdate parameter model secara iteratif berdasarkan gradien yang dihitung tersebut.

###  Rumus
- Model<br>
$y = w_0 + w_1x$<br>
- Data Training<br>
$w_j = w_j - \eta(f(x^i)-y^i)x^i_j$<br>

Keterangan :
- $j$ = fitur ke ...
- $y^i$ = target data ke ...
- $i$ = data ke...
- $f(x^i)$ = prediksi data ke...
- $\eta$ = learning rate

In [None]:
#perubahan dimensi data (kolom menjadi baris dengan [])
dataX = np.array([[1],[2],[4],[3],[5]])
dataY = np.array([1,3,3,2,5])
jmlhData,jmlhFitur = dataX.shape
print(jmlhData,jmlhFitur)

5 1


In [None]:
#menambah bias (1) pada kolom pertama (kolom ditambah 1)
expandY = np.ones((jmlhData,jmlhFitur+1))
#mengisi data dengan data fitur (index 0 = 1,index 1 dan seterusnya diisi dengan data fitur)
expandY[:,1:jmlhData+1]=dataX[:]
print(expandY)

[[1. 1.]
 [1. 2.]
 [1. 4.]
 [1. 3.]
 [1. 5.]]


In [None]:
#2 looping iterasi dalam epoch dan iterasi
w = np.zeros((1,jmlhFitur+1))
#set learn rate
eta = 0.01
epoch = 1
for ep in range(epoch):
  for i in range(jmlhData):
    #transpose
    prediksi = w.dot(expandY[i].T)
    error = prediksi-dataY[i]
    delta = eta*error*expandY[i]
    #update bobot
    w= w-delta
    print(error,delta,w)


[-1.] [-0.01 -0.01] [[0.01 0.01]]
[-2.97] [-0.0297 -0.0594] [[0.0397 0.0694]]
[-2.6827] [-0.026827 -0.107308] [[0.066527 0.176708]]
[-1.403349] [-0.01403349 -0.04210047] [[0.08056049 0.21880847]]
[-3.82539716] [-0.03825397 -0.19126986] [[0.11881446 0.41007833]]


In [None]:
print(w)
#prediksi data ke i
output = w.dot(expandY[3].T) #data ke 3
#model
#f(x,w) = 0,11 + 0,41 x

[[0.11881446 0.41007833]]


In [None]:
import numpy as np

# Inisialisasi parameter gradient descent
theta = np.array([0, 0])
alpha = 0.01

# Membuat dataset awal
X = np.array([[1, 2], [2, 4], [3, 6], [4, 8], [5, 10]])
y = np.array([2, 4, 6, 8, 10])

# Melakukan pelatihan model secara online
for i in range(len(X)):
    # Hitung prediksi
    h = np.dot(theta, X[i])
    # Hitung error
    error = h - y[i]
    # Hitung gradient
    gradient = alpha * error * X[i]
    # Update parameter
    theta = theta - gradient

# Memprediksi nilai dengan model yang sudah dilatih
X_new = np.array([6, 12])
y_new = np.dot(theta, X_new)

print("Hasil prediksi: ", y_new)

Hasil prediksi:  12.2508


In [None]:
import numpy as np

# Inisialisasi parameter gradient descent
theta = np.array([0, 0])
alpha = 0.01
num_iters = 1000

# Membuat dataset awal
X = np.array([[1, 2], [2, 4], [3, 6], [4, 8], [5, 10]])
y = np.array([2, 4, 6, 8, 10])

# Melakukan pelatihan model secara offline
for i in range(num_iters):
    # Hitung prediksi
    h = np.dot(X, theta)
    # Hitung error
    error = h - y
    # Hitung gradient
    gradient = alpha * (1/len(y)) * np.dot(X.T, error)
    # Update parameter
    theta = theta - gradient

# Memprediksi nilai dengan model yang sudah dilatih
X_new = np.array([6, 12])
y_new = np.dot(theta, X_new)

print("Hasil prediksi: ", y_new)

Hasil prediksi:  12.0


##Offline Learning
teknik machine learning yang melibatkan pelatihan model pada dataset yang sudah dikumpulkan sebelumnya dan diproses secara offline.

### Perhitungan Offline Learning

In [None]:
class LinearRegression:
  def __init__(self,bias = 0.1,learning_rate=0.01,epoch=1000,w1=0.2,w2=0.3):
    self.bias = bias
    self.learning_rate = learning_rate
    self.epoch = epoch
    self.w = np.array([w1,w2])
    self.b = bias
  def fit(self,x,y):
    for i in range(self.epoch):
      y_pred = np.dot(x,self.w) + self.b
      error = y - y_pred
      #dataWeight
      dw = (-2 * np.dot(x.T,error))/len(x)
      #dataBias
      db = (-2 * np.sum(error))/len(x)
      self.w -= self.learning_rate * dw
      self.b -= self.learning_rate * db
  def predict(self,x):
    return np.dot(x,self.w) + self.b

In [None]:
x = np.array([[2,4],[2,5],[3,1],[4,5]])
y = np.array([10,12,12,16])
model = LinearRegression()
model.fit(x,y)
x_test = np.array([[2,4],[3,1]])
y_pred = model.predict(x_test)
print(y_pred)

[10.57488605 11.55150446]
