<a href="https://colab.research.google.com/github/TruongHieuDEV/MachineLearning/blob/main/LogisticRegression.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [None]:
!wget --no-check-certificate 'https://docs.google.com/uc?export=download&id=141hQWu6d948cWGRB2gVedrcbAcn6ydUX' -O data.csv

Đối với hai mô hình đã học là linear regression và perceptron learning algorithm thì chúng ta đều có $y = \textbf{f}(\textbf{w}^T⋅\textbf{x}_i)$ gọi là activation function. Với linear regression thì đầu ra là một số thực, không bị chặn trên hay chặn dưới, với PLA thì đầu ra là 1 hoặc -1 thể hiện lớp của điểm dữ liệu. Còn với Logistic Regression đầu ra sẽ là sác xuất được giới hạn bởi (0, 1). Nếu ta coi xác suất $\textbf{x}$ rơi vào class 1 là $\textbf{f}(\textbf{w}^T⋅\textbf{x}_i)$ và rơi vào class 0 là $1-\textbf{f}(\textbf{w}^T⋅\textbf{x}_i)$ với mô hình như vậy, các điểm dữ liệu train đã biết y ta có thể viết như sau:


> $P(y_i=1|\textbf{x}_i;\textbf{w}) = f(\textbf{w}^T⋅\textbf{x}_i)$\
> $P(y_i=0|\textbf{x}_i;\textbf{w}) = 1- f(\textbf{w}^T⋅\textbf{x}_i)$




Đặt $z_i = f(\textbf{w}^T⋅\textbf{x}_i)$ và gộp hai biểu thức trên ta có:
> $P(y_i|\textbf{x}_i;\textbf{w}) = z_i^{y_i} * (1 - z_i)^{1 - y_i}$

Xét toàn bộ training set chúng ta cần tìm w để $P(\textbf{y}|\textbf{X};\textbf{w})$ đạt giá trị max:


> $w = arg max_w$$P(\textbf{y}|\textbf{X};\textbf{w})$



Giả sử các điểm dữ liệu được sinh ra một cách độc lập ngẫu nhiên, ta có:


> $P(\textbf{y}|\textbf{X};\textbf{w}) = \prod_{i = 1}^N P(y_i|\textbf{x}_i;\textbf{w}) = \prod_{i = 1}^N z_i^{y_i} * (1 - z_i)^{1 - y_i}$



In [None]:
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from sklearn.model_selection import train_test_split


In [None]:
df = pd.read_csv('data.csv')
df['Gender_hw'] = df['Gender'].apply(lambda x : 1 if x == 'Male' else 0)
df.tail()

In [None]:
data = df[[ 'EstimatedSalary', 'Purchased']].rename(columns = { 'EstimatedSalary' : 'Es', 'Purchased' : 'P'})

In [None]:
train, test = train_test_split(data, test_size = 0.2, random_state=12)

In [None]:
def sigmoid(s):
  return 1/(1 + np.exp(-s))

In [None]:
def logisticRegerssion(Xtrain, ytrain, w_init, eta, sigmoid, max_count):
  w = [w_init]
  N = Xtrain.shape[1]
  count = 0
  check_w_after = 20
  while count < max_count:
    mix_id = np.random.permutation(N)
    for i in mix_id:
      xi = Xtrain[:, i].reshape(Xtrain.shape[0], 1)
      yi = ytrain[i]
      zi = sigmoid(np.dot(w[-1].T, xi))
      w_new = w[-1] + eta * (yi - zi) * xi
      count+=1
      if count % check_w_after == 0:
        if np.linalg.norm(w_new - w[-check_w_after]) <= 1e-8:
          return w
      w.append(w_new)
  return w

In [None]:
eta = 0.05


X = np.array([[0.50, 0.75, 1.00, 1.25, 1.50, 1.75, 1.75, 2.00, 2.25, 2.50, 
              2.75, 3.00, 3.25, 3.50, 4.00, 4.25, 4.50, 4.75, 5.00, 5.50]])
Xtrain = np.concatenate((X, np.ones((1, X.shape[1]))), axis=0)
ytrain = np.array([0, 0, 0, 0, 0, 0, 1, 0, 1, 0, 1, 0, 1, 0, 1, 1, 1, 1, 1, 1])
w_init = np.random.rand(Xtrain.shape[0], 1)
w = logisticRegerssion(Xtrain, ytrain, w_init, eta, sigmoid, 1000000)


In [None]:
print(w[-1])