# 수치미분
1. 함수 f(x) 정의
2. 델타 x를 작은 값으로 설정(1e-4)
3. 분자/분모 구현

In [1]:
def nummerical_derivative(f, x):
  delta_x = 1e-4
  return (f(x+delta_x) - f(x-delta_x)) / (2*delta_x)

# 수치미분 최종(다변수)

In [2]:
import numpy as np

def numerical_derivative(f,x): # f: 다변수 함수, x: 모든 변수를 포함하고 있는 numpy 객체
  delta_x = 1e-4
  grad = np.zeros_like(x) # 계산된 수치미분 값 저장 변수
  # zeros_like는 x 변수만큼의 사이즈를 가지는 배열을 생성함(0으로 초기화)

  #flags = ['multi_index'] : (row, col) 형태 => 행렬을 쓰기 때문
  # op_flags = ['readwrite'] : 읽고 쓰기 형태
  it = np.nditer(x, flags=['multi_index'], op_flags=['readwrite']) # 모든 입력변수에 대해 편미분하기 위해 iterator 획득


  while not it.finished: # 변수의 개수만큼 반복
    idx = it.multi_index

    tmp_val = x[idx] # numpy 타입은 mutable 이므로 원래 값 보관

    # 하나의 변수에 대한 수치미분 계산(기존코드와 동일)
    #########################################
    x[idx] = float(tmp_val) + delta_x
    fx1 = f(x)

    x[idx] = float(tmp_val) - delta_x
    fx2 = f(x)
    grad[idx] = (fx1-fx2) / (2*delta_x)
    ##########################################
    x[idx] = tmp_val
    it.iternext()

  return grad

ModuleNotFoundError: No module named 'numpy'

# 경사하강법

## 1. simple regression


In [None]:
# 학습데이터 준비
import numpy as np

x_data = np.array([1,2,3,4,5]).reshape(5,1) # 입력 데이터
y_data = np.array([2,3,4,5,6]).reshape(5,1) # 정답 데이터

t_data = np.array([8,9,10,11,12]).reshape(5,1) # x_data, y_data와 크기가 같아야 함.(행렬)

In [None]:
# 임의의 직선 y=Wx+b 정의(임의의 값으로 가중치 W, 바이어스 b 초기화)

W = np.random.rand(1,1)
b = np.random.rand(1)
print("W= ", W, ", W.shape= ", W.shape, ", b = ", b, ", b.shape = ", b.shape)


W=  [[0.01172554]] , W.shape=  (1, 1) , b =  [0.03979369] , b.shape =  (1,)


In [None]:
# 손실함수 E(W,b) 정의
def loss_func(x, t):
  y = np.dot(x, W) + b
  return (np.sum((t-y)**2) / len(x))

In [None]:
# 수치미분 numerical_derivative 및 utility 함수 정의

def numerical_derivative(f,x): # f: 다변수 함수, x: 모든 변수를 포함하고 있는 numpy 객체
  delta_x = 1e-4
  grad = np.zeros_like(x) # 계산된 수치미분 값 저장 변수
  # zeros_like는 x 변수만큼의 사이즈를 가지는 배열을 생성함(0으로 초기화)

  it = np.nditer(x, flags=['multi_index'], op_flags=['readwrite']) # 모든 입력변수에 대해 편미분하기 위해 iterator 획득


  while not it.finished: # 변수의 개수만큼 반복
    idx = it.multi_index

    tmp_val = x[idx] # numpy 타입은 mutable 이므로 원래 값 보관

    # 하나의 변수에 대한 수치미분 계산(기존코드와 동일)
    #########################################
    fx1 = f(x)

    x[idx] = tmp_val - delta_x
    fx2 = f(x)
    grad[idx] = (fx1-fx2) / (2*delta_x)
    ##########################################
    x[idx] = tmp_val
    it.iternext()

  return grad

# 손실함수 값 계산 함수
# 입력변수 x, t : numpy type
def error_val(x,t):
  y = np.dot(x,W) + b
  return (np.sum((t-y)**2) / len(x))

def predict(x):
  y = np.dot(x,W) + b

  return y

In [None]:
# learning rate 초기화 및 손실함수가 최소가 될 때까지 W, b 업데이트
learning_rate = 1e-4 # 발산하는 경우 1e-3~1e-6 등으로 바꾸어서 실행

f = lambda x : loss_func(x_data, t_data) # f(x) = loss_func(x_data, t_data)

print("initial error value = ", error_val(x_data, t_data), "initial W = ", W, "\n", ", b = ", b)
for step in range(8001):
  W-=learning_rate * numerical_derivative(f, W)
  b-=learning_rate * numerical_derivative(f, b)

  if(step % 400 == 0):
    print("step = ", step, "error value = ", error_val(x_data, t_data), "W = ", W, ", b = ", b)


initial error value =  5.213422150974519 initial W =  [[2.48234479]] 
 , b =  [1.64812863]
step =  0 error value =  5.213245893519533 W =  [[2.48231982]] , b =  [1.64821912]
step =  400 error value =  5.143218719280196 W =  [[2.47236077]] , b =  [1.68429305]
step =  800 error value =  5.074132248803851 W =  [[2.46245753]] , b =  [1.72012072]
step =  1200 error value =  5.005973833640657 W =  [[2.45261399]] , b =  [1.75570497]
step =  1600 error value =  4.938731003943064 W =  [[2.44283242]] , b =  [1.79104819]
step =  2000 error value =  4.872391460105987 W =  [[2.43311403]] , b =  [1.82615244]
step =  2400 error value =  4.806943068411382 W =  [[2.42345945]] , b =  [1.86101964]
step =  2800 error value =  4.742373858148936 W =  [[2.41386887]] , b =  [1.89565154]
step =  3200 error value =  4.678672019268039 W =  [[2.40434227]] , b =  [1.93004986]
step =  3600 error value =  4.615825900216465 W =  [[2.39487947]] , b =  [1.96421623]
step =  4000 error value =  4.553824005846495 W =  [[2

In [None]:
predict(np.array([100,97,81,72,65]).reshape(5,1))

array([[231.81503869],
       [224.93034302],
       [188.21196611],
       [167.5578791 ],
       [151.4935892 ]])

# 2. multi-variable regression

In [None]:
# 학습데이터 준비

import numpy as np

# x_data
# t_data


In [None]:
# 임의의 직선 y = W1x1 + W2x2 + ..... + b 정의

W = np.random.rand(3,1) # 3x1 행렬
b = np.random.rand(1)

print("W = ", W, ", W.shape = ", W.shape, ", b = ", b, ", b.shape = ", b.shape)


W =  [[0.22555698]
 [0.63412545]
 [0.16786301]] , W.shape =  (3, 1) , b =  [0.19565637] , b.shape =  (1,)


In [None]:
# 손실함수 E(W,b) 정의
def loss_func(x,t):
  y = np.dot(x,W) + b

  return (np.sum((t-y)**2) / len(x))

In [None]:
# 수치미분 numerical_derivative 및 utility 함수 정의

def numerical_derivative(f,x): # f: 다변수 함수, x: 모든 변수를 포함하고 있는 numpy 객체
  delta_x = 1e-4
  grad = np.zeros_like(x) # 계산된 수치미분 값 저장 변수
  # zeros_like는 x 변수만큼의 사이즈를 가지는 배열을 생성함(0으로 초기화)

  it = np.nditer(x, flags=['multi_index'], op_flags=['readwrite']) # 모든 입력변수에 대해 편미분하기 위해 iterator 획득


  while not it.finished: # 변수의 개수만큼 반복
    idx = it.multi_index

    tmp_val = x[idx] # numpy 타입은 mutable 이므로 원래 값 보관

    # 하나의 변수에 대한 수치미분 계산(기존코드와 동일)
    #########################################
    fx1 = f(x)

    x[idx] = tmp_val - delta_x
    fx2 = f(x)
    grad[idx] = (fx1-fx2) / (2*delta_x)
    ##########################################
    x[idx] = tmp_val
    it.iternext()

  return grad

# 손실함수 값 계산 함수
# 입력변수 x, t : numpy type
def error_val(x,t):
  y = np.dot(x,W) + b
  return (np.sum((t-y)**2) / len(x))

def predict(x):
  y = np.dot(x,W) + b

  return y

In [None]:
# learning rate 초기화 및 손실함수가 최소가 될 때까지 W, b 업데이트
learning_rate = 1e-2 # 발산하는 경우 1e-3~1e-6 등으로 바꾸어서 실행

f = lambda x : loss_func(x_data, t_data) # f(x) = loss_func(x_data, t_data)

print("initial error value = ", error_val(x_data, t_data), "initial W = ", W, "\n", ", b = ", b)
for step in range(8001):
  W-=learning_rate * numerical_derivative(f, W)
  b-=learning_rate * numerical_derivative(f, b)

  if(step % 400 == 0):
    print("step = ", step, "error value = ", error_val(x_data, t_data), "W = ", W, ", b = ", b)


ValueError: ignored

In [None]:
predict(np.array([100,98,81]))

## Linear Regression with sklearn

In [None]:
# simple linear regression과 multiple linear regression을 sklearn으로 구현하는 방법 똑같다.

from sklearn.linear_model import LinearRegression


model = LinearRegression()
model.fit(x, y)

print(model.coef_) # 각 feature들의 coefficients 구하기
print(model.predict(x)) # 예측하기
print(model.score(x, y)) # 정확도 구하기

# Logistic Regression

## simple logistic Regression

1. 시그모이드 함수와 손실함수(cross-entropy) 구현
2. 학습률 a
3. W, b 조정 구현

In [7]:
import numpy as np

learning_rate = 1e-4

W = np.random.rand(3,1)
b = np.random.rand(1,1)



def sigmoid(z):
    return 1/(1+np.exp(-z))

def loss_func(x,t):
    delta = 1e-6
    
    z = np.dot(x,W) + b
    y = sigmoid(z)
    
    return -np.sum(t*np.log(y+delta) + (1-t)*np.log(1+y+delta)) # 여기서 delta는 log 안이 0이 되는 것을 방지해주는 역할

def numerical_derivative(f,x):
    delta = 1e-4
    grad = np.zeros_like(x)
    
    it = np.nditer(x, flags=['multi_index'], op_flags=['readwrite'])
    
    while not it.finished:
        idx = it.multi_index
        
        tmp_val = x[idx]
        
        x[idx] = tmp_val + delta
        fx1 = f(x)
        
        x[idx] = tmp_val - delta
        fx2 = f(x)
        
        grad[idx] = (fx1 - fx2) / (2*delta)
        
    return grad


In [8]:
f = lambda x : loss_func(x_data, y_data)

for step in range(5000):
    W -= learning_rate*numerical_derivative(f,W)
    b -= learning_rate*numerical_derivative(f,b)

NameError: name 'x_data' is not defined

## multi-variable logistic regression

# logistic regression with sklearn

In [None]:
from sklearn.linear_model import LogisticRegression
from sklearn.preprocessing import StandardScaler

model = LogisticRegression()
model.fit(train_features, train_labels) # 모델 훈련하기

print(model.score(train_features, train_labels)) # 정확도 출력하기

print(model.coef_) # 각 feature들의 coefficients 확인하기

data = scaler.transform(data) # 로지스틱 회귀를 할 때엔 스케일링을 해줘야 한다. 


print(model.predict(data)) # 예측하기