In [None]:
from google.colab import drive
drive.mount('/content/drive')

Mounted at /content/drive


In [None]:
import numpy as np

# 학습데이터 준비
loaded_data = np.loadtxt('/content/drive/MyDrive/경기과대/인공지능 수학/11주차/score.csv',delimiter=',',dtype=np.float32) # n행 4열의 데이터임 마지막 열은 타겟 데이터

x_data = loaded_data[:,0:-1] # 1열부터 마지막 열 전까지 모든 행 가져옴
t_data = loaded_data[:,[-1]] # 마지막 열 모든 행 가져옴

# 임의의 직선 y = Wx+b 정의(임의의 값으로 가중치 w, 바이어스 b 초기화) y = w_1x_1+w_2x_2+w_3x_3+b
W = np.random.rand(3,1) # 입력 데이터 초기화 -> 3행 1열
b = np.random.rand(1) # 정답 데이터 초기화 -> 스칼라 값

# 손실함수 l(W,b) 정의 (학습을 위한 정의)
def loss_func(x,t):
    y = np.dot(x,W)+b # dot은 행렬 곱
    return (np.sum((t-y)**2)) / (len(x))

# 수치미분 numerical_derivative 및 utility 함수 정의 
def numerical_derivative(f,x): # f는 미분하고자 하는 다변수 함수, x는 모든 변수를 포함하고 있는 numpy 객체(배열, 행렬)등
    delta_x = 1e-5 #lim에 해당되는 작은 값
    grad = np.zeros_like(x) # 계산된 수치미분 값 저장 변수

    it = np.nditer(x, flags =['multi_index'],op_flags=['readwrite'])# 모든 입력변수에 대해 편미분하기 위해 사용
    while not it.finished:
        idx = it.multi_index  # x에대한 편미분 후 y에 대한 편미분 실행  [1.0,2.0]이라면 1.0 편미분 후 2.0 편미분
        
        tmp_val = x[idx] # numpy 타입은 mutable이므로 원래 값 보관
        x[idx] = float(tmp_val)+delta_x #하나의 변수에 대해 수치미분 계산
        fx1 = f(x) # f(x+delta_x) 전체에 대해 계산해야 하기 때문에 x[idx]가 아닌 x를 넣어줌

        x[idx] = tmp_val - delta_x
        fx2=f(x) # f(x-delta_x)
        grad[idx] = (fx1-fx2)/(2*delta_x)

        x[idx] = tmp_val
        it.iternext()

    return grad

def loss_val(x,t):  # 손실함수값 확인 코드
    y = np.dot(x,W)+b # dot은 행렬 곱
    return (np.sum((t-y)**2)) / (len(x))

def predict(x): # 예측값 확인 코드
    y = np.dot(x,W)+b 
    return y

# 학습률 초기화 및 손실함수가 최소가 될 때까지 W,b 업데이트
learning_rate = 1e-2 

f = lambda x: loss_func(x_data,t_data) # loss_func에 x_data,t_data가 들어감
print(loss_val(x_data,t_data),W,b)

for step in range(10001):
    W-= learning_rate * numerical_derivative(f,W) # w에 대한 수치미분
    b-= learning_rate * numerical_derivative(f,b) # b에 대한 수치미분

    if(step % 400==0):
        print(step,loss_val(x_data,t_data),W,b)
# 결과값 w 3개는 각 열에 대한 w값임

3821.841406021638 [[0.11502261]
 [0.64600351]
 [0.49016282]] [0.60753991]
0 559593702.3073097 [[ 98.73563984]
 [ 99.6528216 ]
 [102.13997272]] [-477.10062096]
400 2.1645164907383327e+29 [[1.87350847e+12]
 [1.87347783e+12]
 [2.00756687e+12]] [-69449398.97562096]
800 2.1645164907383327e+29 [[1.87350847e+12]
 [1.87347783e+12]
 [2.00756687e+12]] [-69449398.97562096]
1200 2.1645164907383327e+29 [[1.87350847e+12]
 [1.87347783e+12]
 [2.00756687e+12]] [-69449398.97562096]
1600 2.1645164907383327e+29 [[1.87350847e+12]
 [1.87347783e+12]
 [2.00756687e+12]] [-69449398.97562096]
2000 2.1645164907383327e+29 [[1.87350847e+12]
 [1.87347783e+12]
 [2.00756687e+12]] [-69449398.97562096]
2400 2.1645164907383327e+29 [[1.87350847e+12]
 [1.87347783e+12]
 [2.00756687e+12]] [-69449398.97562096]
2800 2.1645164907383327e+29 [[1.87350847e+12]
 [1.87347783e+12]
 [2.00756687e+12]] [-69449398.97562096]
3200 2.1645164907383327e+29 [[1.87350847e+12]
 [1.87347783e+12]
 [2.00756687e+12]] [-69449398.97562096]
3600 2.1645

In [9]:
predict([96,93,95])

array([5.44809034e+14])