# diabetes reference

In [13]:
import numpy as np

from sklearn.datasets import load_diabetes

diabetes=load_diabetes(return_X_y=False, as_frame=False)

In [14]:
diabetes

{'data': array([[ 0.03807591,  0.05068012,  0.06169621, ..., -0.00259226,
          0.01990842, -0.01764613],
        [-0.00188202, -0.04464164, -0.05147406, ..., -0.03949338,
         -0.06832974, -0.09220405],
        [ 0.08529891,  0.05068012,  0.04445121, ..., -0.00259226,
          0.00286377, -0.02593034],
        ...,
        [ 0.04170844,  0.05068012, -0.01590626, ..., -0.01107952,
         -0.04687948,  0.01549073],
        [-0.04547248, -0.04464164,  0.03906215, ...,  0.02655962,
          0.04452837, -0.02593034],
        [-0.04547248, -0.04464164, -0.0730303 , ..., -0.03949338,
         -0.00421986,  0.00306441]]),
 'target': array([151.,  75., 141., 206., 135.,  97., 138.,  63., 110., 310., 101.,
         69., 179., 185., 118., 171., 166., 144.,  97., 168.,  68.,  49.,
         68., 245., 184., 202., 137.,  85., 131., 283., 129.,  59., 341.,
         87.,  65., 102., 265., 276., 252.,  90., 100.,  55.,  61.,  92.,
        259.,  53., 190., 142.,  75., 142., 155., 225.,  59

In [16]:
x_data=diabetes.data
y_data=diabetes.target

In [11]:
print(x_data.shape)
print(y_data.shape)

(442, 10)
(442,)


In [21]:
diabetes.feature_names

['age', 'sex', 'bmi', 'bp', 's1', 's2', 's3', 's4', 's5', 's6']

In [22]:
for i,feature_name in enumerate(diabetes.feature_names):
  print(f'feature {i+1} : {feature_name}')

feature 1 : age
feature 2 : sex
feature 3 : bmi
feature 4 : bp
feature 5 : s1
feature 6 : s2
feature 7 : s3
feature 8 : s4
feature 9 : s5
feature 10 : s6


In [23]:
print('<x_data[0]> : ',x_data[0])
print()
print('<y_data[0]> : ',y_data[0] )

<x_data[0]> :  [ 0.03807591  0.05068012  0.06169621  0.02187235 -0.0442235  -0.03482076
 -0.04340085 -0.00259226  0.01990842 -0.01764613]

<y_data[0]> :  151.0


In [29]:
class MultiLinear:
  def __init__(self,learning_rate=0.001):
    self.w=None #모델의 weight 벡터 self.w=(w_1,w_2)
    self.b=None #모델의 bias
    self.lr=learning_rate #모델의 학습률
    self.losses=[] #매 에포크마다 손실을 저장하기 위한 리스트
    self.weight_history=[] #매 에포크마다 계산된 weight를 저장하기 위한 리스트
    self.bias_history=[] #매 에포크마다 계산된 bias를 저장하기 위한 리스트

  def forward(self,x):
    y_pred=np.sum(x*self.w)+self.b #np.sum함수는 인자로 받은 numpy배열의 모든 원소의 합을 return합니다.
    return y_pred

  def loss(self,x,y):
    y_pred=self.forward(x)
    return (y_pred-y)**2

  def gradient(self,x,y):
    y_pred=self.forward(x)
    w_grad=2*x*(y_pred-y)
    b_grad=2*(y_pred-y)

    return w_grad,b_grad

  def fit(self,x_data,y_data,epochs=20):
    self.w=np.ones(x_data.shape[1]) #모델의 weight들을 전부 1로 초기화
    self.b=0 #모델의 bias를 0으로 초기화
    for epoch in range(epochs):
      l=0 #계산할 손실값
      w_grad=np.zeros(x_data.shape[1]) #weight의 기울기를 누적할 numpy배열
      b_grad=0  #bias의 기울기를 누적할 변수

      for x,y in zip(x_data,y_data):
        l+=self.loss(x,y)
        w_i,b_i=self.gradient(x,y)

        w_grad+=w_i #weight누적
        b_grad+=b_i #bias누적

      self.w-=self.lr*(w_grad/len(y_data)) #weight 업데이트
      self.b-=self.lr*(b_grad/len(y_data)) #bias 업데이트
 
      print(f'epoch ({epoch+1}) ===> loss : {l/len(y_data):.5f}')
      self.losses.append(l/len(y_data)) #손실값 저장
      self.weight_history.append(self.w) #weight 배열 저장
      self.bias_history.append(self.b) #bias값 저장

In [30]:
model=MultiLinear(learning_rate=0.1)
model.fit(x_data,y_data,epochs=40)

epoch (1) ===> loss : 29055.28756
epoch (2) ===> loss : 20715.48312
epoch (3) ===> loss : 15375.24358
epoch (4) ===> loss : 11954.73452
epoch (5) ===> loss : 9762.86190
epoch (6) ===> loss : 8357.32549
epoch (7) ===> loss : 7455.05312
epoch (8) ===> loss : 6874.87857
epoch (9) ===> loss : 6500.85541
epoch (10) ===> loss : 6258.77792
epoch (11) ===> loss : 6101.15439
epoch (12) ===> loss : 5997.59010
epoch (13) ===> loss : 5928.63241
epoch (14) ===> loss : 5881.83158
epoch (15) ===> loss : 5849.21975
epoch (16) ===> loss : 5825.69748
epoch (17) ===> loss : 5808.00108
epoch (18) ===> loss : 5794.04176
epoch (19) ===> loss : 5782.48266
epoch (20) ===> loss : 5772.46817
epoch (21) ===> loss : 5763.45067
epoch (22) ===> loss : 5755.07965
epoch (23) ===> loss : 5747.13074
epoch (24) ===> loss : 5739.46035
epoch (25) ===> loss : 5731.97651
epoch (26) ===> loss : 5724.62036
epoch (27) ===> loss : 5717.35418
epoch (28) ===> loss : 5710.15383
epoch (29) ===> loss : 5703.00380
epoch (30) ===> los

# diabetes with sklearn

In [31]:
from sklearn.linear_model import LinearRegression

#scikit-learn에서 제공하는 선형 회귀 모델
skmodel=LinearRegression()

#model을 x와 y 데이터셋을 이용하여 학습시킴
skmodel.fit(x,y)

#model이 'patient' 데이터에 대해 예측한 값을 array로 반환
skmodel.predict(patient)

#testset에 대해 model의 정확도를 판단
skmodel.score(test_x,test_y)

NameError: name 'x' is not defined