# 1. Build Multi-Variable Linear Regression

![image.png](attachment:image.png)

### 1-1) No-use Matrix

In [149]:
import tensorflow as tf

In [150]:
# training data set
x1_data = [73., 93., 89., 96., 73.]
x2_data = [80., 88., 91., 98., 66.]
x3_data = [75., 93., 90., 100., 70.]
y_data = [152., 185., 180., 196., 142.]

In [151]:
# W와 b 값을 임의의 수로 초기화
W1 = tf.Variable(tf.random.normal([1]))
W2 = tf.Variable(tf.random.normal([1]))
W3 = tf.Variable(tf.random.normal([1]))
b = tf.Variable(tf.random.normal([1]))

In [152]:
# 학습률
learning_rate = 0.00001

In [153]:
print("    i |       cost")
for i in range(2000+1):
    with tf.GradientTape() as tape:
        hypothesis = (x1_data * W1) + (x2_data * W2) + (x3_data * W3) + b
        cost = tf.reduce_mean(tf.square(hypothesis - y_data))
        
    # W1, W2, W3, b 의 기울기 계산
    W1_grad, W2_grad, W3_grad, b_grad = tape.gradient(cost, [W1, W2, W3, b])
    
    # W1, W2, W3, b Update
    W1.assign_sub(learning_rate * W1_grad)
    W2.assign_sub(learning_rate * W2_grad)
    W3.assign_sub(learning_rate * W3_grad)
    b.assign_sub(learning_rate * b_grad)
    
    if i % 400 == 0:
        print("{:5} | {:12.4f} ".format(i, cost.numpy()))
print("Prediction :", hypothesis)

    i |       cost
    0 |   98466.8672 
  400 |       0.1879 
  800 |       0.1855 
 1200 |       0.1835 
 1600 |       0.1817 
 2000 |       0.1801 
Prediction : tf.Tensor([151.4937  184.61646 180.5057  196.44041 141.78233], shape=(5,), dtype=float32)


##### 결론
- Matrix 를 사용하지 않았을 경우에도 cost 가 0 에 수렴해가는 결과를 확인 가능
- hypothesis = (x1_data * W1) + (x2_data * W2) + (x3_data * W3) + b 활용
- 그러나, 각 데이터의 Vector, Weight 을 따로 작성 및 관리해야 한다
- 가독성이 떨어지고, 오류 발생 가능성이 높다

### 1-2) Use Matrix

In [254]:
import tensorflow as tf
import numpy as np

In [255]:
# data matrix     x1   x2   x3    y
data = np.array([[73., 80., 75., 152. ],
                 [93., 88., 93., 185. ],
                 [89., 91., 90., 180. ],
                 [96., 98., 100., 196.],
                 [73., 66., 70., 142. ],
                 ], dtype = np.float32)

In [256]:
# data 행렬을 slicing 하여 x와 y행렬 생성
X = data[:, :-1] # 5x3 Matrix
Y = data[:, [-1]] # 5x1 Matrix

- 이 때의 X, Y 를 출력해보면, 
![image.png](attachment:image.png)

In [257]:
# W와 b에 임의의 수, 행렬로 생성
W = tf.Variable(tf.random.normal([3, 1])) # 3x1 Matrix
b = tf.Variable(tf.random.normal([1]))

learning_rate = 0.00001

In [258]:
print("    i |       cost")
for i in range(2000+1):
    with tf.GradientTape() as tape:
        hypothesis = tf.matmul(X, W) + b
        cost = tf.reduce_mean(tf.square(hypothesis - Y))
    
    # W 와 b 의 기울기 계산
    W_grad, b_grad = tape.gradient(cost, [W, b])
    
    # W 와 b Update
    W.assign_sub(learning_rate * W_grad)
    b.assign_sub(learning_rate * b_grad)
    
    if i % 200 == 0:
        print("{:5} | {:10.4f}".format(i, cost.numpy()))

    i |       cost
    0 | 18905.2637
  200 |     4.2779
  400 |     3.9552
  600 |     3.6646
  800 |     3.4030
 1000 |     3.1674
 1200 |     2.9550
 1400 |     2.7636
 1600 |     2.5909
 1800 |     2.4350
 2000 |     2.2943


##### 결론
- 이번에는 Matrix 를 사용하여 1-1) 과 같은 데이터로 모델을 구현하였다

![image.png](attachment:image.png)

- Numpy 의 ndarray 를 활용해 각 변수의 인스턴스를 한번에 2차원 행렬 data 로 생성해줄 수 있었다

![image-2.png](attachment:image-2.png)

- Weight 도 2차원 행렬로 생성해주었다

- hypothesis = tf.matmul(X, W) + b 을 활용해 행렬곱을 간단하게 연산할 수 있다

![image-6.png](attachment:image-6.png) ![image-5.png](attachment:image-5.png)

- 마지막 i 의 Hypothesis 도 실제 데이터가 Y 와 유사하게 도출된 것을 확인할 수 있다
- Matrix 를 사용했을 경우, X, Y, Weight 모두 행렬 단위로 관리할 수 있다
- 따라서, 가독성이 높고 오류 발생 가능성을 효과적으로 낮출 수 있을 것이다