In [1]:
import numpy as np

class LinearModel:
    def __init__(self):
        np.random.seed(42)
        self.w = np.random.randn(1)
        self.b = np.zeros(1)

    def forward(self, x):
        return self.w * x + self.b
    
    def backward(self, dout):
        dx = None
        dw = None
        dy = None

        return dx, dw, dy

In [2]:
x = 2

model = LinearModel()

print(model.w)
print(model.b)

y = model.forward(x)
print(y)

[0.49671415]
[0.]
[0.99342831]


MSE 구현하기

In [3]:
import numpy as np

class LinearModel:
    def __init__(self):
        np.random.seed(42)
        self.w = np.random.randn(1)  # w 값을 저장
        self.b = np.zeros(1)  # b 값을 저장
        self.x = None

    def forward(self, x):
        self.x = x
        return self.w * x + self.b  # wx + b 계산 결과 반환

    def backward(self, dout):
        dx = self.w * dout  # dy(wx+b)/dx 계산 * dout # 순간변화율 구하기
        dw =  self.x * dout # d(wx+b)/dw 계산 * dout
        db = 1.0 * dout  # d(wx+b)/db 계산 * dout
        return dx, dw, db

In [4]:
x = 2
dout = 1

dx, dw, db = model.backward(dout)

In [5]:
import numpy as np

class LinearModel:
    def __init__(self):
        np.random.seed(42)
        self.w = np.random.randn(1)  # w 값을 저장
        self.b = np.zeros(1)  # b 값을 저장
        self.x = None

    def forward(self, x):
        self.x = x
        return self.w * x + self.b  # wx + b 계산 결과 반환

    def backward(self, dout):
        dx = self.w * dout  # dy(wx+b)/dx 계산 * dout # 순간변화율 구하기
        dw = self.x * dout  # d(wx+b)/dw 계산 * dout
        db = 1.0 * dout  # d(wx+b)/db 계산 * dout
        return dx, dw, db

# 평균제곱오차 (MSE) 정의
class MeanSquaredError:
    def __init__(self):
        self.y = None
        self.t = None

    def forward(self, y, t):
        self.y = y
        self.t = t
        return 0.5 * (y - t) ** 2
    
    def backward(self, dout=1):
        return (self.y - self.t) * dout

In [6]:
# Create an instance of LinearModel
model = LinearModel()

# Sample input
x_input = 2  # Input value for forward pass
dout = 1  # Example output gradient

# Perform the forward pass first to set the x value
y = model.forward(x_input)

# Calculate backward gradients
dx, dw, db = model.backward(dout)

print(dx)
print(dw)
print(db)

[0.49671415]
2
1.0


In [7]:
# 테스트용 입력값
x = 2
t = 1

# 모델 예측 및 손실 계산
model1 = LinearModel()
y = model1.forward(x)

mse = MeanSquaredError()
loss = mse.forward(y, t)

print("Loss:", loss)


Loss: [2.15935809e-05]


In [8]:
dout = mse.backward()
print(dout)

[-0.00657169]


$$L = 1/2 * (y-t) ** 2$$

In [9]:
dx, dw, dy = model.backward(dout = dout)
print(dx)
print(dw)
print(dy)

[-0.00326425]
[-0.01314339]
[-0.00657169]


In [10]:
x = 2
t = 1
lr = 0.01

model = LinearModel()
mse = MeanSquaredError()

print(model.w)
print(model.b)

[0.49671415]
[0.]


In [11]:
out = model.forward(x)
print(out)

out = mse.forward(y = out, t = t)
print(out)

[0.99342831]
[2.15935809e-05]


In [12]:
dout = mse.backward()
print(dout)

dx, dw, db = model.backward(dout = dout)
print(dx)
print(dw)
print(db)

[-0.00657169]
[-0.00326425]
[-0.01314339]
[-0.00657169]


In [13]:
model.w = model.w - lr * dw
model.b = model.b - lr * db

print(model.w)
print(model.b)

[0.49684559]
[6.57169398e-05]


In [14]:
out = model.forward(x)
print(out)

out = mse.forward(y = out, t = t)
print(out)

[0.99375689]
[1.94882067e-05]


In [15]:
for i in range(100):
    out = model.forward(x)
    print("{}번째 전파 출력값: {}".format(i, out))

    out = mse.forward(y = out, t=t)
    print("{}번째 손실함수 값: {}".format(i, out))

    dout = mse.backward()
    dx, dw, db = model.backward(dout = dout)

    model.w = model.w - lr * dw
    model.b = model.b - lr * db

0번째 전파 출력값: [0.99375689]
0번째 손실함수 값: [1.94882067e-05]
1번째 전파 출력값: [0.99406905]
1번째 손실함수 값: [1.75881066e-05]
2번째 전파 출력값: [0.99436559]
2번째 손실함수 값: [1.58732662e-05]
3번째 전파 출력값: [0.99464731]
3번째 손실함수 값: [1.43256227e-05]
4번째 전파 출력값: [0.99491495]
4번째 손실함수 값: [1.29288745e-05]
5번째 전파 출력값: [0.9951692]
5번째 손실함수 값: [1.16683093e-05]
6번째 전파 출력값: [0.99541074]
6번째 손실함수 값: [1.05306491e-05]
7번째 전파 출력값: [0.9956402]
7번째 손실함수 값: [9.50391081e-06]
8번째 전파 출력값: [0.99585819]
8번째 손실함수 값: [8.57727951e-06]
9번째 전파 출력값: [0.99606528]
9번째 손실함수 값: [7.74099476e-06]
10번째 전파 출력값: [0.99626202]
10번째 손실함수 값: [6.98624777e-06]
11번째 전파 출력값: [0.99644892]
11번째 손실함수 값: [6.30508861e-06]
12번째 전파 출력값: [0.99662647]
12번째 손실함수 값: [5.69034247e-06]
13번째 전파 출력값: [0.99679515]
13번째 손실함수 값: [5.13553408e-06]
14번째 전파 출력값: [0.99695539]
14번째 손실함수 값: [4.63481951e-06]
15번째 전파 출력값: [0.99710762]
15번째 손실함수 값: [4.1829246e-06]
16번째 전파 출력값: [0.99725224]
16번째 손실함수 값: [3.77508946e-06]
17번째 전파 출력값: [0.99738963]
17번째 손실함수 값: [3.40701823e-06]
18번째 전파 출력값: [0

In [20]:
for i in range(100):
    out = model.forward(x)
    print("{}번째 전파 출력값 : {}".format(i, out))

    out = mse.forward(y=out, t=t)    
    print("{}번째 손실함수 출력값 : {}".format(i, out))

    dout = mse.backward()
    dx, dw, db = model.backward(dout=dout)

    model.w -= lr * dw
    model.b -= lr * db
    print("{}번째 가중치 : {}".format(i, model.w))

0번째 전파 출력값 : [0.99999978]
0번째 손실함수 출력값 : [2.39449533e-14]
0번째 가중치 : [0.49934275]
1번째 전파 출력값 : [0.99999979]
1번째 손실함수 출력값 : [2.16103203e-14]
1번째 가중치 : [0.49934275]
2번째 전파 출력값 : [0.9999998]
2번째 손실함수 출력값 : [1.95033141e-14]
2번째 가중치 : [0.49934276]
3번째 전파 출력값 : [0.99999981]
3번째 손실함수 출력값 : [1.7601741e-14]
3번째 가중치 : [0.49934276]
4번째 전파 출력값 : [0.99999982]
4번째 손실함수 출력값 : [1.58855712e-14]
4번째 가중치 : [0.49934276]
5번째 전파 출력값 : [0.99999983]
5번째 손실함수 출력값 : [1.4336728e-14]
5번째 가중치 : [0.49934277]
6번째 전파 출력값 : [0.99999984]
6번째 손실함수 출력값 : [1.2938897e-14]
6번째 가중치 : [0.49934277]
7번째 전파 출력값 : [0.99999985]
7번째 손실함수 출력값 : [1.16773546e-14]
7번째 가중치 : [0.49934277]
8번째 전파 출력값 : [0.99999985]
8번째 손실함수 출력값 : [1.05388125e-14]
8번째 가중치 : [0.49934278]
9번째 전파 출력값 : [0.99999986]
9번째 손실함수 출력값 : [9.51127826e-15]
9번째 가중치 : [0.49934278]
10번째 전파 출력값 : [0.99999987]
10번째 손실함수 출력값 : [8.58392863e-15]
10번째 가중치 : [0.49934278]
11번째 전파 출력값 : [0.99999988]
11번째 손실함수 출력값 : [7.74699559e-15]
11번째 가중치 : [0.49934278]
12번째 전파 출력값 : [0.99999988]