In [63]:
# 38-creating our first PyTorch model 

In [64]:
# 예전 Linear Regression 코드 
import torch
from torch import nn # nn contains all of PyTorch's building blocks for neural networks 
import matplotlib.pyplot as plt

# 본격적인 데이터 가공 시작 
# splitting data into training and test sets 
# one of the most important concepts in machine learning in general 

## lets create a training and test set with our data. 
# create known parameters 
weight = 0.7 
bias = 0.3 # 원래 weight랑 bias 합쳐서 1로 만들어? 선형회귀는? 

# create
start = 0 # start end step 은 왜 있는거야 무슨 의미야? arange 때문이야? 이거 그냥 임의값이지? 
end = 1 
step = 0.02 
X = torch.arange(start, end, step).unsqueeze(dim=1) # unsqueeze 해서 1 차원 줄이는거지? 
y = weight*X + bias  


X[:10], y[:10] 
len(X), len(y) #결과 50,50

# create a train/test split 
train_split = int(0.8* len(X)) # 80을 트레이닝으로 가져갈거고 test를 20으로 가져갈 거임. 
X_train, y_train = X[:train_split], y[:train_split] # y의 처음부터 train_split까지의 값을 훈련용 출력값으로 가져와.
X_test, y_test = X[train_split:], y[train_split:] # 나머지 20이 test여서 가져옴 

len(X_train), len(y_train), len(X_test), len(y_test)
# 각 데이터셋의 크기를 출력하는 코드야. 이 코드로 훈련 데이터와 테스트 데이터의 개수를 확인할 수 있어.

# you must creat training set/ testing set but you do not always need validation set 
# lets use function to visualize it 
def plot_predictions(train_data=X_train, 
                     train_labels=y_train, 
                     test_data=X_test, 
                     test_labels=y_test, 
                     predictions=None):# we don't have any predictions yet 
    
# **y_train**은 **훈련 데이터에 해당하는 정답(출력 값)**으로, 
# 입력 데이터에 대한 실제 레이블이야. 그래서 여기서는 **train_labels**라고 부른 거야.
  """
  Plots training data, test data and compares predictions.
  """
  plt.figure(figsize=(10, 7))

  # Plot training data in blue
  plt.scatter(train_data, train_labels, c="b", s=4, label="Training data")
  # c가 컬러여서. b는 blue 이다. s는 size
  
  # Plot test data in green
  plt.scatter(test_data, test_labels, c="g", s=4, label="Testing data")

# are there predictions? 
  if predictions is not None:
    # Plot the predictions in red (predictions were made on the test data)
    plt.scatter(test_data, predictions, c="r", s=4, label="Predictions")

  # Show the legend
  # 데이터 시리즈나 요소들이 무엇을 의미하는지 설명하는 **범례(legend)**
  plt.legend(prop={"size": 14});
  



In [65]:
# Create a Linear Regression model class

class LinearRegressionModel(nn.Module): # super해서 여기서 가져옴 
    def __init__(self):
        super().__init__() 
        self.weights = nn.Parameter(torch.randn(1,
                                                requires_grad = True, # gradient descent 
                                                dtype = torch.float
                                                )) 
        # 모델이 학습하는 파라미터(가중치 또는 편향)로 등록할 값을 지정하는 함수야.
        self.bias = nn.Parameter(torch.randn(1,
                                              requires_grad=True,
                                              dtype = torch.float))
        # w가 웨이트고 b가 intercept야. 
        
        def forward(self, x: torch.Tensor) -> torch.Tensor: # ->함수 주석(Annotation) 방식
            # 입력값도 텐서로 처리하고, 반환값도 텐서로 처리
            return self.Weights*x+self.bias 


# checking the contents of our PyTorch model

# create a random seed 
torch.manual_seed(42) 
# seed는 무작위성을 통제하는 값 
# 랜덤 시드(random seed)**를 설정하면, 랜덤한 값들이 항상 동일하게 생성
# 이 코드를 사용하면, 랜덤하게 생성되는 숫자들이 항상 동일하게 나와
# 시드를 고정하면, 다른 사람과 같은 환경에서 동일한 결과를 재현할 수 있어.

# Create an instance of the model 
model_0 = LinearRegressionModel()

# Check out the parameters
list(model_0.parameters())  
# 렌덤시드의 값으로 모델의 가중치와 편향값을 부르는 코드 
# 리스트 형태 : 한 번에 모아서 쉽게 확인
# 리스트로 묶어서 확인하면 몇 개의 파라미터가 있는지 쉽게 볼 수 있음 
# 모델의 모든 파라미터(가중치와 편향)를 반환




[Parameter containing:
 tensor([0.3367], requires_grad=True),
 Parameter containing:
 tensor([0.1288], requires_grad=True)]

In [66]:
# List named parameters 
model_0.state_dict() 
# state_dict : 델의 모든 파라미터 값들(가중치, 편향 등)을 딕셔너리 형태로 반환
# 모델을 저장하거나 불러올 때 모델의 상태(파라미터 값들)를 저장
# 'weights': 가중치 값
# 'bias': 편향 값

OrderedDict([('weights', tensor([0.3367])), ('bias', tensor([0.1288]))])

In [70]:
# X_test의 모양 확인
print(X_test.shape)

# 만약 1차원이라면 2차원으로 변환
if len(X_test.shape) == 1:
    X_test = X_test.unsqueeze(dim=1)

torch.Size([10, 1])


PyTorch model building essentials  
- torch.nn - contains all of the buildings for computational graphs (a neural network can be considered a computational graph)  
- torch.nn.Parameter - what parameters should our model try and learn, often a PyTorch layer from torch.nn will set these for us  
- torch.nn.Module - The base class for all neural network modules, if you subclass it, you should overwrite forward()  
- torch.optim - this where the optimizers in PyTorch live, they will help with gradient descent
- def forward() - All nn.Module subclasses require you to overwrite forward(), this method defines what happens in the forward computation

Because we're going to be building classes throughout the course, I'd recommend getting familiar with OOP in Python, to do so you can use the following resource from Real Python: https://realpython.com/python3-object-oriented-programming/

What our model does:

Start with random values (weight & bias)
Look at training data and adjust the random values to better represent (or get closer to) the ideal values (the weight & bias values we used to create the data)
How does it do so?

Through two main algorithms:

Gradient descent - https://youtu.be/IHZwWFHWa-w
Backpropagation - https://youtu.be/Ilg3gGewQ5U

In [68]:

y_preds = model_0(X_test)
y_preds
# y-hat 값을 뽑음 
# **X_test**는 모델이 학습하지 않은 테스트 데이터로, 일반적으로 **훈련 데이터(X_train)**
# 모델의 forward() 함수가 실행되고, X_test 값이 
# **가중치(weights)**와 곱해진 후 **편향(bias)**가 더해져서 최종 **예측값(y-hat)**이 계산


NotImplementedError: Module [LinearRegressionModel] is missing the required "forward" function

In [38]:
# Make predictions with model
with torch.inference_mode():
  y_preds = model_0(X_test)
  
# You can also do something similar with torch.no_grad(), 
# however, torch.inference_mode() is preferred
# with torch.no_grad(): y_preds = model_0(X_test)


IndentationError: expected an indented block after 'with' statement on line 2 (1145169076.py, line 3)

In [None]:
y_test

In [None]:
plot_predictions(predictions=y_preds)