***
3/10

In [None]:
import math
import torch
import matplotlib.pyplot as plt
import numpy as np
import pandas as pd

넘파이처럼 벡터를 생성 할 수 있다.

In [None]:
A = torch.Tensor([0, 1, 2, 3])
A.type()

'torch.FloatTensor'

텐서의 모양과 크기

In [None]:
A.shape

torch.Size([4])

텐서의 차원 표시

In [None]:
A.dim()

1

In [None]:
B = torch.Tensor([[0.8425, 0.3970],
                  [0.5268, 0.7384],
                 [0.5639, 0.3080]])
B.shape

torch.Size([3, 2])

In [None]:
B.dim()

2

In [None]:
C = torch.Tensor([
    [[6, 4],
     [8, 0],
     [8, 4],
     [2, 4]],

    [[2, 8],
     [3, 6],
     [4, 7],
     [0, 9]],

    [[8, 0],
     [3, 9],
     [0, 5],
     [7, 3]]
])

C.shape

torch.Size([3, 4, 2])

### 인공신경망의 구조와 학습
#### 활성화 함수
- 먼저 활성화 함수는 전달 함수에서 전달받은 값을 출력할 때 일정 기준에 따라 출력 값을 변화시키는 비선형 함수
- 활성화 함수로는 시그모이드, 하이퍼볼릭 탄젠트, 렐루 함수 등이 있음

#### 시그모이드 함수
- 선형 함수의 결과를 0~1 사이에서 비선형 형태로 변형
- 주로 로지스틱 회귀와 같은 분류 문제를 확률적으로 표현하는데 사용
- 현재는 딥러닝 모델의 깊이가 깊어지면 기울기가 사라지는 '기울기 소멸 문제'가 발생하여 딥러닝 모델에서는 잘 사용하지 않음


#### 손실 함수
- 학습을 통해 얻은 데이터의 추정치가 실제 데이터와 얼마나 차이가 나는지 평가하는 지표
- 값이 클수록 많이 틀리고, 0에 가까우면 완벽하게 추정할 수 있다는 의미

#### 크로스 엔트로피 오차 (분류의 손실함수)
- 크로스 엔트로피 분류 모델이 얼마나 잘 수행되는지 측정하기 위해 사용
- 0과 1 사이로 측정
- 주로 결과값이 3개 이상일때 사용, 결과값이 2개인 경우 Binary Cross Entropy Loss 사용 가능

#### 경사 하강법 (Gradient decent)
- 신경망 안의 가중치 조합을 모두 계산하면 시간이 오래걸리기 때문에 효율적으로 가중치를 업데이트 하기 위해 고안된 방법
- 함수의 기울기(경사)를 구하고 경사의 반대 방향으로 계속 이동시켜 최솟값에 이를 때까지 반복시키는 학습 방법
$$w'=w-α\frac{dL(y,y)}{dw}$$

##### 한계점
- 딥러닝은 일반적으로 데이터가 많음
- 수식 한번에 N(=데이터의 개수)번의 덧셈 수행
- 한번에 모든 데이터에 대한 계산을 한번에 하면 매우 많은 시간이 소요됨
- 또한, 한번에 계산하는 데이터가 너무 많으면 메모리가 부족해질 수 있음

### RMSProp (Root Mean Square Propagation)
최근 경로의 곡면 변화량에 따라 학습률을 적응적으로 결정하는 알고리즘
- 곡면 변화량을 측정할 때 전체 경로가 아닌 최근 경로의 변화량 측정, 최근 경로에 지수가중이동평균 적용


In [None]:
import torch.nn as nn

data = pd.read_excel('boston.xlsx')

model = nn.Sequential(
    nn.Linear(13, 100), # input이 13개
    nn.ReLU(), # 렐루 신경망 상수항 처리
    nn.Linear(100, 1) # 결과값이 1개
)

In [None]:
data.columns

Index(['CRIM', 'ZN', 'INDUS', 'CHAS', 'NOX', 'RM', 'AGE', 'DIS', 'RAD', 'TAX',
       'PTRATIO', 'B', 'LSTAT', 'target'],
      dtype='object')

In [None]:
X = data[['CRIM', 'ZN', 'INDUS', 'CHAS', 'NOX', 'RM', 'AGE', 'DIS', 'RAD', 'TAX',
       'PTRATIO', 'B', 'LSTAT']].values

Y = data[['target']].values # 대괄호를 두개 써야 2차원 벡터로 나옴

In [None]:
# 데이터를 Train과 test로 나누는 패키지
from sklearn.model_selection import train_test_split

# 전체데이터를 Train(Train + Validation)과 Test로 나눔
X_temp, X_test, Y_temp, Y_test = train_test_split(X, Y,
                                                    test_size=0.3,
                                                    shuffle=True,
                                                    random_state=42)
# Train을 다시 Train, Validation으로 나눔
X_train, X_val, Y_train, Y_val = train_test_split(X_temp, Y_temp,
                                                    test_size=0.2,
                                                    shuffle=True,
                                                    random_state=42)

In [None]:
# torch.Tensor(numpy 값): 변수를 numpy -> Tensor로 변환
x_train = torch.Tensor(X_train)
y_train = torch.Tensor(Y_train)
x_val = torch.Tensor(X_val)
y_val = torch.Tensor(Y_val)
x_test = torch.Tensor(X_test)
y_test = torch.Tensor(Y_test)

In [None]:
# 파이토치에서 미니배치를 변환을 도와주는 패키지
from torch.utils.data import TensorDataset, DataLoader

batch_size = 64

# 배치할 때, feature와 target이 동일하게 섞여야 함으로 먼저 TensorDataset으로 통합 데이터셋을 만든다.
# drop_last = 나머지 데이터는 사용하지 않음
train_dataset = TensorDataset(x_train, y_train)
train_dataloader = DataLoader(train_dataset, batch_size, shuffle=True, drop_last=True)

In [None]:
learning_rate = 0.001

# 최적화 학습 방법 선택 -> Adam
from torch.optim.adam import Adam
optim = Adam(model.parameters(), lr=learning_rate)

***
3/11