In [None]:
# 붓꽃 데이터를 Tensorflow 말고 Pytorch 에서 학습 해보기

In [None]:
# !pip install tqdm 
# tqdm 실행 안되면 설치

In [None]:
# 교재 p9
!git clone https://github.com/jetsonai/DeepLearning4Projects.git

In [1]:
import torch # 텐서 생성, 연산
import torch.nn as nn # 신경망(Neural Network)의 층(layer) 관련 라이브러리
import torch.optim as optim # 최적화 알고리즘
from torch.utils.data import DataLoader, TensorDataset # TensorDataset -> X,y를 텐서 형태로 나누기

import pandas as pd
from sklearn.preprocessing import LabelEncoder # label 전처리 하자 
from tqdm.notebook import tqdm  #에포크 상황 확인하기

In [2]:
# 데이터 준비 과정 (전처리 + 텐서형태로 데이터 가공)

df = pd.read_csv("robot/data/iris3.csv")
# 0 ~ 4 미만 까지 X, 
# 4번 인덱스 y
X = df.iloc[:,:4].values #df형태를 tensor로 변환하기 용이하게 ndarray로 변환
y = df.iloc[:, 4].values

# label들이 Iris-setosa와 같은 형식으로 클래스 이름으로 되어있기 때문에 
#  -> 0,1,2 등 숫자형태로 label을 변환할 필요가 있음
# why? Pytorch는 정수나 숫자만 연산이 가능함.
label_encoder = LabelEncoder()
y_encoded = label_encoder.fit_transform(y)
# ndarray 형태의 X를 Pytorch에서 사용하기 위해 텐서 형태로 변환
X_tensor = torch.tensor(X,dtype=torch.float32)
y_tensor = torch.tensor(y_encoded, dtype=torch.long)

In [3]:
# 모델 정의

class IrisModel(nn.Module):
    def __init__(self):
        super().__init__()
        self.layer_1 = nn.Linear(4,12)
        self.layer_2 = nn.Linear(12,8)
        self.layer_3 = nn.Linear(8,3)
  
    # 순전파    
    def forward(self,X):
        # 1) input 4 -> output 12
        # 1-1) 활성화 함수 relu
        # 2) input 12 -> output 8
        # 2-1) 활성화 함수 relu
        # 3) input 8 -> output 3
        X = torch.relu(self.layer_1(X))
        X = torch.relu(self.layer_2(X))
        X = self.layer_3(X)
        return X 

In [None]:
# tensorflow 경우 모델정의
# from tensorflow.keras.models import Sequential
# from tensorflow.keras.layers import Dense
# model = Sequential()
# model.add(Dense(12, input_dim=4, activation ="relu"))
# model.add(Dense(8,activation = "relu"))
# model.add(Dense(3,activation = "softmax"))
# model.summary()

In [4]:
# 모델 생성
model = IrisModel()
# 손실 함수
loss_fn = nn.CrossEntropyLoss() # softmax 다중분류
# 옵티마이져
optimizer = optim.Adam(model.parameters(), lr=0.001)

# 데이터셋 -> 텐서 형식으로 변환
dataset = TensorDataset(X_tensor,y_tensor)
# label이 00001111222~식으로 일정하기때문에 shuffle
dataloader = DataLoader(dataset, batch_size=5, shuffle= True)

In [None]:
!pip install --upgrade ipywidgets

In [5]:
# 모델 학습
epochs = 30

for epoch in tqdm(range(epochs)):

    for input_data, label in dataloader:
        #1) 기울기 0으로 초기화
        optimizer.zero_grad()
        #2) 모델에 input 넣어 예측 값 얻기
        pred = model(input_data)
        #3) 예측 값을 통해 loss 계산
        loss = loss_fn(pred, label)
        #4) loss를 통해 최적화 진행(역전파)
        loss.backward()
        #5) 가중치, 바이어스 업데이트
        optimizer.step()    

  0%|          | 0/30 [00:00<?, ?it/s]

In [6]:
# 모델 평가 
with torch.no_grad():
    pred = model(X_tensor)
    # pred.data의 클래스 중 가장 높은 값
    _, predicted = torch.max(pred.data, 1)
    # 전체 데이터셋의 크기
    y_tensor.size(0)
    # 만약 X_tensor.size(0)or(1)or(2)    
    total = y_tensor.size(0)
    # 예측값과 실제 값이 같은 것들을 전부 합산하여 correct에 저장
    correct = (predicted == y_tensor).sum().item()  # item() 스칼라로 변형
    # 정확도
    print(f"정확도 : {correct / total: .2f}")

정확도 :  0.97


In [None]:
# yolov5 사용 (p292)
# new -> terminal
# cd yolov5
# pip install -r requirements.txt
# python detect.py --source 0

In [7]:
# 내일 오전에 MNIST 손글씨 -> PyTorch로 진행
# 디바이스 설정 -> to device까지 
# 손글씨 학습 데이터 6만개,검증 데이터 1만개
# 오래 걸린다 -> colab으로 진행
# 온라인에서 이미지 검색해서 이미지 자동 다운로드 하는 방법 # selenium

!git clone https://github.com/ultralytics/yolov5

Cloning into 'yolov5'...
