# 목적

- 파이토치로 CNN을 구현하여 이미지 데이터가 어떤 이미지인지 분류하는 모델을 생성하겠다
- 객체 지향방식으로 모델을 생성
- 데이터
  - 치매/정상 뇌스캔 이미지
  - train/ad or normal: 80개
  - test/ad or normal: 60개
  - 형식 *.jpg
- 목표
  - 뇌스캔 사진 입력 -> 치매를 진단 (정상/치매)

# 모듈 가져오기, 환경 변수

In [5]:
import torch
import torch.nn as nn
import torch.nn.functional as F
import torch.optim as optim

# 참고 (연습용 내부 데이터) -> FashionMNIST
from torchvision import transforms, datasets

In [6]:
# GPU 설정
DEVICE = torch.device('cuda' if torch.cuda.is_available() else 'cpu')
DEVICE

device(type='cuda')

## 학습 관련 용어 정리

- 종류 1
  - 온라인 : 학습된 모델이 실시간 반영 (리스크가 크다)
  - 오프라인 : 모델 교체시 시스템 다운 -> 교체 ->가동, 실제 서비스와 분리되어 있다

- 종류 2
  - 배치학습
    - 전체 데이터를 통으로 학습에 한번에 넣어서 진행 (많은 리소스 요구)
  - 미니베치학습
    - 전체 데이터를 n개로 분할해서 학습 회수를 늘려서 진행
- 전략 
  - 내가 직접 신경망을 만들어서 학습
  - 전이학습 (tranfer learning)
    - 타인이 오랜시간 대량의 데이터로 학습한(사전학습) 모델을 가져와서 사용
    - 파인튜닝
    - 프럼프트 러닝
    - 인컨텍스트 러닝
      - 제로샷 러닝
      - 원샷 러닝
      - 퓨샷 러닝
- 학습시 요소
  - epoch : 전체 데이터를 한번 다 사용하여 학습한 경우 '1 epoch' 라고 표현 (1세대 학습)
  - batch size : 1회 학습시 투입되는 데이터량 -> 미니 배치 학습
  - 예시, 데이터가 총 1,000,000 개 있다 
    - 1회 학습시 1,000개 사용
    ( 세대별로 1000개의 조합이 다르다 )
    - 10 에폭으로 학습 하겠다
    - 1 에폭 학습시 학습 행위가 몇번 진행되는가? 1,000번 학습이 진행
  - 조기학습 종료 ( early_stopping )
    - 더이상 학습의 성과가 없으면 학습행위를 중단한다

In [7]:
# 환경변수 (학습에 관련된 설정값)
# GPU 환경 : 30회 / CPU 환경 : 5회
EPOCHES = 30 if torch.cuda.is_available() else 5
BATCH_SIZE = 64 # 1회 학습시 64개 데이터를 공급받아서 학습하겠다

# 데이터 준비

- 데이터 공급자를 설계 제공

In [8]:
# 훈련용 데이터 공급자
train_loader = torch.utils.data.DataLoader( datasets.FashionMNIST( root='./data',# 데이터가 저장된 위치
                                                                  train= True,   # 훈련용
                                                                  download=True, # 부재시 다운로드 진행
                                                                  # 이미지를 전처리 (가공, 등등)
                                                                  transform=transforms.Compose([
                                                                      transforms.ToTensor(), # 이미지는 텐서로 받겠다
                                                                      transforms.Normalize( 0.2,0.3 ) # 정규화, 평균, 표준편차 설정값
                                                                  ])),
                                           batch_size=BATCH_SIZE, 
                                           shuffle=True )

Downloading http://fashion-mnist.s3-website.eu-central-1.amazonaws.com/train-images-idx3-ubyte.gz
Downloading http://fashion-mnist.s3-website.eu-central-1.amazonaws.com/train-images-idx3-ubyte.gz to ./data/FashionMNIST/raw/train-images-idx3-ubyte.gz


  0%|          | 0/26421880 [00:00<?, ?it/s]

Extracting ./data/FashionMNIST/raw/train-images-idx3-ubyte.gz to ./data/FashionMNIST/raw

Downloading http://fashion-mnist.s3-website.eu-central-1.amazonaws.com/train-labels-idx1-ubyte.gz
Downloading http://fashion-mnist.s3-website.eu-central-1.amazonaws.com/train-labels-idx1-ubyte.gz to ./data/FashionMNIST/raw/train-labels-idx1-ubyte.gz


  0%|          | 0/29515 [00:00<?, ?it/s]

Extracting ./data/FashionMNIST/raw/train-labels-idx1-ubyte.gz to ./data/FashionMNIST/raw

Downloading http://fashion-mnist.s3-website.eu-central-1.amazonaws.com/t10k-images-idx3-ubyte.gz
Downloading http://fashion-mnist.s3-website.eu-central-1.amazonaws.com/t10k-images-idx3-ubyte.gz to ./data/FashionMNIST/raw/t10k-images-idx3-ubyte.gz


  0%|          | 0/4422102 [00:00<?, ?it/s]

Extracting ./data/FashionMNIST/raw/t10k-images-idx3-ubyte.gz to ./data/FashionMNIST/raw

Downloading http://fashion-mnist.s3-website.eu-central-1.amazonaws.com/t10k-labels-idx1-ubyte.gz
Downloading http://fashion-mnist.s3-website.eu-central-1.amazonaws.com/t10k-labels-idx1-ubyte.gz to ./data/FashionMNIST/raw/t10k-labels-idx1-ubyte.gz


  0%|          | 0/5148 [00:00<?, ?it/s]

Extracting ./data/FashionMNIST/raw/t10k-labels-idx1-ubyte.gz to ./data/FashionMNIST/raw



In [9]:
test_loader = torch.utils.data.DataLoader( datasets.FashionMNIST(root='./data', # 데이터가 저장된 위치
                                                                  train= True,  # 훈련용
                                                                  download=True,# 부재시 다운로드 진행
                                                                  # 이미지를 전처리 (가공, 등등)
                                                                  transform=transforms.Compose([
                                                                      transforms.ToTensor(), # 이미지는 텐서로 받겠다
                                                                      transforms.Normalize( 0.2,0.3 ) # 정규화, 평균, 표준편차 설정값
                                                                  ])),
                                              batch_size=BATCH_SIZE, 
                                              shuffle=True )

# 합성곱 요소간 관계식

- 합성곱을 통과한 feature map의 크기
- H = ((h + 2*p-k) / s) + 1
- W = ((w + 2*p-k) / s) + 1

# 인공신경망 구성

In [None]:
if 0:
  class Net(nn.Module):
    # 맴버 변수
    # 맴버 함수(상속 받은 함수 재정의 or 직접 구현)
    def forward(self,x): 
      '''
        부모로 부터 받은 상속 함수
        모델의 순방향으로 네트워크를 구성하는 함수
        네트워크 연결 (=keras의 add())
      '''
      pass
    # 생성자 ( self <-> this)
    def __init__(self):
      '''
        1. 부모 생성자 호출 -> 통상 상속받으면 진행
      '''
      super(Net,self).__init__()
      '''
        네트워크의 각 요소를 생성 -> 합성곱층, 풀링층, 전결합층, 출력층
        MNIST(28,28)  -> (14,14) -> (7,7) -> FC -> 출력층으로 수렴
      '''
      # 1F 합성곱층 -> 맴버변수 -> 객체.맴버
      # 1개 이미지 -> 합성곱 통과시키면 32장으로 증폭
      self.conv1 = nn.Conv2d( 1, 32, 5, 1, padding='same' )
      # 2F 합성곱층
      self.conv2 = nn.Conv2d( 32, 32*2, 5, 1, padding='same' )
      # 과적합 방지 층 -> 학습 방해 (10% 방해하겠다) -> 학습이 되지않게 조절하는 값
      self.dropout = nn.Dropout2d(0.1)
      # 3F FC : 4D -> 2D로 Flattern 후에 출력에 수렴하기전 적당한 크기로 완충하는 역할
      # 원본이미지 784 pixel -> 3136 pixel -> 1024 <- feature
      self.fc = nn.Linear( 7*7*32*2, 1024 )
      # 4F output 생성
      self.output = nn.Linear( 1024,10 )v
      
      pass


In [11]:
class Net(nn.Module):
  # 맴버 변수
  # 맴버 함수(상속 받은 함수 재정의 or 직접 구현)
  def forward(self,x): # 순정신경망 (x->y)
    # x는 입력,stride가 2이므로 이미지 크기는 반으로 줄어든다
    x = F.relu(F.maxpool2d( self.conv1(x),2 ))
    # 이미지는 반으로 줄어든다
    x = F.relu(F.maxpool2d( self.dropout(self.conv2(x),2) ))
    # Flattern 4D -> 2D view()
    x = x.view( -1 , 7*7*32*2 ) # 이미지 1개에 대해서 총량을 맞추면 총 개수는 알아서 설정
    x = F.relu(self.fc(x))
    x = F.dropout ( x, training=self.training) # 학습률로 표시하는 예
    # 출력층
    x = F.relu(self.output)
    # x를 리턴
    return F.log_softmax(x,dim=1)
    pass
    

  def __init__(self):
    super(Net,self).__init__()
    self.conv1 = nn.Conv2d( 1, 32, 5, 1, padding='same' )
    self.conv2 = nn.Conv2d( 32, 32*2, 5, 1, padding='same' )
    self.dropout = nn.Dropout2d(0.1)
    self.fc = nn.Linear( 7*7*32*2, 1024 )
    self.output = nn.Linear( 1024,10 )    
    pass


In [12]:
# 모델 생성 -> GPU 적용
model = Net().to( DEVICE )

In [13]:
model

Net(
  (conv1): Conv2d(1, 32, kernel_size=(5, 5), stride=(1, 1), padding=same)
  (conv2): Conv2d(32, 64, kernel_size=(5, 5), stride=(1, 1), padding=same)
  (dropout): Dropout2d(p=0.1, inplace=False)
  (fc): Linear(in_features=3136, out_features=1024, bias=True)
  (output): Linear(in_features=1024, out_features=10, bias=True)
)

In [None]:
# 최적화 도구 준비
# ( 튜닝대상(W,b), 학습계수(적용비율), 속도 )
optimizer = optim.SGD( model.parameters(), lr=0.01, momentum=0.5 ) # 경사 하강법

# 학습 구성

# 학습 실행 및 테스트

In [None]:
def train(model,train_loader,optimizer):
  '''
    model         : 모델 (학습 대상)
    train_loader  : 학습시 사용할 데이터를 제공하는 공급자
    optimizer     : 모델 학습시 손실값을 최소로 줄일 수 있게 조정하는 주체
                    최적의 W,b를 계산(조정, 수정)하는 주체
  '''
  # 학습 모드로 전환
  model.train()
  # 미니 배치 학습 진행
  for idx, (data, target) in enumerate(train_loader):
    pass
  pass

In [None]:
def test(model,test_loader):
  # 테스트 모드로 전환
  model.eval()
  # 테스트 행위간 발생되는 모든 내용을 기록하지 않는다
  with torch.no_grad():
    pass
  pass

In [None]:
# 조기학습 종료 컨셉이 없으므로 EPOCHES 설정 횟수만큼 진행
for epoch in range(1,EPOCHES+1):
  # 1세대 학습이 끝나면 바로 테스트
  # 훈련
  train(model, train_loader,optimizer)
  # 테스트
  loss, acc = test(model, test_loader)
  # 로그
  print( f'epoch:{epoch}, 손실:{loss}, 정확도:{acc}' )