## 이번 머신러닝 학습 계획

개, 고양이 이미지를 각각 1000개씩 가지고 있고, 테스트 이미지도 1000개씩 가지고 있다.

강아지 레이블을 0, 고양이 레이블을 1로 하여 이미지를 저장한다.

**이번 코드를 짜며 가장 이루고 싶은 목표는 torch, data_loader을 쓰지 않고 리스트로 해결하는 것이다.**

**가능하다면 위 목표를 지키기 위해 노력하겠지만, 정 어렵다면 최소한으로 사용하는 것을 목표로 한다.**

In [2]:
import os
import cv2
import numpy as np
import matplotlib.pyplot as plt
import torch.nn as nn
import torch.nn.functional as F
from torch.utils.data import DataLoader, Dataset
import torch
from torchvision import transforms

torch.backends.cuda.max_split_size_mb = 0
torch.backends.cuda.max_sync_interval = 0

In [3]:
##현재 데이터는 각 폴더에 1000개씩 저장되어 있다.
##이를 label, 이미지로 저장해보도록 하겠다.


cat_path = 'C:\\Users\\kuroc\\Documents\\no_3\\02_cnn_pt\\train\\cat'
dog_path = 'C:\\Users\\kuroc\\Documents\\no_3\\02_cnn_pt\\train\\dog'

# 데이터셋 초기화; 이미지:라벨로 저장
cat_data = {'images': [], 'labels': []}
dog_data = {'images': [], 'labels': []}

# 디렉토리 내의 모든 파일 목록 얻기
cfile_list = os.listdir(cat_path)
dfile_list = os.listdir(dog_path)  # 수정 필요

print(len(cfile_list))
print(len(dfile_list))


1000
1000


## 고양이 먼저 저장

In [4]:

# 디렉토리 내의 각 이미지에 대해 반복
'''강아지를 0, 고양이를 1로 하여 저장할 것이다.'''

for file_name in cfile_list:
    img_path = os.path.join(cat_path, file_name)
    img_array=np.fromfile(img_path, np.uint8)
    img = cv2.imdecode(img_array, cv2.IMREAD_COLOR)
    # 이미지를 읽어오기
    img = cv2.imread(img_path, cv2.IMREAD_GRAYSCALE)

    # 이미지 파일 이름에서 숫자 정보 추출
    '''
    이미지 형식은 "해당 숫자.순번"형식이다.
    따라서 .를 기준으로 숫자를 분리한다.
    '''
    label = 1

    # 이미지와 레이블을 데이터셋에 추가
    cat_data['images'].append(img)
    cat_data['labels'].append(label)

print(len(cat_data['images']))

1000


## 강아지 저장

In [5]:
# 디렉토리 내의 각 이미지에 대해 반복
'''강아지를 0, 고양이를 1로 하여 저장할 것이다.'''

for file_name in dfile_list:
    img_path = os.path.join(dog_path, file_name)
    img_array=np.fromfile(img_path, np.uint8)
    img = cv2.imdecode(img_array, cv2.IMREAD_COLOR)
    # 이미지를 읽어오기

    # 이미지 파일 이름에서 숫자 정보 추출
    '''
    이미지 형식은 "해당 숫자.순번"형식이다.
    따라서 .를 기준으로 숫자를 분리한다.
    '''
    label = 0

    # 이미지와 레이블을 데이터셋에 추가
    dog_data['images'].append(img)
    dog_data['labels'].append(label)

print(len(dog_data['images']))

1000


## 두 데이터를 합쳐서 하나의 데이터로 만들기

In [6]:
data = {'images': cat_data['images'] + dog_data['images'], 'labels': cat_data['labels'] + dog_data['labels']}
print(len(data['images']))


2000


## 이미지 전처리
CNN에서는 fully-connected network 와 마찬가지로 고정적인 input이 필요하다.

그래서 나는 image의 크기를 250, 250으로 맞추어 이미지를 전처리 해보도록 하겠다.

In [11]:
'''
유의할 점: data={'images':'labels'}형이므로, len(data)라고 하면 2개 값만 처리 된다.
키 값을 len값으로 처리하는 게 좋다.'''



for i in range(len(data['images'])):
    data['images'][i] = (data['images'][i] / 255.0).astype(np.float32)




print(data['images'][0]) ##제대로 0~1로 정의되었다.

[[2.5682431e-03 2.5682431e-03 2.5836218e-03 ... 3.1372549e-03
  3.1218762e-03 3.1064975e-03]
 [2.5682431e-03 2.5682431e-03 2.5836218e-03 ... 3.1526336e-03
  3.1372549e-03 3.1064975e-03]
 [2.5682431e-03 2.5682431e-03 2.5836218e-03 ... 3.1526336e-03
  3.1372549e-03 3.1218762e-03]
 ...
 [1.9069589e-03 1.9069589e-03 1.9069589e-03 ... 3.0757401e-05
  3.0757401e-05 3.0757401e-05]
 [1.8915802e-03 1.8915802e-03 1.8915802e-03 ... 3.0757401e-05
  3.0757401e-05 3.0757401e-05]
 [1.8762015e-03 1.8762015e-03 1.8762015e-03 ... 1.5378700e-05
  1.5378700e-05 1.5378700e-05]]


## CNN 클래스 제작

In [12]:
class CNN(nn.Module):
    def __init__(self):
        super(CNN, self).__init__()
        self.conv1 = nn.Conv2d(in_channels=1, out_channels=632, kernel_size=3, stride=1, padding=1)
        self.pool = nn.MaxPool2d(kernel_size=2, stride=2)
        
        self.linear1 = nn.Sequential(
            nn.Conv2d(632, 800, kernel_size=3, stride=1, padding=1),
            nn.ReLU(),
            nn.MaxPool2d(2)
        )
        self.linear2 = nn.Sequential(
            nn.Conv2d(800, 900, kernel_size=3, stride=1, padding=1),
            nn.ReLU(),
            nn.MaxPool2d(2)
        )
        self.linear3 = nn.Sequential(
            nn.Conv2d(900, 1000, kernel_size=3, stride=1, padding=1),
            nn.ReLU(),
            nn.MaxPool2d(2)
        )
        
        self.fc1 = nn.Linear(225000, 1000)
        self.relu = nn.ReLU()
        self.fc2 = nn.Linear(1000, 2, bias=True)
        
        torch.nn.init.xavier_uniform_(self.fc1.weight)
        torch.nn.init.xavier_uniform_(self.fc2.weight)

    def forward(self, x):
        out = self.conv1(x)
        out = self.pool(out)
        out = self.linear1(out)
        out = self.linear2(out)
        out = self.linear3(out)
        out = out.view(out.size(0), -1)
        out = self.fc1(out)
        out = self.relu(out)
        out = self.fc2(out)
        return out

model = CNN()


## 데이터 전처리

pytorch.dataloader 기능을 쓸 수가 없어서 이를 그대로 구현해주기로 했다.

우선은 batch 기능을 먼저 구현해보고, 추후에 시간이 되면 셔플 기능을 추가해보기로 한다.

dict1, dict2..식으로 저장하기에는 너무 개수가 많으므로 리스트에 모든 딕셔너리를 저장한다.

In [13]:
from PIL import Image

batch_size = 20

# 빈 리스트(딕셔너리 저장할 리스트).
batched_dicts = []

def resize_image(img, target_size):
    transform = transforms.Compose([transforms.Resize(target_size),
                                    transforms.ToTensor()])
    return transform(img)


# 딕셔너리의 아이템을 순회하면서 20개만큼 값 추가.
current_batch = {'images': [], 'labels': []}
for img, label in zip(data['images'], data['labels']):
    img = Image.fromarray(img)  # numpy 배열을 이미지로 변환
    img = resize_image(img, (250, 250))
    current_batch['images'].append(img)
    current_batch['labels'].append(label)
    if len(current_batch['images']) == batch_size:
        batched_dicts.append(current_batch)
        current_batch = {'images': [], 'labels': []}

print(len(batched_dicts))
print(len(batched_dicts[0]))
print(batched_dicts[0])


TypeError: Cannot handle this data type: (1, 1, 3), <f4

CNN 학습을 위해선 conv2d 를 써야 하는데, 입력값이 무조건 tensor여야만 사용할 수 있다.

그래서 여기서 x를 tensor화 해주기로 했다.

In [None]:
total = len(batched_dicts)

epoch = 20

optimizer = torch.optim.SGD(model.parameters(), lr=0.001)
criterion = nn.CrossEntropyLoss()

for e in range(epoch):
    total_cost = 0  # 새로운 변수로 변경
    for batch in batched_dicts:
        x = torch.stack(batch['images'])  # 이미지 데이터를 텐서로 변환하고 GPU로 이동

        y = torch.tensor(batch['labels'])
        print(0)
        optimizer.zero_grad()
        hy = model(x)
        cost = criterion(hy, y)
        print(2)
        cost.backward()
        optimizer.step()
        print(1)
        total_cost += cost.item()
    print("cost[{}] :{}".format(e + 1, total_cost / total))

print("학습종료")
