# 필요 라이브러리 호출

In [None]:
import os, tqdm, math, random, argparse

import numpy as np
import pandas as pd

from glob import glob
from PIL import Image
from matplotlib import pyplot as plt

import torch
import torch.nn as nn
import torchvision
import torchvision.transforms as transforms
import torchvision.transforms.functional as TF
from torch.utils.data import DataLoader, Dataset

from tqdm.notebook import tqdm

import segmentation_models_pytorch as smp
from pytorch_msssim import MS_SSIM

import cv2
import random

In [None]:
device = "cuda:0" if torch.cuda.is_available() else "cpu"
device = torch.device(device)
print(device)

#device는 학습 환경을 cpu로 할 것인지 아니면 gpu로 할것인지 에 대한 변수이다.
# torch.cuda.is_available()는 말 그대로 cuda(gpu)을 사용할 수 있으면 사용하겠다는 의미

# 빛번짐 최소화 인공지능 데이터 수집

Dacon : https://dacon.io/competitions/official/235746/data

DACON에서 가져온 같은장소에서 빛번짐이 존재하는 이미지 데이터 622개와 빛 번짐이 없는 이미지 데이터 622개로 이루어진 데이터셋을 제공해줘서 이 데이터셋을 다운로드. 

 모두 비정형 데이터 이며 이미지 크기는 3264*2448와 1632*1224 두가지의 PNG형식의 비정형 데이터임.

 개발 시 622개의 데이터셋을 학습용으로 562개 검증용으로 60개로 사용하였음.
-빛이 번져있는 사진을 인공지능에 넣었을 때 생성되는 빛이 줄이든 사진이 이미 준비해둔 빛이 안번져있는 사진과 시각 적으로 비교해서 얼마나 잘 줄어들었는지 확인하기위함.

 DACON에서 다운받는 데이터로만 진행했기 때문에 위의 과정을 거치고 같은 장소의 빛이 번져있는 사진과 안번져있는 사진을 구할 수 있으면 파일 형식과 사진 개수는 무관함.


# directory 확인

In [None]:
cd C:/Users/ChangHwan/Desktop/data

In [None]:
ls

In [None]:
cd C:/Users/ChangHwan/Desktop/data/train_input_img

In [None]:
ls

In [None]:
cd C:/Users/ChangHwan/Desktop

In [None]:
train_csv = pd.read_csv('data/train.csv')
test_csv = pd.read_csv('data/test.csv')

In [None]:
train_csv.head()

In [None]:
test_csv.head()

In [None]:
train_all_input_files = 'data/train_input_img/'+train_csv['input_img']
train_all_label_files = 'data/train_label_img/'+train_csv['label_img']
test_all_input_files = 'data/test_input_img/'+test_csv['input_img']

# 학습 데이터와 검증 데이터를 분리

In [None]:
train_input_files = train_all_input_files[60:].to_numpy()
train_label_files = train_all_label_files[60:].to_numpy()

In [None]:
vaild_input_files = train_all_input_files[:60].to_numpy()
vaild_label_files = train_all_label_files[:60].to_numpy()

In [None]:
train_input_files

In [None]:
vaild_input_files

# 빛번짐 데이터 열어서 확인

In [None]:
for i in range(4):
    origin_img = Image.open(f'data/train_input_img/train_input_{i+10060}.png')
    trans_img = Image.open(f'data/train_label_img/train_label_{i+10060}.png')
    fix , ax = plt.subplots(ncols = 2,figsize = (8,8))
    ax[0].set_title('input')
    ax[0].imshow(origin_img)
    ax[1].set_title('label')
    ax[1].imshow(trans_img)
    plt.show()


# 빛번짐 최소화 데이터 처리

제공된 데이터의 크기(3264*2448 , 1632*1224)를 512*384의 크기로 축소시키는 과정을 거침

 데이터의 크기와 사용하는 인공지능 신경망을 gpu에 할당할 때 현재 colab에서 제공되는 최대 GPU는 15GB로 데이터 크기 그대로 사용했을 때 15GB로는 메모리가 부족한 현상이 발생해서 15GB에 최대한 맞는 크기로 이미지를 축소한 결과 512*384인걸 확인해서 이미지를 축소함

 만약 GPU MEMORY가 더 큰 GPU를 사용한다면 최대한 이미지의 크기를 보존하도록 하는 게 좋음
-이미지를 축소한다는 것은 이미지의 정보에 대해서 손실이 일어난다는 것을 의미하기 때문에


In [None]:
class CustomDataset(Dataset):
    def __init__(self, data, label,w,h ,is_train=True):
        self.data  = data
        self.label = label
        self.w = w
        self.h = h
        self.is_train = is_train
        
    def __len__(self):
        return len(self.data)
    
    def transform(self, image, label):
        
        resizer = transforms.Resize(size=(self.h, self.w))
        image = resizer(image)
        label = resizer(label)

        image = TF.to_tensor(image)
        label = TF.to_tensor(label)
        return image, label
    
    def __getitem__(self, idx):
        origin_img = Image.open(self.data[idx])
        label_img  = Image.open(self.label[idx])
        
        origin_img, label_img = self.transform(origin_img, label_img)
        return origin_img, label_img
    
#def __init__는 생성자
#def __len__은 데이셋의 길이를 변환
#def __transform 에서 resize = 이미지 크기 재지정 , to_tensor = 이미지를 tensor형으로 변경
#def __getitem__은 이미지를 호출하고 transform함수를 적용 시킨 후 이미지를 호출

In [None]:
class testDataset(Dataset):
    def __init__(self, data,is_train=True):
        self.data  = data
        self.is_train = is_train
        
    def __len__(self):
        return len(self.data)
    
    def transform(self, image):
        
        transform = transforms.Compose([
            transforms.ToTensor(),
            transforms.Resize(size=(384, 512))
        ])
        image = transform(image)
        
        return image
    
    def __getitem__(self, idx):
        origin_img = Image.open(self.data[idx]).convert("RGB") 
        
        origin_img = self.transform(origin_img)
        return origin_img

In [None]:
train_dataset = CustomDataset(train_input_files, train_label_files,512,384)
vaild_dataset = CustomDataset(vaild_input_files, vaild_label_files,512,384)
test_dataset = testDataset(test_all_input_files)

In [None]:
for i in range(4):
    origin_img = Image.open(f'data/train_input_img/train_input_{i+10060}.png')
    trans_img = train_dataset[i][0].numpy().transpose(1,2,0)
    fix , ax = plt.subplots(ncols = 2,figsize = (8,8))
    ax[0].set_title('before reduce')
    ax[0].imshow(origin_img)
    ax[1].set_title('after reduce')
    ax[1].imshow(trans_img)
    plt.show()



In [None]:
train_loader = DataLoader(train_dataset , batch_size = 4, shuffle = True)
vaild_loader = DataLoader(vaild_dataset , batch_size = 1, shuffle = False)
test_loader = DataLoader(test_dataset , batch_size = 4 , shuffle = True )

# 빛번짐 최소화 인공지능 모델 선정

 개발 시 사용할 인공지능 신경망으로는 CNN을 선정
다른 신경망들과 다르게 이미지 데이터를 처리 할 때 이미지의 단순한 특징 뿐만 아니라 패턴까지 알아 낼 수 있는 장점이 있기 때문임

 선정한 모델로는 Resnet , Mobilenet , Efficientnet임
-3가지 모델은 Resnet > Mobilenet > Efficinetnet으로
인공지능의 모델의 크기에 따른 성능을 비교하기 위해 위의 모델들을 선정하였음

 단 개발시에는 다른 모델을 사용해도 상관 없으나 CNN을 기초로 한 인공지능 모델을 선정하는 것을 추천
-단순히 특징만 추출해내는 DNN같은 신경망으로 해도 문제는 없으나 효과를 기대하기는 CNN에 비해서 기대 효과를 얻기 어렵기 때문임.


In [None]:
model = smp.UnetPlusPlus(encoder_name='efficientnet-b0',
                encoder_weights='imagenet',
                in_channels=3, classes=3, activation='sigmoid')

'''
model = smp.UnetPlusPlus(encoder_name='efficientnet-b4',
                encoder_weights='imagenet',
                in_channels=3, classes=3, activation='sigmoid')
                

model = smp.UnetPlusPlus(encoder_name='mobilenet_v2',
                encoder_weights='imagenet',
                in_channels=3, classes=3, activation='sigmoid')
'''

In [None]:
model.to(device)
model
#model.load_state_dict(torch.load('/content/drive/MyDrive/efficientnet.pt'))

# 빛번짐 최소화 인공지능 모델 학습

빛번짐 최소화 인공지능 모델 학습

 선정한 모델 Resnet , Mobilenet , Efficientnet을 조원끼리 하나씩 맡아서 각자의 기기로 학습을 진행

 하나의 모델에 대해서 학습당 시간이 약 5분정도가 소요되고 최소한 성능을 내기 위해서는 100회 이상의 학습량이 필요했음. (ex)100회 학습 시 500분 소요)

 개발 환경 구축 , 데이터 수집 , 데이터 처리까지는 각자모두 같은 과정을 수행하고 각자 모델을 하나씩 맡아서 ex)고창환은 resnet, 김선영은 mobilenet 
300번의 횟수로 학습을 진행하였음

  -한 학기의 시간동안 빠르게 인공지능을 완성해야 하였기 때문에 위와 같은 방식을 선정하였음 


In [None]:
criterion = torch.nn.MSELoss().to(device) #예상 답과 실제 답의 차이를 줄이기 위한 함수
optimizer = torch.optim.Adam(model.parameters(), lr=0.001) #가중치를 갱신해주는 함수
scheduler = torch.optim.lr_scheduler.StepLR(optimizer,step_size = 10, gamma=0.8)#학습에 사용 되는 가중치를 조절해주는 함수

In [None]:
'''
train_loss = []
vaild_loss=[]
model.load_state_dict(torch.load('data/resnet.pt'))
for epoch in range(80):
    total_loss = 0
    model.train()
    
    for image , label in tqdm(train_loader,total=len(train_loader),leave = False):
        image = image.to(device)
        label = label.to(device)
        output = model(image.float())
        loss = torch.sqrt(criterion(output,label))
        optimizer.zero_grad()
        loss.backward()
        optimizer.step()
        total_loss += loss.item()
    train_loss.append(total_loss/len(train_loader))
    torch.save(model.state_dict(), 'data/resnet.pt')
    print("epoch :" , epoch+1 , "loss :" , total_loss/len(train_loader))
    
    scheduler.step()
    
    idx = 1
    '''
'''
    model.eval()
    with torch.no_grad():
        for image , label in tqdm(vaild_loader,total=len(vaild_loader),leave = False):
            image = image.to(device)
            label = label.to(device)
            output = model(image.float())
            loss = torch.sqrt(criterion(output,label))
            
            total_loss += loss.item()
            

            target_path = 'data/result/' + str(epoch+1)+'/'
            if not os.path.exists(target_path):
                os.makedirs(target_path, exist_ok=True)

            grid = torchvision.utils.make_grid(tensor=torch.vstack([image,label,output]), nrow=image.shape[0])    # Saving results
            torchvision.utils.save_image(grid, target_path+str(idx)+'.png')
            idx +=1
        vaild_loss.append(total_loss/len(vaild_loader))
        print("val_epoch :" , epoch+1 , "val_loss :" , total_loss/len(vaild_loader))
    '''

#요약으로 dataset에서 문제(image)와 답지(label)을 호출 하고 model에 문제를 넣음(output = modle(image))
#output은 예상 답을 의미 하고 loss변수는 예상 답과 실제 답에 대한 차이를 줄여 나감
#zero_grad는 가중치를 초기화해주는 함수
#loss backward는 역전파 알고리즘에 대한 것으로 신경망 방향을 순방향으로 한번 역방향으로 한번 확인 후 비교를 하는 것
    

# 빛번짐 모델 검증

빛번짐 최소화 인공지능 모델 검증

 검증용(학습 때 사용하지 않음)으로 사용하기로 했던 60개의 빛이 번져있는 사진과 번져있지 않은 사진을 준비해서 번져있는 사진을 학습이 끝난 인공지능 모델에 넣고 그에 대한 결과를 번져있지 않은 사진과 비교해서 얼마나 빛이 잘 줄어들었는지 확인

 수치적으로 이를 검증할 수 없기 때문에 시각적으로 가장 빛을 잘 줄였다고 생각한 모델을 가장 빛을 최소화시킨 모델로 선정하기로 하고 이 모델을 최종적인 빛번짐 최소화 모델로 선정

 resnet mobilenet efficinetnet중 efficientnet이 가장 시각적으로 빛을 잘 줄였다고 생각해 efiicinetnet을 선정하였음


In [None]:
'''
model.eval()
model.load_state_dict(torch.load('data/efficientnet.pt'))
for image,label in vaild_loader:
    recon = model(image.to(device))
    _, ax = plt.subplots(1, 3, figsize=(15,15))
    ax[0].set_title('input')
    ax[0].imshow(np.moveaxis(image.reshape(3,384,512).cpu().numpy(),0,2))
    ax[1].set_title('label')
    ax[1].imshow(np.moveaxis(label.reshape(3,384,512).cpu().numpy(),0,2))
    ax[2].set_title('predict')
    ax[2].imshow(np.moveaxis(recon.reshape(3,384,512).cpu().detach().numpy(),0,2))
    '''

# 밤낮 전환 인공지능 데이터 수집

kaggle : https://www.kaggle.com/datasets/solesensei/solesensei_bdd100k

Kaggle에서 낮에 찍힌 블랙박스 영상을 이미지로 분할한 사진과 밤에 블랙박스 영상을 이미지로 분할한 데이터셋을 다운로드

 모두 비정형 데이터이며 이미지 크기는 모두 1080*720으로 이루어져 있고 jpg형식의 비정형 데이터임.

 개발 시 다운 받은 데이터셋(약 밤사진 20000장 낮 사진 20000장)에서 밤사진 4000장 과 낮사진4000 장을 가지고 와서 학습 데이터로 사용함 

 데이터를 모두 사용하면 좋으나 이 또한 한달안에 인공지능을 개발해야 하기 때문에 데이터 수를 줄여서 빠르게 결과를 보기 위해서 사용


In [None]:
cd C:/Users/ChangHwan/Desktop/

# 밤낮 데이터 파일 크기 및 확인

In [None]:
origin_img = Image.open(f'data/밤/795378f0-db2d80b2.jpg')
trans_img = Image.open(f'data/낮/58610009-f3b500dd.jpg')
fix , ax = plt.subplots(ncols = 2,figsize = (8,8))
ax[0].set_title('input(night)')
ax[0].imshow(origin_img)
ax[1].set_title('label(day)')
ax[1].imshow(trans_img)
plt.show()

In [None]:
cd C:/Users/ChangHwan/Desktop/data/밤

In [None]:
ls

In [None]:
cd C:/Users/ChangHwan/Desktop/data/낮

In [None]:
ls

In [None]:
cd C:/Users/ChangHwan/Desktop/

# 밤낮 전환 인공지능 데이터 처리

빛번짐과 똑같이 처리함 이유 또한 동일

-1280 * 720 이미지를 512* 384로 축소 


In [None]:
class Dataset(object):
    def __init__(self, label_dir, input_dir, image_size, scale):
        self.label_dir = [os.path.join(label_dir, x) for x in os.listdir(label_dir) if self.check_image_file(x)]
        self.input_dir = [os.path.join(input_dir, x) for x in os.listdir(input_dir) if self.check_image_file(x)]
        self.image_size = image_size
        self.to_Tensor = transforms.ToTensor()
        self.resize = transforms.Resize((128 , 128 ), interpolation=Image.BICUBIC)
        self.rotates = [0, 90, 180, 270]
    
    def check_image_file(self, filename: str):
        return any(filename.endswith(extension) for extension in [".jpg", ".jpeg", ".png", ".bmp", ".tif", ".tiff", ".JPG", ".JPEG", ".PNG", ".BMP"])
    
    def data_augmentation(self, hr, lr):

        width, height = hr.size
        
        hr = hr.resize((512, 384), resample=Image.BICUBIC)
        lr = lr.resize((512, 384), resample=Image.BICUBIC)
    
        return hr, lr

    def __getitem__(self, idx):
    
    
        hr = Image.open(self.label_dir[idx]).convert("RGB")
        lr = Image.open(self.input_dir[idx]).convert("RGB") 

        hr, lr = self.data_augmentation(hr, lr) 
        
        return self.to_Tensor(hr), self.to_Tensor(lr) 

    def __len__(self):
        return len(self.label_dir)

In [None]:
class TestDataset(object):
    def __init__(self, input_dir, image_size, scale):
        self.input_dir = [os.path.join(input_dir, x) for x in os.listdir(input_dir) if self.check_image_file(x)]
        self.image_size = image_size
        self.to_Tensor = transforms.ToTensor()
        self.resize = transforms.Resize((image_size , image_size ), interpolation=Image.BICUBIC)
        self.rotates = [0, 90, 180, 270]
     
    
    def check_image_file(self, filename: str):
        return any(filename.endswith(extension) for extension in [".jpg", ".jpeg", ".png", ".bmp", ".tif", ".tiff", ".JPG", ".JPEG", ".PNG", ".BMP"])
    

    def data_augmentation(self, hr):

        width, height = hr.size

        hr = hr.resize((512, 384), resample=Image.BICUBIC) # 테스트용은 밤 하나이기 때문.

        return hr

    def __getitem__(self, idx):

        hr = Image.open(self.input_dir[idx]).convert("RGB") 

        hr = self.data_augmentation(hr) 
        return self.to_Tensor(hr)

    def __len__(self):
        return len(self.input_dir)

In [None]:
import natsort
train_dir = 'data/밤/' # 밤
label_dir = 'data/낮/' # 낮
test_dir = natsort.natsorted(glob('data/video/*.png')) #테스트 값.

In [None]:
print(test_dir)

In [None]:
train_dataset = Dataset(train_dir , label_dir,256,1)
test_dataset = testDataset(test_dir)

In [None]:
pwd

In [None]:
origin_img = Image.open(f'data/밤/795378f0-db2d80b2.jpg')
trans_img = train_dataset[1][0].numpy().transpose(1,2,0)
fix , ax = plt.subplots(ncols = 2,figsize = (8,8))
ax[0].set_title('before reduce')
ax[0].imshow(origin_img)
ax[1].set_title('after reduce')
ax[1].imshow(trans_img)
plt.show()

In [None]:
origin_img = Image.open(f'data/낮/58610009-f3b500dd.jpg')
trans_img = train_dataset[0][1].numpy().transpose(1,2,0)
fix , ax = plt.subplots(ncols = 2,figsize = (8,8))
ax[0].set_title('before reduce')
ax[0].imshow(origin_img)
ax[1].set_title('after reduce')
ax[1].imshow(trans_img)
plt.show()

In [None]:
train_loader = DataLoader(
    train_dataset,
    batch_size = 2,
    shuffle = True,
)

test_loader = DataLoader(
    test_dataset,
    batch_size = 1,
    shuffle = False
)

# 밤낮 전환 인공지능 모델 선정

 개발 시 사용할 인공지능 신경망으로는 CNN을 선정
다른 신경망들과 다르게 이미지 데이터를 처리 할 때 이미지의 단순한 특징 뿐만 아니라 패턴까지 알아 낼 수 있는 장점이 있기 때문임

 선정한 모델로는 Cycle Gan임
- 사용할 데이터가 낮,밤에 대해서 같은 장소에 시간이 다른 paire된 데이터가 아니라 아예 개개인의 다른 장소의 낮 , 밤으로 이루어져 있기 때문에 unpaired된 image로 데이터의 특징을 전이할 수 있는 Cycle Gan을 이용한 현재 unpaired된 데이터로 특징을 전이 할 수 있는 모델은 Cycle Gan이 유일함


# generator

In [None]:
class ResidualBlock(nn.Module):
    def __init__(self, in_channels):
        super(ResidualBlock, self).__init__()
        self.block = nn.Sequential(
            nn.ReflectionPad2d(1), # reflectionpadding이란 가장자리 기준으로 input값을 패딩영역에 반전하여 복사하여 채우는 기법. 여기선 가장자리 1줄을 채움.
            nn.Conv2d(in_channels, in_channels, 3), #CNN.
            nn.InstanceNorm2d(in_channels), #BatchNorm과 다른 점은 Batch는 전체 Dataset기준으로 Batch를 Normalize하는 것이라면, Instance는 mini-Batch단위로 instance들을 Normalize한다는 점.
            nn.GELU(), # dropout, zoneout, ReLu 함수의 특성을 조합한 것이 GeLU, ReLU가 뛰어나긴 하나 음수가 되어버리면 그 때의 모든 기울기는 0이 되어버리기에 음수에서 조금의 기울기를 주는 형태.
            nn.ReflectionPad2d(1),
            nn.Conv2d(in_channels, in_channels, 3),
            nn.InstanceNorm2d(in_channels)
        )
    
    def forward(self, x):  # weight를 통과한 layer들과 통과하지 않은 값들을 더한 residual mapping방식. 
        return x + self.block(x) # x는 통과하지 않은 값들, self.block(x)는 통과한 값들.

In [None]:
class GeneratorResNet(nn.Module):
    def __init__(self, in_channels, num_residual_blocks=3):  # 이 클래스에서 resiudalblock 클래스를 이용할 때 쓰이는 변수. 현재는 layer 9번 쓴다고 선언 되어있고 block수는 맘대로 선언해도 됨.
        super(GeneratorResNet, self).__init__()
        
        out_channels=64   #최초의 convolution 블록. 처음 출력값은 64개.
        self.conv = nn.Sequential(
            nn.ReflectionPad2d(in_channels), 
            nn.Conv2d(in_channels, out_channels, 2*in_channels+1),# in_channels = 3 이유는 이미지는 모두 rgb를 가지고 있기 때문.
            nn.InstanceNorm2d(out_channels),
            nn.GELU(),
        )

        channels = out_channels # convolution 후 나온 값을 저장한 모습. 즉, 64가 저장 된다.
                                
                                # 이 작업으로 64개의 출력값을 가지고 있는 은닉층 형성.
        
        self.down = [] #데이터 수를 줄이는게 아니라 우리 빛번짐에서 이미지 축소하고 확장하잖아? 그중 축소하면서 특징 추출하는 과정임.
                       #generator는 기본적으로 Unet model을 기본으로 만들기 때문에 그 중 이미지 축소하면서 특징 추출하는거지
                       
        for _ in range(2): # 2번 반복하는데 index부분이 필요가 없으므로 _ 사용.
            out_channels = channels * 2 #채널 값을 2배로 늘린 후 저장(첫 컨볼루션에서 3-64 여기서 64-128, 그 후 128-256)
            self.down += [                                                  # 이미지 축소 과정.
                nn.Conv2d(channels, out_channels, 3, stride=2, padding=1),
                nn.InstanceNorm2d(out_channels),
                nn.GELU(),
            ]
            channels = out_channels # 각각의 출력값을 저장. 1번째 convolution에선 128. 2번째 convolution에선 256저장.
        self.down = nn.Sequential(*self.down) #위에 for문 과정 down 리스트에 저장.
        
        self.trans = [ResidualBlock(channels) for _ in range(num_residual_blocks)]  #residual block을 돌리는 코드.
                                                                                    # for문을 풀자면 ResidualBlock클래스를 9번 돌리고 그 결괏값을 trans에 저장한다는 코드.
                                                                                    
        self.trans = nn.Sequential(*self.trans) #trans라는 리스트에 resudial block 9개층을 저장(여기도 모델에 resudial block을 몇을 주냐에 따라 층 개수 달라짐)
        self.up = [] # residual block을 거쳐서 mapping이 진행된 값을 저장.
        
        for _ in range(2): #upsampling과정. 여기서는 이미지를 축소했기 때문에 다시 복원하는 과정이다.
            out_channels = channels // 2 # 컨볼루션 과정에서 3-64-128-256형태로 축소했기 때문에 다시 256-128-64-3형태로 가야한다.
                                         #여기서는 이미지를 다시 확장하는 과정임
            self.up += [
                nn.Upsample(scale_factor=2), # 이미지가 만약 2*2면 scale_factor = 2면 이미지가 4*4가 됨 이렇게 확장하는과정에서 빈공간의 수를 어떻게 채울지에 따라 3가지 방식 여기선 bil...어쩌고
                nn.Conv2d(channels, out_channels, 3, stride=1, padding=1), 
                nn.InstanceNorm2d(out_channels),
                nn.GELU(),
            ]
            channels = out_channels #위에 설명 해줬으니까 알겠지? / 다시 64를 저장.
        self.up = nn.Sequential(*self.up) #up list에 이미지 확장해주는 layer를 리스트로 저장
        
        self.out = nn.Sequential( #출력 layer. 이제 64-3 convolution 진행.
            nn.ReflectionPad2d(in_channels),
            nn.Conv2d(channels, in_channels, 2*in_channels+1),
            nn.Tanh() #마지막은 Sigmoid나 tanh둘중에 뭐쓸지 고민중 
        )
    
    def forward(self, x):
        x = self.conv(x)
        x = self.down(x)
        x = self.trans(x)
        x = self.up(x)
        x = self.out(x)
        return x

# discriminator

In [None]:
class Discriminator(nn.Module):
    def __init__(self, in_channels):
        super(Discriminator, self).__init__()
        
        self.model = nn.Sequential(
            *self.block(in_channels, 32, normalize=False),
            *self.block(32, 64),  
            *self.block(64, 128), 
            *self.block(128, 256),
            
            nn.ZeroPad2d((1,0,1,0)), 
            nn.Conv2d(256, 1, 4, padding=1)
        )
        
        self.scale_factor = 16
        self.m = nn.Sigmoid()
    
    @staticmethod
    def block(in_channels, out_channels, normalize=True):
        layers = [nn.Conv2d(in_channels, out_channels, 4, stride=2, padding=1)]
        if normalize:
            layers.append(nn.InstanceNorm2d(out_channels))
        layers.append(nn.LeakyReLU(0.2, inplace=True))
        
        return layers
        
    def forward(self, x):
        x = self.model(x)
        x = self.m(x)
        return x
    

In [None]:
G_AB = GeneratorResNet(3, num_residual_blocks=6)
D_B = Discriminator(3)

G_BA = GeneratorResNet(3, num_residual_blocks=6)
D_A = Discriminator(3)

In [None]:
criterion_GAN = nn.BCELoss()
criterion_cycle = nn.L1Loss()
criterion_identity = nn.MSELoss()

In [None]:
cuda = torch.cuda.is_available()
print(f'cuda: {cuda}')
if cuda:
    G_AB = G_AB.cuda()
    #G_AB.load_state_dict(torch.load('/content/drive/MyDrive/weight/'+'G_AB2.pt'))
    D_B = D_B.cuda()
    #D_B.load_state_dict(torch.load('/content/drive/MyDrive/weight/'+'D_B2.pt'))
    G_BA = G_BA.cuda()
    #G_BA.load_state_dict(torch.load('/content/drive/MyDrive/weight/'+'G_BA2.pt'))
    D_A = D_A.cuda()
    #D_A.load_state_dict(torch.load('/content/drive/MyDrive/weight/'+'D_A2.pt'))
    
    criterion_GAN = criterion_GAN.cuda()
    criterion_cycle = criterion_cycle.cuda()
    criterion_identity = criterion_identity.cuda()

# genrator 결과 시각화

In [None]:
from torchvision.utils import make_grid
import random
Tensor = torch.cuda.FloatTensor if cuda else torch.Tensor

def sample_images(real_A, figside=1.5):
    G_AB.cuda()
    G_AB.eval()
    G_BA.eval()
    
    real_A = real_A.type(Tensor) #진짜 밤 사진.
    fake_B = G_AB(real_A).detach()
    reconv_A = G_BA(fake_B).detach()
    '''
    real_B = real_B.type(Tensor)
    fake_A = G_BA(real_B).detach()
'''
    
    nrows = real_A.size(0)
    real_A = make_grid(real_A, nrow=nrows, normalize=True)
    fake_B = make_grid(fake_B, nrow=nrows, normalize=True)
    reconv_A = make_grid(reconv_A, nrow=nrows, normalize=True)
    #fake_A = make_grid(fake_A, nrow=nrows, normalize=True)
    
    image_grid = torch.cat((real_A, fake_B, reconv_A), 1).cpu().permute(1, 2, 0)
    
    plt.figure(figsize=(15, 10))
    plt.imshow(image_grid)
    plt.axis('off')
    plt.show()

In [None]:
real_A = next(iter(test_loader))
print(real_A.shape)
sample_images(real_A)

# 밤낮 전환 인공지능 인공지능 모델 학습


Cycle Gan의 모델 구조는 이미지를 축소 -> 이미지 특징 전이 -> 특징이 전이 된 이미지를 확장 하는 순으로 진행이 된다

1번째로는 축소와 확장 횟수에 따른 결과 값을 비교하는 방식으로 진행하고 

2번째로는 특징을 전이할 때 사용하는 신경망 층의 개수에 따른 성능을 비교해서

가장 좋았던 축소 확장 횟수 -> 가장 좋았던 특징 전이 신경망 층 개수 순으로 최종 인공지능 모델 구조를 선정한 후 최종 학습을 진행 할 예정


In [None]:
criterion_GAN = nn.BCELoss()
criterion_cycle = nn.L1Loss()
criterion_identity = nn.MSELoss()

In [None]:
import itertools
lr = 0.0002


optimizer_G = torch.optim.Adam(
    itertools.chain(G_AB.parameters(), G_BA.parameters()), lr=lr , betas = (0.5,0.999)
)

optimizer_D_A = torch.optim.Adam(
    D_A.parameters(), lr=lr , betas = (0.5,0.999)
)

optimizer_D_B = torch.optim.Adam(
    D_B.parameters(), lr=lr , betas = (0.5,0.999)
)

In [None]:
n_epoches = 300
decay_epoch = 20

lambda_func = lambda epoch: 1 - max(0, epoch-decay_epoch)/(n_epoches-decay_epoch)

lr_scheduler_G = torch.optim.lr_scheduler.LambdaLR(optimizer_G, lr_lambda=lambda_func)
lr_scheduler_D_A = torch.optim.lr_scheduler.LambdaLR(optimizer_D_A, lr_lambda=lambda_func)
lr_scheduler_D_B = torch.optim.lr_scheduler.LambdaLR(optimizer_D_B, lr_lambda=lambda_func)

In [None]:
'''
torch.manual_seed(777)

import gc
from tqdm.notebook import tqdm

for epoch in range(100):
    gc.collect()
    torch.cuda.empty_cache()

    for i, (real_A, real_B) in tqdm(enumerate(train_loader),total = len(train_loader)):
        real_A, real_B = real_A.type(Tensor), real_B.type(Tensor)
        
        # groud truth
        out_shape = [real_A.size(0), 1, real_A.size(2)//D_A.scale_factor, real_A.size(3)//D_A.scale_factor]
        valid = torch.ones(out_shape).type(Tensor)
        fake = torch.zeros(out_shape).type(Tensor)
        
        G_AB.train()
        G_BA.train()
        D_A.train()
        D_B.train()
        
        optimizer_G.zero_grad()
        
        fake_B = G_AB(real_A) 
        fake_A = G_BA(real_B)  
        
        loss_id_A = torch.sqrt(criterion_identity(fake_B, real_A)) 
        loss_id_B = torch.sqrt(criterion_identity(fake_A, real_B))
        loss_identity = (loss_id_A + loss_id_B) / 2

        loss_GAN_AB = criterion_GAN(D_B(fake_B),valid)
        loss_GAN_BA = criterion_GAN(D_A(fake_A), valid)
        loss_GAN = (loss_GAN_AB + loss_GAN_BA) / 2
        
        recov_A = G_BA(fake_B)
        recov_B = G_AB(fake_A)
        
        loss_cycle_A = criterion_cycle(recov_A, real_A)
        loss_cycle_B = criterion_cycle(recov_B, real_B)
        loss_cycle = (loss_cycle_A + loss_cycle_B) / 2
        
        loss_G = 5.0 *loss_identity + loss_GAN + 10.0*loss_cycle
        
        loss_G.backward()
        optimizer_G.step()
        
        optimizer_D_A.zero_grad()
        
        loss_real = criterion_GAN(D_A(real_A), valid)
        loss_fake = criterion_GAN(D_A(fake_A.detach()), fake)
        loss_D_A = (loss_real + loss_fake) / 2
        
        loss_D_A.backward()
        optimizer_D_A.step()
        
        optimizer_D_B.zero_grad()
        
        loss_real = criterion_GAN(D_B(real_B), valid)
        loss_fake = criterion_GAN(D_B(fake_B.detach()), fake)
        loss_D_B = (loss_real + loss_fake) / 2
        
        loss_D_B.backward()
        optimizer_D_B.step()
        
    
        torch.save(G_AB.state_dict(), 'data/weight/'+f'G_AB{epoch+1}.pt') # model.load_state_dict(torch.load(G_AB2.pth))
        torch.save(G_BA.state_dict(), 'data/weight/'+f'G_BA{epoch+1}.pt')
        torch.save(D_A.state_dict(), 'data/weight/'+f'D_A{epoch+1}.pt')
        torch.save(D_B.state_dict(), 'data/weight/'+f'D_B{epoch+1}.pt')
            
    lr_scheduler_G.step()
    lr_scheduler_D_A.step()
    lr_scheduler_D_B.step()
    
 
    test_real_A = next(iter(test_loader))
    if (epoch+1) % 5 == 0:
        sample_images(test_real_A)

    loss_D = (loss_D_A + loss_D_B) / 2
    if (epoch+1) % 10 == 0:
        print(f'[Epoch {epoch+1}/{n_epoches}]')
        print(f'[G loss: {loss_G.item()} | identity: {loss_identity.item()} GAN: {loss_GAN.item()} cycle: {loss_cycle.item()}]')
        print(f'[D loss: {loss_D.item()} | D_A: {loss_D_A.item()} D_B: {loss_D_B.item()}]') 
        
        '''

In [None]:
!nvidia-smi

# 밤낮 인공지능 검증

In [None]:
real_A= next(iter(test_loader))
print(real_A.shape)

sample_images(real_A)

# 전체 결과 보기(빛 줄인 후 밤낮 전환)

In [None]:


import time
from IPython import display

model.eval()
G_AB.eval()
model.load_state_dict(torch.load('data/efficientnet.pt'))
G_AB.load_state_dict(torch.load('data/밤.pt'))
idx=0
with torch.no_grad():
    for data in test_loader:
        predict = model(data.to(device))  
        pred = G_AB(predict.to(device))
        fix , ax = plt.subplots(ncols = 3,figsize = (20,15))
        ax[0].set_title('input(vaildation)')
        ax[0].imshow(np.moveaxis(data.reshape(3,384,512).cpu().numpy(),0,2))
        ax[1].set_title('reduce light')
        ax[1].imshow(np.moveaxis(predict.reshape(3,384,512).cpu().numpy(),0,2))
        ax[2].set_title('transform to day')
        ax[2].imshow(np.moveaxis(pred.reshape(3,384,512).cpu().numpy(),0,2))
        
        display.clear_output(wait=True)
        display.display(plt.gcf())
        idx = idx+1
        print(idx)

    
      #time.sleep(2)
    #print(image.shape , output.shape ,out.shape)
    

# 전체 결과 보기(밤낮 전환 후 빛 줄이기)

In [None]:

import time
from IPython import display

model.eval()
G_AB.eval()
model.load_state_dict(torch.load('data/efficientnet.pt'))
G_AB.load_state_dict(torch.load('data/밤.pt'))
with torch.no_grad():
    for image  in test_loader:
        image = image
        output = G_AB(image.to(device))  
        out = model(output.to(device))
        print(image.shape , output.shape ,out.shape)
        fix , ax = plt.subplots(ncols = 3,figsize = (20,15))
        ax[0].set_title('input(vaildation)')
        ax[0].imshow(np.moveaxis(image.reshape(3,384,512).cpu().numpy(),0,2))
        ax[1].set_title('transform to day')
        ax[1].imshow(np.moveaxis(output.reshape(3,384,512).cpu().numpy(),0,2))
        ax[2].set_title('reduce light')
        ax[2].imshow(np.moveaxis(out.reshape(3,384,512).cpu().numpy(),0,2))
        
        display.clear_output(wait=True)
        display.display(plt.gcf())
        idx = idx+1
        print(idx)
        

# 그냥 밤낮만 전환 했을 때랑 빛 최소화 후 밤낮 전환 했을 때랑 밤낮 전환 후 빛 최소화를 비교

In [None]:
import time
from IPython import display

model.eval()
G_AB.eval()
model.load_state_dict(torch.load('data/efficientnet.pt'))
G_AB.load_state_dict(torch.load('data/밤.pt'))
with torch.no_grad():
    idx=0

    for image in test_loader:

        
        image = image
        reduce_image = model(image.to(device))  
        nd_image = G_AB(image.to(device))
        predict = G_AB(reduce_image.to(device))
        prediction = model(nd_image.to(device))
        fix , ax = plt.subplots(ncols = 4,figsize = (30,15))
        ax[0].set_title('input(vaildation)')
        ax[0].imshow(np.moveaxis(image.reshape(3,384,512).cpu().numpy(),0,2))
        ax[1].set_title('only transform night to day')
        ax[1].imshow(np.moveaxis(nd_image.reshape(3,384,512).cpu().detach().numpy(),0,2))
        ax[2].set_title('reduce light and transform night to day')
        ax[2].imshow(np.moveaxis(predict.reshape(3,384,512).cpu().detach().numpy(),0,2))
        ax[3].set_title('transform night to day and reduce light')
        ax[3].imshow(np.moveaxis(prediction.reshape(3,384,512).cpu().detach().numpy(),0,2))
        
        display.clear_output(wait=True)
        display.display(plt.gcf())
        idx = idx+1
        print(idx)
        #plt.show()
        #time.sleep(1)
        
        