In [5]:
import torch
import torch.nn as nn
import torch.optim as optim
from torch.utils.data import DataLoader, Dataset
import os
from PIL import Image
import torchvision.transforms as transforms
import numpy as np
import matplotlib.pyplot as plt

# 데이터셋 로딩 및 변환
class ImageDataset(Dataset):
    def __init__(self, photo_dir, sketch_dir, transform=None):
        self.photo_paths = sorted([os.path.join(photo_dir, x) for x in os.listdir(photo_dir)])
        self.sketch_paths = sorted([os.path.join(sketch_dir, x) for x in os.listdir(sketch_dir)])
        self.transform = transform

    def __len__(self):
        return len(self.photo_paths)

    def __getitem__(self, idx):
        photo = Image.open(self.photo_paths[idx]).convert('RGB')
        sketch = Image.open(self.sketch_paths[idx]).convert('RGB')

        if self.transform:
            photo = self.transform(photo)
            sketch = self.transform(sketch)

        return photo, sketch

# 이미지 전처리
transform = transforms.Compose([
    transforms.Resize((286, 286)),
    transforms.RandomCrop(256),
    transforms.RandomHorizontalFlip(),
    transforms.ToTensor(),
    transforms.Normalize((0.5, 0.5, 0.5), (0.5, 0.5, 0.5))
])

# 데이터셋 준비
dataset = ImageDataset('/content/drive/MyDrive/GAN_tutorial-main/photos', '/content/drive/MyDrive/GAN_tutorial-main/sketches', transform)
dataloader = DataLoader(dataset, batch_size=1, shuffle=True)

# Generator 정의 (UNet 스타일)
class Generator(nn.Module):
    def __init__(self):
        super(Generator, self).__init__()
        self.encoder = nn.Sequential(
            nn.Conv2d(3, 64, kernel_size=4, stride=2, padding=1),
            nn.LeakyReLU(0.2),
            nn.Conv2d(64, 128, kernel_size=4, stride=2, padding=1),
            nn.BatchNorm2d(128),
            nn.LeakyReLU(0.2),
        )
        self.decoder = nn.Sequential(
            nn.ConvTranspose2d(128, 64, kernel_size=4, stride=2, padding=1),
            nn.BatchNorm2d(64),
            nn.ReLU(),
            nn.ConvTranspose2d(64, 3, kernel_size=4, stride=2, padding=1),
            nn.Tanh(),
        )

    def forward(self, x):
        x = self.encoder(x)
        x = self.decoder(x)
        return x

# Discriminator 정의
class Discriminator(nn.Module):
    def __init__(self):
        super(Discriminator, self).__init__()
        self.model = nn.Sequential(
            nn.Conv2d(3, 64, kernel_size=4, stride=2, padding=1),
            nn.LeakyReLU(0.2),
            nn.Conv2d(64, 128, kernel_size=4, stride=2, padding=1),
            nn.LeakyReLU(0.2),
            nn.Conv2d(128, 1, kernel_size=4, stride=2, padding=1),
            nn.Sigmoid()
        )

    def forward(self, x):
        return self.model(x)

# 생성자와 판별자 모델 초기화
generator_g = Generator().cuda()  # 사진 -> 스케치
generator_f = Generator().cuda()  # 스케치 -> 사진
discriminator_x = Discriminator().cuda()  # 판별자 (스케치)
discriminator_y = Discriminator().cuda()  # 판별자 (사진)

# 손실 함수 및 옵티마이저 설정
criterion = nn.BCELoss()
lambda_cycle = 10.0  # Cycle consistency loss scale
optimizer_g = optim.Adam(list(generator_g.parameters()) + list(generator_f.parameters()), lr=0.0002, betas=(0.5, 0.999))
optimizer_d = optim.Adam(list(discriminator_x.parameters()) + list(discriminator_y.parameters()), lr=0.0002, betas=(0.5, 0.999))

# 훈련 함수
def train_step(real_x, real_y):
    batch_size = real_x.size(0)
    valid = torch.ones(batch_size, 1, 32, 32, device=real_x.device)  # Adjust shape to match discriminator output
    fake = torch.zeros(batch_size, 1, 32, 32, device=real_x.device)  # Adjust shape to match discriminator output

    # Generator 학습
    optimizer_g.zero_grad()

    # 생성자 g의 손실 (스케치 -> 사진)
    fake_x = generator_g(real_y)
    g_loss = criterion(discriminator_y(fake_x), valid)  # 스케치 -> 사진 판별자
    g_loss.backward()

    # 생성자 f의 손실 (사진 -> 스케치)
    fake_y = generator_f(real_x)
    f_loss = criterion(discriminator_x(fake_y), valid)  # 사진 -> 스케치 판별자
    f_loss.backward()

    optimizer_g.step()

    # Discriminator 학습
    optimizer_d.zero_grad()

    # 판별자 x (스케치 판별)
    d_x_real_loss = criterion(discriminator_x(real_y), valid)
    d_x_fake_loss = criterion(discriminator_x(fake_y.detach()), fake)
    d_x_loss = (d_x_real_loss + d_x_fake_loss) * 0.5

    # 판별자 y (사진 판별)
    d_y_real_loss = criterion(discriminator_y(real_x), valid)
    d_y_fake_loss = criterion(discriminator_y(fake_x.detach()), fake)
    d_y_loss = (d_y_real_loss + d_y_fake_loss) * 0.5

    d_loss = d_x_loss + d_y_loss
    d_loss.backward()

    optimizer_d.step()

    return g_loss, f_loss, d_x_loss, d_y_loss

# 훈련 루프
EPOCHS = 100
for epoch in range(EPOCHS):
    for real_x, real_y in dataloader:
        real_x, real_y = real_x.cuda(), real_y.cuda()

        g_loss, f_loss, d_x_loss, d_y_loss = train_step(real_x, real_y)

    print(f"Epoch [{epoch+1}/{EPOCHS}], g_loss={g_loss.item()}, f_loss={f_loss.item()}, d_x_loss={d_x_loss.item()}, d_y_loss={d_y_loss.item()}")


Epoch [1/100], g_loss=0.8529413938522339, f_loss=0.6886417865753174, d_x_loss=0.6840558052062988, d_y_loss=0.676378607749939
Epoch [2/100], g_loss=0.7795727849006653, f_loss=0.722180962562561, d_x_loss=0.6899711489677429, d_y_loss=0.651207685470581
Epoch [3/100], g_loss=0.7673603296279907, f_loss=0.6862666606903076, d_x_loss=0.6972934603691101, d_y_loss=0.6616925001144409
Epoch [4/100], g_loss=0.7572587728500366, f_loss=0.7042737007141113, d_x_loss=0.6903238296508789, d_y_loss=0.6684834957122803
Epoch [5/100], g_loss=0.9822690486907959, f_loss=0.7348226308822632, d_x_loss=0.7007501125335693, d_y_loss=0.586349606513977
Epoch [6/100], g_loss=0.809486985206604, f_loss=0.6969208717346191, d_x_loss=0.6931134462356567, d_y_loss=0.7215025424957275
Epoch [7/100], g_loss=1.1146695613861084, f_loss=0.7617266774177551, d_x_loss=0.694053053855896, d_y_loss=0.518182635307312
Epoch [8/100], g_loss=0.6992472410202026, f_loss=0.6936072111129761, d_x_loss=0.6932144165039062, d_y_loss=0.5961412191390991

In [6]:
import torch
import torch.nn as nn
import torch.optim as optim
from torch.utils.data import DataLoader, Dataset
import os
from PIL import Image
import torchvision.transforms as transforms
import numpy as np
import matplotlib.pyplot as plt
import torchvision.utils as vutils

# 데이터셋 로딩 및 변환
class ImageDataset(Dataset):
    def __init__(self, photo_dir, sketch_dir, transform=None):
        self.photo_paths = sorted([os.path.join(photo_dir, x) for x in os.listdir(photo_dir)])
        self.sketch_paths = sorted([os.path.join(sketch_dir, x) for x in os.listdir(sketch_dir)])
        self.transform = transform

    def __len__(self):
        return len(self.photo_paths)

    def __getitem__(self, idx):
        photo = Image.open(self.photo_paths[idx]).convert('RGB')
        sketch = Image.open(self.sketch_paths[idx]).convert('RGB')

        if self.transform:
            photo = self.transform(photo)
            sketch = self.transform(sketch)

        return photo, sketch

# 이미지 전처리
transform = transforms.Compose([
    transforms.Resize((286, 286)),
    transforms.RandomCrop(256),
    transforms.RandomHorizontalFlip(),
    transforms.ToTensor(),
    transforms.Normalize((0.5, 0.5, 0.5), (0.5, 0.5, 0.5))
])

# 데이터셋 준비
dataset = ImageDataset('/content/drive/MyDrive/GAN_tutorial-main/photos', '/content/drive/MyDrive/GAN_tutorial-main/sketches', transform)
dataloader = DataLoader(dataset, batch_size=1, shuffle=True)

# Generator 정의 (UNet 스타일)
class Generator(nn.Module):
    def __init__(self):
        super(Generator, self).__init__()
        self.encoder = nn.Sequential(
            nn.Conv2d(3, 64, kernel_size=4, stride=2, padding=1),
            nn.LeakyReLU(0.2),
            nn.Conv2d(64, 128, kernel_size=4, stride=2, padding=1),
            nn.BatchNorm2d(128),
            nn.LeakyReLU(0.2),
        )
        self.decoder = nn.Sequential(
            nn.ConvTranspose2d(128, 64, kernel_size=4, stride=2, padding=1),
            nn.BatchNorm2d(64),
            nn.ReLU(),
            nn.ConvTranspose2d(64, 3, kernel_size=4, stride=2, padding=1),
            nn.Tanh(),
        )

    def forward(self, x):
        x = self.encoder(x)
        x = self.decoder(x)
        return x

# Discriminator 정의
class Discriminator(nn.Module):
    def __init__(self):
        super(Discriminator, self).__init__()
        self.model = nn.Sequential(
            nn.Conv2d(3, 64, kernel_size=4, stride=2, padding=1),
            nn.LeakyReLU(0.2),
            nn.Conv2d(64, 128, kernel_size=4, stride=2, padding=1),
            nn.LeakyReLU(0.2),
            nn.Conv2d(128, 1, kernel_size=4, stride=2, padding=1),
            nn.Sigmoid()
        )

    def forward(self, x):
        return self.model(x)

# 생성자와 판별자 모델 초기화
generator_g = Generator().cuda()  # 사진 -> 스케치
generator_f = Generator().cuda()  # 스케치 -> 사진
discriminator_x = Discriminator().cuda()  # 판별자 (스케치)
discriminator_y = Discriminator().cuda()  # 판별자 (사진)

# 손실 함수 및 옵티마이저 설정
criterion = nn.BCELoss()
lambda_cycle = 10.0  # Cycle consistency loss scale
optimizer_g = optim.Adam(list(generator_g.parameters()) + list(generator_f.parameters()), lr=0.0002, betas=(0.5, 0.999))
optimizer_d = optim.Adam(list(discriminator_x.parameters()) + list(discriminator_y.parameters()), lr=0.0002, betas=(0.5, 0.999))

# 훈련 함수
def train_step(real_x, real_y):
    batch_size = real_x.size(0)
    valid = torch.ones(batch_size, 1, 32, 32, device=real_x.device)  # Adjust shape to match discriminator output
    fake = torch.zeros(batch_size, 1, 32, 32, device=real_x.device)  # Adjust shape to match discriminator output

    # Generator 학습
    optimizer_g.zero_grad()

    # 생성자 g의 손실 (스케치 -> 사진)
    fake_x = generator_g(real_y)
    g_loss = criterion(discriminator_y(fake_x), valid)  # 스케치 -> 사진 판별자
    g_loss.backward()

    # 생성자 f의 손실 (사진 -> 스케치)
    fake_y = generator_f(real_x)
    f_loss = criterion(discriminator_x(fake_y), valid)  # 사진 -> 스케치 판별자
    f_loss.backward()

    optimizer_g.step()

    # Discriminator 학습
    optimizer_d.zero_grad()

    # 판별자 x (스케치 판별)
    d_x_real_loss = criterion(discriminator_x(real_y), valid)
    d_x_fake_loss = criterion(discriminator_x(fake_y.detach()), fake)
    d_x_loss = (d_x_real_loss + d_x_fake_loss) * 0.5

    # 판별자 y (사진 판별)
    d_y_real_loss = criterion(discriminator_y(real_x), valid)
    d_y_fake_loss = criterion(discriminator_y(fake_x.detach()), fake)
    d_y_loss = (d_y_real_loss + d_y_fake_loss) * 0.5

    d_loss = d_x_loss + d_y_loss
    d_loss.backward()

    optimizer_d.step()

    return g_loss, f_loss, d_x_loss, d_y_loss, fake_x, fake_y

# 이미지를 저장하는 함수
def save_generated_images(fake_x, fake_y, epoch, batch_idx):
    # fake_x와 fake_y를 저장합니다.
    vutils.save_image(fake_x.data, f'generated_image_photo_epoch_{epoch+1}_batch_{batch_idx+1}.jpg', normalize=True)
    vutils.save_image(fake_y.data, f'generated_image_sketch_epoch_{epoch+1}_batch_{batch_idx+1}.jpg', normalize=True)

# 모델 저장 함수
def save_models(epoch):
    torch.save(generator_g.state_dict(), f'generator_g_epoch_{epoch+1}.pth')
    torch.save(generator_f.state_dict(), f'generator_f_epoch_{epoch+1}.pth')
    torch.save(discriminator_x.state_dict(), f'discriminator_x_epoch_{epoch+1}.pth')
    torch.save(discriminator_y.state_dict(), f'discriminator_y_epoch_{epoch+1}.pth')

# 훈련 루프
EPOCHS = 100
for epoch in range(EPOCHS):
    for batch_idx, (real_x, real_y) in enumerate(dataloader):
        real_x, real_y = real_x.cuda(), real_y.cuda()

        # 학습 단계
        g_loss, f_loss, d_x_loss, d_y_loss, fake_x, fake_y = train_step(real_x, real_y)

        # 100번째 배치마다 이미지 저장
        if batch_idx % 100 == 0:
            save_generated_images(fake_x, fake_y, epoch, batch_idx)

    # 에폭 끝날 때마다 모델 저장
    save_models(epoch)

    print(f"Epoch [{epoch+1}/{EPOCHS}], g_loss={g_loss.item()}, f_loss={f_loss.item()}, d_x_loss={d_x_loss.item()}, d_y_loss={d_y_loss.item()}")


Epoch [1/100], g_loss=0.8352916240692139, f_loss=0.7455977201461792, d_x_loss=0.6737101078033447, d_y_loss=0.710139274597168
Epoch [2/100], g_loss=0.8419185280799866, f_loss=0.7243838906288147, d_x_loss=0.6933859586715698, d_y_loss=0.755504846572876
Epoch [3/100], g_loss=0.805988073348999, f_loss=0.695401668548584, d_x_loss=0.6854727268218994, d_y_loss=0.583869993686676
Epoch [4/100], g_loss=0.7378864884376526, f_loss=0.6463990807533264, d_x_loss=0.704510509967804, d_y_loss=0.5676020383834839
Epoch [5/100], g_loss=0.8188287019729614, f_loss=0.7490993738174438, d_x_loss=0.6903992295265198, d_y_loss=0.6325308084487915
Epoch [6/100], g_loss=0.9038805961608887, f_loss=0.6844819784164429, d_x_loss=0.6879574060440063, d_y_loss=0.6273003816604614
Epoch [7/100], g_loss=0.7847558259963989, f_loss=0.7143215537071228, d_x_loss=0.6971917152404785, d_y_loss=0.6211123466491699
Epoch [8/100], g_loss=0.9140084981918335, f_loss=0.6988698840141296, d_x_loss=0.6907092332839966, d_y_loss=0.610450029373169

In [None]:
import torch
import torchvision.transforms as transforms
from PIL import Image
import os

# 모델 로딩 함수
def load_model(model, path):
    model.load_state_dict(torch.load(path))
    model.eval()

# 이미지 변환 함수
def transform_image(image_path, transform):
    image = Image.open(image_path).convert('RGB')
    image = transform(image).unsqueeze(0).cuda()  # 배치 차원을 추가하고 GPU로 이동
    return image

# 이미지 저장 함수
def save_image(tensor, save_path):
    # 이미지 출력을 0~1 범위로 되돌려 놓고 저장
    unnormalized_image = tensor.cpu().detach().squeeze(0)
    unnormalized_image = unnormalized_image * 0.5 + 0.5  # [-1, 1] to [0, 1]
    save_image = transforms.ToPILImage()(unnormalized_image)
    save_image.save(save_path)

# 이미지 전처리
transform = transforms.Compose([
    transforms.Resize((286, 286)),
    transforms.CenterCrop(256),
    transforms.ToTensor(),
    transforms.Normalize((0.5, 0.5, 0.5), (0.5, 0.5, 0.5))
])

# 모델 로드
generator_f_path = 'generator_f.pth'  # 훈련 후 저장된 모델 파일 경로
generator_f = Generator().cuda()  # 사진 -> 스케치 생성기 (가짜 이미지 생성)
load_model(generator_f, generator_f_path)

# 이미지 변환
sketch_image_path = 'image.jpg'  # 변환할 스케치 이미지 파일 경로
transformed_image = transform_image(sketch_image_path, transform)

# 생성된 이미지를 사진으로 변환
with torch.no_grad():
    fake_photo = generator_f(transformed_image)

# 변환된 이미지 저장
save_image(fake_photo, 'generated_image.jpg')
print("사진으로 변환된 이미지를 'generated_image.jpg'로 저장했습니다.")


In [8]:
import torch
import torchvision.transforms as transforms
from PIL import Image
from google.colab import drive

# 구글 드라이브 마운트
drive.mount('/content/drive')

# 모델 로딩 함수
def load_model(model, path):
    model.load_state_dict(torch.load(path))
    model.eval()

# 이미지 변환 함수
def transform_image(image_path, transform):
    image = Image.open(image_path).convert('RGB')  # 이미지를 RGB로 변환
    image = transform(image).unsqueeze(0).cuda()  # 텐서로 변환하고 배치 차원 추가, GPU로 이동
    return image

# 이미지 저장 함수
def save_image(tensor, save_path):
    # [-1, 1] 범위의 텐서를 [0, 1] 범위로 변환하고 이미지를 저장
    unnormalized_image = tensor.cpu().detach().squeeze(0)
    unnormalized_image = unnormalized_image * 0.5 + 0.5  # [-1, 1] -> [0, 1]
    save_image = transforms.ToPILImage()(unnormalized_image)
    save_image.save(save_path)

# 모델 및 전처리 설정
transform = transforms.Compose([
    transforms.Resize((286, 286)),  # 모델 입력 크기에 맞게 크기 조정
    transforms.CenterCrop(256),  # 중앙 크롭
    transforms.ToTensor(),  # 텐서로 변환
    transforms.Normalize((0.5, 0.5, 0.5), (0.5, 0.5, 0.5))  # 정규화
])

# 모델 로드 (코랩에 있는 모델 불러오기)
generator_g = Generator().cuda()  # 생성자 모델 초기화
generator_g_path = '/content/generator_g_epoch_99.pth'  # 코랩에서 모델 경로
load_model(generator_g, generator_g_path)

# 이미지 경로 설정 (구글 드라이브에 있는 이미지)
sketch_image_path = '/content/drive/MyDrive/GAN_tutorial-main/image.jpg'  # 구글 드라이브에서 이미지 경로
transformed_image = transform_image(sketch_image_path, transform)

# 생성된 이미지를 사진으로 변환
with torch.no_grad():
    fake_photo = generator_g(transformed_image)  # 스케치를 사진으로 변환

# 변환된 이미지 저장 (구글 드라이브에 저장)
save_image(fake_photo, '/content/drive/MyDrive/GAN_tutorial-main/generated_image.jpg')  # 구글 드라이브에 저장
print("스케치 이미지가 사진으로 변환되어 'generated_image.jpg'로 저장되었습니다.")


Drive already mounted at /content/drive; to attempt to forcibly remount, call drive.mount("/content/drive", force_remount=True).
스케치 이미지가 사진으로 변환되어 'generated_image.jpg'로 저장되었습니다.


  model.load_state_dict(torch.load(path))


In [12]:
import torch
import torchvision.transforms as transforms
from PIL import Image
from google.colab import drive

# 구글 드라이브 마운트
drive.mount('/content/drive')

# 모델 로딩 함수
def load_model(model, path):
    model.load_state_dict(torch.load(path))
    model.eval()

# 이미지 변환 함수
def transform_image(image_path, transform):
    image = Image.open(image_path).convert('RGB')  # 이미지를 RGB로 변환
    image = transform(image).unsqueeze(0).cuda()  # 텐서로 변환하고 배치 차원 추가, GPU로 이동
    return image

# 이미지 저장 함수
def save_image(tensor, save_path):
    # [-1, 1] 범위의 텐서를 [0, 1] 범위로 변환하고 이미지를 저장
    unnormalized_image = tensor.cpu().detach().squeeze(0)
    unnormalized_image = (unnormalized_image + 1) / 2  # [-1, 1] -> [0, 1] 범위로 변환
    save_image = transforms.ToPILImage()(unnormalized_image)
    save_image.save(save_path)

# 모델 및 전처리 설정
transform = transforms.Compose([
    transforms.Resize((286, 286)),  # 모델 입력 크기에 맞게 크기 조정
    transforms.CenterCrop(256),  # 중앙 크롭
    transforms.ToTensor(),  # 텐서로 변환
    transforms.Normalize((0.5, 0.5, 0.5), (0.5, 0.5, 0.5))  # 정규화
])

# 모델 로드 (코랩에 있는 모델 불러오기)
generator_g = Generator().cuda()  # 생성자 모델 초기화
generator_g_path = '/content/generator_g_epoch_80.pth'  # 코랩에서 모델 경로
load_model(generator_g, generator_g_path)

# 이미지 경로 설정 (구글 드라이브에 있는 이미지)
sketch_image_path = '/content/drive/MyDrive/GAN_tutorial-main/image.jpg'  # 구글 드라이브에서 이미지 경로
transformed_image = transform_image(sketch_image_path, transform)

# 생성된 이미지를 사진으로 변환
with torch.no_grad():
    fake_photo = generator_g(transformed_image)  # 스케치를 사진으로 변환

# 변환된 이미지 저장 (구글 드라이브에 저장)
save_image(fake_photo, '/content/drive/MyDrive/GAN_tutorial-main/generated_image2324.jpg')  # 구글 드라이브에 저장
print("스케치 이미지가 사진으로 변환되어 'generated_image.jpg'로 저장되었습니다.")


Drive already mounted at /content/drive; to attempt to forcibly remount, call drive.mount("/content/drive", force_remount=True).
스케치 이미지가 사진으로 변환되어 'generated_image.jpg'로 저장되었습니다.


  model.load_state_dict(torch.load(path))


알겠습니다! 이제 모델을 저장하고, 생성된 이미지를 메모리에서 확인할 수 있도록 저장하는 방법을 설명하겠습니다. 아래에 **모델 저장**과 **생성된 이미지 저장**을 포함한 전체적인 예제를 제공합니다. 이 예제는 훈련 중 생성된 이미지를 `image.jpg`로 저장하고, 훈련이 완료되면 모델을 저장하는 기능을 추가한 코드입니다.

### 코드 수정 내용:
1. **이미지 저장**: 생성된 이미지를 `image.jpg`와 같은 형식으로 저장합니다.
2. **모델 저장**: 훈련 후 `generator`와 `discriminator` 모델을 `.pth` 파일로 저장합니다.

### 전체 코드:

```python
import torch
import torch.nn as nn
import torch.optim as optim
from torch.utils.data import DataLoader, Dataset
import os
from PIL import Image
import torchvision.transforms as transforms
import numpy as np
import matplotlib.pyplot as plt
import torchvision.utils as vutils

# 데이터셋 로딩 및 변환
class ImageDataset(Dataset):
    def __init__(self, photo_dir, sketch_dir, transform=None):
        self.photo_paths = sorted([os.path.join(photo_dir, x) for x in os.listdir(photo_dir)])
        self.sketch_paths = sorted([os.path.join(sketch_dir, x) for x in os.listdir(sketch_dir)])
        self.transform = transform

    def __len__(self):
        return len(self.photo_paths)

    def __getitem__(self, idx):
        photo = Image.open(self.photo_paths[idx]).convert('RGB')
        sketch = Image.open(self.sketch_paths[idx]).convert('RGB')

        if self.transform:
            photo = self.transform(photo)
            sketch = self.transform(sketch)

        return photo, sketch

# 이미지 전처리
transform = transforms.Compose([
    transforms.Resize((286, 286)),
    transforms.RandomCrop(256),
    transforms.RandomHorizontalFlip(),
    transforms.ToTensor(),
    transforms.Normalize((0.5, 0.5, 0.5), (0.5, 0.5, 0.5))
])

# 데이터셋 준비
dataset = ImageDataset('/content/drive/MyDrive/GAN_tutorial-main/photos', '/content/drive/MyDrive/GAN_tutorial-main/sketches', transform)
dataloader = DataLoader(dataset, batch_size=1, shuffle=True)

# Generator 정의 (UNet 스타일)
class Generator(nn.Module):
    def __init__(self):
        super(Generator, self).__init__()
        self.encoder = nn.Sequential(
            nn.Conv2d(3, 64, kernel_size=4, stride=2, padding=1),
            nn.LeakyReLU(0.2),
            nn.Conv2d(64, 128, kernel_size=4, stride=2, padding=1),
            nn.BatchNorm2d(128),
            nn.LeakyReLU(0.2),
        )
        self.decoder = nn.Sequential(
            nn.ConvTranspose2d(128, 64, kernel_size=4, stride=2, padding=1),
            nn.BatchNorm2d(64),
            nn.ReLU(),
            nn.ConvTranspose2d(64, 3, kernel_size=4, stride=2, padding=1),
            nn.Tanh(),
        )

    def forward(self, x):
        x = self.encoder(x)
        x = self.decoder(x)
        return x

# Discriminator 정의
class Discriminator(nn.Module):
    def __init__(self):
        super(Discriminator, self).__init__()
        self.model = nn.Sequential(
            nn.Conv2d(3, 64, kernel_size=4, stride=2, padding=1),
            nn.LeakyReLU(0.2),
            nn.Conv2d(64, 128, kernel_size=4, stride=2, padding=1),
            nn.LeakyReLU(0.2),
            nn.Conv2d(128, 1, kernel_size=4, stride=2, padding=1),
            nn.Sigmoid()
        )

    def forward(self, x):
        return self.model(x)

# 생성자와 판별자 모델 초기화
generator_g = Generator().cuda()  # 사진 -> 스케치
generator_f = Generator().cuda()  # 스케치 -> 사진
discriminator_x = Discriminator().cuda()  # 판별자 (스케치)
discriminator_y = Discriminator().cuda()  # 판별자 (사진)

# 손실 함수 및 옵티마이저 설정
criterion = nn.BCELoss()
lambda_cycle = 10.0  # Cycle consistency loss scale
optimizer_g = optim.Adam(list(generator_g.parameters()) + list(generator_f.parameters()), lr=0.0002, betas=(0.5, 0.999))
optimizer_d = optim.Adam(list(discriminator_x.parameters()) + list(discriminator_y.parameters()), lr=0.0002, betas=(0.5, 0.999))

# 훈련 함수
def train_step(real_x, real_y):
    batch_size = real_x.size(0)
    valid = torch.ones(batch_size, 1, 32, 32, device=real_x.device)  # Adjust shape to match discriminator output
    fake = torch.zeros(batch_size, 1, 32, 32, device=real_x.device)  # Adjust shape to match discriminator output

    # Generator 학습
    optimizer_g.zero_grad()

    # 생성자 g의 손실 (스케치 -> 사진)
    fake_x = generator_g(real_y)
    g_loss = criterion(discriminator_y(fake_x), valid)  # 스케치 -> 사진 판별자
    g_loss.backward()

    # 생성자 f의 손실 (사진 -> 스케치)
    fake_y = generator_f(real_x)
    f_loss = criterion(discriminator_x(fake_y), valid)  # 사진 -> 스케치 판별자
    f_loss.backward()

    optimizer_g.step()

    # Discriminator 학습
    optimizer_d.zero_grad()

    # 판별자 x (스케치 판별)
    d_x_real_loss = criterion(discriminator_x(real_y), valid)
    d_x_fake_loss = criterion(discriminator_x(fake_y.detach()), fake)
    d_x_loss = (d_x_real_loss + d_x_fake_loss) * 0.5

    # 판별자 y (사진 판별)
    d_y_real_loss = criterion(discriminator_y(real_x), valid)
    d_y_fake_loss = criterion(discriminator_y(fake_x.detach()), fake)
    d_y_loss = (d_y_real_loss + d_y_fake_loss) * 0.5

    d_loss = d_x_loss + d_y_loss
    d_loss.backward()

    optimizer_d.step()

    return g_loss, f_loss, d_x_loss, d_y_loss, fake_x, fake_y

# 이미지를 저장하는 함수
def save_generated_images(fake_x, fake_y, epoch, batch_idx):
    # fake_x와 fake_y를 저장합니다.
    vutils.save_image(fake_x.data, f'generated_image_photo_epoch_{epoch+1}_batch_{batch_idx+1}.jpg', normalize=True)
    vutils.save_image(fake_y.data, f'generated_image_sketch_epoch_{epoch+1}_batch_{batch_idx+1}.jpg', normalize=True)

# 모델 저장 함수
def save_models(epoch):
    torch.save(generator_g.state_dict(), f'generator_g_epoch_{epoch+1}.pth')
    torch.save(generator_f.state_dict(), f'generator_f_epoch_{epoch+1}.pth')
    torch.save(discriminator_x.state_dict(), f'discriminator_x_epoch_{epoch+1}.pth')
    torch.save(discriminator_y.state_dict(), f'discriminator_y_epoch_{epoch+1}.pth')

# 훈련 루프
EPOCHS = 100
for epoch in range(EPOCHS):
    for batch_idx, (real_x, real_y) in enumerate(dataloader):
        real_x, real_y = real_x.cuda(), real_y.cuda()

        # 학습 단계
        g_loss, f_loss, d_x_loss, d_y_loss, fake_x, fake_y = train_step(real_x, real_y)

        # 100번째 배치마다 이미지 저장
        if batch_idx % 100 == 0:
            save_generated_images(fake_x, fake_y, epoch, batch_idx)

    # 에폭 끝날 때마다 모델 저장
    save_models(epoch)

    print(f"Epoch [{epoch+1}/{EPOCHS}], g_loss={g_loss.item()}, f_loss={f_loss.item()}, d_x_loss={d_x_loss.item()}, d_y_loss={d_y_loss.item()}")
```

### 주요 수정 사항:
1. **이미지 저장**: `save_generated_images` 함수는 각 배치마다 생성된 `fake_x` (스케치에서 사진으로 변환된 이미지)와 `fake_y` (사진에서 스케치로 변환된 이미지)를 `.jpg` 형식으로 저장합니다.
   - 이미지 파일 이름은 `generated_image_photo_epoch_{epoch+1}_batch_{batch_idx+1}.jpg`와 `generated_image_sketch_epoch_{epoch+1}_batch_{batch_idx+1}.jpg`와 같은 형식으로 저장됩니다.
   
2. **모델 저장**: 훈련이 끝날 때마다 `save_models` 함수가 호출되어 각 epoch마다 모델을 `.pth` 파일로 저장합니다.
   - 파일 이름은 `generator_g_epoch_{epoch+1}.pth`, `discriminator_x_epoch_{epoch+1}.pth` 형식으로 저장됩니다.

### 추가적으로:
- **모델 저장 후 재사용**

: 모델을 저장한 후, 다른 코드에서 `torch.load()`로 로드하여 사용할 수 있습니다.
- **이미지 저장**: 생성된 이미지를 지정한 경로에 저장하여 모델의 출력을 확인할 수 있습니다.

이해했습니다! `GAN_tutorial-main` 폴더 안에서 작업을 진행한다고 하셨으므로, 해당 경로와 설정을 맞춰서 CycleGAN을 구현하는 코드로 다시 작성하겠습니다.

### 1. 라이브러리 설치 및 임포트

먼저, 필요한 라이브러리를 설치하고 임포트합니다. 이 코드는 **CycleGAN** 모델을 구성하는 데 필요한 라이브러리를 포함하고 있습니다.

```python
!pip install -q git+https://github.com/tensorflow/examples.git
import tensorflow as tf
import os
import time
import matplotlib.pyplot as plt
from tensorflow_examples.models.pix2pix import pix2pix
```

### 2. 구글 드라이브 마운트

구글 드라이브에 있는 `photos`와 `sketches` 폴더를 사용하기 위해, 먼저 드라이브를 마운트합니다.

```python
from google.colab import drive
drive.mount('/content/drive')
```

### 3. 데이터셋 경로 설정

구글 드라이브에서 `GAN_tutorial-main` 폴더 내에 `photos`와 `sketches` 폴더가 존재하는 경로를 설정합니다. 해당 경로는 **자신의 드라이브에 맞게 수정**해야 합니다.

```python
# 구글 드라이브에서 데이터셋 경로 설정
base_dir = '/content/drive/MyDrive/GAN_tutorial-main/'  # 'GAN_tutorial-main' 폴더 경로
photos_path = os.path.join(base_dir, 'photos')
sketches_path = os.path.join(base_dir, 'sketches')

# 이미지 크기 설정
IMG_HEIGHT = 256
IMG_WIDTH = 256
BATCH_SIZE = 1
```

### 4. 이미지 전처리 함수

이미지를 불러오고 전처리하는 함수들입니다. 여기서는 이미지를 `256x256` 크기로 자르고 정규화하여 CycleGAN 모델에 적합하게 만듭니다.

```python
# 이미지 무작위 자르기 함수
def random_crop(image):
    cropped_image = tf.image.random_crop(image, size=[IMG_HEIGHT, IMG_WIDTH, 3])  # 256x256 크기로 자릅니다.
    return cropped_image

# 이미지 정규화 함수
def normalize(image):
    image = tf.cast(image, tf.float32)  # 이미지 타입을 float32로 변환
    image = (image / 127.5) - 1  # [-1, 1] 범위로 정규화
    return image

# 이미지 무작위 지터링 함수
def random_jitter(image):
    # 이미지 크기를 286x286으로 리사이즈합니다. 더 큰 크기로 변경한 후 자르기 위해 사용합니다.
    image = tf.image.resize(image, [286, 286], method=tf.image.ResizeMethod.NEAREST_NEIGHBOR)
    # 256x256 크기로 무작위 자르기 진행
    image = random_crop(image)
    # 50% 확률로 이미지를 좌우 반전하여 데이터 다양성 증가
    image = tf.image.random_flip_left_right(image)
    return image
```

### 5. 데이터셋 불러오기

`photos`와 `sketches` 폴더에서 이미지를 쌍으로 불러오는 함수입니다.

```python
# 사진과 스케치 이미지 불러오기 함수
def load_image(image_path):
    image = tf.io.read_file(image_path)
    image = tf.image.decode_jpeg(image, channels=3)
    image = random_jitter(image)  # 이미지에 무작위 지터링 적용
    image = normalize(image)
    return image

# 파일 경로 로드
def load_dataset(photo_dir, sketch_dir):
    photos = sorted([os.path.join(photo_dir, x) for x in os.listdir(photo_dir)])
    sketches = sorted([os.path.join(sketch_dir, x) for x in os.listdir(sketch_dir)])
    return photos, sketches

# 데이터셋 로드
photos_images, sketches_images = load_dataset(photos_path, sketches_path)
```

### 6. 모델 정의

CycleGAN에서 사용할 생성자(generator)와 판별자(discriminator)를 정의합니다. `pix2pix.unet_generator`와 `pix2pix.discriminator`를 사용하여 생성자와 판별자를 구성합니다.

```python
# 생성자 모델 정의
OUTPUT_CHANNELS = 3  # RGB 이미지를 생성하기 위해 출력 채널 수를 3으로 설정합니다.
generator_g = pix2pix.unet_generator(OUTPUT_CHANNELS, norm_type='instancenorm')  # 스케치 -> 사진
generator_f = pix2pix.unet_generator(OUTPUT_CHANNELS, norm_type='instancenorm')  # 사진 -> 스케치

# 판별자 모델 정의
discriminator_x = pix2pix.discriminator(norm_type='instancenorm', target=False)  # 스케치 이미지 판별
discriminator_y = pix2pix.discriminator(norm_type='instancenorm', target=False)  # 사진 이미지 판별
```

### 7. 손실 함수 정의

CycleGAN에서 사용하는 **생성자 손실**과 **판별자 손실** 함수입니다.

```python
# 생성자 손실 함수
def generator_loss(disc_generated_output, gen_output, target, cycle_output, lambda_cycle=10.0):
    # GAN Loss
    gan_loss = tf.reduce_mean(tf.nn.sigmoid_cross_entropy_with_logits(labels=tf.ones_like(disc_generated_output), logits=disc_generated_output))
    # Cycle Consistency Loss
    cycle_loss = tf.reduce_mean(tf.abs(target - cycle_output))
    # L1 loss 추가
    l1_loss = tf.reduce_mean(tf.abs(target - gen_output))
    return gan_loss + lambda_cycle * cycle_loss + 100 * l1_loss

# 판별자 손실 함수
def discriminator_loss(disc_real_output, disc_generated_output):
    real_loss = tf.reduce_mean(tf.nn.sigmoid_cross_entropy_with_logits(labels=tf.ones_like(disc_real_output), logits=disc_real_output))
    generated_loss = tf.reduce_mean(tf.nn.sigmoid_cross_entropy_with_logits(labels=tf.zeros_like(disc_generated_output), logits=disc_generated_output))
    return real_loss + generated_loss
```

### 8. 최적화 및 훈련 단계 설정

CycleGAN의 훈련을 위한 **최적화 함수**와 **훈련 단계**를 설정합니다.

```python
# 최적화 함수 설정
lr_schedule = tf.keras.optimizers.schedules.ExponentialDecay(initial_learning_rate=0.0002, decay_steps=100, decay_rate=0.96, staircase=True)
generator_optimizer = tf.keras.optimizers.Adam(learning_rate=lr_schedule, beta_1=0.5)
discriminator_optimizer = tf.keras.optimizers.Adam(learning_rate=lr_schedule, beta_1=0.5)
```

### 9. 훈련 루프

훈련 루프에서는 생성자와 판별자의 손실을 계산하고, **실제 이미지와 생성된 이미지**를 비교하여 모델을 업데이트합니다. 아래는 훈련 루프의 예시입니다.

```python
# 훈련 루프
@tf.function
def train_step(real_x, real_y):
    with tf.GradientTape(persistent=True) as tape:
        # 생성자 모델 예측
        fake_x = generator_g(real_y, training=True)
        fake_y = generator_f(real_x, training=True)

        # 판별자 출력
        disc_real_x = discriminator_x(real_x, training=True)
        disc_fake_x = discriminator_x(fake_x, training=True)

        disc_real_y = discriminator_y(real_y, training=True)
        disc_fake_y = discriminator_y(fake_y, training=True)

        # 생성자 손실 계산
        g_loss = generator_loss(disc_fake_y, fake_y, real_y, fake_x)
        f_loss = generator_loss(disc_fake_x, fake_x, real_x, fake_y)

        # 판별자 손실 계산
        d_x_loss = discriminator_loss(disc_real_x, disc_fake_x)
        d_y_loss = discriminator_loss(disc_real_y, disc_fake_y)

    # 그라디언트 계산 및 최적화
    generator_g_gradients = tape.gradient(g_loss, generator_g.trainable_variables)
    generator_f_gradients = tape.gradient(f_loss, generator_f.trainable_variables)
    discriminator_x_gradients = tape.gradient(d_x_loss, discriminator_x.trainable_variables)
    discriminator_y_gradients = tape.gradient(d_y_loss, discriminator_y.trainable_variables)

    # 최적화
    generator_optimizer.apply_gradients(zip(generator_g_gradients, generator_g.trainable_variables))
    generator_optimizer.apply_gradients(zip(generator_f_gradients, generator_f.trainable_variables))
    discriminator_optimizer.apply_gradients(zip(discriminator_x_gradients, discriminator_x.trainable_variables))
    discriminator_optimizer.apply_gradients(zip(discriminator_y_gradients, discriminator_y.trainable_variables))

    return g_loss, f_loss, d_x_loss, d_y_loss
```

### 10. 훈련 시작

이제 훈련을 시작할 준비가 되었습니다. 여러 에폭을 반복하여 모델을 훈련시킬 수 있습니다.

```python
# 에폭 반복
EPOCHS = 100
for epoch in range(EPOCHS):
    for image_x, image_y in zip(photos_images, sketches_images):
        real_x = load_image(image_x)
        real_y = load_image(image_y)

        g_loss, f_loss, d_x_loss, d_y_loss = train_step(real_x

, real_y)

    # 훈련 진행 상황 출력
    print(f"Epoch {epoch+1}/{EPOCHS}, g_loss={g_loss}, f_loss={f_loss}, d_x_loss={d_x_loss}, d_y_loss={d_y_loss}")
```

이 코드를 사용하여 `GAN_tutorial-main` 폴더에서 CycleGAN 모델을 훈련시키고, 구글 드라이브의 `photos`와 `sketches` 폴더에서 이미지를 불러와 훈련할 수 있습니다.