In [9]:
import torch
import torch.nn as nn
import torch.optim as optim
from torch.utils.data import DataLoader
from torchvision import datasets, transforms
from torchvision.utils import save_image
import os

In [10]:
# Cihaz ayarı
device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
print("Kullanılan cihaz:", device)

Kullanılan cihaz: cuda


### Görüntülerin bulunduğu dizin

In [11]:
data_dir = "generated_images/"

In [12]:
# Hiperparametreler
latent_dim = 256  # Latent vektör boyutu, 100 veya 128 de sık kullanılır
lr = 0.0001       # Öğrenme oranı
batch_size = 32   # Batch büyüklüğü
epochs = 300      # Epoch sayısı
img_size = 224    # Görüntü boyutu (224x224)
ngf = 64          # Generator'deki temel filtre sayısı
ndf = 64          # Discriminator'deki temel filtre sayısı
num_channels = 1  # Görüntü kanalı sayısı (gri tonlamalı için 1)

In [13]:
# Dönüştürmeler
transform = transforms.Compose([
    transforms.Resize(img_size),
    transforms.Grayscale(num_output_channels=num_channels), # Tek kanala dönüştürme
    transforms.ToTensor(),
    transforms.Normalize([0.5] * num_channels, [0.5] * num_channels), # Tek kanal için normalizasyon
])

In [14]:
# Generator
class Generator(nn.Module):
    def __init__(self, latent_dim, ngf, num_channels):
        super().__init__()
        self.main = nn.Sequential(
            # Giriş: latent_dim x 1 x 1
            # Hedef: 7x7'ye çıkarmak için kernel_size=7, stride=1, padding=0 (veya 4x4'e çıkarıp sonraki adımları ayarlayabilirsiniz)
            self._block(latent_dim, ngf * 8, 7, 1, 0),  # latent_dim -> ngf*8, 1x1 -> 7x7
            self._block(ngf * 8, ngf * 4, 4, 2, 1),    # ngf*8 -> ngf*4,  7x7 -> 14x14
            self._block(ngf * 4, ngf * 2, 4, 2, 1),    # ngf*4 -> ngf*2,  14x14 -> 28x28
            self._block(ngf * 2, ngf,     4, 2, 1),    # ngf*2 -> ngf,    28x28 -> 56x56
            self._block(ngf,     ngf // 2,4, 2, 1),    # ngf   -> ngf//2,  56x56 -> 112x112
            # Son katman: Aktivasyon olarak Tanh, num_channels'a çıktı
            nn.ConvTranspose2d(ngf // 2, num_channels, kernel_size=4, stride=2, padding=1, bias=False), # ngf//2 -> num_channels, 112x112 -> 224x224
            nn.Tanh()
        )

    def _block(self, in_c, out_c, k, s, p):
        return nn.Sequential(
            nn.ConvTranspose2d(in_c, out_c, k, s, p, bias=False),
            nn.BatchNorm2d(out_c),
            nn.ReLU(True)
        )

    def forward(self, z):
        return self.main(z)

In [15]:
# Discriminator
class Discriminator(nn.Module):
    def __init__(self, ndf, num_channels):
        super().__init__()
        self.main = nn.Sequential(
            # Giriş: num_channels x 224 x 224
            self._block(num_channels, ndf,       4, 2, 1, use_bn=False), # num_channels -> ndf, 224x224 -> 112x112 (İlk katmanda BN genellikle kullanılmaz)
            self._block(ndf,          ndf * 2,   4, 2, 1),               # ndf -> ndf*2, 112x112 -> 56x56
            self._block(ndf * 2,      ndf * 4,   4, 2, 1),               # ndf*2 -> ndf*4, 56x56 -> 28x28
            self._block(ndf * 4,      ndf * 8,   4, 2, 1),               # ndf*4 -> ndf*8, 28x28 -> 14x14
            self._block(ndf * 8,      ndf * 16,  4, 2, 1),               # ndf*8 -> ndf*16, 14x14 -> 7x7
            # Son katman: 1x1'e düşürme ve Sigmoid aktivasyonu
            nn.Conv2d(ndf * 16, 1, kernel_size=7, stride=1, padding=0, bias=False), # ndf*16 -> 1, 7x7 -> 1x1
            nn.Sigmoid()
        )

    def _block(self, in_c, out_c, k, s, p, use_bn=True):
        layers = [nn.Conv2d(in_c, out_c, k, s, p, bias=False)]
        if use_bn:
            layers.append(nn.BatchNorm2d(out_c))
        layers.append(nn.LeakyReLU(0.2, inplace=True))
        return nn.Sequential(*layers)

    def forward(self, x):
        return self.main(x).view(-1) # Çıktıyı BCELoss için düzleştir

In [16]:
# Ağırlıkların başlatılması
def weights_init(m):
    classname = m.__class__.__name__
    if classname.find('Conv') != -1:
        nn.init.normal_(m.weight.data, 0.0, 0.02)
    elif classname.find('BatchNorm') != -1:
        nn.init.normal_(m.weight.data, 1.0, 0.02)
        nn.init.constant_(m.bias.data, 0)

In [17]:
# Model ve optimizasyon
G = Generator(latent_dim, ngf, num_channels).to(device)
D = Discriminator(ndf, num_channels).to(device)

G.apply(weights_init)
D.apply(weights_init)

criterion = nn.BCELoss()
optimizer_G = optim.Adam(G.parameters(), lr=lr, betas=(0.5, 0.999))
optimizer_D = optim.Adam(D.parameters(), lr=lr, betas=(0.5, 0.999))

In [18]:
print("Eğitim başlıyor...")

image_dataset = datasets.ImageFolder(data_dir, transform=transform)
dataloader = DataLoader(image_dataset, batch_size=batch_size, shuffle=True, num_workers=2)



for epoch in range(epochs):
    for i, (real_imgs, _) in enumerate(dataloader):
        real_imgs = real_imgs.to(device)
        b_size = real_imgs.size(0)

        # Gerçek ve sahte etiketler
        valid = torch.full((b_size,), 0.9, dtype=torch.float, device=device) # Yumuşak etiket
        fake = torch.full((b_size,), 0.1, dtype=torch.float, device=device)  # Yumuşak etiket

        # ---------------------
        #  Discriminator Eğitimi
        # ---------------------
        optimizer_D.zero_grad()

        # Gerçek imajlarla kayıp
        real_output = D(real_imgs)
        real_loss = criterion(real_output, valid)
        # real_loss.backward() # Gradyanları biriktir

        # Sahte imajlarla kayıp
        z = torch.randn(b_size, latent_dim, 1, 1, device=device) # (batch_size, latent_dim, 1, 1)
        fake_imgs = G(z)
        fake_output = D(fake_imgs.detach()) # Generator'ün gradyanlarını D eğitimi sırasında dondur
        fake_loss = criterion(fake_output, fake)
        # fake_loss.backward() # Gradyanları biriktir

        d_loss = real_loss + fake_loss
        d_loss.backward() # Toplam gradyanı geri yay
        optimizer_D.step()

        # -----------------
        #  Generator Eğitimi
        # -----------------
        optimizer_G.zero_grad()
        # Sahte imajları Discriminator'den geçir (bu sefer detach() YOK)
        # Generator'ün hedefi, Discriminator'ün sahte imajları gerçek olarak sınıflandırmasıdır (valid etiket)
        output = D(fake_imgs)
        g_loss = criterion(output, valid) # Generator, Discriminator'ı kandırmaya çalışır (valid etiketini hedefleyerek)
        g_loss.backward()
        optimizer_G.step()

        if i % 50 == 0: # Her 50 batch'te bir logla
            print(
                f"[Epoch {epoch+1}/{epochs}] [Batch {i}/{len(dataloader)}] "
                f"Loss_D: {d_loss.item():.4f} (Real: {real_loss.item():.4f}, Fake: {fake_loss.item():.4f}), "
                f"Loss_G: {g_loss.item():.4f}"
            )

    # Her 10 epoch'ta bir ya da son epoch'ta kaydet
    if ((epoch + 1) % 10 == 0 or epoch == epochs -1) and (epoch != 0):
        with torch.no_grad():
            fixed_noise = torch.randn(batch_size, latent_dim, 1, 1, device=device) # Bir batch dolusu örnek üret
            sample_batch = G(fixed_noise).detach().cpu()
            save_image(sample_batch, f"generated/epoch_{epoch+1}.png", nrow=8, normalize=True) # nrow, bir satırda kaç resim olacağını belirler
            print(f"Epoch {epoch+1} için örnek görseller generated/epoch_{epoch+1}.png dosyasına kaydedildi.")

print("Eğitim tamamlandı.")

Eğitim başlıyor...
[Epoch 1/300] [Batch 0/84] Loss_D: 2.2915 (Real: 0.7334, Fake: 1.5581), Loss_G: 12.2091
[Epoch 1/300] [Batch 50/84] Loss_D: 3.3694 (Real: 2.3532, Fake: 1.0161), Loss_G: 21.1299
[Epoch 2/300] [Batch 0/84] Loss_D: 13.7366 (Real: 7.4459, Fake: 6.2906), Loss_G: 56.7839
[Epoch 2/300] [Batch 50/84] Loss_D: 12.3621 (Real: 6.3820, Fake: 5.9801), Loss_G: 54.2189
[Epoch 3/300] [Batch 0/84] Loss_D: 14.3322 (Real: 8.6422, Fake: 5.6900), Loss_G: 51.1148
[Epoch 3/300] [Batch 50/84] Loss_D: 6.3097 (Real: 0.4575, Fake: 5.8523), Loss_G: 52.4013
[Epoch 4/300] [Batch 0/84] Loss_D: 6.1579 (Real: 0.3663, Fake: 5.7916), Loss_G: 52.2058
[Epoch 4/300] [Batch 50/84] Loss_D: 5.9997 (Real: 0.4267, Fake: 5.5730), Loss_G: 50.6335
[Epoch 5/300] [Batch 0/84] Loss_D: 6.1258 (Real: 0.5023, Fake: 5.6235), Loss_G: 51.2775
[Epoch 5/300] [Batch 50/84] Loss_D: 5.6891 (Real: 0.3680, Fake: 5.3211), Loss_G: 48.1773
[Epoch 6/300] [Batch 0/84] Loss_D: 5.6879 (Real: 0.3786, Fake: 5.3093), Loss_G: 47.3296
[Epoc