### Kütüphaneler

In [5]:
from tensorflow.keras.layers import LeakyReLU,Conv2DTranspose,Embedding,Input,Dense,Flatten,Conv2D,Concatenate,MaxPooling2D,Reshape
from tensorflow.keras.models import Sequential,Model
from tensorflow.keras.optimizers import Adam

import numpy as np
import matplotlib.pyplot as plt
import pandas as pd
import cv2

from datasets import load_dataset

### Ön Tanımlar

In [2]:
inp_size = (160,160,3)
batch_size = 15
latent_dim = 150

### Veri Seti ve Ön İşlemler

In [9]:
dataset = load_dataset("trashsock/hands-images")

In [46]:
dataset_labels_tr = {
    0 : "kapalı yumruk",
    1 : "parmak çevreler",
    2 : "parmak semboller",
    3 : "yarım parmak bükme",
    4 : "açık avuç",
    5 : "yarım açık yumruk",
    6 : "yarım açık avuç",
    7 : "tek parmak bükme",
}

Etiketleri tokenize etmek için etiketlerde geçen sözcükleri
saymalıyız. Bu yüzden önce tüm etiketleri tek cümlede 
topluyoruz. Sonra Counter sınıfı ile hepsini saydırıyoruz.
Counter sınıfı "" boş stringide en sonda kelime olarak eklediği için onu sileceğiz.

Bu işlem etiketleri bir dict (sözlük) yapısından aldığımız için gerekli.

In [32]:
from collections import Counter
collected = ""
for i in dataset_labels_tr.values():
    collected+=f"{i} "
print("Tüm labellerin birleştirilmiş hali \n",collected,"\n")

Tüm labellerin birleştirilmiş hali 
 kapalı yumruk parmak çevreler parmak semboller yarım parmak bükme açık avuç yarım açık yumruk yarım açık avuç tek parmak bükme  



In [36]:
word_dictionary_list = []
for word, number in Counter(collected.split(" ")).items():
    word_dictionary_list.append(word)
    print(f"adet: {number} kelime: {word} ")

adet: 1 kelime: kapalı 
adet: 2 kelime: yumruk 
adet: 4 kelime: parmak 
adet: 1 kelime: çevreler 
adet: 1 kelime: semboller 
adet: 3 kelime: yarım 
adet: 2 kelime: bükme 
adet: 3 kelime: açık 
adet: 2 kelime: avuç 
adet: 1 kelime: tek 
adet: 1 kelime:  


In [37]:
word_dictionary_list.remove("")
print("Sözlük\n",word_dictionary)

Sözlük
 ['kapalı', 'yumruk', 'parmak', 'çevreler', 'semboller', 'yarım', 'bükme', 'açık', 'avuç', 'tek']


Oluşturduğumuz sözlükteki her etiket için bir sayı atamamız gerekiyor. Bu sebeple LabelEncoder sınıfını kullanıyoruz.

In [35]:
from sklearn.preprocessing import LabelEncoder

In [39]:
encoder = LabelEncoder()
encoded = encoder.fit_transform(word_dictionary)
word_dictionary_encoded = {}

for idx in range(len(encoded)):
    word_dictionary_encoded[word_dictionary_list[idx]] = encoded[idx]
print("Kodlanmış etiketler:\n",word_dictionary_encoded)

Kodlanmış etiketler:
 {'kapalı': 3, 'yumruk': 8, 'parmak': 4, 'çevreler': 9, 'semboller': 5, 'yarım': 7, 'bükme': 2, 'açık': 1, 'avuç': 0, 'tek': 6}


Token haline getirdiğimiz kelimeler ile verisetindeki sınıf etiketlerimizi tekrardan kodlamamız gerekiyor. Çünkü bu sınıf etiketlerini kodlanmış şekilde eğitimde kullanacağız.
Vektörlerimiz 3 uzunluğunda olacak. Eğer 3'den az ise 0 ekleyerek padding işlemi yapacağız.

In [48]:
def convert_label_to_vector():
    label_vectors = {}
    for key ,value in dataset_labels_tr.items():
        words = value.split(" ")
        row_encodes = []
        for word in words:
            row_encodes.append(word_dictionary_encoded[word])
        
        if(len(row_encodes) != 3):
            row_encodes.append(0)
            
        label_vectors[key] = np.array(row_encodes)
    
    return label_vectors

labels_vectorized_dict = convert_label_to_vector()
for i in labels_vectorized_dict.items():print(i)

(0, array([3, 8, 0], dtype=int64))
(1, array([4, 9, 0], dtype=int64))
(2, array([4, 5, 0], dtype=int64))
(3, array([7, 4, 2], dtype=int64))
(4, array([1, 0, 0], dtype=int64))
(5, array([7, 1, 8], dtype=int64))
(6, array([7, 1, 0], dtype=int64))
(7, array([6, 4, 2], dtype=int64))


Yaptığımız vektörizasyon işlemini veri setine uyguluyoruz.
Ayrıca resimleride modele uygun hale getiriyoruz.


In [49]:
def preprocess_image(image):
    image = np.array(image)
    image = cv2.resize(image,(inp_size[0],inp_size[1]))
    image = (image/255)
    return image

def preprocess_label(label):
    return np.array(tokenized_labels[label])

In [52]:
def load_real_samples():   
    train_images = map(preprocess_image,dataset["train"]["image"])
    train_labels = map(preprocess_label,dataset["train"]["label"])
    return [train_images,train_labels]

Model eğitimi sırasında kullanacağımız gerçek ve sahte verileri üretmemiz gerekiyor. Aşağıda bu işlemi yapıyoruz.

In [82]:
get_random_number = np.random.randint
get_random_vector = np.random.randn

In [59]:
def generate_real_samples(real_images,real_labels,n_samples):
    """
    [n_samples] : Üretilecek veri boyutu
    """
    
    # sample sayısı kadar 0 ile verisetinin uzunluğu arasında rastgele sayı üret
    ix = get_random_number(0,real_images.shape[0],n_samples)
    images , labels = real_images[ix], real_labels[ix]
    
    # Gerçek olduğu etiketi
    y = np.ones((n_samples,1))
    
    return [images,labels],y

In [89]:
def generate_latent_seeds(latent_dim, n_samples ,n_classes):
    latent_seeds = get_random_vector(latent_dim * n_samples)
    latent_seeds = np.reshape(latent_seeds,(n_samples,latent_dim))
    
    labels = get_random_number(0,n_classes,3*n_samples)
    labels = np.reshape(labels,(n_samples,3))
    
    return [latent_seed,labels]

def generate_fake_samples(generator,latent_dim,n_samples,n_classes):
    fake_image , fake_label = generate_latent_seeds(latent_dim,n_samples,n_classes)
    predicted_images = generator.predict([fake_image,fake_label])
    
    y = zeros((n_samples,1))
    
    return [predicted_images,fake_label],y    

### Eğitim İşlemleri

<p>Her bir döngü için aslında modeli 3 kez eğiteceğiz ama farklı şekillerde.</p>
<p>Önce ayırıcı ağı gerçek resim ve etiket girdileri ile [1] elde etmesi için eğiteceğiz</p>
<p>Ardından ayırıcı ağı sahte resim ve etiket girdileri ile [0] elde etmesi için eğiteceğiz,</p>
<p>Sonrasında çekişme modelinin tümünü rastgeler resim ve etiket tohumlarıyla [1] elde etmesi için eğiteceğiz.</p>
<p>Son yapılan işlemde üretici ağın daha gerçek görüntüler oluşturmasını amaçlıyoruz. Ve bu gerçekliğin ne ölçüde olduğunu anlamak için aslında yine ayırıcı ağdan faydalanıyoruz.</p>

In [None]:
real_images , real_labels = load_real_samples()

In [None]:
def train(model_gen,model_disc,model_gan,real_images,real_labels,latent_dim,epochs,batch_size,n_classes):
    
    batch_per_epoch = dataset.shape[0] / batch_size
    half_batch = int(batch_size / 2)
    
    for i in range(epochs):
        for j in range(batch_per_epoch):
            [real_xi, real_xl],real_y = generate_real_samples(real_images,real_labels,half_batch)
            d_loss1 , _ = model_disc.train_on_batch([real_xi,real_xl],real_y)
            
            [fake_xi,fake,xl],fake_y = generate_fake_samples(model_gen,latent_dim,n_half_batch,n_classes)
            d_loss2 , _ = model_disc.train_on_batch([fake_xi,fake,xl],fake_y)
            
            [predicted_xi, xl] = generate_latent_seeds(latent_dim,n_samples,n_classes)
            gan_y = np.ones((batch_size,1))
            
            g_loss = model_gan.train_on_batch([predicted_xi, xl], gan_y)
            
            print(f"{i+1} {j+1} {d_loss1} {d_loss2} {g_loss}")
        model_gen.save(f'./models/generator_model_{i+1}.h5')

### Ayırıcı Ağ

In [90]:
def build_discriminator(in_shape):
    inp_label = Input((3,))
    embedding = Embedding(1,50,input_length=3)(inp_label)
    d1 = Dense(in_shape[0]*in_shape[1])(embedding)
    reshape1 = Reshape(in_shape)(d1)
    
    inp_image = Input(in_shape)
    concat1 = Concatenate()([reshape1,inp_image])
    
    conv1 = Conv2D(128,(3,3),strides=(2,2))(concat1)
    conv2 = Conv2D(128,(3,3),strides=(1,1))(conv1)
    conv3 = Conv2D(128,(5,5),strides=(2,2))(conv2)
    conv4 = Conv2D(128,(3,3),strides=(2,2))(conv3)
    conv5 = Conv2D(128,(3,3),strides=(2,2))(conv4)
    
    flat1 = Flatten()(conv5)
    dense_output = Dense(1)(flat1)
    
    opt = Adam(learning_rate=0.0002,beta_1=0.5)
    model = Model([inp_label,inp_image],dense_output)
    model.compile(loss='binary_crossentropy',optimizer=opt,metrics=['accuracy'])
    
    return model

### Üretici Ağ

In [None]:
def build_generator(latent_dim=150):
    inp_label = Input((3,))
    embedding = Embedding(1,50,input_length=3)(inp_label)
    flat1 = Flatten()(embedding)
    
    inp_image_latent = Input((latent_dim))
    concated = Concatenate()([flat1,inp_image_latent])
    d1 = Dense(10*10*20)(concated)
    reshape1 = Reshape((10,10,20))(d1)
    
    conv1 = Conv2DTranspose(72,(3,3),strides=(2,2),padding='same')(reshape1)
    conv1 = LeakyReLU(alpha=0.2)(conv1)
    conv2 = Conv2DTranspose(72,(5,5),strides=(2,2),padding='same')(conv1)
    conv2 = LeakyReLU(alpha=0.2)(conv2)
    conv3 = Conv2DTranspose(72,(3,3),strides=(2,2),padding='same')(conv2)
    conv3 = LeakyReLU(alpha=0.2)(conv3)
    conv4 = Conv2DTranspose(3,(3,3),strides=(2,2),padding='same')(conv3)
    conv4 = LeakyReLU(alpha=0.2)(conv4)
    
    model = Model([inp_label,inp_image_latent],conv4)
    model.compile("rmsprop","mse")
    
    return model

### Çekişme Modeli

In [None]:
def build_gan(model_gen,model_disc):
    model_disc.trainable = False
    gen_label,  gen_noise= model_gen.input
    gen_output = model_gen.output
    gan_output = model_disc([gen_label,gen_output])
    
    model = Model([gen_label,gen_noise], gan_output)
    
    opt = Adam(lr=0.0002,beta_1=0.5)
    model.compile(loss='binary_crossentropy',optimizer=opt)
    return model