<a href="https://colab.research.google.com/github/nurcann23/AygazCompVisionBootcamp/blob/main/main.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

- Sizin gösterdiğiniz şekilde data kaynaktan indirildi.

In [4]:

import kagglehub
rrebirrth_animals_with_attributes_2_path = kagglehub.dataset_download('rrebirrth/animals-with-attributes-2')

print('Data source import complete.')

Downloading from https://www.kaggle.com/api/v1/datasets/download/rrebirrth/animals-with-attributes-2?dataset_version_number=1...


100%|██████████| 13.0G/13.0G [10:19<00:00, 22.5MB/s]

Extracting files...





Data source import complete.


- Yine sizin verdiğiniz kod ile dosyalardaki gerekli resimlerin path'leri dictionary'ye kaydedildi. Kod her hayvandan ilk 650 resmi alacak şekilde modifiye edildi.

In [5]:
import os

# Initialize the dictionary to hold paths for each animal
image_paths = {}

# Base directory for your dataset
base_path = "/root/.cache/kagglehub/datasets/rrebirrth/animals-with-attributes-2/versions/1/Animals_with_Attributes2/JPEGImages/"

# List of animals to search for
animals = ["collie", "dolphin", "elephant", "fox", "moose", "rabbit", "sheep", "squirrel", "giant+panda", "polar+bear"]

# Traverse the directory structure
for dirname, _, filenames in os.walk(base_path):
    for animal in animals:
        # Check if the current directory contains the animal's name
        if animal in dirname:
            # Initialize the list if the animal is encountered for the first time
            if animal not in image_paths:
                image_paths[animal] = []
            # Add all image paths for the current animal
            i = 0;
            for filename in filenames:
                if i < 650:
                    image_paths[animal].append(os.path.join(dirname, filename))
                    i += 1
                else:
                    break


- Tüm resimler aynı boyuta getirildi ve normalized edildi. Burada normalde hakim olduğum OpenCV'yi kullanmıştım ama GPU kullanımını sağlayabilmek için tensorflow kullandım.
- Augmentation için daha önce Computer Vision dersimde yazmış olduğum add_salt_pepper_noise algoritmasını kullandım. Resimlere noise (resimlerin 15% kısmı noise olacak şekilde) ekleyerek datasetine ekledim.

In [10]:
import tensorflow as tf
import numpy as np

def add_salt_pepper_noise(image):

    salt_pepper_image = image.copy()
    rows, cols, _ = salt_pepper_image.shape

    for x in range(rows):
        for y in range(cols):
            noisy_or_not = np.random.random()
            if noisy_or_not < 0.15:
                black_or_white = np.random.random()
                salt_pepper_image[x, y] = 0 if black_or_white < 0.5 else 255

    return salt_pepper_image

normalized_data = []

for animal, paths in image_paths.items():
    for img_path in paths:
        img_raw = tf.io.read_file(img_path)
        img_tensor = tf.image.decode_jpeg(img_raw, channels=3)
        img_resized = tf.image.resize(img_tensor, (128, 128))
        img_resized_np = img_resized.numpy()

        img_normalized = img_resized_np / 255.0
        normalized_data.append((img_normalized, animal))

        img_noisy = add_salt_pepper_noise(img_resized_np)
        img_noisy_normalized = img_noisy / 255.0
        normalized_data.append((img_noisy_normalized, animal))


- Task açıklamasında gösterildiği gibi resimler train ve test olarak ikiye ayrıldı.

In [11]:
from sklearn.model_selection import train_test_split

X = [x[0] for x in normalized_data]
y = [x[1] for x in normalized_data]

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)
print("Eğitim setindeki resim sayısı: ", len(X_train))
print("Test setindeki resim sayısı: ", len(X_test))

Eğitim setindeki resim sayısı:  9100
Test setindeki resim sayısı:  3900


- Bu modelde ilk olarak 16 filtreli bir Conv2D katmanıyla başladım ve daha karmaşık özellikleri öğrenebilmek için 64 ve 128 filtreli Conv2D katmanlarını ekleyerek devam ettim. Overfitting’i önlemek için Dropout katmanı ekledim. Modeli son halina getirmeden denemeler yaparak en yüksek doğruluğu yakaladığım halini kullandım.

In [12]:
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Conv2D, MaxPooling2D, Flatten, Dense, Dropout

model = Sequential([
    Conv2D(16, (3, 3), activation='relu', input_shape=(128, 128, 3)),
    MaxPooling2D((2, 2)),
    Conv2D(64, (3, 3), activation='relu'),
    MaxPooling2D((2, 2)),
    Conv2D(128, (3, 3), activation='relu'),
    MaxPooling2D((2, 2)),
    Flatten(),
    Dense(256, activation='relu'),
    Dropout(0.5),
    Dense(10, activation='softmax')
])

model.compile(optimizer='adam', loss='categorical_crossentropy', metrics=['accuracy'])
print(model.summary())


  super().__init__(activity_regularizer=activity_regularizer, **kwargs)


None


- Burada modelimi eğittim. Modelin performansı, validation data kullanılarak her epoch sonunda ölçüldü. Modelin accuracy değeri artarak güzel bir seviyeye ulaştı aynı şekilde noise eklenmiş datalar sayesinde val_accuracy değeri de önceki denemelerime göre oldukça arttı.

In [13]:
from tensorflow.keras.utils import to_categorical
import numpy as np

class_mapping = {cls: i for i, cls in enumerate(animals)}
y_train_enc = to_categorical([class_mapping[label] for label in y_train], num_classes=10)
y_test_enc = to_categorical([class_mapping[label] for label in y_test], num_classes=10)

model.fit(np.array(X_train), np.array(y_train_enc), epochs=10, validation_data=(np.array(X_test), np.array(y_test_enc)))


Epoch 1/10
[1m285/285[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m22s[0m 48ms/step - accuracy: 0.2527 - loss: 2.0477 - val_accuracy: 0.4508 - val_loss: 1.5894
Epoch 2/10
[1m285/285[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m5s[0m 17ms/step - accuracy: 0.4680 - loss: 1.5381 - val_accuracy: 0.5287 - val_loss: 1.3368
Epoch 3/10
[1m285/285[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m5s[0m 17ms/step - accuracy: 0.5610 - loss: 1.2661 - val_accuracy: 0.6038 - val_loss: 1.1734
Epoch 4/10
[1m285/285[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m5s[0m 16ms/step - accuracy: 0.6294 - loss: 1.0837 - val_accuracy: 0.6336 - val_loss: 1.0995
Epoch 5/10
[1m285/285[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m5s[0m 17ms/step - accuracy: 0.6936 - loss: 0.8981 - val_accuracy: 0.6749 - val_loss: 0.9463
Epoch 6/10
[1m285/285[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m5s[0m 16ms/step - accuracy: 0.7487 - loss: 0.7409 - val_accuracy: 0.7164 - val_loss: 0.8362
Epoch 7/10
[1m285/28

<keras.src.callbacks.history.History at 0x7ccb2dc64400>

- Bu kod parçasında adjust_brightness fonksiyonu kullanılarak her bir test resminin parlaklığıyla oynadım. Yeni bir test datası oluşturdum.

In [14]:
def get_manipulated_images(image, factor):
    return tf.image.adjust_brightness(image, factor)

manipulated_test_data = []
for img, label in zip(X_test, y_test):
    img_tensor = tf.convert_to_tensor(img, dtype=tf.float32)
    manipulated_img = get_manipulated_images(img_tensor, factor=0.2)
    manipulated_test_data.append((manipulated_img.numpy(), label))


- Manipüle edilen test verileri ile modeli test ettim ve doğruluk oranında bir düşüş gözlemledim. Model bu manipülasyona karşı çok sağlam değil.

In [15]:
manipulated_X_test = [x[0] for x in manipulated_test_data]
manipulated_y_test = [x[1] for x in manipulated_test_data]
manipulated_y_test_enc = to_categorical(
    [class_mapping[label] for label in manipulated_y_test], num_classes=10
)

loss, accuracy = model.evaluate(
    np.array(manipulated_X_test), np.array(manipulated_y_test_enc)
)


[1m122/122[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 8ms/step - accuracy: 0.6316 - loss: 1.2005


- Bu kodda, manipüle edilmiş test verilerine renk sabitleme işlemi uyguladım. get_wb_images fonksiyonu, her bir görüntü kanalını kendi ortalamasına bölerek renk dengesini sağlar ve renk sapmalarını azaltır. Manipüle edilmiş her görüntü işlenip yeni bir listeye eklenmiştir.

In [16]:
def get_wb_images(image):

    mean_r = tf.reduce_mean(image[:, :, 0])
    mean_g = tf.reduce_mean(image[:, :, 1])
    mean_b = tf.reduce_mean(image[:, :, 2])
    balanced_image = tf.stack([
        image[:, :, 0] / mean_r,
        image[:, :, 1] / mean_g,
        image[:, :, 2] / mean_b
    ], axis=2)

    balanced_image = tf.clip_by_value(balanced_image * 128, 0, 255)
    return balanced_image

wb_test_data = []
for img, label in manipulated_test_data:
    img_tensor = tf.convert_to_tensor(img, dtype=tf.float32)
    wb_img = get_wb_images(img_tensor)
    wb_test_data.append((wb_img.numpy(), label))


- Model bu manipülasyonla daha da kötü bir sonuç verdi ve accuracy anlamadığım şekilde çok düştü.

In [18]:
wb_X_test = [x[0] for x in wb_test_data]
wb_y_test = [x[1] for x in wb_test_data]
wb_y_test_enc = to_categorical(
    [class_mapping[label] for label in wb_y_test], num_classes=10
)

loss, accuracy = model.evaluate(
    np.array(wb_X_test), np.array(wb_y_test_enc)
)
print("Renk Sabitliği Uygulanmış Test Verisi - Loss:", loss)
print("Renk Sabitliği Uygulanmış Test Verisi - Accuracy:", accuracy)


[1m122/122[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 6ms/step - accuracy: 0.1986 - loss: 1024.6254
Renk Sabitliği Uygulanmış Test Verisi - Loss: 1035.0372314453125
Renk Sabitliği Uygulanmış Test Verisi - Accuracy: 0.1989743560552597


- Bu sonuçlar, modelin manipülasyonlar sonrası doğruluğunun düştüğünü muhtemel olarak overfitting olduğunu gösteriyor.