In [2]:
from PIL import Image
import os
import random
import shutil

def resize_image(input_image_path, output_image_path, size):
    """Resize image to specified size."""
    with Image.open(input_image_path) as image:
        image_resized = image.resize(size)
        image_resized.save(output_image_path)

def split_dataset(input_folder, output_folder, split_ratio=0.8, image_size=(300, 300), seed=42):
    # Pastikan folder output tersedia
    if not os.path.exists(output_folder):
        os.makedirs(output_folder)

    # Tentukan folder untuk training dan validation
    train_folder = os.path.join(output_folder, 'train')
    val_folder = os.path.join(output_folder, 'val')

    # Buat folder training dan validation jika belum ada
    for folder in [train_folder, val_folder]:
        if not os.path.exists(folder):
            os.makedirs(folder)

    # Loop melalui setiap kategori/folder dalam dataset
    categories = os.listdir(input_folder)
    for category in categories:
        category_path = os.path.join(input_folder, category)
        if os.path.isdir(category_path):
            # Buat folder untuk kategori tersebut di dalam folder training dan validation
            train_category_folder = os.path.join(train_folder, category)
            val_category_folder = os.path.join(val_folder, category)
            if not os.path.exists(train_category_folder):
                os.makedirs(train_category_folder)
            if not os.path.exists(val_category_folder):
                os.makedirs(val_category_folder)

            # Ambil daftar file dalam kategori tersebut
            files = os.listdir(category_path)
            # Acak urutan file
            random.seed(seed)
            random.shuffle(files)
            # Tentukan jumlah file untuk training dan validation
            num_train_files = int(len(files) * split_ratio)
            train_files = files[:num_train_files]
            val_files = files[num_train_files:]

            # Pindahkan file ke folder training dan ubah ukuran gambar
            for file in train_files:
                src = os.path.join(category_path, file)
                dst = os.path.join(train_category_folder, file)
                resize_image(src, dst, size=image_size)

            # Pindahkan file ke folder validation dan ubah ukuran gambar
            for file in val_files:
                src = os.path.join(category_path, file)
                dst = os.path.join(val_category_folder, file)
                resize_image(src, dst, size=image_size)

    print("Dataset berhasil dibagi menjadi training dan validation dan ukuran gambar diubah menjadi 300x300.")

# Ubahlah sesuai dengan folder input dan output yang diinginkan
input_folder_path = "/content/Content/MyDrive/Tugas Akhir/Dataset 522 Default"
output_folder_path = "/content/Content/MyDrive/Tugas Akhir/Dataset 522 Resize"

# Tentukan rasio pembagian dataset (contoh: 70% training, 30% validation)
split_ratio = 0.8

# Panggil fungsi split_dataset
split_dataset(input_folder_path, output_folder_path, split_ratio)


Dataset berhasil dibagi menjadi training dan validation dan ukuran gambar diubah menjadi 300x300.


In [3]:
import os
import random
import shutil

# Path ke direktori dataset
base_dir = './dataset/hsv_masking/train'
classes = ['Manggis', 'Pisang', 'Rambutan']
test_dir = './dataset/test_set_hsv'

# Buat direktori untuk test_set jika belum ada
if not os.path.exists(test_dir):
    os.makedirs(test_dir)

for class_name in classes:
    class_dir = os.path.join(base_dir, class_name)
    test_class_dir = os.path.join(test_dir, class_name)
    
    # Buat direktori untuk setiap kelas di test_set jika belum ada
    if not os.path.exists(test_class_dir):
        os.makedirs(test_class_dir)
    
    file_list = os.listdir(class_dir)
    
    # Pilih 20 gambar acak dari kelas tersebut
    sample_files = random.sample(file_list, 20)
    
    for file_name in sample_files:
        src_file = os.path.join(class_dir, file_name)
        dest_file = os.path.join(test_class_dir, file_name)
        
        # Salin file ke direktori test_set
        shutil.copy(src_file, dest_file)

print("Selesai memisahkan 20 gambar dari setiap kelas ke direktori test_set.")


Selesai memisahkan 20 gambar dari setiap kelas ke direktori test_set.
