In [1]:
import os
import numpy as np
import pandas as pd
from PIL import Image

In [2]:
dataset_path = 'dataset/'

try:
    labels = [d for d in os.listdir(dataset_path) if os.path.isdir(os.path.join(dataset_path, d))]
    if not labels:
        print(f"Error: Tidak ada folder ditemukan di dalam '{dataset_path}'. Pastikan struktur folder Anda benar.")
        exit()
except FileNotFoundError:
    print(f"Error: Folder '{dataset_path}' tidak ditemukan. Pastikan Anda menjalankan skrip ini dari folder proyek yang benar.")
    exit()

data_list = []

print(f"Memulai ekstraksi fitur untuk kelas: {', '.join(labels)}")

# Loop melalui setiap folder spesies
for label in labels:
    folder_path = os.path.join(dataset_path, label)
    image_files = [f for f in os.listdir(folder_path) if f.endswith(('.jpg', '.png', '.jpeg'))]
    print(f"- Memproses {len(image_files)} gambar dari folder '{label}'...")
    
    for filename in image_files:
        image_path = os.path.join(folder_path, filename)
        try:
            # Buka gambar dan hitung rata-rata warnanya
            with Image.open(image_path) as img:
                img_array = np.array(img)
                avg_rgb = np.mean(img_array, axis=(0, 1))
                # Simpan fitur (R, G, B) dan labelnya
                data_row = [avg_rgb[0], avg_rgb[1], avg_rgb[2], label]
                data_list.append(data_row)
        except Exception as e:
            print(f"  Peringatan: Gagal memproses gambar {image_path}: {e}")

# Buat DataFrame pandas dari hasil ekstraksi
columns = ['rata_R', 'rata_G', 'rata_B', 'label']
df = pd.DataFrame(data_list, columns=columns)

df.to_excel('data_daun_multiclass.xlsx', index=False)

print("\nEkstraksi fitur selesai!")
print(f"Berhasil membuat file 'data_daun_multiclass.xlsx' dengan {len(df)} baris data.")


Memulai ekstraksi fitur untuk kelas: beras, katuk, kelor, kentang, saga, tomat
- Memproses 312 gambar dari folder 'beras'...
- Memproses 312 gambar dari folder 'katuk'...
- Memproses 312 gambar dari folder 'kelor'...
- Memproses 312 gambar dari folder 'kentang'...
- Memproses 312 gambar dari folder 'saga'...
- Memproses 312 gambar dari folder 'tomat'...

Ekstraksi fitur selesai!
Berhasil membuat file 'data_daun_multiclass.xlsx' dengan 1872 baris data.
