In [6]:
#-----------------------------------------
# DOWNLOAD AND ORGANIZE FLOWERS17 DATASET
#-----------------------------------------
# Mengimpor modul yang dibutuhkan
import os  # Modul untuk berinteraksi dengan sistem operasi
import glob  # Modul untuk mencari file berdasarkan pola
import datetime  # Modul untuk bekerja dengan waktu dan tanggal
import tarfile  # Modul untuk mengekstrak file TAR
import urllib.request  # Modul untuk mengunduh file dari internet

# Fungsi untuk mengunduh dataset
def download_dataset(filename, url, work_dir):
    # Memeriksa apakah file sudah ada
    if not os.path.exists(filename):
        # Mencetak informasi bahwa dataset sedang diunduh
        print("[INFO] Mengunduh dataset flowers17....")
        # Mengunduh file dari URL yang diberikan
        filename, _ = urllib.request.urlretrieve(url + filename, filename)
        # Mendapatkan informasi tentang file yang diunduh
        statinfo = os.stat(filename)
        # Mencetak informasi ukuran file yang berhasil diunduh
        print("[INFO] Berhasil mengunduh " + filename + " " + str(statinfo.st_size) + " bytes.")
        # Mengekstrak file TAR yang diunduh
        untar(filename, work_dir)

# Fungsi untuk mendapatkan file JPG dari dalam file TAR
def jpg_files(members):
    # Menghasilkan file dengan ekstensi .jpg
    for tarinfo in members:
        if os.path.splitext(tarinfo.name)[1] == ".jpg":
            yield tarinfo

# Fungsi untuk mengekstrak file TAR
def untar(fname, path):
    # Membuka file TAR
    tar = tarfile.open(fname)
    # Mengekstrak file JPG dari file TAR ke direktori yang ditentukan
    tar.extractall(path=path, members=jpg_files(tar))
    # Menutup file TAR
    tar.close()
    # Mencetak informasi bahwa dataset berhasil diekstrak
    print("[INFO] Dataset diekstrak dengan sukses.")


In [7]:

#-------------------------
# MAIN FUNCTION
#-------------------------
# Cek apakah kode ini sedang dijalankan sebagai program utama
if __name__ == '__main__':

    # URL untuk mengunduh dataset bunga
    flowers17_url = "http://www.robots.ox.ac.uk/~vgg/data/flowers/17/"

    # Nama file dataset bunga yang akan diunduh
    flowers17_name = "17flowers.tgz"

    # Nama direktori untuk menyimpan dataset
    train_dir = "dataset"

    # Buat direktori 'dataset' jika belum ada
    if not os.path.exists(train_dir):
        os.makedirs(train_dir)

    # Panggil fungsi untuk mengunduh dataset (fungsi ini tidak ditampilkan dalam kode ini)
    download_dataset(flowers17_name, flowers17_url, train_dir)

    # Ganti nama folder 'jpg' menjadi 'train' jika ada
    if os.path.exists(train_dir + "\\jpg"):
        os.rename(train_dir + "\\jpg", train_dir + "\\train")

    # Dapatkan jumlah kelas bunga (17)
    class_limit = 17

    # Ambil semua jalur file gambar dalam direktori 'train'
    image_paths = glob.glob(train_dir + "\\train\\*.jpg")

    # Variabel untuk membantu proses pemisahan gambar berdasarkan kelas
    label = 0
    i = 0
    j = 80

    # Nama-nama kelas bunga dalam dataset
    class_names = ["daffodil", "snowdrop", "lilyvalley", "bluebell", "crocus",
                   "iris", "tigerlily", "tulip", "fritillary", "sunflower",
                   "daisy", "coltsfoot", "dandelion", "cowslip", "buttercup",
                   "windflower", "pansy"]

    # Lakukan proses untuk setiap kelas bunga
    for x in range(1, class_limit+1):
        # Buat direktori untuk kelas bunga tersebut
        os.makedirs(train_dir + "\\train\\" + class_names[label])

        # Dapatkan jalur direktori kelas bunga tersebut
        cur_path = train_dir + "\\train\\" + class_names[label] + "\\"

        # Lakukan proses untuk setiap gambar dalam kelas tersebut
        for index, image_path in enumerate(image_paths[i:j], start=1):
            # Simpan jalur asli gambar
            original_path = image_path

            # Pisahkan nama file dari jalur gambar
            image_path = image_path.split("\\")

            # Buat nama file baru dengan nomor urut
            image_file_name = str(index) + ".jpg"

            # Pindahkan gambar ke direktori kelas bunga tersebut dengan nama file baru
            os.rename(original_path, cur_path + image_file_name)

        # Siapkan variabel untuk 80 gambar berikutnya
        i += 80
        j += 80

        # Pindah ke kelas bunga berikutnya
        label += 1


[INFO] Downloading flowers17 dataset....
