<a href="https://colab.research.google.com/github/nailarraza/projek-yolo8/blob/main/notebooks/oil-image-mining.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [None]:
# Langkah 1: Instalasi library simple_image_download
# Jalankan perintah ini di sel Colab. Tanda seru (!) mengeksekusi perintah shell.
!pip install simple_image_download

# Langkah 2: Impor library yang dibutuhkan
import os
import shutil # Untuk membuat file ZIP
from google.colab import files # Untuk mengunduh file dari Colab
from simple_image_download import simple_image_download as simp

# Membuat instance dari image downloader
image_downloader = simp.simple_image_download()

# Langkah 3: Tentukan kata kunci dan batasan jumlah gambar
# Daftar kata kunci yang akan dicari, diperbarui sesuai permintaan pengguna
keywords = [
    "oli motor",
    "motorcycle oil",
    "ganti oli motor",
    "motorcycle oil change",
    "oli motor bekas",
    "used motorcycle oil",
    "oli motor asli",
    "genuine motorcycle oil",
    "fake motorcycle oil",
    "warna oli motor",
    "oil motorcycle color",
    "oil motorcycle color genuine",
    "oil viscosity",
    "kekentalan oli",
    "oil motor bebek",
    "oil motor matic",
    "oil motor sport",
    "oil motor merk internesional",
    "oli motor merk indonesia",
    "oli motor merk amerika"
    "oli motor merk asia",
    "oli motor merk eropa"
]

# Batasan jumlah gambar yang ingin diunduh per kata kunci
limit_per_keyword = 25 # Sesuaikan jika perlu

# Nama folder utama tempat gambar disimpan (default oleh library adalah 'simple_images')
main_download_folder = "simple_images"
zip_file_name = "downloaded_motor_oil_images" # Nama untuk file ZIP (tanpa .zip)

# Pesan awal
print("Memulai proses pengunduhan gambar...\n")

# Langkah 4: Looping melalui setiap kata kunci dan mengunduh gambar
for keyword in keywords:
    print(f"--------------------------------------------------")
    print(f"Mencari dan mengunduh gambar untuk kata kunci: '{keyword}'")
    print(f"Target jumlah gambar: {limit_per_keyword}")
    print(f"--------------------------------------------------")

    try:
        # Memanggil fungsi download
        # Menghapus argumen 'download_path' karena tidak didukung oleh metode .download()
        # Library akan secara otomatis menyimpan ke folder 'simple_images/keyword_name/'
        image_downloader.download(keyword, limit_per_keyword)
        print(f"\nBerhasil mengunduh gambar untuk '{keyword}'.")
        # Library simple_image_download biasanya sudah membuat subfolder dengan nama keyword.
        # Path lengkapnya: main_download_folder/keyword_folder_name/
        # Mengganti spasi dengan garis bawah untuk referensi nama folder jika diperlukan,
        # meskipun library mungkin menangani ini secara internal.
        keyword_folder_name = keyword.replace(' ', '_')
        print(f"Gambar disimpan di folder: {main_download_folder}/{keyword_folder_name}/ (atau nama folder serupa yang dibuat library)")
    except Exception as e:
        print(f"Terjadi kesalahan saat mengunduh gambar untuk '{keyword}': {e}")
        print(f"Melanjutkan ke kata kunci berikutnya...")

    print("\n")

print("==================================================")
print("Proses pengunduhan semua gambar telah selesai.")
print("==================================================")

# Langkah 5: Mengemas folder gambar menjadi file ZIP
print(f"\nMengemas folder '{main_download_folder}' menjadi file ZIP...")
if os.path.exists(main_download_folder) and os.listdir(main_download_folder):
    try:
        shutil.make_archive(zip_file_name, 'zip', main_download_folder)
        print(f"Berhasil membuat file ZIP: {zip_file_name}.zip")

        # Langkah 6: Mengunduh file ZIP
        print(f"\nMempersiapkan unduhan untuk file {zip_file_name}.zip...")
        print("Harap tunggu, proses unduhan akan dimulai secara otomatis oleh browser Anda.")
        files.download(f"{zip_file_name}.zip")
        print(f"\nJika unduhan tidak dimulai, periksa pengaturan pop-up browser Anda.")
    except Exception as e:
        print(f"Terjadi kesalahan saat membuat atau mengunduh file ZIP: {e}")
else:
    print(f"Folder '{main_download_folder}' tidak ditemukan atau kosong. Tidak ada yang di-ZIP.")

print("\n==================================================")
print("Semua proses telah selesai.")
print("==================================================")


# Catatan:
# 1. Gambar akan diunduh ke folder bernama 'simple_images' (atau nama folder yang didefinisikan di main_download_folder).
#    Di dalam folder tersebut, akan ada subfolder untuk setiap kata kunci yang dibuat secara otomatis oleh library.
# 2. Setelah semua gambar diunduh, skrip akan mencoba membuat file ZIP bernama 'downloaded_motor_oil_images.zip'.
# 3. Kemudian, skrip akan secara otomatis memicu unduhan file ZIP tersebut ke komputer lokal Anda.
#    Proses ini menggunakan fitur `google.colab.files.download`.
# 4. Pastikan browser Anda mengizinkan pop-up dari Google Colab agar unduhan dapat dimulai.
# 5. Jika Anda menjalankan kode ini lagi, library simple_image_download mungkin akan melewatkan gambar yang sudah ada.
#    Folder ZIP yang lama (jika ada di environment Colab) akan ditimpa saat shutil.make_archive dijalankan lagi.

Memulai proses pengunduhan gambar...

--------------------------------------------------
Mencari dan mengunduh gambar untuk kata kunci: 'oli motor'
Target jumlah gambar: 25
--------------------------------------------------

Berhasil mengunduh gambar untuk 'oli motor'.
Gambar disimpan di folder: simple_images/oli_motor/ (atau nama folder serupa yang dibuat library)


--------------------------------------------------
Mencari dan mengunduh gambar untuk kata kunci: 'motorcycle oil'
Target jumlah gambar: 25
--------------------------------------------------

Berhasil mengunduh gambar untuk 'motorcycle oil'.
Gambar disimpan di folder: simple_images/motorcycle_oil/ (atau nama folder serupa yang dibuat library)


--------------------------------------------------
Mencari dan mengunduh gambar untuk kata kunci: 'ganti oli motor'
Target jumlah gambar: 25
--------------------------------------------------
HTTPSConnectionPool(host='automotive.evalube.com', port=443): Max retries exceeded with url

<IPython.core.display.Javascript object>

<IPython.core.display.Javascript object>


Jika unduhan tidak dimulai, periksa pengaturan pop-up browser Anda.

Semua proses telah selesai.
