In [1]:
import os
import glob

def rename_positive_files(directory, prefix="pos_"):
    """
    Mengganti nama file JPG dan XML yang berpasangan di direktori tertentu
    menjadi format berurutan (misal: pos_0001.jpg, pos_0001.xml).
    """
    print(f"Memulai proses penamaan ulang di direktori: {directory}")

    # Mengumpulkan semua file JPG
    # Gunakan glob untuk menemukan semua file dengan ekstensi .jpg, .jpeg, .png, .bmp
    # Pastikan untuk mencari file secara case-insensitive jika perlu (misal: *.JPG, *.jpeg)
    image_files = []
    for ext in ['*.jpg', '*.jpeg', '*.png', '*.bmp']:
        image_files.extend(glob.glob(os.path.join(directory, ext)))

    image_files.sort() # Urutkan file agar penamaan berurutan konsisten

    if not image_files:
        print("Tidak ada file gambar yang ditemukan di direktori ini.")
        return

    print(f"Ditemukan {len(image_files)} file gambar untuk diproses.")

    renamed_count = 0
    for i, old_image_path in enumerate(image_files):
        # Pisahkan nama file dan ekstensi
        base_name = os.path.splitext(os.path.basename(old_image_path))[0]
        image_extension = os.path.splitext(old_image_path)[1]

        # Path ke file XML yang diharapkan
        old_xml_path = os.path.join(directory, base_name + '.xml')

        # Buat nama baru yang berurutan
        new_base_name = f"{prefix}{i+1:04d}" # Menggunakan 4 digit padding (0001, 0002, ...)
        new_image_path = os.path.join(directory, new_base_name + image_extension)
        new_xml_path = os.path.join(directory, new_base_name + '.xml')

        # Cek apakah file XML yang sesuai ada
        if os.path.exists(old_xml_path):
            try:
                # Ganti nama file gambar
                os.rename(old_image_path, new_image_path)
                print(f"Mengganti nama: '{os.path.basename(old_image_path)}' -> '{os.path.basename(new_image_path)}'")

                # Ganti nama file XML
                os.rename(old_xml_path, new_xml_path)
                print(f"Mengganti nama: '{os.path.basename(old_xml_path)}' -> '{os.path.basename(new_xml_path)}'")
                renamed_count += 1
            except OSError as e:
                print(f"Error saat mengganti nama '{old_image_path}' atau '{old_xml_path}': {e}")
        else:
            print(f"Melewatkan '{os.path.basename(old_image_path)}': File XML yang sesuai ({os.path.basename(old_xml_path)}) tidak ditemukan.")

    print(f"\nProses penamaan ulang selesai. Total {renamed_count} pasangan file (JPG dan XML) berhasil diganti namanya.")
    if renamed_count < len(image_files):
        print("Beberapa file gambar dilewatkan karena tidak memiliki file XML yang sesuai.")

# --- Cara Penggunaan ---
if __name__ == "__main__":
    # GANTI DENGAN PATH KE FOLDER "Gambar Positif" ANDA
    positive_images_folder = r"D:\Penelitian Skripsi\Dataset\Gambar Positif"

    rename_positive_files(positive_images_folder)

Memulai proses penamaan ulang di direktori: D:\Penelitian Skripsi\Dataset\Gambar Positif
Ditemukan 103 file gambar untuk diproses.
Mengganti nama: '1000_F_223952188_K8pFfnUBNXerHrCN2uxrUwV6QF6F3NrE_jpeg.rf.28548a2515b03315ac6263e09493a09f.jpg' -> 'pos_0001.jpg'
Mengganti nama: '1000_F_223952188_K8pFfnUBNXerHrCN2uxrUwV6QF6F3NrE_jpeg.rf.28548a2515b03315ac6263e09493a09f.xml' -> 'pos_0001.xml'
Mengganti nama: '1000_F_223952188_K8pFfnUBNXerHrCN2uxrUwV6QF6F3NrE_jpeg.rf.3f1a9b4ecc043e28000ca4913424e5ba.jpg' -> 'pos_0002.jpg'
Mengganti nama: '1000_F_223952188_K8pFfnUBNXerHrCN2uxrUwV6QF6F3NrE_jpeg.rf.3f1a9b4ecc043e28000ca4913424e5ba.xml' -> 'pos_0002.xml'
Mengganti nama: '1000_F_223952188_K8pFfnUBNXerHrCN2uxrUwV6QF6F3NrE_jpeg.rf.7f142a9fcd2de8646dd7cad7dc7cdeca.jpg' -> 'pos_0003.jpg'
Mengganti nama: '1000_F_223952188_K8pFfnUBNXerHrCN2uxrUwV6QF6F3NrE_jpeg.rf.7f142a9fcd2de8646dd7cad7dc7cdeca.xml' -> 'pos_0003.xml'
Mengganti nama: '1000_F_273324839_NULWjhchckh8a2SehdKJABWPQXigAesO_jpeg.rf.2054f4b4

In [2]:
import os
import glob

def rename_negative_files(directory, prefix="neg_"):
    """
    Mengganti nama file gambar di direktori tertentu menjadi format berurutan
    (misal: neg_0001.jpg, neg_0002.jpg).

    Args:
        directory (str): Path ke direktori yang berisi gambar negatif.
        prefix (str): Awalan untuk nama file baru (default: "neg_").
    """
    print(f"Memulai proses penamaan ulang di direktori: {directory}")

    # Mengumpulkan semua file gambar
    # Gunakan glob untuk menemukan semua file dengan ekstensi .jpg, .jpeg, .png, .bmp
    image_files = []
    for ext in ['*.jpg', '*.jpeg', '*.png', '*.bmp']:
        image_files.extend(glob.glob(os.path.join(directory, ext)))

    image_files.sort() # Urutkan file agar penamaan berurutan konsisten

    if not image_files:
        print("Tidak ada file gambar yang ditemukan di direktori ini.")
        return

    print(f"Ditemukan {len(image_files)} file gambar untuk diproses.")

    renamed_count = 0
    for i, old_image_path in enumerate(image_files):
        # Pisahkan nama file dan ekstensi
        image_extension = os.path.splitext(old_image_path)[1]

        # Buat nama baru yang berurutan
        new_base_name = f"{prefix}{i+1:04d}" # Menggunakan 4 digit padding (0001, 0002, ...)
        new_image_path = os.path.join(directory, new_base_name + image_extension)

        try:
            # Ganti nama file gambar
            os.rename(old_image_path, new_image_path)
            print(f"Mengganti nama: '{os.path.basename(old_image_path)}' -> '{os.path.basename(new_image_path)}'")
            renamed_count += 1
        except OSError as e:
            print(f"Error saat mengganti nama '{old_image_path}': {e}")

    print(f"\nProses penamaan ulang selesai. Total {renamed_count} file gambar berhasil diganti namanya.")

# --- Cara Penggunaan ---
if __name__ == "__main__":
    # GANTI DENGAN PATH KE FOLDER "Gambar Negatif" ANDA
    negative_images_folder = r"D:\Penelitian Skripsi\Dataset\Gambar Negatif"

    rename_negative_files(negative_images_folder)

Memulai proses penamaan ulang di direktori: D:\Penelitian Skripsi\Dataset\Gambar Negatif
Ditemukan 300 file gambar untuk diproses.
Mengganti nama: '0001.jpg' -> 'neg_0001.jpg'
Mengganti nama: '0002.jpg' -> 'neg_0002.jpg'
Mengganti nama: '0003.jpg' -> 'neg_0003.jpg'
Mengganti nama: '0004.jpg' -> 'neg_0004.jpg'
Mengganti nama: '0005.jpg' -> 'neg_0005.jpg'
Mengganti nama: '0006.jpg' -> 'neg_0006.jpg'
Mengganti nama: '0007.jpg' -> 'neg_0007.jpg'
Mengganti nama: '0008.jpg' -> 'neg_0008.jpg'
Mengganti nama: '0009.jpg' -> 'neg_0009.jpg'
Mengganti nama: '0010.jpg' -> 'neg_0010.jpg'
Mengganti nama: '0011.jpg' -> 'neg_0011.jpg'
Mengganti nama: '0012.jpg' -> 'neg_0012.jpg'
Mengganti nama: '0013.jpg' -> 'neg_0013.jpg'
Mengganti nama: '0014.jpg' -> 'neg_0014.jpg'
Mengganti nama: '0015.jpg' -> 'neg_0015.jpg'
Mengganti nama: '0016.jpg' -> 'neg_0016.jpg'
Mengganti nama: '0017.jpg' -> 'neg_0017.jpg'
Mengganti nama: '0018.jpg' -> 'neg_0018.jpg'
Mengganti nama: '0019.jpg' -> 'neg_0019.jpg'
Mengganti nama

In [3]:
import os
import glob
import xml.etree.ElementTree as ET

def create_positives_txt(positive_images_dir, output_file_path):
    """
    Membuat file 'positives.txt' dari gambar dan file XML anotasi.
    Format output: path/ke/gambar.jpg <jumlah_objek> <x> <y> <lebar> <tinggi> ...
    """
    print(f"Membuat 'positives.txt' dari direktori: {positive_images_dir}")
    count_objects = 0
    with open(output_file_path, 'w') as f:
        # Cari semua file gambar yang mungkin ada di direktori positif
        image_files = []
        for ext in ['*.jpg', '*.jpeg', '*.png', '*.bmp']:
            image_files.extend(glob.glob(os.path.join(positive_images_dir, ext)))
        image_files.sort() # Urutkan agar output TXT juga terurut

        for image_path in image_files:
            # Dapatkan nama dasar file tanpa ekstensi
            base_name = os.path.splitext(os.path.basename(image_path))[0]
            xml_path = os.path.join(positive_images_dir, base_name + '.xml')

            if os.path.exists(xml_path):
                try:
                    tree = ET.parse(xml_path)
                    root = tree.getroot()

                    objects_info = []
                    for obj in root.findall('object'):
                        # Asumsi format XML adalah PASCAL VOC atau serupa dengan <xmin>, <ymin>, <xmax>, <ymax>
                        bndbox = obj.find('bndbox')
                        xmin = int(bndbox.find('xmin').text)
                        ymin = int(bndbox.find('ymin').text)
                        xmax = int(bndbox.find('xmax').text)
                        ymax = int(bndbox.find('ymax').text)

                        width = xmax - xmin
                        height = ymax - ymin
                        objects_info.append(f"{xmin} {ymin} {width} {height}")
                        count_objects += 1

                    if objects_info:
                        # Tulis path relatif dan informasi objek ke file TXT
                        relative_path = os.path.relpath(image_path, start=os.path.dirname(output_file_path))
                        line = f"{relative_path} {len(objects_info)} {' '.join(objects_info)}\n"
                        f.write(line)
                    else:
                        print(f"Peringatan: Tidak ada objek yang ditemukan di XML untuk {image_path}. Melewatkan.")
                except ET.ParseError as e:
                    print(f"Error parsing XML file {xml_path}: {e}. Melewatkan.")
            else:
                print(f"Peringatan: File XML tidak ditemukan untuk {image_path}. Melewatkan.")

    print(f"Selesai membuat '{output_file_path}'. Total {count_objects} objek terdeteksi.")
    return count_objects

def create_negatives_txt(negative_images_dir, output_file_path):
    """
    Membuat file 'negatives.txt' dari daftar path gambar negatif.
    """
    print(f"Membuat 'negatives.txt' dari direktori: {negative_images_dir}")
    count_images = 0
    with open(output_file_path, 'w') as f:
        # Cari semua file gambar yang mungkin ada di direktori negatif
        image_files = []
        for ext in ['*.jpg', '*.jpeg', '*.png', '*.bmp']:
            image_files.extend(glob.glob(os.path.join(negative_images_dir, ext)))
        image_files.sort() # Urutkan agar output TXT juga terurut

        for image_path in image_files:
            # Tulis path relatif ke file TXT
            relative_path = os.path.relpath(image_path, start=os.path.dirname(output_file_path))
            f.write(f"{relative_path}\n")
            count_images += 1

    print(f"Selesai membuat '{output_file_path}'. Total {count_images} gambar negatif.")
    return count_images

if __name__ == "__main__":
    # --- KONFIGURASI PATH ANDA ---
    # Path ke folder gambar positif Anda (yang sudah dirapikan)
    positive_images_folder = r"D:\Penelitian Skripsi\Dataset\Gambar Positif"

    # Path ke folder gambar negatif Anda (yang sudah dirapikan)
    negative_images_folder = r"D:\Penelitian Skripsi\Dataset\Gambar Negatif"

    # Nama file output TXT yang akan dibuat (akan dibuat di direktori skrip ini dijalankan)
    output_positives_txt = "positives.txt"
    output_negatives_txt = "negatives.txt"

    print("--- Memulai Pembuatan File TXT untuk Haar Cascade ---")

    # Membuat positives.txt
    total_positive_objects = create_positives_txt(positive_images_folder, output_positives_txt)

    # Membuat negatives.txt
    total_negative_images = create_negatives_txt(negative_images_folder, output_negatives_txt)

    print("\n--- Proses Selesai ---")
    print(f"Jumlah total objek positif yang terdeteksi: {total_positive_objects}")
    print(f"Jumlah total gambar negatif: {total_negative_images}")
    print(f"File '{output_positives_txt}' dan '{output_negatives_txt}' telah dibuat di direktori yang sama.")
    print("Anda sekarang siap untuk melanjutkan ke langkah 'opencv_createsamples' dan 'opencv_traincascade'.")

--- Memulai Pembuatan File TXT untuk Haar Cascade ---
Membuat 'positives.txt' dari direktori: D:\Penelitian Skripsi\Dataset\Gambar Positif
Selesai membuat 'positives.txt'. Total 103 objek terdeteksi.
Membuat 'negatives.txt' dari direktori: D:\Penelitian Skripsi\Dataset\Gambar Negatif
Selesai membuat 'negatives.txt'. Total 300 gambar negatif.

--- Proses Selesai ---
Jumlah total objek positif yang terdeteksi: 103
Jumlah total gambar negatif: 300
File 'positives.txt' dan 'negatives.txt' telah dibuat di direktori yang sama.
Anda sekarang siap untuk melanjutkan ke langkah 'opencv_createsamples' dan 'opencv_traincascade'.


In [6]:
!"C:\Users\acer\Downloads\opencv\build\x64\vc14\bin" -vec samples.vec -info positives.txt -num 103 -w 48 -h 48

'"C:\Users\acer\Downloads\opencv\build\x64\vc14\bin"' is not recognized as an internal or external command,
operable program or batch file.


In [None]:
opencv_traincascade -data data/ -vec samples.vec -bg negatives.txt -numPos 90 -numNeg 270 -numStages 15 -w 48 -h 48 -featureType HAAR