In [3]:
#!/usr/bin/env python3
import os
import random
import shutil

def sample_images(input_dir: str, output_dir: str, num_samples: int = 100):
    """
    Prende num_samples immagini a caso da input_dir e le copia in output_dir.
    """
    # Controlla che la cartella di input esista
    if not os.path.isdir(input_dir):
        raise FileNotFoundError(f"Directory di input non trovata: {input_dir}")

    # Crea la cartella di output se non esiste
    os.makedirs(output_dir, exist_ok=True)

    # Filtra i file immagine per estensione
    valid_exts = {'.jpg', '.jpeg', '.png', '.bmp', '.tiff'}
    all_files = [
        f for f in os.listdir(input_dir)
        if os.path.splitext(f.lower())[1] in valid_exts
    ]

    if len(all_files) < num_samples:
        raise ValueError(f"Non ci sono abbastanza immagini in {input_dir} (trovate {len(all_files)}, richieste {num_samples})")

    # Scegli num_samples file a caso
    sampled = random.sample(all_files, num_samples)

    # Copia ciascuna immagine nella cartella di output
    for fname in sampled:
        src = os.path.join(input_dir, fname)
        dst = os.path.join(output_dir, fname)
        shutil.copy2(src, dst)

    print(f"Copiate {num_samples} immagini da '{input_dir}' a '{output_dir}'.")

if __name__ == "__main__":
    INPUT_DIR = "CocoMini_25k"
    OUTPUT_DIR = "CocoBase_10k"
    NUM_SAMPLES = 10000

    sample_images(INPUT_DIR, OUTPUT_DIR, NUM_SAMPLES)


Copiate 10000 immagini da 'CocoMini_25k' a 'CocoBase_10k'.
