In [None]:
from google.colab import drive
import os
import shutil
import requests

def download_images(labels_directory, output_directory, base_url, max_images=None):
    """
    Télécharge les images en utilisant les noms des fichiers texte dans un dossier comme références.

    Args:
        labels_directory (str): Le chemin vers le dossier contenant les fichiers .txt.
        output_directory (str): Le dossier où les images seront enregistrées.
        base_url (str): L'URL de base pour les images.
        max_images (int, optional): Le nombre maximum d'images à télécharger. Si None, toutes les images seront téléchargées.
    """
    # Supprime le dossier de sortie s'il existe, puis le recrée
    if os.path.exists(output_directory):
        shutil.rmtree(output_directory)
    os.makedirs(output_directory)

    count = 0

    # Parcourt tous les fichiers dans le dossier des labels
    for file_name in os.listdir(labels_directory):
        if file_name.endswith('.txt'):
            if max_images is not None and count >= max_images:
                print("Limite de téléchargement atteinte.")
                break

            ref_full = os.path.splitext(file_name)[0]  # Obtient le nom du fichier sans l'extension
            ref_parts = ref_full.split('_')
            ref_main = ref_parts[0]  # Première partie avant le premier '_'
            ref_detail = ref_parts[1] if len(ref_parts) > 1 else ""  # Deuxième partie après le premier '_'
            image_url = f"{base_url}{ref_detail}.att_1200.png"  # Construit l'URL complète pour le téléchargement
            output_path = os.path.join(output_directory, f"{ref_detail}.png")

            try:
                print(f"Téléchargement de l'image {count}/{max_images} {image_url}...")
                response = requests.get(image_url, stream=True)
                response.raise_for_status()

                # Écrit le contenu dans un fichier
                with open(output_path, 'wb') as output_file:
                    for chunk in response.iter_content(1024):
                        output_file.write(chunk)
                print(f"Image enregistrée sous {output_path}")
                count += 1

            except requests.exceptions.RequestException as e:
                print(f"Erreur lors du téléchargement de {image_url}: {e}")


 drive.mount('/content/drive')

# Chemins vers les dossiers dans Google Drive
labels_directory = "/content/drive/My Drive/Deep Learning/Project/Deep Learning/MELU_Labels"  # Chemin vers MELU_Labels
output_directory = "/content/drive/My Drive/Deep Learning/Project/Deep Learning/images"  # Dossier où enregistrer les images

# URL de base
    base_url = "https://online.herbarium.unimelb.edu.au/images/thumbnails/"

    max_images = 200

    # Appelle la fonction de téléchargement
    download_images(labels_directory, output_directory, base_url, max_images)


Mounted at /content/drive
Téléchargement de l'image 0 https://online.herbarium.unimelb.edu.au/images/thumbnails/sp66248714031375187292.att_1200.png...
Image enregistrée sous /content/drive/My Drive/Deep Learning/Project/Deep Learning/images/sp66248714031375187292.png
Téléchargement de l'image 1 https://online.herbarium.unimelb.edu.au/images/thumbnails/sp66604940262865981817.att_1200.png...
Image enregistrée sous /content/drive/My Drive/Deep Learning/Project/Deep Learning/images/sp66604940262865981817.png
Téléchargement de l'image 2 https://online.herbarium.unimelb.edu.au/images/thumbnails/sp68950451724847247190.att_1200.png...
Image enregistrée sous /content/drive/My Drive/Deep Learning/Project/Deep Learning/images/sp68950451724847247190.png
Téléchargement de l'image 3 https://online.herbarium.unimelb.edu.au/images/thumbnails/sp68457143854943580082.att_1200.png...
Image enregistrée sous /content/drive/My Drive/Deep Learning/Project/Deep Learning/images/sp68457143854943580082.png
Téléch