#**Aquisition des données**

**Télécharger les images à partir du fichier csv au format jpg**



In [4]:
import os
import csv
import requests
from PIL import Image
from io import BytesIO

def download_images(csv_file_path, output_folder):
    with open(csv_file_path, 'r') as csvfile:
        reader = csv.DictReader(csvfile)
        for row in reader:
            image_id = row['gbifid']
            url = row['url']
            response = requests.get(url)

            if response.status_code == 200:
                # Télécharger l'image depuis l'URL
                image = Image.open(BytesIO(response.content))

                # Créer le dossier de sortie s'il n'existe pas
                os.makedirs(output_folder, exist_ok=True)

                # Enregistrer l'image dans le dossier avec l'ID comme nom de fichier
                output_path = os.path.join(output_folder, f"{image_id}.jpg")
                image.save(output_path, "JPEG")

                print(f"Image téléchargée avec succès : {output_path}")
            else:
                print(f"Échec du téléchargement de l'image à partir de l'URL : {url}")

# Utilisation de la fonction avec votre fichier CSV et le dossier de sortie souhaité
csv_file_path = '/content/mnhn_urls.csv'
output_folder = '/content/Images'

download_images(csv_file_path, output_folder)

Image téléchargée avec succès : /content/Images/436951420.jpg
Image téléchargée avec succès : /content/Images/436951425.jpg
Image téléchargée avec succès : /content/Images/436951625.jpg
Image téléchargée avec succès : /content/Images/436952275.jpg
Image téléchargée avec succès : /content/Images/436952280.jpg
Image téléchargée avec succès : /content/Images/436952290.jpg
Image téléchargée avec succès : /content/Images/436952300.jpg
Image téléchargée avec succès : /content/Images/436952455.jpg
Image téléchargée avec succès : /content/Images/436952460.jpg
Image téléchargée avec succès : /content/Images/436952485.jpg
Image téléchargée avec succès : /content/Images/436952755.jpg
Image téléchargée avec succès : /content/Images/436952760.jpg
Image téléchargée avec succès : /content/Images/436952785.jpg
Image téléchargée avec succès : /content/Images/436952830.jpg
Image téléchargée avec succès : /content/Images/436952935.jpg
Image téléchargée avec succès : /content/Images/436952975.jpg
Image té

**Télécharger les images localement**

In [None]:
from google.colab import files

# Télécharger le dossier en tant qu'archive ZIP
!zip -r Images.zip Images/

# Télécharger l'archive ZIP
files.download('Images.zip')

  adding: Images/ (stored 0%)
  adding: Images/436954557.jpg (deflated 1%)
  adding: Images/436959339.jpg (deflated 4%)
  adding: Images/436953154.jpg (deflated 2%)
  adding: Images/436952755.jpg (deflated 1%)
  adding: Images/436952581.jpg (deflated 4%)
  adding: Images/436963111.jpg (deflated 1%)
  adding: Images/436963249.jpg (deflated 1%)
  adding: Images/436954783.jpg (deflated 1%)
  adding: Images/436951492.jpg (deflated 4%)
  adding: Images/436955748.jpg (deflated 1%)
  adding: Images/436964616.jpg (deflated 3%)
  adding: Images/436963199.jpg (deflated 1%)
  adding: Images/436968973.jpg (deflated 3%)
  adding: Images/436961164.jpg (deflated 3%)
  adding: Images/436962492.jpg (deflated 1%)
  adding: Images/436968715.jpg (deflated 1%)
  adding: Images/436955619.jpg (deflated 1%)
  adding: Images/436958736.jpg (deflated 1%)
  adding: Images/436955760.jpg (deflated 1%)
  adding: Images/436963903.jpg (deflated 1%)
  adding: Images/436955214.jpg (deflated 2%)
  adding: Images/43696077

<IPython.core.display.Javascript object>

<IPython.core.display.Javascript object>

**Voir la taille des images**

In [5]:
from PIL import Image
import os

def get_image_sizes(folder_path):
    image_sizes = []

    # Vérifier si le dossier existe
    if not os.path.exists(folder_path):
        print(f"Le dossier {folder_path} n'existe pas.")
        return

    # Liste des fichiers dans le dossier
    files = os.listdir(folder_path)

    for file in files:
        file_path = os.path.join(folder_path, file)

        # Vérifier si le fichier est une image
        if file.lower().endswith(('.png', '.jpg', '.jpeg', '.gif')):
            try:
                # Ouvrir l'image avec Pillow
                with Image.open(file_path) as img:
                    width, height = img.size
                    image_sizes.append((file, width, height))
            except Exception as e:
                print(f"Erreur lors du traitement de l'image {file}: {e}")

    return image_sizes

# Spécifiez le chemin du dossier contenant les images
folder_path = 'chemin_vers_votre_dossier_images'

# Obtenez les tailles des images
sizes = get_image_sizes("/content/Images/")

# Affichez les tailles des images
for size in sizes:
    print(f"Image: {size[0]}, Dimensions: {size[1]} x {size[2]} pixels")


Image: 436954557.jpg, Dimensions: 3328 x 5202 pixels
Image: 436959339.jpg, Dimensions: 3307 x 5153 pixels
Image: 436953154.jpg, Dimensions: 3337 x 5261 pixels
Image: 436952755.jpg, Dimensions: 3296 x 5145 pixels
Image: 436952581.jpg, Dimensions: 3315 x 5177 pixels
Image: 436963111.jpg, Dimensions: 3331 x 5197 pixels
Image: 436963249.jpg, Dimensions: 3316 x 5155 pixels
Image: 436954783.jpg, Dimensions: 3319 x 5198 pixels
Image: 436951492.jpg, Dimensions: 3303 x 5059 pixels
Image: 436955748.jpg, Dimensions: 3316 x 5154 pixels
Image: 436964616.jpg, Dimensions: 3312 x 5153 pixels
Image: 436963199.jpg, Dimensions: 3291 x 5163 pixels
Image: 436968973.jpg, Dimensions: 3281 x 5065 pixels
Image: 436961164.jpg, Dimensions: 3300 x 5121 pixels
Image: 436962492.jpg, Dimensions: 3290 x 5143 pixels
Image: 436968715.jpg, Dimensions: 3660 x 5160 pixels
Image: 436955619.jpg, Dimensions: 3337 x 5124 pixels
Image: 436958736.jpg, Dimensions: 3243 x 5017 pixels
Image: 436955760.jpg, Dimensions: 3311 x 5139 