# <FONT size="10pt"> <center>Projet 6</center></FONT>


### Notebook 3

#### <FONT size="10pt"> <center>Classifiez automatiquement des biens de consommation</center></FONT>


Vous êtes Data Scientist au sein de l’entreprise "Place de marché”, qui souhaite lancer une marketplace e-commerce.

**Objectif** : Nous souhaitons élargir notre gamme de produits à l’épicerie fine. Pour cela, pourrais-tu tester la collecte de produits à base de “champagne” via l’API disponible ici ? Pourrais-tu ensuite nous proposer un script ou notebook Python permettant une extraction des 10 premiers produits dans un fichier “.csv”, contenant pour chaque produit les données suivantes : **foodId**, **label**, **category**, **foodContentsLabel**, **image**.

API : https://developer.edamam.com/food-database-api

In [17]:
import requests
import pandas as pd
import numpy as np

# Vos App ID et App Key
app_id = 'ca4a4f13'
app_key = '3ef7ab7d8a17698ee93340c9e3bbbaf0'

# Le terme de recherche (ingrédient) pour lequel vous souhaitez obtenir des données
search_query = 'champagne'

# Initialiser un DataFrame vide pour stocker les résultats
df_api = pd.DataFrame()

# Boucle sur les valeurs de session pour la pagination
for session_value in range(20, 220, 20):  # Par exemple, pour les sessions de 20 à 200 avec un pas de 20
    # Construire l'URL de la requête avec les paramètres nécessaires
    url = f'https://api.edamam.com/api/food-database/v2/parser?session={session_value}&app_id={app_id}&app_key={app_key}'

    # Définir les paramètres de la requête
    query_params = {'ingr': search_query}
    
    # Envoyer la requête HTTP GET à l'API d'Edamam
    response = requests.get(url, params=query_params)
    
    # Vérifier si la requête a réussi (code 200)
    if response.status_code == 200:
        # Convertir la réponse JSON en dictionnaire Python
        response_data = response.json()
        
        # Extraire les données des produits à partir de la réponse JSON
        product_hints = response_data.get('hints', [])
        
        # Parcourir chaque produit pour extraire les données pertinentes
        for product in product_hints:
            product_data = product.get('food', {})
            product_details = {
                'foodId': product_data.get('foodId', ''),                      # ID du produit
                'label': product_data.get('label', ''),                        # Nom/étiquette du produit
                'category': product_data.get('category', ''),                  # Catégorie du produit
                'foodContentsLabel': product_data.get('foodContentsLabel', np.nan),  # Ingrédients du produit, remplace NaN par np.nan
                'image': product_data.get('image', np.nan)                     # URL de l'image du produit, remplace NaN par np.nan
            }
            # Ajouter les données du produit au DataFrame principal
            df_api = pd.concat([df_api, pd.DataFrame(product_details, index=[0])], ignore_index=True)
    else:
        print(f"Erreur lors de la requête pour la session {session_value} : {response.status_code} - {response.text}")

In [18]:
df_api.head(10)

Unnamed: 0,foodId,label,category,foodContentsLabel,image
0,food_ax1n26waalpd9cbc64bjob7pw6hg,Champagne Jelly,Generic meals,Champagne; gelatine; caster sugar; blueberries,
1,food_b4va8u0bb6pf74akh2rtcb3llna9,Champagne Punch,Generic meals,champagne; simple syrup; orange juice; blueber...,
2,food_a4j8wm8ayflf13b45t3c3bk9w4ek,Champagne Sangria,Generic meals,mint leaves; Champagne; orange juice; lemon; l...,
3,food_bba727vaimolf0b8stgoibx7ujei,Champagne Cake,Generic meals,flour; baking powder; salt; butter; sugar; egg...,
4,food_a6mj2obbqy38soat01vrxaqnvvet,Champagne Cupcakes,Generic meals,butter; sugar; eggs; champagne; plain yogurt; ...,
5,food_anrtk55a3aac9uactv3wlanz1m02,Champagne Cocktail,Generic meals,sugar; bitters; Champagne; lemon rind; orange ...,
6,food_aoxaf73b3o0igebpj6wjga6kqhco,Strawberry Champagne,Generic meals,frozen strawberries; champagne; sugar; gourd; ...,
7,food_bncple4a2uagu1b4hov92budz2vs,Champagne Grape,Generic foods,,https://www.edamam.com/food-img/ca5/ca55ac74de...
8,food_bxdqsxkax2vgmpbv8e4ygb6zfnkn,Champagne Vinegar,Generic foods,,https://www.edamam.com/food-img/5f6/5f69b84c39...
9,food_a1huw7sahgifqva60rgdqbpxcf2s,Champagne Margaritas,Generic meals,Lime Juice; tequila; Triple Sec; sparkling win...,


In [19]:
# Nettoyer le DataFrame en supprimant les valeurs manquantes et les doublons
df_api = df_api.dropna().drop_duplicates().reset_index(drop=True).head(10)

# Afficher le DataFrame nettoyé dans le notebook
display(df_api)

# Afficher le nombre total de produits extraits après nettoyage
print(f"Nombre total de produits extraits après nettoyage : {len(df_api)}")

Unnamed: 0,foodId,label,category,foodContentsLabel,image
0,food_bu12urpbtuo9v6b4jpvk2a1fh4hh,"Champagne Simply Dressed Vinaigrette, Champagne",Packaged foods,FILTERED WATER; CANOLA OIL; CHAMPAGNE AND WHIT...,https://www.edamam.com/food-img/736/736a3e27a6...
1,food_b48c55sagj89z4afsne5dar76h4x,Champagne Vinegar,Packaged foods,CHAMPAGNE VINEGAR DILUTED WITH WATER TO 7% ACI...,https://www.edamam.com/food-img/ad8/ad8c8d6ba8...
2,food_bb0nrsgbser5g4ac2enxib1deyh8,Champagne Mustard,Packaged foods,DIJON MUSTARD (VINEGAR; WATER; MUSTARD SEED; S...,https://www.edamam.com/food-img/775/775b39c0b0...
3,food_arm1rlyb5v81v6arurmjqb6xiy9t,"Light Champagne Dressing, Light Champagne",Packaged foods,WATER; SOYBEAN OIL; WHITE WINE (PRESERVED WITH...,https://www.edamam.com/food-img/ee0/ee0475f45b...
4,food_bzb3i0lbxkz4nnbv10dsladd965e,Inglenook Champagne,Packaged foods,Dealcoholized Champagne; Water; Grape Juice Co...,https://www.edamam.com/food-img/cb3/cb33b008db...
5,food_byl67wcbbfw82ua6j1n7oa6ago4a,Cola Champagne,Packaged foods,CARBONATED WATER; HIGH FRUCTOSE CORN SYRUP; AR...,https://www.edamam.com/food-img/f82/f82d164536...
6,food_b3iaz2gav39j6abdpavjka0qgz2e,Cola Champagne,Packaged foods,CARBONATED WATER; HIGH FRUCTOSE CORN SYRUP; AR...,https://www.edamam.com/food-img/b4b/b4b747a25b...
7,food_bsck64rasshe3aag46w4dbq3ip81,Champagne Reserve Vinegar,Packaged foods,CHAMPAGNE VINEGAR,https://www.edamam.com/food-img/d2d/d2dcfa4b43...
8,food_b2y7rqqan02gndal9taplb4idv5j,Girard's Champagne Vinaigrette,Packaged foods,Canola and Soybean Oil; White Wine; Contains S...,https://www.edamam.com/food-img/189/18997efa76...
9,food_b2exrzmbb6rq7za4wsvoeaga4q09,Champagne Vinaigrette Dressing,Packaged foods,CANOLA OIL; HONEY; CHAMPAGNE VINEGAR; WATER; D...,https://www.edamam.com/food-img/c08/c085cc31e2...


Nombre total de produits extraits après nettoyage : 10


In [20]:
# Enregistrer le DataFrame nettoyé dans un fichier CSV
df_api.to_csv('products_champagne_paginated_cleaned.csv', index=False)
print("Extraction, nettoyage et enregistrement des données terminées.")

Extraction, nettoyage et enregistrement des données terminées.
