# Classifiez automatiquement des biens de consommation : 
*Notebook mission 2 - Test d’une API de collecte de données de change*

Nous souhaitons élargir notre gamme de produits à l’épicerie fine. 
 

Pour cela, pourrais-tu tester la collecte de produits à base de “champagne” via l’API disponible ici ou via l'API Openfood Facts en pièce jointe (ne nécessitant aucune inscriptio? 

 

Pourrais-tu ensuite nous proposer un script ou notebook Python permettant une extraction des 10 premiers produits dans un fichier “.csv”, contenant pour chaque produit les données suivantes : foodId, label, category, foodContentsLabel, image.

**Appeler l'API et récupérer le résultat**

In [2]:
import requests

# Définir l'URL de l'API avec le paramètre de recherche
url = "https://world.openfoodfacts.org/cgi/search.pl?action=process&tagtype_0=ingredients&tag_contains_0=contains&tag_0=champagne&json=true"

# Effectuer la requête GET
response = requests.get(url)

# Vérifier si la requête a réussi
if response.status_code == 200:
    # Récupérer la réponse en JSON
    data = response.json()
    
    # Récupérer les produits
    products = data.get("products", [])
    print("Succès - nbre de produits :", len(products))
else:
    print(f"Erreur : {response.status_code}")

Succès - nbre de produits : 50


**Filtrer les produits avec l'ingrédient "champagne"**

In [4]:
# Filtrer les produits contenant "champagne" dans les ingrédients
filtered_products = [
    product for product in products 
    if "ingredients_text" in product and "champagne" in product["ingredients_text"].lower()
]

**Afficher le résultat**

In [6]:
# Afficher les produits filtrés
print(f"Produits contenant 'champagne' ({len(filtered_products)} trouvés) :\n")
for i, product in enumerate(filtered_products[:10]):  # Limiter l'affichage aux 10 premiers
    print(f"{i+1}. {product.get('product_name', 'Nom inconnu')} - {product.get('brands', 'Marque inconnue')}")
    print(f"   Ingrédients: {product.get('ingredients_text', 'Non précisé')}\n")

Produits contenant 'champagne' (48 trouvés) :

1. Faux Gras - Gaia
   Ingrédients: Eau, levure alimentaire, huile de coco, amidon de pomme de terre, protéines de tournesol, Champagne (2%), pulpe de tomates, sel marin, huile de tournesol, truffe (1%), épices (0,18% : coriandre, cannelle, clous de girofle).

2. Veuve Clicquot Champagne Ponsardin Brut - Champagner weiss, Veuve Clicquot Champagne Brut
   Ingrédients: Champagne

3. Nicolas Feuillatte - Nicolas Feuillatte
   Ingrédients: Champagne, Contient des _sulfites_

4. Confiture abricot, mangue, pêche fruit de la passion - Monoprix Gourmet,Monoprix
   Ingrédients: Fruits 60% (pulpe d'abricot 25%, pulpe de mangue 12%, pêche 12%, jus de fruit de la passion 11%) - sucre de canne - gélifiant : pectines - Champagne - jus de citron - extrait de vanille. Malgré tout le soin apporté à la préparation de ce produit, la présence exceptionnelle de noyaux n'est pas exclue.

5. Champagne CHARLES VINCENT BRUT - Carrefour
   Ingrédients: Champagne br

**Extraction des 10 premiers produits**

In [8]:
champagne_products = []

for i, product in enumerate(filtered_products[:10]):    
            champagne_product = {
                "foodId": product.get("code", "N/A"),
                "label": product.get("product_name", "Nom inconnu"),
                "category": product.get("categories", "Non précisé"),
                "foodContentsLabel": product.get("ingredients_text", "Non précisé"),
                "image": product.get("image_url", "Aucune image")
            }
            champagne_products.append(champagne_product)

champagne_products

[{'foodId': '8711812380571',
  'label': 'Faux Gras',
  'category': 'Produits à tartiner, Produits à tartiner salés, Alternatives à la viande, Substituts de viande, Substituts du foie gras',
  'foodContentsLabel': 'Eau, levure alimentaire, huile de coco, amidon de pomme de terre, protéines de tournesol, Champagne (2%), pulpe de tomates, sel marin, huile de tournesol, truffe (1%), épices (0,18% : coriandre, cannelle, clous de girofle).',
  'image': 'https://images.openfoodfacts.org/images/products/871/181/238/0571/front_fr.81.400.jpg'},
 {'foodId': '3049610004104',
  'label': 'Veuve Clicquot Champagne Ponsardin Brut',
  'category': 'Boissons, Boissons alcoolisées, Vins, Vins effervescents, Champagnes',
  'foodContentsLabel': 'Champagne',
  'image': 'https://images.openfoodfacts.org/images/products/304/961/000/4104/front_fr.39.400.jpg'},
 {'foodId': '3282946015837',
  'label': 'Nicolas Feuillatte',
  'category': 'Boissons, Boissons alcoolisées, Vins, Vins français, Vins effervescents, Cha

**Mettre les informations extraites dans un fichier csv**

In [10]:
import csv

csv_filename = "C:/Users/admin/Documents/Projets/Projet_6/result_api.csv"

# Écrire les données dans un fichier CSV
with open(csv_filename, mode="w", newline="", encoding="utf-8") as file:
        writer = csv.DictWriter(file, fieldnames=["foodId", "label", "category", "foodContentsLabel", "image"])
        writer.writeheader()  # Écrire l'en-tête
        writer.writerows(champagne_products)  # Écrire les données

print(f"✅ Données enregistrées dans '{csv_filename}' ({len(champagne_products)} produits).")

✅ Données enregistrées dans 'C:/Users/admin/Documents/Projets/Projet_6/result_api.csv' (10 produits).


**Création du script complet**

In [12]:
import csv
import requests

# Définir l'URL de l'API avec le paramètre de recherche
url = "https://world.openfoodfacts.org/cgi/search.pl?action=process&tagtype_0=ingredients&tag_contains_0=contains&tag_0=champagne&json=true"

# Effectuer la requête GET
response = requests.get(url)

# Vérifier si la requête a réussi
if response.status_code == 200:
    # Récupérer la réponse en JSON
    data = response.json()
    
    # Récupérer les produits
    products = data.get("products", [])

    # Filtrer les produits contenant "champagne" dans les ingrédients
    filtered_products = [
        product for product in products 
        if "ingredients_text" in product and "champagne" in product["ingredients_text"].lower()
    ]

    # Sélectionner les 10 premiers produits et extraire les infos demandées
    champagne_products = []
    for i, product in enumerate(filtered_products[:10]):    
        champagne_product = {
                    "foodId": product.get("code", "N/A"),
                    "label": product.get("product_name", "Nom inconnu"),
                    "category": product.get("categories", "Non précisé"),
                    "foodContentsLabel": product.get("ingredients_text", "Non précisé"),
                    "image": product.get("image_url", "Aucune image")
        }
        champagne_products.append(champagne_product)

    # Écrire les données dans un fichier CSV
    csv_filename = "C:/Users/admin/Documents/Projets/Projet_6/results_api.csv"
    with open(csv_filename, mode="w", newline="", encoding="utf-8") as file:
            writer = csv.DictWriter(file, fieldnames=["foodId", "label", "category", "foodContentsLabel", "image"])
            writer.writeheader()  # Écrire l'en-tête
            writer.writerows(champagne_products)  # Écrire les données
    
    print(f"✅ Données enregistrées dans '{csv_filename}' ({len(champagne_products)} produits).")
    
else:
    print(f"Erreur : {response.status_code}")

✅ Données enregistrées dans 'C:/Users/admin/Documents/Projets/Projet_6/results_api.csv' (10 produits).
