# P6 - Notebook 5 : Collecte de Données via une API

## 1. Conformité RGPD et Imports

### Conformité avec le Règlement Général sur la Protection des Données (RGPD)

Dans le cadre de la collecte de données via l'API OpenFoodFacts, une attention particulière a été portée au respect des principes du RGPD.

1.  **Licéité, loyauté et transparence** : Les données sont issues d'une API publique et collaborative (OpenFoodFacts), dont les conditions d'utilisation sont transparentes.
2.  **Limitation des finalités** : Les données collectées sont utilisées exclusivement pour la finalité de ce projet pédagogique.
3.  **Minimisation des données** : Seuls les champs strictement nécessaires (`foodId`, `label`, `category`, `foodContentsLabel`, `image`) ont été collectés, conformément au cahier des charges.
4.  **Exactitude** : Les données sont utilisées telles que fournies par l'API.
5.  **Limitation de la conservation** : Les données seront conservées uniquement le temps de la réalisation de ce projet.


In [1]:
import requests
import pandas as pd

## 2. Construction et Exécution de la Requête API

In [2]:
# Objectif : Collecter des données sur des produits contenant du "champagne".

# Définition des paramètres de la requête
url = "https://world.openfoodfacts.org/cgi/search.pl"

# Définition des paramètres de la requête
params = {
    "action": "process",
    "search_terms": "champagne",
    "sort_by": "unique_scans_n",
    "page_size": 20,
    "json": 1,
    "fields": "code,product_name,categories,ingredients_text,image_url" # Noms de champs actuels
}

# Exécution de la requête
print("Envoi de la requête à l'API OpenFoodFacts...")
response = requests.get(url, params=params)

# Vérification du succès de la requête
if response.status_code == 200:
    print("Réponse reçue avec succès !")
    data = response.json()
    products = data.get('products', [])
    print(f"{len(products)} produits ont été trouvés.")
else:
    print(f"Erreur lors de la requête API. Statut : {response.status_code}")
    products = []

Envoi de la requête à l'API OpenFoodFacts...
Réponse reçue avec succès !
20 produits ont été trouvés.


## 3. Traitement des Données et Sauvegarde

In [3]:
if products:
    # Conversion en DataFrame
    df_api = pd.DataFrame(products)

    # Affichage d'un aperçu
    print("\n\nAperçu des données brutes collectées :")
    print(df_api.head())
    print("\nInformations sur le DataFrame :")
    df_api.info()

    # Dictionnaire pour renommer les colonnes
    rename_dict = {
        'code': 'foodId',
        'product_name': 'label',
        'categories': 'category',
        'ingredients_text': 'foodContentsLabel',
        'image_url': 'image'
    }

    df_api.rename(columns=rename_dict, inplace=True)
    df_api = df_api[['foodId', 'label', 'category', 'foodContentsLabel', 'image']]

    # Sauvegarde
    output_path = 'Data/api_products_champagne.csv'
    df_api.to_csv(output_path, index=False)
    print(f"\n\nDonnées collectées et sauvegardées avec succès dans '{output_path}'")
else:
    print("\nAucun produit n'a été collecté. Cela peut être dû à un changement dans l'API ou à l'absence de résultats.")



Aperçu des données brutes collectées :
                                          categories           code  \
0                                Produits,Champagnes  8001841769189   
1  Aliments et boissons à base de végétaux, Alime...  3039820510250   
2                                     Salted spreads  3292070010264   
3  Boissons, Boissons alcoolisées, Vins, Vins eff...  3113934004147   
4                                                NaN  4820097815556   

                                           image_url  \
0  https://images.openfoodfacts.org/images/produc...   
1  https://images.openfoodfacts.org/images/produc...   
2  https://images.openfoodfacts.org/images/produc...   
3  https://images.openfoodfacts.org/images/produc...   
4  https://images.openfoodfacts.org/images/produc...   

                                    ingredients_text  \
0                                                NaN   
1                                  Lentilles vertes.   
2  Pois chiches 44% - purée