Dans le cadre de notre mission en tant que Data Scientist chez "Place de marché", nous avons pour objectif d'automatiser l'attribution des catégories pour les articles proposés sur notre plateforme e-commerce. Actuellement, cette tâche est réalisée manuellement par les vendeurs, ce qui peut engendrer des erreurs et des incohérences. Avec la croissance prévue du volume d'articles, il devient crucial de développer un moteur de classification automatique des articles basé sur leur description textuelle et leur image. Linda, notre Lead Data Scientist, nous a confié la réalisation d'une étude de faisabilité pour ce projet. Cette étude comprendra l'analyse des données textuelles et visuelles, l'extraction de features, et l'évaluation de la possibilité de regrouper les articles par catégorie de manière automatique.

Voici la démarche utilisée :

*   Paramètrage d’un script python sur RapidAPI
*   Importation JSON des données
- Transformation en Dataframe
- Requeter sur la catégorie Champagne
- Filtrer en assurant les règles RGPD
- Extraire au format CSV




# Script d'extraction d'informations depuis une API en ligne

## Importation des libraires

In [1]:
import pandas as pd
import requests
import csv

## URL de l'API

In [2]:
url= "https://api.edamam.com/api/food-database/v2/parser"

In [3]:
url2="https://api.edamam.com/api/food-database/v2/parser?app_id=99ac66db&app_key=1fc39dc71e1d27c4138d43442db37e9d&ingr=champagne&nutrition-type=cooking"

## Requête

In [5]:
response = requests.get(url2)
response

<Response [200]>

## Extraction des produits contenant le mot champagne

In [6]:
print(response.json())

{'text': 'champagne', 'count': 297, 'parsed': [{'food': {'foodId': 'food_a656mk2a5dmqb2adiamu6beihduu', 'label': 'Champagne', 'knownAs': 'dry white wine', 'nutrients': {'ENERC_KCAL': 82.0, 'PROCNT': 0.07, 'FAT': 0.0, 'CHOCDF': 2.6, 'FIBTG': 0.0}, 'category': 'Generic foods', 'categoryLabel': 'food', 'image': 'https://www.edamam.com/food-img/a71/a718cf3c52add522128929f1f324d2ab.jpg'}}], 'hints': [{'food': {'foodId': 'food_a656mk2a5dmqb2adiamu6beihduu', 'label': 'Champagne', 'knownAs': 'dry white wine', 'nutrients': {'ENERC_KCAL': 82.0, 'PROCNT': 0.07, 'FAT': 0.0, 'CHOCDF': 2.6, 'FIBTG': 0.0}, 'category': 'Generic foods', 'categoryLabel': 'food', 'image': 'https://www.edamam.com/food-img/a71/a718cf3c52add522128929f1f324d2ab.jpg'}, 'measures': [{'uri': 'http://www.edamam.com/ontologies/edamam.owl#Measure_serving', 'label': 'Serving', 'weight': 147.0}, {'uri': 'http://www.edamam.com/ontologies/edamam.owl#Measure_unit', 'label': 'Whole', 'weight': 750.0}, {'uri': 'http://www.edamam.com/onto

## Transformation du Json en Pandas

In [7]:
data = response.json()


In [9]:
df = pd.json_normalize(data['hints'])
df.head()

Unnamed: 0,measures,food.foodId,food.label,food.knownAs,food.nutrients.ENERC_KCAL,food.nutrients.PROCNT,food.nutrients.FAT,food.nutrients.CHOCDF,food.nutrients.FIBTG,food.category,food.categoryLabel,food.image,food.brand,food.foodContentsLabel,food.servingSizes,food.servingsPerContainer
0,[{'uri': 'http://www.edamam.com/ontologies/eda...,food_a656mk2a5dmqb2adiamu6beihduu,Champagne,dry white wine,82.0,0.07,0.0,2.6,0.0,Generic foods,food,https://www.edamam.com/food-img/a71/a718cf3c52...,,,,
1,[{'uri': 'http://www.edamam.com/ontologies/eda...,food_b8d1c2rbdpdok6bjpwmtlbsa5hs4,"Champagne Vinaigrette, Champagne","CHAMPAGNE VINAIGRETTE, CHAMPAGNE",571.0,0.0,64.290001,7.14,,Packaged foods,food,,SoFine Food,OLIVE OIL; BALSAMIC VINEGAR; CHAMPAGNE VINEGAR...,[{'uri': 'http://www.edamam.com/ontologies/eda...,
2,[{'uri': 'http://www.edamam.com/ontologies/eda...,food_axmullnbxsm8f5aug13l2aqoyu6j,"Champagne Vinaigrette, Champagne","CHAMPAGNE VINAIGRETTE, CHAMPAGNE",333.0,0.0,36.669998,6.67,,Packaged foods,food,https://www.edamam.com/food-img/d88/d88b64d973...,Maple Grove Farms of Vermont,INGREDIENTS: WATER; CANOLA OIL; CHAMPAGNE VINE...,[{'uri': 'http://www.edamam.com/ontologies/eda...,12.0
3,[{'uri': 'http://www.edamam.com/ontologies/eda...,food_a7j75b0bk4sd87a34ed3tats8n31,"Champagne Dressing, Champagne","CHAMPAGNE DRESSING, CHAMPAGNE",571.0,0.0,64.290001,7.14,,Packaged foods,food,,SoFine Food,OLIVE OIL; BALSAMIC VINEGAR; CHAMPAGNE VINEGAR...,[{'uri': 'http://www.edamam.com/ontologies/eda...,
4,[{'uri': 'http://www.edamam.com/ontologies/eda...,food_b2xjyr5beqff2mbwycgjza8o1hxk,"Champagne Vinaigrette, Champagne","CHAMPAGNE VINAIGRETTE, CHAMPAGNE",500.0,0.0,50.0,6.67,0.0,Packaged foods,food,,Girard's,CANOLA AND SOYBEAN OIL; WHITE WINE (CONTAINS S...,[{'uri': 'http://www.edamam.com/ontologies/eda...,


## Tri des colonnes

In [10]:
df.columns = [col.split('.')[-1] for col in df.columns]
selected_columns = ['foodId', 'label', 'category', 'foodContentsLabel', 'image']
df = df[selected_columns]
df.head()

Unnamed: 0,foodId,label,category,foodContentsLabel,image
0,food_a656mk2a5dmqb2adiamu6beihduu,Champagne,Generic foods,,https://www.edamam.com/food-img/a71/a718cf3c52...
1,food_b8d1c2rbdpdok6bjpwmtlbsa5hs4,"Champagne Vinaigrette, Champagne",Packaged foods,OLIVE OIL; BALSAMIC VINEGAR; CHAMPAGNE VINEGAR...,
2,food_axmullnbxsm8f5aug13l2aqoyu6j,"Champagne Vinaigrette, Champagne",Packaged foods,INGREDIENTS: WATER; CANOLA OIL; CHAMPAGNE VINE...,https://www.edamam.com/food-img/d88/d88b64d973...
3,food_a7j75b0bk4sd87a34ed3tats8n31,"Champagne Dressing, Champagne",Packaged foods,OLIVE OIL; BALSAMIC VINEGAR; CHAMPAGNE VINEGAR...,
4,food_b2xjyr5beqff2mbwycgjza8o1hxk,"Champagne Vinaigrette, Champagne",Packaged foods,CANOLA AND SOYBEAN OIL; WHITE WINE (CONTAINS S...,


In [None]:
df = df.head(10)
df.to_csv('Zilliox_Thomas_Champagne.csv', index=False)