<a href="https://github.com/data-for-good-grenoble/atelier-OFF" target="_blank"><img src="image_meetup_off.png" width=500px/></a>

# 🍫 Atelier d'exploration des données d'Open Food Facts - Meetup Python Grenoble 🐍

*Jeudi 27 juin 2024 - 19h - <a href="https://turbine.coop/" target="_blank">La Turbine</a> - Grenoble*

**Notations :**

▶️ : le code peut être exécuté sans modification

💻 : le code doit être créé ou modifié

___

▶️ Importer les **bibliothèques nécessaires** à l'activité

In [None]:
import requests
import pprint

## Partie 1 : Récupérer des produits grâce à l'API "détail"

Documentation :
- https://openfoodfacts.github.io/openfoodfacts-server/api/
- https://openfoodfacts.github.io/openfoodfacts-server/api/tutorial-off-api/

Staging vs Prod ?
- staging : `.net`
- prod : `.org`

Explorer les différentes bases de données
- https://world.openfoodfacts.org (3256540000339)
- https://world.openproductsfacts.org (3256224068150)
- https://world.openbeautyfacts.org (3600541888302)
- https://world.openpetfoodfacts.org (0052742855707)

💻 Récupérer 1 produit

In [None]:
product_code = "3256540000339"
OFF_API_URL = "https://world.openfoodfacts.org/api/v2/product"
response = requests.get(f"{OFF_API_URL}/{product_code}")
data = response.json()
# print(data)
# pprint.pprint(data)
print(data['product'].keys())
print(len(data['product'].keys()))

Il est possible de filtrer le JSON retourné grâce au paramètre d'URL `fields`

In [None]:
product_code = "3256540000339"
OFF_API_URL = "https://world.openfoodfacts.org/api/v2/product"
response = requests.get(f"{OFF_API_URL}/{product_code}?fields=product_name,nutriscore_data,nutriments,nutrition_grades,misc_tags")
data = response.json()
print(data['product']['misc_tags'])

## Partie 2 : Récupérer des produits grâce à l'API "search"

Documentation :
- https://openfoodfacts.github.io/openfoodfacts-server/api/tutorial-off-api/#search-for-a-product-by-nutri-score
- alternative : https://github.com/openfoodfacts/search-a-licious

In [None]:
QUERY = "categories_tags_fr=ravioles"
OFF_SEARCH_URL = "https://world.openfoodfacts.org/api/v2/search"
response = requests.get(f"{OFF_SEARCH_URL}?{QUERY}")
data = response.json()
print(data)

In [None]:
# alternative en cours de développement
QUERY = ""
OFF_SEARCHALICIOUS_URL = "https://search.openfoodfacts.org/search"
response = requests.get(f"{OFF_SEARCHALICIOUS_URL}?q={QUERY}")
data = response.json()

## Partie 3 : Créer/modifier un produit

Documentation :
- https://openfoodfacts.github.io/openfoodfacts-server/api/tutorial-off-api/#completing-products-to-get-the-nutri-score

Il faut se créer un compte, car il faudra authentifier les requêtes (`user_id` et `password`)

In [None]:
OFF_CREATE_API_URL = "https://world.openfoodfacts.net/cgi/product_jqm2.pl"
DATA = {
    "code": "3256540000339",
    "user_id": "",
    "password": ""
}
response = requests.post(OFF_CREATE_API_URL, data=DATA)
print(response.json())

## Bonus : SDK python

Documentation :
- https://github.com/openfoodfacts/openfoodfacts-python

In [None]:
import openfoodfacts

In [None]:
from openfoodfacts import API, APIVersion, Country, Flavor, Environment

client = API(
    #user_agent="Meetup-Grenoble",
    #username=None,
    #password=None,
    country=Country.world,
    flavor=Flavor.off,
    version=APIVersion.v2,
    environment=Environment.net,
)

code = "3017620422003"
client.product.get(code, fields=["code", "product_name", "brands_tags", "categories_tags"])

In [None]:
client.product.text_search("nutella")

In [None]:
from openfoodfacts.taxonomy import get_taxonomy

# récupérer la taxonomie des catégories (graph)
CATEGORIES = get_taxonomy("category")

# nombre de catégories
# print(len(CATEGORIES))

# toutes les catégories 'racine'
# print([node for node in CATEGORIES.iter_nodes() if not node.get_parents_hierarchy()])