Skip to content

Préparation de la données open-food-fact en vu d'une utilisation pour un système de recommendation

Notifications You must be signed in to change notification settings

Hellfik/Foodflix

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

10 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Foodflix project

Generic badge Generic badge Generic badge

Structure du projet

Contexte du projet

Vous intégrez FoodFlix, une startup de la FoodTech qui travaille actuellement sur une application permettant de recommander le meilleur produit à un utilisateur selon un mot clé ou un ensemble de mot clés. Les éléments à remonter sont les éléments liés au Nutri Score pour le MVP. Cependant vous pouvez être force de proposition et proposer de nouveaux éléments.

En tant que développeur IA, vous avez été missionné afin de prouver que la donnée récupérée va permettre de mettre en place cette future application.

Le travail consiste à étudier la donnée, selectionner le sous ensemble qui va permettre de mettre en place la solution et de proposer un jeu de données de bonne qualité permettant ainsi de passer à l'implementation du moteur de recommendation.

Pour faciliter le travail, j'ai travaillé sur un sous ensemble du dataset.(Base de 10.000 observations).

Lien du dataset (Kaggle)

Objectifs

  • Fournir une analyse du jeu de données permettant de faire un états des lieux
  • Sélectionner la donnée sur laquelle l'application va se baser
  • Adapter la bonne stratégie de nettoyage en cohérence avec l'amélioration de la qualité de la données afin de répondre au mieux aux besoins de l'utilisateur.

Livrables

  • Code de l'analyse de la donnée non nettoyée
  • Code de selection des données et de nettayge de celle-ci
  • Visualisation des données / Vérification de la consistance des données
  • Slide de présentation du travail réalisé

En complément : Utilisation du machine learning pour remplir les valeurs manquantes.

Technologies utilisées

  • Python (Notebooks)
  • Pandas pour la manipulation de la donnée
  • Sqlite3 pour le stockage des données nettoyées
  • seaborn pour afficher, de façon graphique, l'analyse du jeu de données

Liens et sources utilisés pour mon analyse

calcul du nutriscore

Première étape

Dans un premier temps, il faut comprendre ce qu'on entend par nutriscore et se poser les questions suivantes. Qu'est-ce que le nutriscore, comment est -il attribué, quels sont les paramètres qui entrent en jeu de le calcul de celui-ci ? Cette étape est très importante pour notre analyse afin de garder seulement les données pertinantes.

On peut commencer par remarquer que le nutriscore est calculé de façon de différente si le produit est transformé ou si il s'agit d'une boisson (Ne sont pas concerné les fruits, légumes frais, poissons ou encore les boissons alcolisées).

Le nutriscore est attribué sur la base d'un score prenant en compte pour 100g ou 100mL de produit, la teneur en :

  • en nutriments et aliments à favoriser (fibres, protéines, fruits, légumes, légumineuses, fruits à coques, huile de colza, de noix et d'olive)

  • en nutriments à limiter (énergie, acides gras saturés, sucres, sel)

Deuxième étape

About

Préparation de la données open-food-fact en vu d'une utilisation pour un système de recommendation

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages