# Projet 3 : Concevez une application au service de la santé publique

### Votre mission

Après avoir lu l’appel à projets, voici les différentes étapes que vous avez identifiées :

1) Traiter le jeu de données afin de repérer des variables pertinentes pour les traitements à venir. Automatiser ces traitements pour éviter de répéter ces opérations. Le programme doit fonctionner si la base de données est légèrement modifiée (ajout d’entrées, par exemple).

2) Tout au long de l’analyse, produire des visualisations afin de mieux comprendre les données. Effectuer une analyse univariée pour chaque variable intéressante, afin de synthétiser son comportement. L’appel à projets spécifie que l’analyse doit être simple à comprendre pour un public néophyte. Soyez donc attentif à la lisibilité : taille des textes, choix des couleurs, netteté suffisante, et variez les graphiques (boxplots, histogrammes, diagrammes circulaires, nuages de points…) pour illustrer au mieux votre propos.

3) Confirmer ou infirmer les hypothèses  à l’aide d’une analyse multivariée. Effectuer les tests statistiques appropriés pour vérifier la significativité des résultats.

4) Élaborer une idée d’application. Identifier des arguments justifiant la faisabilité (ou non) de l’application à partir des données Open Food Facts.

5) Rédiger un rapport d’exploration et pitcher votre idée durant la soutenance du projet.

# Import des données

In [1]:
import pandas as pd
data_raw = pd.read_csv("en.openfoodfacts.org.products.csv", sep="\t")

  interactivity=interactivity, compiler=compiler, result=result)


In [10]:
print("Le DataFrame possède {} lignes et {} colonnes.".format(data_raw.shape[0],data_raw.shape[1]))

Le DataFrame possède 882172 lignes et 175 colonnes.


In [15]:
data_raw.head(25)

Unnamed: 0,code,url,creator,created_t,created_datetime,last_modified_t,last_modified_datetime,product_name,generic_name,quantity,...,carbon-footprint-from-meat-or-fish_100g,nutrition-score-fr_100g,nutrition-score-uk_100g,glycemic-index_100g,water-hardness_100g,choline_100g,phylloquinone_100g,beta-glucan_100g,inositol_100g,carnitine_100g
0,10,http://world-en.openfoodfacts.org/product/0000...,openfoodfacts-contributors,1550246813,2019-02-15T16:06:53Z,1550246813,2019-02-15T16:06:53Z,,,,...,,,,,,,,,,
1,10,http://world-en.openfoodfacts.org/product/0000...,openfoodfacts-contributors,1550246831,2019-02-15T16:07:11Z,1550246831,2019-02-15T16:07:11Z,,,,...,,,,,,,,,,
2,17,http://world-en.openfoodfacts.org/product/0000...,kiliweb,1529059080,2018-06-15T10:38:00Z,1529059204,2018-06-15T10:40:04Z,Vitória crackers,,,...,,,,,,,,,,
3,31,http://world-en.openfoodfacts.org/product/0000...,isagoofy,1539464774,2018-10-13T21:06:14Z,1539464817,2018-10-13T21:06:57Z,Cacao,,130 g,...,,,,,,,,,,
4,1111111111,http://world-en.openfoodfacts.org/product/0000...,openfoodfacts-contributors,1560020173,2019-06-08T18:56:13Z,1560020173,2019-06-08T18:56:13Z,Sfiudwx,,dgesc,...,,,,,,,,,,
5,123,http://world-en.openfoodfacts.org/product/0000...,kiliweb,1535737982,2018-08-31T17:53:02Z,1535737986,2018-08-31T17:53:06Z,Sauce Sweety chili 0%,,,...,,,,,,,,,,
6,178,http://world-en.openfoodfacts.org/product/0000...,kiliweb,1542456332,2018-11-17T12:05:32Z,1542456333,2018-11-17T12:05:33Z,Mini coco,,,...,,,,,,,,,,
7,208,http://world-en.openfoodfacts.org/product/0000...,kiliweb,1544207680,2018-12-07T18:34:40Z,1544207683,2018-12-07T18:34:43Z,Pistou d'ail des ours,,,...,,,,,,,,,,
8,284,http://world-en.openfoodfacts.org/product/0000...,kiliweb,1547120245,2019-01-10T11:37:25Z,1547120246,2019-01-10T11:37:26Z,Pain maïs,,,...,,,,,,,,,,
9,291,http://world-en.openfoodfacts.org/product/0000...,kiliweb,1534239669,2018-08-14T09:41:09Z,1534239732,2018-08-14T09:42:12Z,Mendiants,,,...,,,,,,,,,,


In [11]:
data_raw.tail()

Unnamed: 0,code,url,creator,created_t,created_datetime,last_modified_t,last_modified_datetime,product_name,generic_name,quantity,...,carbon-footprint-from-meat-or-fish_100g,nutrition-score-fr_100g,nutrition-score-uk_100g,glycemic-index_100g,water-hardness_100g,choline_100g,phylloquinone_100g,beta-glucan_100g,inositol_100g,carnitine_100g
882167,99999971,http://world-en.openfoodfacts.org/product/9999...,openfoodfacts-contributors,1546519940,2019-01-03T12:52:20Z,1555593435,2019-04-18T13:17:15Z,test,,,...,,,,,,,,,,
882168,99999988,http://world-en.openfoodfacts.org/product/9999...,teolemon,1546519833,2019-01-03T12:50:33Z,1552746673,2019-03-16T14:31:13Z,Boules,,,...,,,,,,,,,,
882169,9999999004360,http://world-en.openfoodfacts.org/product/9999...,kiliweb,1548086277,2019-01-21T15:57:57Z,1558357406,2019-05-20T13:03:26Z,Minis beignets,Beignets natures sucrés,,...,,15.0,15.0,,,,,,,
882170,99999995,http://world-en.openfoodfacts.org/product/9999...,kiliweb,1538818432,2018-10-06T09:33:52Z,1552167501,2019-03-09T21:38:21Z,Steak haché pur boeuf,,,...,,-2.0,-2.0,,,,,,,
882171,9999999999994,http://world-en.openfoodfacts.org/product/9999...,ddidelot,1558375257,2019-05-20T18:00:57Z,1558375940,2019-05-20T18:12:20Z,ERREUR SAISIE - A SUPPRIMER,,,...,,,,,,,,,,


Le jeu de données semble posséder de nombreuses erreurs : données cruciales non renseignées (product_name), lignes de test...

## Sélection des colonnes

In [12]:
# Liste des colonnes


## Nettoyage des lignes

In [13]:
# Nettoyage des lignes : nom manquant, doublons, code mal formaté, lignes vides...


# Analyse univariée

# Analyse multivariée