# Faim dans le monde : +9 millions de morts par an

*Etude de santé publique FAO - Projet 3 - Nalron (septembre 2019)* /
*ENSAE-ENSAI Formation Continue*

---

### Rappel du contexte

J'ai intégré une nouvelle équipe de chercheurs de la *Food and Agriculture Organization of the United Nations (FAO)*, l'un des organes qui compose l'ONU et dont l'objectif est d' « aider à construire un monde libéré de la faim ».

Mon équipe est chargée de réaliser une étude de grande ampleur sur le thème de la **sous-nutrition dans le monde**.

Le problème de la faim est complexe et peut avoir de multiples causes, différentes selon les pays. L’étape préliminaire de cette étude sera donc d’établir un “état de l’art” des recherches déjà publiées, mais également de mener une étude statistique destinée à orienter les recherches vers des pays particuliers, et de mettre en lumière différentes causes de la faim. Ainsi, une poignée de data analysts a été sélectionnée pour mener cette étape préliminaire. Lors de la première réunion, j'ai été désigné pour mettre en place la base de données que mon équipe pourra requéter (en SQL) à souhait pour réaliser cette étude statistique.

In [1]:
#Importation des librairies Numpy et Pandas
import numpy as np
import pandas as pd

Les données de la population mondiale de 2013 sont téléchargées sur le site de la FAO :
[Bilans Alimentaires](http://www.fao.org/faostat/fr/#data/FBS)

In [3]:
#Chargement du dataframe de la population mondiale, fichier 'population.csv'
population = pd.read_csv('p3_data/population.csv')
population.head()

Unnamed: 0,Code Domaine,Domaine,Code Pays,Pays,Code Élément,Élément,Code Produit,Produit,Code Année,Année,Unité,Valeur,Symbole,Description du Symbole
0,FBS,Bilans Alimentaires,2,Afghanistan,511,Population totale,2501,Population,2013,2013,1000 personnes,30552,,Donnée officielle
1,FBS,Bilans Alimentaires,202,Afrique du Sud,511,Population totale,2501,Population,2013,2013,1000 personnes,52776,,Donnée officielle
2,FBS,Bilans Alimentaires,3,Albanie,511,Population totale,2501,Population,2013,2013,1000 personnes,3173,,Donnée officielle
3,FBS,Bilans Alimentaires,4,Algérie,511,Population totale,2501,Population,2013,2013,1000 personnes,39208,,Donnée officielle
4,FBS,Bilans Alimentaires,79,Allemagne,511,Population totale,2501,Population,2013,2013,1000 personnes,82727,,Donnée officielle


In [4]:
#Projection pour isoler les populations / Pays
population = population[['Code Pays', 'Pays', 'Année', 'Valeur']].sort_values(by='Code Pays')
population = population.reset_index()
population.head()

Unnamed: 0,index,Code Pays,Pays,Année,Valeur
0,9,1,Arménie,2013,2977
1,0,2,Afghanistan,2013,30552
2,2,3,Albanie,2013,3173
3,3,4,Algérie,2013,39208
4,5,7,Angola,2013,21472


---

### 1. La population mondiale en 2013 selon les données de la FAO

La population mondiale devrait atteindre **9,8 milliards de personnes en 2050** contre **7,7 milliards en 2019**, avec un doublement des habitants de l'Afrique subsaharienne, selon un rapport de l'ONU.

In [5]:
#Population Mondiale pour l'année 2013
population_mondiale = (population['Valeur']*1000).sum()
population_mondiale

6997326000

**6,99 milliards de personnes en 2013.** 
L'estimation est totalement cohérente face au chiffre actuel de l'année 2019.

In [6]:
#Ajout d'une colonne pour identifier les produits d'origine végétale et animale

In [6]:
#Ajout distinct sur les dataframes vegetal et animal
vegetal = pd.read_csv('p3_data/vegetal.csv')
vegetal['Origine'] = 'Végétale'
animal = pd.read_csv('p3_data/animal.csv')
animal['Origine'] = 'Animale'

In [7]:
#Jointure de nos précédents dataframes

In [8]:
#Méthode .append puis .merge pour agréger nos données produits à celles de la population
df = vegetal.append(animal)
df = pd.merge(df, population, on='Pays')
df.head()

Unnamed: 0,Code Domaine,Domaine,Code Pays_x,Pays,Code Élément,Élément,Code Produit,Produit,Code Année,Année_x,Unité,Valeur_x,Symbole,Description du Symbole,Origine,index,Code Pays_y,Année_y,Valeur_y
0,FBS,Bilans Alimentaires,2,Afghanistan,5511,Production,2511,Blé,2013,2013,Milliers de tonnes,5169.0,S,Données standardisées,Végétale,0,2,2013,30552
1,FBS,Bilans Alimentaires,2,Afghanistan,5611,Importations - Quantité,2511,Blé,2013,2013,Milliers de tonnes,1173.0,S,Données standardisées,Végétale,0,2,2013,30552
2,FBS,Bilans Alimentaires,2,Afghanistan,5072,Variation de stock,2511,Blé,2013,2013,Milliers de tonnes,-350.0,S,Données standardisées,Végétale,0,2,2013,30552
3,FBS,Bilans Alimentaires,2,Afghanistan,5301,Disponibilité intérieure,2511,Blé,2013,2013,Milliers de tonnes,5992.0,S,Données standardisées,Végétale,0,2,2013,30552
4,FBS,Bilans Alimentaires,2,Afghanistan,5527,Semences,2511,Blé,2013,2013,Milliers de tonnes,322.0,S,Données standardisées,Végétale,0,2,2013,30552


In [9]:
#.rename nous servira à rencommer les colonnes ambigües 
df = df[['Code Domaine', 'Domaine', 'Code Pays_x', 'Pays', 'Code Élément', 'Élément', 'Code Produit', 'Produit','Origine', 'Année_x', 'Unité', 'Valeur_x', 'Symbole', 'Valeur_y']]
df = df.rename(columns={'Code Pays_x':'Code Pays', 'Année_x': 'Année', 'Valeur_x': 'Valeur', 'Valeur_y': 'Population'})
df.head()

Unnamed: 0,Code Domaine,Domaine,Code Pays,Pays,Code Élément,Élément,Code Produit,Produit,Origine,Année,Unité,Valeur,Symbole,Population
0,FBS,Bilans Alimentaires,2,Afghanistan,5511,Production,2511,Blé,Végétale,2013,Milliers de tonnes,5169.0,S,30552
1,FBS,Bilans Alimentaires,2,Afghanistan,5611,Importations - Quantité,2511,Blé,Végétale,2013,Milliers de tonnes,1173.0,S,30552
2,FBS,Bilans Alimentaires,2,Afghanistan,5072,Variation de stock,2511,Blé,Végétale,2013,Milliers de tonnes,-350.0,S,30552
3,FBS,Bilans Alimentaires,2,Afghanistan,5301,Disponibilité intérieure,2511,Blé,Végétale,2013,Milliers de tonnes,5992.0,S,30552
4,FBS,Bilans Alimentaires,2,Afghanistan,5527,Semences,2511,Blé,Végétale,2013,Milliers de tonnes,322.0,S,30552


### 2. Identification des redondances, en donnant une réponse sous forme de formule mathématique 
C'est une équation à 3 termes de type \(a_1 + a2 + [...] = b_1 + b_2 + [...] = c_1 + c_2 + [...]\) ) faisant intervenir chacune des 11 quantités données ci dessus. Illustrez cette équation avec l'exemple du blé en France. Pour avoir un indice, cliquez sur "Définitions et Standards" sur la page de téléchargement des données.

**Disponibilité intérieure** = Production + Importations - Exportations + Evolutions des stocks

**Nourriture** = Disponibilité intérieure - Semences - Pertes - Aliments pour animaux - Autre utilisation - Traitement

**Disponibilité alimentaire** = Nourriture / Population

*Extrait des définitions des **Éléments** pris sur le site de la FAO :*

In [10]:
elements = pd.read_excel('p3_data/elements_bilans_alimentaires.xls')
elements = elements.fillna('-')
pd.set_option('display.max_colwidth', -1)
elements

Unnamed: 0,Code Élément,Élément,Unité,Description
0,5521,Aliments pour animaux,Milliers de tonnes,"Les données se rapportent à la quantité du produit concerné disponible pour alimenter le bétail et la volaille au cours de la période de référence, qu'il s'agisse d'une production nationale ou de produits importés. Source: FAO. 1986. The ICS users' manual. Interlinked computer strorage and processing system of food and agricultural commodity data. Rome."
1,5154,Autres Utilisations,Milliers de tonnes,"Les statistiques se rapportent à la quantité de produits utilisée à des fins non alimentaires, par exemple, l'huile servant à fabriquer du savon. Afin de ne pas brouiller la représentation du mode d'alimentation national, les quantités du produit concerné consommées avant tout par les touristes sont également reprises sous cette rubrique (voir également ""Disponibilités par habitant""). Ce poste couvre en outre les aliments des petits animaux familiers. Source: FAO. 1986. The ICS users' manual. Interlinked computer strorage and processing system of food and agricultural commodity data. Rome."
2,664,Disponibilité alimentaire (Kcal/personne/jour),Kcal/personne/jour,-
3,645,Disponibilité alimentaire en quantité (kg/personne/an),kg,-
4,684,Disponibilité de matière grasse en quantité (g/personne/jour),g/personne/jour,-
5,674,Disponibilité de protéines en quantité (g/personne/jour),g/personne/jour,-
6,5301,Disponibilité intérieure,Milliers de tonnes,"Production + importations - exportations + évolution des stocks (augmentation ou diminution) = disponibilités servant à une utilisation intérieure.Il existe plusieurs définitions des disponibilités et, dans la pratique, plusieurs notions entrent en jeu. Les éléments concernés sont la production, les importations, les exportations et l'évolution des stocks (augmentation ou diminution). La production, les importations et l'évolution des stocks (à la hausse ou à la baisse) représentent, sans conteste, des éléments constitutifs des disponibilités. Source: Division de la statistique (FAO)"
7,5911,Exportations - Quantité,Milliers de tonnes,-
8,5611,Importations - Quantité,Milliers de tonnes,-
9,5142,Nourriture,Milliers de tonnes,"Les données se rapportent au montant total du produit disponible pour la consommation humaine au cours de la période de référence. Elles englobent le produit concerné, de même que tout produit qui en découlerait à la suite d'une transformation ultérieure. Ainsi, les denrées alimentaires provenant du maïs comprennent la quantité de maïs, de farine de maïs et de tout autre produit qui en est tiré et est disponible à la consommation humaine. Les denrées alimentaires tirées du lait reprennent la quantité de lait en tant que tel, de même que l'équivalent en lait frais des produits laitiers. Source: FAO. 1986. The ICS users' manual. Interlinked computer strorage and processing system of food and agricultural commodity data. Rome."


### 3. Disponibilité alimentaire en kcal et kg de protéines pour chaque pays et chaque produit

In [11]:
#Synthèse des données du df pour obtenir les valeurs de disponibilité alimentaire… par pays et produit
#.pivot_table() pour synthétiser et agréger les résultats en somme 
df1 = df.pivot_table(index=['Code Pays', 'Pays', 'Code Produit', 'Produit', 'Origine', 'Population', 'Année'], \
                     columns='Élément', values='Valeur', aggfunc=sum).reset_index()
df1.head()

Élément,Code Pays,Pays,Code Produit,Produit,Origine,Population,Année,Aliments pour animaux,Autres Utilisations,Disponibilité alimentaire (Kcal/personne/jour),...,Disponibilité de protéines en quantité (g/personne/jour),Disponibilité intérieure,Exportations - Quantité,Importations - Quantité,Nourriture,Pertes,Production,Semences,Traitement,Variation de stock
0,1,Arménie,2511,Blé,Végétale,2977,2013,93.0,0.0,1024.0,...,30.52,554.0,1.0,361.0,389.0,32.0,312.0,30.0,10.0,-118.0
1,1,Arménie,2513,Orge,Végétale,2977,2013,137.0,26.0,0.0,...,0.0,198.0,0.0,9.0,0.0,15.0,189.0,14.0,7.0,0.0
2,1,Arménie,2514,Maïs,Végétale,2977,2013,96.0,,0.0,...,0.01,102.0,,82.0,0.0,7.0,21.0,0.0,,
3,1,Arménie,2515,Seigle,Végétale,2977,2013,1.0,,1.0,...,0.02,1.0,,0.0,0.0,0.0,1.0,0.0,,0.0
4,1,Arménie,2516,Avoine,Végétale,2977,2013,4.0,,2.0,...,0.09,6.0,,1.0,1.0,0.0,5.0,0.0,,


In [12]:
#Ajout des Series "Disponibilités alimentaire en Kcal et Kg" et "Disponibilités protéines en Kg"
df1['Disponibilité alimentaire (Kcal/an)'] = df1['Disponibilité alimentaire (Kcal/personne/jour)'] \
* 365 * df1['Population'] 

df1['Disponibilité de protéines en quantité (Kg/an)']= df1['Disponibilité de protéines en quantité (g/personne/jour)']\
* 365 * .001 * df1['Population']

df1['Disponibilité alimentaire en quantité (Kg/an)'] = df1['Disponibilité alimentaire en quantité (kg/personne/an)'] \
* df1['Population']


In [13]:
#Projection des données sur les valeurs demandées
df2 = df1[['Pays','Produit','Origine', 'Disponibilité alimentaire (Kcal/an)', \
           'Disponibilité alimentaire en quantité (Kg/an)', 'Disponibilité de protéines en quantité (Kg/an)', \
           'Disponibilité intérieure', 'Aliments pour animaux', 'Pertes']].reset_index()

df2.head()

Élément,index,Pays,Produit,Origine,Disponibilité alimentaire (Kcal/an),Disponibilité alimentaire en quantité (Kg/an),Disponibilité de protéines en quantité (Kg/an),Disponibilité intérieure,Aliments pour animaux,Pertes
0,0,Arménie,Blé,Végétale,1112684000.0,388796.2,33163.1846,554.0,93.0,32.0
1,1,Arménie,Orge,Végétale,0.0,0.0,0.0,198.0,137.0,15.0
2,2,Arménie,Maïs,Végétale,0.0,89.31,10.86605,102.0,96.0,7.0
3,3,Arménie,Seigle,Végétale,1086605.0,357.24,21.7321,1.0,1.0,0.0
4,4,Arménie,Avoine,Végétale,2173210.0,1101.49,97.79445,6.0,4.0,0.0


### 4. Ratio "énergie/poids" (Kcal/Kg) pour chaque pays et chaque produit
Ratio calculé à partir de ces dernières informations, et à partir du poids de la disponibilité alimentaire…

Indication : La disponibilité alimentaire en kcal/personne/jour est calculée par la FAO en multipliant la quantité Nouriture (Food) par le ratio énergie/poids (en kcal/kg), puis en le divisant par la population du pays puis par 365. Ici, l'objectif est juste de retrouver le ratio énergie/poids que la FAO a utilisé dans son calcul.

In [14]:
#La Disponibilité intérieure est exprimée en Milliers de tonnes, conversion en Kg
df2['Disponibilité intérieure Kg'] = df2['Disponibilité intérieure'] * 1e6
del df2['Disponibilité intérieure']


df2['Ratio énergie/poids (Kcal/Kg)'] = df2['Disponibilité alimentaire (Kcal/an)'] \
/ df2['Disponibilité alimentaire en quantité (Kg/an)']
df2 = df2.replace([np.inf, -np.inf], np.nan).dropna(subset=["Ratio énergie/poids (Kcal/Kg)"], how="all")

df2.head()

Élément,index,Pays,Produit,Origine,Disponibilité alimentaire (Kcal/an),Disponibilité alimentaire en quantité (Kg/an),Disponibilité de protéines en quantité (Kg/an),Aliments pour animaux,Pertes,Disponibilité intérieure Kg,Ratio énergie/poids (Kcal/Kg)
0,0,Arménie,Blé,Végétale,1112684000.0,388796.2,33163.1846,93.0,32.0,554000000.0,2861.8683
2,2,Arménie,Maïs,Végétale,0.0,89.31,10.86605,96.0,7.0,102000000.0,0.0
3,3,Arménie,Seigle,Végétale,1086605.0,357.24,21.7321,1.0,0.0,1000000.0,3041.666667
4,4,Arménie,Avoine,Végétale,2173210.0,1101.49,97.79445,4.0,0.0,6000000.0,1972.972973
7,7,Arménie,"Céréales, Autres",Végétale,15212470.0,5834.92,423.77595,1.0,1.0,21000000.0,2607.142857


#### 4.1  Vérification de la cohérence du calcul en comparant ce ratio aux données disponibles sur Internet en cherchant par exemple la valeur calorique d'un oeuf.

[Source my-pharma.info](https://www.my-pharma.info/nutrition/calories-oeuf/)
![](p3_photo/calories_oeufs.png)

In [15]:
#Vérification de la valeur calorique d'un oeufs dans notre df
dff = df2[df2['Produit'] == 'Oeufs']
dff.head()

Élément,index,Pays,Produit,Origine,Disponibilité alimentaire (Kcal/an),Disponibilité alimentaire en quantité (Kg/an),Disponibilité de protéines en quantité (Kg/an),Aliments pour animaux,Pertes,Disponibilité intérieure Kg,Ratio énergie/poids (Kcal/Kg)
74,74,Arménie,Oeufs,Animale,48897225.0,34801.13,3727.05515,,,35000000.0,1405.047049
144,144,Afghanistan,Oeufs,Animale,55757400.0,39717.6,4237.5624,,5.0,47000000.0,1403.846154
226,226,Albanie,Oeufs,Animale,53274670.0,39503.85,4227.22925,,7.0,47000000.0,1348.594378
319,319,Algérie,Oeufs,Animale,386394840.0,316016.48,32915.116,,10.0,348000000.0,1222.704715
400,400,Angola,Oeufs,Animale,31349120.0,23833.92,2586.3024,,2.0,29000000.0,1315.315315


*>>> Les ratios sont en corrélation avec les données trouvées sur Internet.*

#### 4.2 Pourcentage de protéines de chaque produit et pour chaque pays.  

Ce pourcentage est obtenu en calculant le ratio "poids de protéines/poids total". 

In [16]:
df2['%Protéines'] = df2['Disponibilité de protéines en quantité (Kg/an)'] \
   / df2['Disponibilité alimentaire en quantité (Kg/an)'] * 100
    
df2['Ratio poids de protéines/poids total'] = df2['Disponibilité de protéines en quantité (Kg/an)'] \
   / df2['Disponibilité alimentaire en quantité (Kg/an)']
    
df2.head()

Élément,index,Pays,Produit,Origine,Disponibilité alimentaire (Kcal/an),Disponibilité alimentaire en quantité (Kg/an),Disponibilité de protéines en quantité (Kg/an),Aliments pour animaux,Pertes,Disponibilité intérieure Kg,Ratio énergie/poids (Kcal/Kg),%Protéines,Ratio poids de protéines/poids total
0,0,Arménie,Blé,Végétale,1112684000.0,388796.2,33163.1846,93.0,32.0,554000000.0,2861.8683,8.529709,0.085297
2,2,Arménie,Maïs,Végétale,0.0,89.31,10.86605,96.0,7.0,102000000.0,0.0,12.166667,0.121667
3,3,Arménie,Seigle,Végétale,1086605.0,357.24,21.7321,1.0,0.0,1000000.0,3041.666667,6.083333,0.060833
4,4,Arménie,Avoine,Végétale,2173210.0,1101.49,97.79445,4.0,0.0,6000000.0,1972.972973,8.878378,0.088784
7,7,Arménie,"Céréales, Autres",Végétale,15212470.0,5834.92,423.77595,1.0,1.0,21000000.0,2607.142857,7.262755,0.072628


#### 4.3 Vérification de la cohérence des ratios trouvés aux données disponibles sur internet, par exemple en cherchant la teneur en protéines de l'avoine.  

In [17]:
#Suppression des 0 pour éviter de fausser la moyenne calculée
df2_prot = df2
df2_prot = df2_prot.drop(df2_prot[df2_prot['%Protéines'] == 0].index)

In [18]:
df2_prot['%Protéines'][df2_prot['Produit'] == 'Avoine'].mean()

8.787114676022817

![](avoine_prot.jpg)

*>>> La comparaison permet de confirmer que les ratios calculés semblent cohérents.*

### 5. Sélection des 5 aliments parmi les 20 aliments les plus caloriques, en utilisant le ratio énergie/poids
Étonnamment, il arrive que ce ratio soit différent en fonction du pays. Je réalise donc pour chaque aliment une moyenne sur les différents pays. Création d'une nouvelle table grâce à une agrégation. *(Suppression des valeurs égales à 0 afin de ne pas fausser le calcul de la moyenne).*

#### 5.1 Liste des 5 aliments parmi les 20 les plus caloriques

In [19]:
#Création du dataframe (df31) par agrégation 
#Retrait des valeurs 0 pour éviter de fausser le calcul de la moyenne
df31 = df2.groupby(['Produit']).mean()
df31 = df31.replace([np.inf, -np.inf], np.nan).dropna(subset=["Ratio énergie/poids (Kcal/Kg)"], how="all")
df31 = df31['Ratio énergie/poids (Kcal/Kg)'].sort_values(ascending=False)
df31.head(20)

Produit
Huile de Palme             8791.217534
Huile de Soja              8625.483876
Huile de Son de Riz        8497.969939
Huile de Colza&Moutarde    8368.869607
Huile de Tournesol         8305.568299
Huil Plantes Oleif Autr    8246.215771
Huile Graines de Coton     8177.340910
Huile de Coco              8097.752477
Huile de Palmistes         7885.602997
Huile de Germe de Maïs     7827.167158
Huile d'Arachide           7803.918649
Huile d'Olive              7774.263485
Graisses Animales Crue     7579.278844
Huile de Sésame            7482.722820
Huiles de Poissons         7133.945055
Beurre, Ghee               6946.278887
Palmistes                  5475.000000
Arachides Decortiquees     5466.324644
Sésame                     5010.932143
Feve de Cacao              4343.034036
Name: Ratio énergie/poids (Kcal/Kg), dtype: float64

**Liste des 5 aliments les plus caloriques :**

In [20]:
df31.head(5)

Produit
Huile de Palme             8791.217534
Huile de Soja              8625.483876
Huile de Son de Riz        8497.969939
Huile de Colza&Moutarde    8368.869607
Huile de Tournesol         8305.568299
Name: Ratio énergie/poids (Kcal/Kg), dtype: float64

#### 5.2 Liste des 5 aliments parmi les 20 aliments les plus riches en protéines

In [21]:
#Création du dataframe (df32) par agrégation 
#Retrait des valeurs 0 pour éviter de fausser le calcul de la moyenne
df32 = df2.groupby(['Produit']).mean()
df32 = df32.replace([np.inf, -np.inf], np.nan).dropna(subset=["%Protéines"], how="all")
df32 = df32['%Protéines'].sort_values(ascending=False)
df32.head(20)

Produit
Soja                        25.338211
Arachides Decortiquees      24.790816
Pois                        22.108112
Légumineuses Autres         22.025876
Haricots                    21.719055
Sésame                      17.828134
Abats Comestible            17.630901
Viande, Autre               17.410158
Plantes Oleiferes, Autre    16.693495
Aliments pour enfants       14.872622
Viande de Bovins            14.461108
Cephalopodes                14.057333
Viande d'Ovins/Caprins      13.736265
Viande de Volailles         12.620016
Poissons Pelagiques         12.129966
Piments                     11.337096
Graines Colza/Moutarde      10.950000
Poissons Marins, Autres     10.942450
Épices, Autres              10.744898
Oeufs                       10.696134
Name: %Protéines, dtype: float64

**Liste des 5 aliments les plus riches en protéines :**

In [22]:
df32.head(5)

Produit
Soja                      25.338211
Arachides Decortiquees    24.790816
Pois                      22.108112
Légumineuses Autres       22.025876
Haricots                  21.719055
Name: %Protéines, dtype: float64

### 6.  Calcul de la disponibilité intérieure mondiale (en kcal), pour les produits végétaux uniquement.

In [23]:
#Création du dataframe (df4) à partir de df2
#Réduction selon la condition de l'origine Végétale des produits
df4 = df2[['Pays', 'Produit', 'Origine', 'Disponibilité intérieure Kg', 'Ratio énergie/poids (Kcal/Kg)',\
           'Ratio poids de protéines/poids total']]
df4 = df4[df4['Origine'] == 'Végétale']

In [24]:
df4.head()

Élément,Pays,Produit,Origine,Disponibilité intérieure Kg,Ratio énergie/poids (Kcal/Kg),Ratio poids de protéines/poids total
0,Arménie,Blé,Végétale,554000000.0,2861.8683,0.085297
2,Arménie,Maïs,Végétale,102000000.0,0.0,0.121667
3,Arménie,Seigle,Végétale,1000000.0,3041.666667,0.060833
4,Arménie,Avoine,Végétale,6000000.0,1972.972973,0.088784
7,Arménie,"Céréales, Autres",Végétale,21000000.0,2607.142857,0.072628


#### 6.1 Disponibilité intérieure par produit exprimée en Kg

In [25]:
#Agrégation des données et restriction selon les produits et la disponibilité intérieure en Kg
df4 = df4.replace([np.inf, -np.inf], np.nan).dropna(subset=["Disponibilité intérieure Kg"], how="all")

df4.groupby('Produit').sum().reset_index()[['Produit', 'Disponibilité intérieure Kg']].head(10)

Élément,Produit,Disponibilité intérieure Kg
0,"Agrumes, Autres",12237000000.0
1,Aliments pour enfants,761000000.0
2,Ananas,23282000000.0
3,Arachides Decortiquees,29577000000.0
4,Avoine,23383000000.0
5,Bananes,103992000000.0
6,Bananes plantains,29239000000.0
7,Bière,187275000000.0
8,Blé,679498000000.0
9,Boissons Alcooliques,25583000000.0


#### 6.2 Disponibilité intérieure mondiale exprimée en Kg

In [26]:
disponibilite_interieure_kg = df4['Disponibilité intérieure Kg'].sum()
disponibilite_interieure_kg

7504396000000.0

#### 6.3 Disponibilité intérieure par produit exprimée en Kcal

In [27]:
#Ajout d'une colonne 'Disponibilité intérieure Kcal'
#Restriction selon les produits et la disponibilité intérieure en Kcal
df4['Disponibilité intérieure Kcal'] = df4['Disponibilité intérieure Kg'] * df4['Ratio énergie/poids (Kcal/Kg)']
df4.groupby('Produit').sum().reset_index()[['Produit', 'Disponibilité intérieure Kg']].head(10)

df4.groupby('Produit').sum().reset_index()[['Produit', 'Disponibilité intérieure Kcal']].head(10)

Élément,Produit,Disponibilité intérieure Kcal
0,"Agrumes, Autres",2659187000000.0
1,Aliments pour enfants,2769245000000.0
2,Ananas,7927188000000.0
3,Arachides Decortiquees,156225300000000.0
4,Avoine,49488160000000.0
5,Bananes,64658800000000.0
6,Bananes plantains,25227850000000.0
7,Bière,84881300000000.0
8,Blé,1984328000000000.0
9,Boissons Alcooliques,74940200000000.0


#### 6.4 Disponibilité intérieure mondiale exprimée en Kcal

In [28]:
df4 = df4.replace([np.inf, -np.inf], np.nan).dropna(subset=["Disponibilité intérieure Kcal"], how="all")
disponibilite_interieure_kcal = df4['Disponibilité intérieure Kcal'].sum()
disponibilite_interieure_kcal

1.216642152417339e+16

[L'étude continue sur le thème des populations cibles à partir des disponibilités précédemment calculées](https://github.com/nalron/project_public_health_study/blob/french_version/p3_notebook02.ipynb)

![](usage_huilecoco.png)