<div style="display: flex; text-align:center; background-color: rgb(153,102,153);" >
<h1 style="margin: auto; padding: 30px; ">Réaliser une étude de santé avec Python <br>
</h1>
</div>

# Scénario

Je viens de rejoindre une équipe de chercheurs de la FAO en tant que data analyst. Notre mission est de réaliser une étude de grande ampleur sur le thème de la sous-nutrition dans le monde :

- Avoir un panorama de l’état de la malnutrition dans le monde en 2017 (Questions de Marc + 2 de Julien)
- Avoir une étude un peu plus fine pour chacun des pays (Question de Mélanie)

<div style="background-color: RGB(51,165,182);" >
<h2 style="margin: auto; padding: 20px; color:#fff; ">Partie 1 - Importation des librairies et fichiers</h2>
</div>

In [1]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns

In [2]:
df_pop = pd.read_csv("population.csv")
df_sous_nutri = pd.read_csv("sous_nutrition.csv")
df_aide_ali =pd.read_csv("aide_alimentaire.csv")
df_dispo_ali = pd.read_csv("dispo_alimentaire.csv")
liste_cereales = pd.read_csv("liste_cereales2.csv")

FileNotFoundError: [Errno 2] No such file or directory: 'population.csv'

<div style="background-color: RGB(51,165,182);" >
<h2 style="margin: auto; padding: 20px; color:#fff; ">Partie 2 - Nettoyage </h2>
</div>

Méthodologie : 
- Premier visuel : head(), shape, dtypes, unique(), describe()...
- Modification du nom des colonnes : rename(), .columns=
- Modification des types de D si besoin : astype(), to_numeric()
- Recherche doublon : duplicated()
- Recherche et modifications valeur manquante : isna(), fillna()...
- Conversion des unités au besoin : column*10^x

<div style="border: 1px solid RGB(51,165,182);" >
<h3 style="margin: auto; padding: 10px; color: RGB(51,165,182); ">1.1- Fichier population </h3>
</div>


In [None]:
df_pop.head()

In [None]:
df_pop.shape

In [None]:
df_pop.dtypes

In [None]:
df_pop["Année"].unique()

In [None]:
#df_pop["Valeur"].unique().tolist()

In [None]:
df_pop.columns= ["Pays", "Annee", "Nb_habitants"]

In [None]:
df_pop.Nb_habitants=df_pop.Nb_habitants*10**3
df_pop.head()

In [None]:
df_pop.duplicated().sum()

In [None]:
df_pop.isna().sum()

<div style="border: 1px solid RGB(51,165,182);" >
<h3 style="margin: auto; padding: 10px; color: RGB(51,165,182); ">1.2- Fichier sous_nutrition </h3>
</div>

In [None]:
df_sous_nutri.head()

In [None]:
df_sous_nutri.shape

In [None]:
df_sous_nutri.dtypes

In [None]:
df_sous_nutri["Valeur"].unique()

In [None]:
## On voit qu'il y a des nan et des "<0.1", on va d'abord remplacer par 0 le <0.1
df_sous_nutri=df_sous_nutri.replace("<0.1", "0")
df_sous_nutri["Valeur"].unique()

In [None]:
df_sous_nutri["Valeur"]=pd.to_numeric(df_sous_nutri["Valeur"])*10**6
df_sous_nutri["Valeur"].head()

In [None]:
df_sous_nutri.columns= ["Pays", "Annee", "Valeur_sous_nutri"]

In [None]:
df_sous_nutri["Annee"].replace("2012-2014","2013", inplace=True)
df_sous_nutri["Annee"].replace("2013-2015","2014", inplace=True)
df_sous_nutri["Annee"].replace("2014-2016","2015", inplace=True)
df_sous_nutri["Annee"].replace("2015-2017","2016", inplace=True)
df_sous_nutri["Annee"].replace("2016-2018","2017", inplace=True)
df_sous_nutri["Annee"].replace("2017-2019","2018", inplace=True)

In [None]:
df_sous_nutri.duplicated().sum()

In [None]:
#On a vu tout à l'heure qu'il y avait des nan, effectivement il y en a 594
df_sous_nutri.isna().sum()

In [None]:
df_sous_nutri["Valeur_sous_nutri"].fillna(0, inplace=True)
df_sous_nutri.isna().sum()

<div style="border: 1px solid RGB(51,165,182);" >
<h3 style="margin: auto; padding: 10px; color: RGB(51,165,182); ">1.3- Fichier aide_alimentaire </h3>
</div>

In [None]:
df_aide_ali.head()

In [None]:
df_aide_ali.shape

In [None]:
df_aide_ali.dtypes

In [None]:
df_aide_ali.columns=["Pays", "Annee", "Produit_aide", "Qte_produit_aide(tonne)" ]
df_aide_ali.head()

In [None]:
df_aide_ali.duplicated().sum()

In [None]:
df_aide_ali.isna().sum()

In [None]:
df_aide_ali.describe(include="all")

<div style="border: 1px solid RGB(51,165,182);" >
<h3 style="margin: auto; padding: 10px; color: RGB(51,165,182); ">1.4- Fichier Dispo_alimentaire </h3>
</div>

In [None]:
df_dispo_ali.head()

In [None]:
df_dispo_ali.shape

In [None]:
df_dispo_ali.dtypes

In [None]:
df_dispo_ali.columns = ["Pays", "Produit", "Origine", "Aliment_animaux", "Autre_utilisation", "Dispo_alim(cal/personne/jour)", "Dispo_ali_qte(kg/personne/an)", "Dispo_matiere_grasse(g/personne/jour)", "Dispo_proteine(g/personne/jour)", "Dispo_interieure", "Exportations", "Importations",  "Nourriture", "Pertes", "Production", "Semences", "Traitement", "Variation_stock"]

In [None]:
df_dispo_ali.Aliment_animaux=df_dispo_ali.Aliment_animaux*10**3
df_dispo_ali.Autre_utilisation=df_dispo_ali.Autre_utilisation*10**3
df_dispo_ali.Dispo_interieure=df_dispo_ali.Dispo_interieure*10**3
df_dispo_ali.Exportations=df_dispo_ali.Exportations*10**3
df_dispo_ali.Importations=df_dispo_ali.Importations*10**3
df_dispo_ali.Nourriture=df_dispo_ali.Nourriture*10**3
df_dispo_ali.Pertes=df_dispo_ali.Pertes*10**3
df_dispo_ali.Production=df_dispo_ali.Production*10**3
df_dispo_ali.Semences=df_dispo_ali.Semences*10**3
df_dispo_ali.Traitement=df_dispo_ali.Traitement*10**3
df_dispo_ali.Variation_stock=df_dispo_ali.Variation_stock*10**3

In [None]:
df_dispo_ali.duplicated().sum()

In [None]:
#mean pour changer un peu de sum(), bcp de données manquantes
df_dispo_ali.isna().mean()

In [None]:
df_dispo_ali.fillna(0, inplace=True)
df_dispo_ali.isna().sum()

In [None]:
df_dispo_ali.describe(include="all")

<div style="background-color: RGB(51,165,182);" >
<h2 style="margin: auto; padding: 20px; color:#fff; ">Partie 3 - Analyse</h2>
</div>

<div style="border: 1px solid RGB(51,165,182);" >
<h3 style="margin: auto; padding: 10px; color: RGB(51,165,182); ">3.1- Questions de Marc </h3>
</div>


### Question 1 : proportion de personnes en état de sous-nutrition 

In [None]:
#Merge entre fichier population et sous nutrition de 2017
prop_sous_nutri = pd.merge(df_pop.loc[df_pop["Annee"]== 2017, ["Pays", "Nb_habitants"]],
                           df_sous_nutri.loc[df_sous_nutri["Annee"]== "2017", ["Pays", "Valeur_sous_nutri"]],
                           on="Pays")
prop_sous_nutri

In [None]:
# Pop mondiale de 2017 : 
total_pop2017 = df_pop.loc[df_pop['Annee'] == 2017,"Nb_habitants"].sum()
print("La population mondiale en 2017 est de : ", str(total_pop2017))

In [None]:
# Nb de personnes sous-nutries :
pop_sous_nutri = prop_sous_nutri.Valeur_sous_nutri.sum() 
print("Il y a au total " , str(pop_sous_nutri), " personnes sous-nutries en 2017")

In [None]:
pop = [7548134111]
x2 = ["Population totale"]
x3 = ["Population sous-nutrie"]
sous_nutrie = [535700000]

plt.figure(figsize=(9,9))
plt.bar(x2, pop,  width= 1, label="Total nombre de personnes")
plt.bar(x3, sous_nutrie, width= 1, label="Nombre de personne sous-nutries")
plt.title("Nombre de personnes en état de sous-nutrition en 2017", pad=(20),
          fontdict={'family': 'serif', 
                    'color' : 'black',
                    'weight': 'bold',
                    'size': 18});
plt.ylabel("Nombre de personnes (milliards)")
plt.legend()

# Annotating the bar plot with the values midle
plt.annotate(pop[0], (0,pop[0]/2), ha="center")
plt.annotate(sous_nutrie[0], ( 1,sous_nutrie[0]/2),ha="center")




# TOUT EN HAUT DES BARS
#plt.annotate(pop[0], (0,pop[0]+1), ha="center")
#plt.annotate(sous_nutrie[0], ( 1, sous_nutrie[0]+1),ha="center")

In [None]:
# On veut connaître la proportion de personnes sous-nutries :
prop_sous_nutri_mondiale = ((prop_sous_nutri.Valeur_sous_nutri.sum() * 100) / prop_sous_nutri.Nb_habitants.sum()) 
print("La proportion mondiale de personnes en sous nutrition est de ", "{:.2f}".format(round(prop_sous_nutri_mondiale,2)) ,"%")

In [None]:
graph_popsousnutrie = [7548134111-535700000, 535700000]

plt.figure(figsize=(9,9))
plt.pie(graph_popsousnutrie, labels=["Population totale","Population sous-nutrie"],
         normalize = True,
       autopct =lambda x: str(round(x, 2)) + '%' )
my_circle=plt.Circle( (0,0), 0.7, color='white')
p=plt.gcf()
p.gca().add_artist(my_circle)
plt.title("Proportion de personnes en état de sous-nutrition en 2017",
          fontdict={'family': 'serif', 
                    'color' : 'black',
                    'weight': 'bold',
                    'size': 18})
plt.legend()

### Question 2 : nombre théorique de personnes qui pourraient être nourries 

In [None]:
#Merge entre dispo_alimentaire et population
pop_nourries = pd.merge(left= df_dispo_ali[["Pays", "Produit", "Origine", "Dispo_alim(cal/personne/jour)"]], \
                       right= df_pop.loc[df_pop["Annee"]==2017, ["Pays", "Nb_habitants"]], how="left", on="Pays")
pop_nourries

In [None]:
# On crée une nouvelle colonne ds le tableau avec comme résultat le nb de personne nourries par an en fct de la dispo ali de chaque pdt
pop_nourries["dispo_total_annee"]=pop_nourries["Dispo_alim(cal/personne/jour)"] * 365 * pop_nourries["Nb_habitants"]
pop_nourries["dispo_total_annee"]

In [None]:
# On veut savoir cmb de personnes on pourrait nourrir par an :
dispo_mondiale= pop_nourries["dispo_total_annee"].sum() / (2500*365)
print("On peut nourrir " , (round(dispo_mondiale,0)), "personnes au niveau mondial")

In [None]:
pop = [7548134111]
x2 = ["Population totale"]
x3 = ["Population nourrie"]
pop_nourrie = [8367593851]

plt.figure(figsize=(9,9))
plt.bar(x2, pop,  width= 1, label="Total nombre de personnes")
plt.bar(x3, pop_nourrie, width= 1, label="Nombre de personnes nourries", color="green")
plt.title("Nombre de personnes pouvant être nourries en 2017", pad=(20),
          fontdict={'family': 'serif', 
                    'color' : 'black',
                    'weight': 'bold',
                    'size': 18});
plt.ylabel("Nombre de personnes (milliards)")
plt.legend()

# Annotating the bar plot with the values midle
plt.annotate(pop[0], (0,pop[0]/2), ha="center")
plt.annotate(pop_nourrie[0], ( 1,pop_nourrie[0]/2),ha="center")


In [None]:
# Proportion:
print("La proportion de personnes qui pourraient être nourries en 2017 est :", round((dispo_mondiale*100)/total_pop2017,2),"% de la population mondiale")

### Question 3 : nb théorique de personnes qui pourraient être nourries avec les pdts végétaux 

In [None]:
# On avait déjà un merge où on avait mis la colonne origine pour anticiper cette question :
dispo_alim_veg = pop_nourries.loc[pop_nourries["Origine"]=="vegetale" ]
dispo_alim_veg

On note qu'il y a bcp plus de pdts d'origine végétale que animale (76,23%)

In [None]:
# Cmb de personnes on pourrait nourrir avec des pdts végétaux :
dispo_veg_mondiale=dispo_alim_veg["dispo_total_annee"].sum() / (2500*365)
print("On pourrait nourrir", int(dispo_veg_mondiale), "personnes avec des pdts d'origine végétale par an")

In [None]:
pop = [7548134111]
x2 = ["Population totale"]
x3 = ["Population nourrie (végétal)"]
pop_nourrie = [6904305684]

plt.figure(figsize=(9,9))
plt.bar(x2, pop,  width= 1, label="Total nombre de personnes")
plt.bar(x3, pop_nourrie, width= 1, label="Nombre de personnes nourries", color="grey")
plt.title("Nombre de personnes pouvant être nourries avec du végétal en 2017", pad=(20),
          fontdict={'family': 'serif', 
                    'color' : 'black',
                    'weight': 'bold',
                    'size': 18});
plt.ylabel("Nombre de personnes (milliards)")
plt.legend()

# Annotating the bar plot with the values midle
plt.annotate(pop[0], (0,pop[0]/2), ha="center")
plt.annotate(pop_nourrie[0], ( 1,pop_nourrie[0]/2),ha="center")

In [None]:
# Sa proportion :
prop_dispo_veg_mondiale = (dispo_veg_mondiale*100)/total_pop2017
print("La proportion de personne qui pourrait être nourrie avec des produits d'origine végétale en 2017 est : ", str(round(prop_dispo_veg_mondiale,2)),"% de la population mondiale")

In [None]:
graph_vegetaux = [7548134111-6904305684, 6904305684]


plt.figure(figsize=(9,9))
plt.pie(graph_vegetaux, labels=["Population restante","Population nourrie (végétal)"],colors=["grey", "skyblue"], 
         normalize = True,
       autopct =lambda x: str(round(x, 2)) + '%' )
my_circle=plt.Circle( (0,0), 0.7, color='white')
p=plt.gcf()
p.gca().add_artist(my_circle)
plt.title("Proportion de personnes pouvant être nourrie avec du végétal en 2017",
          fontdict={'family': 'serif', 
                    'color' : 'black',
                    'weight': 'bold',
                    'size': 18})
plt.legend()




### Question 4 : l’utilisation de la disponibilité intérieure avec la part de l’alimentation animale, humaine et celle qui est perdue

**Disponibilité intérieure (quantités disponibles d'un aliment pour un pays) =** Production + importations - exportations + variations des stocks (baisse ou augmentation) \
source :http://www.fao.org/3/x9892f/x9892f03.htm

In [None]:
# Qté de disponibilité alimentaire mondiale en 2017 : 
dispo_interieur2017= df_dispo_ali["Dispo_interieure"].sum()
print("Pour l'année 2017, la dispo intérieure mondiale était de " , str(dispo_interieur2017) , " tonnes.")

In [None]:
# Création d'une fonction pour calculer les pourcentages :
def afficherPart(df, col, total):
    part = (df[str(col)].sum()*100)/total
    print("La part attribuée à :" , str(col),"est :", round(part, 2) , "%.")

# Puis boucle for pour les différentes variales demandées :
variables = "Aliment_animaux", "Nourriture", "Pertes", "Autre_utilisation", "Semences", "Traitement" 
for i in variables :
    afficherPart(df_dispo_ali,i,dispo_interieur2017)

In [None]:
x = [13.24, 49.51, 4.61, 8.78, 1.57, 22.38] 


plt.figure(figsize=(9,9))
plt.pie(x, labels = ['Aliment_animaux', 'Nourriture', 'Pertes', 'Autre_utilisation', 'Semences', 'Traitement'],\
       normalize = True,
       autopct = lambda x: str(round(x, 2)) + '%' )
plt.title("Utilisation de la disponibilité intérieure 2017",
          fontdict={'family': 'serif', 
                    'color' : 'darkblue',
                    'weight': 'bold',
                    'size': 18})
plt.legend()


### Question 5 : L'utilisation des céréales dans la répartition entre l'alimentation humaine et animale

In [None]:
df_dispo_ali.loc[df_dispo_ali["Origine"]=='vegetale', 'Produit'].unique()

In [None]:
liste_cereales["Produit"].unique()

In [None]:
liste_cereales = ["Blé et produits", "Riz et produits", "Orge et produits", "Maïs et produits", "Seigle et produits",
                  "Avoine", "Millet et produits", "Sorgho et produits", "Céréales, Autres"]

In [None]:
df_cereales = df_dispo_ali.loc[df_dispo_ali["Produit"].isin(liste_cereales), :]

In [None]:
df_cereales.shape

In [None]:
# Calcul de la dispo intérieure total des céréales :
dispo_int_cereales2017 = df_cereales["Dispo_interieure"].sum()
dispo_int_cereales2017

In [None]:
# boucle for pour les différentes variales demandées :
variables = "Aliment_animaux", "Nourriture", "Pertes", "Autre_utilisation", "Semences", "Traitement" 
for i in variables :
    afficherPart(df_cereales,i,dispo_int_cereales2017)

In [None]:
x = [69.34, 18.13, 2.55, 3.13, 7.25, 0.39] 


plt.figure(figsize=(10,9))
plt.pie(x, labels = ['Aliment_animaux', 'Nourriture', 'Pertes', 'Autre_utilisation', 'Semences', 'Traitement'],\
       normalize = True,
       autopct = lambda x: str(round(x, 2)) + '%' )
plt.title("Utilisation de la disponibilité intérieure (céréales) 2017",
          fontdict={'family': 'serif', 
                    'color' : 'darkblue',
                    'weight': 'bold',
                    'size': 18})
plt.legend(loc='upper right')

### Question 6 : Utilisation du manioc par la Thaïlande aux égards de la proportion de personnes en sous-nutrition

In [None]:
#Sélectionne le manioc au niveau mondial
manioc_mondial = pop_nourries.loc[(pop_nourries["Produit"]=="Manioc")]
manioc_mondial

In [None]:
dispo_manioc_mondial = manioc_mondial["dispo_total_annee"].sum() / (2500*365)
print("On pourrait nourrir avec le manioc ", int(dispo_manioc_mondial), " personnes par an.")

In [None]:
prop_dispo_manioc_mondial = (dispo_manioc_mondial*100)/total_pop2017
round(prop_dispo_manioc_mondial,2)

In [None]:
#Voir le manioc pour la Thaïlande
thailande_manioc = df_dispo_ali.loc[(df_dispo_ali["Produit"]=="Manioc") & (df_dispo_ali["Pays"]=="Thaïlande")]
thailande_manioc

On voit que le manioc représente 40cal par jour par personne, ce qui n'est pas négligeable. Le pays en pdt 30 millions de tonnes, en exporte 25 millions. Seulement 871k tonnes sont consacrées à la nourriture humaine. 

In [None]:
# Ajout colonne proportion pour voir le tx de sous_nutri par pays ds notre ancien merge (fichier pop et sous nut) :
prop_sous_nutri["proportion"] = (prop_sous_nutri["Valeur_sous_nutri"] *100) / prop_sous_nutri["Nb_habitants"]
prop_sous_nutri

In [None]:
# % et pop sous_nutrie de la thailande 
Thailande_sous_nutri=prop_sous_nutri.loc[prop_sous_nutri["Pays"]=="Thaïlande", :]
Thailande_sous_nutri

En thaïlande, plus de 6 millions d'habitants, soit 9% sont en état de sous_nutrition. Pourtant, le pays exporte plus de 25 millions de tonnes de manioc chaque année.

In [None]:
#Calcul du tx d'exportation du manioc
exportation_manioc =(thailande_manioc["Exportations"] * 100) / thailande_manioc["Production"]
print('Proportion de manioc exporté :', "{:.2f}".format(thailande_manioc['Exportations'].iloc[0]*100 / thailande_manioc['Production'].iloc[0]), "%")

Le manioc a une grande valeur calorique/nutritive (40cal/j/p) ce qui permettrait d'éviter cette sous-nutrition. Pourquoi la thaïlande en exporte t-elle autant ? Ne pourrait elle pas les garder pour sa propre population ? Qu'en est il des 1.5 millions de perte, peut-on les limiter ? 

<div style="border: 1px solid RGB(51,165,182);" >
<h3 style="margin: auto; padding: 10px; color: RGB(51,165,182); ">3.1- Questions de Mélanie </h3>
</div>


### Question 1 : liste des pays en 2017 où la proportion des pays sous-nutri est la plus élevé

In [None]:
liste_pays_sous_nutris =prop_sous_nutri.sort_values(by = "proportion", ascending=False).head(10)
liste_pays_sous_nutris

In [None]:
df1=pd.DataFrame ({
                "Group":["Afghanistan","Timor-Leste","Mozambique","Rwanda","Tchad","Lesotho","Libéria","Madagascar","RD de Corée","Haïti"],
                "Valeurs": [28.93, 32.17, 32.81, 35.05, 37.96, 38.25, 38.28, 41.06, 47.19, 48.26]
})

plt.figure(figsize=(10,7))
plt.bar(df1["Group"], df1["Valeurs"], width= 0.7, color="green")
plt.title("Liste des 10 pays où la sous_nutrition est la plus élevée en 2017",
                     fontdict={'family': 'serif', 
                    'color' : 'black',
                    'weight': 'bold',
                    'size': 16});
plt.ylabel('Proportion sous-nutrition (%)')
plt.xticks(rotation=45)
plt.grid(False)
i = 0
j = 1
# Annotating the bar plot with the values (proportion sous-nut)
for i in range(len(df1.Group)):
    plt.annotate(df1.Valeurs[i], (-0.1 + i, df1.Valeurs[i] + j), ha="center")
    
plt.savefig("Liste des 10 pays les plus sous-nutris")

### Question 2 : liste des pays qui ont le plus bénéficié d'aide depuis 2013

In [None]:
liste_pays_aide = df_aide_ali.groupby(["Pays"]).sum().sort_values(by="Qte_produit_aide(tonne)", ascending=False).head(10)
liste_pays_aide

In [None]:
df2=pd.DataFrame ({
                "Group":["R Arabe syrienne","Ethiopie","Yémen","Soudan du Sud","Soudan","Kenya","Bangladesh","Somalie","RD du Congo","Niger"],
                "Valeurs": [1858943, 1381294, 1206484, 695248, 669784, 552836, 348188, 292678, 288502, 276344]
})

plt.figure(figsize=(10,7))
plt.bar(df2.Group, df2.Valeurs, width= 0.7)
plt.title("Liste des 10 pays qui ont le plus bénéficié d'aides depuis 2013",pad=(20),
                     fontdict={'family': 'serif', 
                    'color' : 'darkblue',
                    'weight': 'bold',
                    'size': 16});
plt.ylabel('Quantité de produits données (tonnes)')
plt.xticks(rotation=45)
plt.ylim([0, 2000000])
i = 0
j = 1
# Annotating the bar plot with the values (qte pdts donnees)
for i in range(len(df2.Group)):
    plt.annotate(df2.Valeurs[i], (-0.1 + i, df2.Valeurs[i] + j), ha="center")
    
plt.savefig("Liste des 10 pays qui ont le plus bénéficié d'aides")

Liste des pays qui ont le plus bénéficié d'aides depuis 2013
On voit que sur ces 10 aucun des pays qui ont reçu le plus d'aide depuis 2013 ne font partie des pays qui sont les plus dénutris. Mais ils ont des contextes géo-politique plutôt complexes (guerres?)

In [None]:
liste_pays_aide_moins = df_aide_ali.groupby(["Pays"]).sum().sort_values(by="Qte_produit_aide(tonne)", ascending=True).head(10)
liste_pays_aide_moins

In [None]:
df3=pd.DataFrame ({
                "Group":["Bolivie","Géorgie","Timor-Leste","Vanuatu","Egypte","Chine","Equateur","Sao Tomé-&-principe","Tadjikistan","Bhoutan"],
                "Valeurs": [6, 70, 116, 802, 1122, 1298, 1362, 1826, 2028, 2666]
})


plt.figure(figsize=(10,7))
plt.bar(df3.Group, df3.Valeurs, width= 0.7)
plt.title("Liste des 10 pays qui ont le moins bénéficié d'aides depuis 2013",
                     fontdict={'family': 'serif', 
                    'color' : 'darkblue',
                    'weight': 'bold',
                    'size': 16});
plt.ylabel('Quantité de produits données (tonnes)')
plt.xticks(rotation=45)
plt.ylim([0, 3000])
i = 1
j = 0
# Annotating the bar plot with the values (qte pdts donnees)
for i in range(len(df3.Group)):
    plt.annotate(df3.Valeurs[i], (-0.1 + i, df3.Valeurs[i] + j), ha="center")
    
plt.savefig("Liste des 10 pays qui ont le moins bénéficié d'aides")

Si on prends les deux valeurs les plus hautes de qte de pdt données pour les tableaux : 1858943/2666=697.28

On peut presque dire que les pays avec le moinds d'aide, on eu 700 fois moins d'aide que ceux qui en ont eu le plus. 

### Question 3 : Liste des pays ayant le plus et le moins de dispo alimentaire depuis 2013

In [None]:
dispo_totale_plus= df_dispo_ali[['Pays','Produit','Dispo_alim(cal/personne/jour)']].groupby(["Pays"]).sum()
dispo_totale_plus.sort_values(by='Dispo_alim(cal/personne/jour)',ascending=False).head(10)

In [None]:
df4=pd.DataFrame = ({
        "Group":["Autriche","Belgique","Turquie","E.U","Israël","Irlande","Italie","Luxembourg","Egypte","Allemagne"],
        "Valeurs": [3770, 3737, 3708, 3682, 3610, 3602, 3578, 3540, 3518, 3503]
})
                    
plt.figure(figsize=(11,6))
plt.barh( df4["Group"], df4["Valeurs"], height=0.7, color="maroon")
plt.title("Liste des 10 pays qui ont le plus de dispo alimentaire depuis 2013",
                     fontdict={'family': 'serif', 
                    'color' : 'black',
                    'weight': 'bold',
                    'size': 16});
plt.xlabel('Dispo alimentaire (cal/jour/personne)')
plt.xlim([0, 4000])
    
plt.savefig("Liste des 10 pays qui ont le plus de dispo alimentaire depuis 2013")

In [None]:
dispo_totale_moins= df_dispo_ali[['Pays','Produit','Dispo_alim(cal/personne/jour)']].groupby(["Pays"]).sum()
dispo_totale_moins.sort_values(by='Dispo_alim(cal/personne/jour)',ascending=True).head(10)

In [None]:
df5=pd.DataFrame = ({
        "Group":["R centrafricaine","Zambie","Madagascar","Afghanistan","Haïti","RPD de Corée","Tchad","Zimbabwe","Ouganda","Timor-Leste"],
        "Valeurs": [1879, 1924, 2056, 2087, 2089, 2093, 2109, 2113, 2126, 2129]
})
                    
plt.figure(figsize=(11,6))
plt.barh( df5["Group"], df5["Valeurs"], height=0.7, color="maroon")
plt.title("Liste des 10 pays qui ont le moins de dispo alimentaire depuis 2013",
                     fontdict={'family': 'serif', 
                    'color' : 'black',
                    'weight': 'bold',
                    'size': 16});
plt.xlabel('Dispo alimentaire (cal/jour/personne)')
plt.xlim([0, 4000])
    
plt.savefig("Liste des 10 pays qui ont le moins de dispo alimentaire depuis 2013")

<div style="background-color: RGB(51,165,182);" >
<h2 style="margin: auto; padding: 20px; color:#fff; ">Partie 4 - Conclusion</h2>
</div>

La liste des 10 pays les plus sous nutris ne font pas partie de ceux qui ont eu le plus d’aide, 

Ceux qui ont eu le moins d’aide ne font pas partie de ceux qui sont sous nutris

Ceux qui ont eu le plus d’aide semble être des pays en guerre, contexte géo politiques compliqués

Ceux qui ont eu le plus de dispo alimentaire sont des pays développés
Et inversement ceux qui ont eu le moins sont des pays pauvres, on peut voir sur le graffique qu'il y a une différence de presque 50% entre ceux qui ont le plus et le moins d’aides

Timor-lesthe fait partie des pays les plus sous_nutris, qui ont le moins bénéficié d’aide et de ceux qui ont le moins de dispo alimentaire 
Haïti fait partie des pays les plus sous nutris et de ceux qui ont le moins de dispo alimentaire

D'ailleurs les pays suivants : Corée, Madagascar, Tchad, Timor-Leste, Afghanistan font parties de ceux qui sont le plus sous-nutries

Le pays de Timor-Leste fait pourtant partie des pays qui ont le moins bénéficié d'aides

Axe d'amélioration : 
- Chercher le nombre théorique de personne pouvant être nourries et sa proportion pour chaque catégorie de produit
- Voir quels sont les produits les plus disponibles, les plus exportés, importés, ceux qui sont le plus nourrissants etc... 
- Voir dans les années passées les pays les plus et les moins aidés, ceux qui ont le plus et le moins de dispo alim par habitants et ceux qui étaient les plus sous-nutries pour voir l'évolution en fonction de 2017. (p-e que ceux qui ont eu le plus d'aide et qui ne sont plus considérés comme les plus sous-nutries ont pu bénéficiés avant d'aides alimentaire conséquentes.