# Faim dans le monde : +9 millions de morts par an

*Etude de santé publique FAO - Projet 3 - Nalron (septembre 2019)* /
*ENSAE-ENSAI Formation Continue*

---

## Intégration des données dans une base de données relationnelle


La base de données contiendra différentes tables, 4 exactement :
**population, dispo_alim, equilibre_prod, sous_nutrition**


In [132]:
import sqlite3
conn = sqlite3.connect('p3_data/base_fao.db')
c = conn.cursor()

### 15.  Choix d'une clé primaire pertinente, en anglais primary key (PK), pour la table population

La table appelée population, contient la population de chaque pays pour l'année 2013. Dans l'extraction des données du site de la FAO, les autres années après 2013 n'étant pas disponibles, la table sera basée uniquement sur 2013.     La table contient 4 colonnes : pays, code_pays, annee, population.

In [133]:
#Préparation de la table population à partir du dataframe (population)
df_pop = population
df_pop = df_pop[['Code Pays', 'Pays', 'Année', 'Valeur']].sort_values(by='Code Pays')
df_pop = df_pop.rename(columns={'Code Pays': 'code_pays', 'Pays': 'pays', 'Année': 'annee', 'Valeur': 'population'})

*La clé primaire retenue pour la table population sera le **code pays**.*

In [134]:
#Création de la table population
c.execute('''CREATE TABLE population(
           code_pays INTEGER PRIMARY KEY,
           pays TEXT,
           annee INTEGER,
           population REAL)''')
conn.commit()

In [135]:
df_pop.to_sql('population', conn, if_exists='append', index=False)

### 16. Choix d'une clé primaire pertinente pour la table dispo_alim

La table appelée dispo_alim contient pour chaque pays, pour chaque produit, sur l'année 2013, les informations suivantes:
- la nature du produit (deux valeurs possibles“animal” ou “végétal”)
- disponibilité alimentaire en tonnes
- disponibilité alimentaire en Kcal/personne/jour
- disponibilité alimentaire de protéines en g/personne/jour
- disponibilité alimentaire de matières grasses en g/personne/jour

La table contient ces colonnes : pays, code_pays, année, produit, code_produit, origin, dispo_alim_tonnes, dispo_alim_kcal_p_j, dispo_prot, dispo_mat_gr .

In [136]:
#Préparation de la table population à partir du dataframe (df1) sur les bilans alimentaires de la FAO
dispo_alim = df1
dispo_alim['Disponibilité alimentaire en quantité tonnes'] = dispo_alim['Disponibilité alimentaire en quantité (Kg/an)'] / 1000
dispo_alim = dispo_alim.rename(columns={'Pays': 'pays', 'Code Pays': 'code_pays', 'Année': 'année', 'Produit': 'produit', 'Code Produit': 'code_produit', 'Origine': 'origin', 'Disponibilité alimentaire en quantité tonnes': 'dispo_alim_tonnes', 'Disponibilité alimentaire (Kcal/personne/jour)': 'dispo_alim_kcal_p_j', 'Disponibilité de protéines en quantité (Kg/an)': 'dispo_prot', 'Disponibilité de matière grasse en quantité (g/personne/jour)': 'dispo_mat_gr'})
dispo_alim = dispo_alim[['pays', 'code_pays', 'année', 'produit', 'code_produit', 'origin', 'dispo_alim_tonnes', 'dispo_alim_kcal_p_j', 'dispo_prot', 'dispo_mat_gr']]

*La clé primaire de la table dispo_alim sera **id (clé artificielle)**.*

En cas d'évolution future, la création de l'id [PK] est une solution qui restera stable

In [137]:
#Création de la table dispo_alim
c.execute('''CREATE TABLE dispo_alim(
            id INTEGER primary key,
            code_pays INTEGER,
            pays TEXT,
            année INTEGER,
            produit TEXT,
            code_produit INTEGER,
            origin TEXT,
            dispo_alim_tonnes REAL,
            dispo_alim_kcal_p_j REAL,
            dispo_prot REAL,
            dispo_mat_gr REAL)''')
conn.commit()

In [138]:
dispo_alim.to_sql('dispo_alim', conn, if_exists='append', index=False)

### 17. Choix d'une clé primaire pertinente pour la table equilibre_prod 

La table appelée equilibre_prod contient pour chaque pays, pour chaque produit, et pour l'année disponible 2013, les quantités suivantes :
- disponibilité intérieure
- aliments pour animaux
- semences
- pertes
- transformés
- nourriture
- autres utilisations

Elle contient ces colonnes : pays, code_pays, année, produit, code_produit, dispo_int, alim_ani, semences, pertes, transfo, nourriture, autres_utilisations.

In [139]:
#Préparation de la table population à partir du dataframe (df1) sur les bilans alimentaires de la FAO
equilibre_prod = df1
equilibre_prod = equilibre_prod.rename(columns={'Pays': 'pays', 'Code Pays': 'code_pays', 'Année': 'année', 'Produit': 'produit', 'Code Produit': 'code_produit', 'Disponibilité intérieure': 'dispo_int', 'Aliments pour animaux': 'alim_ani', 'Semences': 'semences', 'Pertes': 'pertes', 'Nourriture': 'nourriture', 'Autres Utilisations': 'autres_utilisations'})
equilibre_prod = equilibre_prod[['pays', 'code_pays', 'année', 'produit', 'code_produit', 'dispo_int', 'alim_ani',  'semences', 'pertes', 'nourriture', 'autres_utilisations']]


*La clé primaire de la table dispo_alim sera **id (clé artificielle)**.*

En cas d'évolution future, la création de l'id [PK] est une solution qui restera stable

In [140]:
#Création de la table equilibre_prod
c.execute("""CREATE TABLE equilibre_prod(
            id INTEGER PRIMARY KEY,
            pays TEXT, 
            code_pays INTEGER, 
            année INTEGER, 
            produit TEXT, 
            code_produit INTEGER, 
            dispo_int REAL, 
            alim_ani REAL, 
            semences REAL, 
            pertes REAL, 
            nourriture REAL, 
            autres_utilisations REAL)""")
conn.commit()

In [141]:
equilibre_prod.to_sql('equilibre_prod', conn, if_exists='append', index=False)

### 18. Choix d'une clé primaire pertinente pour la table sous_nutrition

La table appelée sous_nutrition, contient le nombre de personnes en sous-alimentation pour chaque pays et pour chaque année comprise entre 2012 à 2018. Elle contient 4 colonnes : pays, code_pays, année, nb_personnes.

In [142]:
#Préparation de la table population à partir du dataframe (df_sousnut) sur la sécurité alimentaire de la FAO
sousnut = df_sousnut
sousnut = sousnut.rename(columns={'Zone': 'pays', 'Code zone': 'code_pays', 'Année': 'année', 'Valeur': 'nb_personnes'})
sousnut = sousnut[['pays', 'code_pays', 'année', 'nb_personnes']]

*La clé primaire retenue pour la table sous_nutrition sera le **code pays**.*

In [143]:
#Création de la table sous_nutrition
c.execute("""CREATE TABLE sous_nutrition(
            pays TEXT, code_pays INTEGER, année TEXT, nb_personnes REAL, CONSTRAINT pays_annee PRIMARY KEY (pays, année))""")

#c.execute("""ALTER TABLE sous_nutrition(ADD CONSTRAINT PRIMARY KEY (pays, année))""")
conn.commit()

In [144]:
sousnut.to_sql('sous_nutrition', conn, if_exists='append', index=False)

### 19. Les requêtes SQL permettant de connaître…

#### 19.1 Les 10 pays ayant le plus haut ratio disponibilité alimentaire/habitant en termes de protéines (en kg) par habitant, puis en termes de kcal par habitant

In [145]:
#Ratio disponibilité alimentaire en protéines (en kg et kcal) par habitant
c.execute("""
SELECT pays, ROUND(SUM(dispo_prot)/1000, 2) AS dispo_prot_kg, SUM(dispo_alim_kcal_p_j) AS dispo_kcal 
FROM dispo_alim
WHERE année = 2013
GROUP BY pays 
ORDER BY(dispo_prot_kg) 
DESC LIMIT 10
""")
c.fetchall()

[('Chine, continentale', 49587.02, 3112.0),
 ('Inde', 27380.73, 2454.0),
 ("États-Unis d'Amérique", 12782.29, 3682.0),
 ('Brésil', 6948.28, 3262.0),
 ('Indonésie', 5672.71, 2776.0),
 ('Fédération de Russie', 5359.94, 3360.0),
 ('Pakistan', 4351.26, 2438.0),
 ('Japon', 4067.62, 2726.0),
 ('Nigéria', 4041.07, 2700.0),
 ('Mexique', 3910.55, 3068.0)]

#### 19.2 Pour chaque année disponible, les 10 pays ayant le plus faible ratio disponibilité alimentaire/habitant en termes de protéines (en kg) par habitant. Le nombre de lignes de la table renvoyée sera donc égal à 10 fois le nombre d'années disponibles

In [146]:
c.execute("""
SELECT PAYS, ROUND(SUM(dispo_prot)/1000, 2) AS dispo_prot_kg
FROM dispo_alim
WHERE année = 2013
GROUP BY pays
ORDER BY(dispo_prot_kg)
ASC LIMIT 10
""").fetchall()

[('Saint-Kitts-et-Nevis', 1.43),
 ('Dominique', 2.0),
 ('Bermudes', 2.14),
 ('Grenade', 2.68),
 ('Kiribati', 2.73),
 ('Antigua-et-Barbuda', 2.74),
 ('Saint-Vincent-et-les Grenadines', 3.43),
 ('Sao Tomé-et-Principe', 3.74),
 ('Sainte-Lucie', 5.7),
 ('Samoa', 5.93)]

#### 19.3 La quantité totale (en kg) de produits perdus par pays et par année. La table renvoyée contiendra donc une ligne par couple (pays, année)

In [147]:
c.execute("""
SELECT pays, SUM(pertes)
FROM equilibre_prod
WHERE année = 2013
GROUP BY pays
ORDER BY SUM(pertes)
DESC LIMIT 20
""").fetchall()

[('Chine, continentale', 89575.0),
 ('Brésil', 75914.0),
 ('Inde', 55930.0),
 ('Nigéria', 19854.0),
 ('Indonésie', 13081.0),
 ('Turquie', 12036.0),
 ('Mexique', 8289.0),
 ('Égypte', 7608.0),
 ('Ghana', 7442.0),
 ("États-Unis d'Amérique", 7162.0),
 ('Viet Nam', 6743.0),
 ('Pakistan', 5897.0),
 ('Thaïlande', 5749.0),
 ("Iran (République islamique d')", 5450.0),
 ('Fédération de Russie', 4997.0),
 ('Angola', 4799.0),
 ('Ukraine', 4138.0),
 ('Bangladesh', 4080.0),
 ('Cameroun', 3981.0),
 ('Allemagne', 3781.0)]

#### 19.4 Les 10 pays pour lesquels la proportion de personnes sous-alimentées est la plus forte

In [148]:
#La proportion de personnes sous-alimentées / Pays a été faite sur le cumul des années 2012 à 2018
#Vision globale sur les 7 années enregistrées
c.execute("""
SELECT pays, SUM(nb_personnes) AS personnes
FROM sous_nutrition
GROUP BY pays
ORDER BY personnes DESC LIMIT 10
""").fetchall()

[('Inde', 1020.7),
 ('Chine', 638.1999999999999),
 ('Chine, continentale', 633.1),
 ('Pakistan', 196.0),
 ('Bangladesh', 126.10000000000001),
 ('Éthiopie', 115.29999999999998),
 ('Indonésie', 111.7),
 ('Nigéria', 93.0),
 ('République-Unie de Tanzanie', 84.9),
 ('Ouganda', 75.4)]

#### 19.5 Les 10 produits pour lesquels le ratio Autres utilisations/Disponibilité intérieure est le plus élevé

In [149]:
c.execute("""
SELECT produit, ROUND(SUM(autres_utilisations/dispo_int), 2) AS ratio
FROM equilibre_prod
GROUP BY produit
ORDER BY ratio DESC LIMIT 10
""").fetchall()

[('Alcool, non Comestible', 112.0),
 ('Huile de Palme', 96.57),
 ('Huil Plantes Oleif Autr', 85.36),
 ('Graisses Animales Crue', 46.64),
 ('Huile de Palmistes', 44.87),
 ('Huile de Colza&Moutarde', 42.56),
 ('Plantes Aquatiques', 40.51),
 ('Huile de Coco', 35.97),
 ('Manioc', 28.17),
 ('Edulcorants Autres', 23.44)]

### 20 : Exemples d'autres utilisations de l'Huile de Palme et de l'Huile de Coco

#### 20.1 Autres utilisations pour l'Huile de Palme

[Source Wikipedia](https://fr.wikipedia.org/wiki/Huile_de_palme)

![](p3_photo/usage_huile_palme0.png)

![](p3_photo/usage_huile_palme1.png)

#### 20.2 Autres utilisations pour l'Huile de Coco

[Source Wikipedia](https://fr.wikipedia.org/wiki/Huile_de_coco)

![](p3_photo/usage_huilecoco.png)