Dans ce notebook nous importons les données de la Banque Mondiale avec l'API

Installation des bibliothèques requises

In [None]:
#%pip install requests
#%pip install Faostat
#%pip install pycountry

Collecting pycountry
  Downloading pycountry-24.6.1-py3-none-any.whl.metadata (12 kB)
Downloading pycountry-24.6.1-py3-none-any.whl (6.3 MB)
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m6.3/6.3 MB[0m [31m20.1 MB/s[0m eta [36m0:00:00[0m00:01[0m
[?25hInstalling collected packages: pycountry
Successfully installed pycountry-24.6.1
Note: you may need to restart the kernel to use updated packages.


Import des données économiques avec l'API de la Banque Mondiale (voir la doc sur https://datatopics.worldbank.org/world-development-indicators/)

Avant d'importer les variables dont nous avons besoin, il faut justement déterminer quelles sont ces variables. Une petite revue de littérature s'impose. 

idée: utiliser la variable "part de l'agriculture dans le PIB", "revenus de la déforestation" (si ça existe).
Référence qui revient souvent: la courbe de kuznets environnementale

Articles : 
- Andrée, B. P. J., Chamorro, A., Spencer, P., Koomen, E., & Dogo, H. (2019). Revisiting the relation between economic growth and the environment; a global assessment of deforestation, pollution and carbon emission. Renewable and Sustainable Energy Reviews, 114, 109221.)
  - inverted U-shaped relations between per capita income and deforestation
  - Poverty and income inequality correlate with higher deforestation
  - agricultural GDP shares correlate with deforestation
- López, R., & Galinato, G. I. (2005). Trade policies, economic growth, and the direct causes of deforestation. Land economics, 81(2), 145-169.
  -  Economy-wide factors such as trade openness and economic growth explain an important portion of the variation in three key factors of deforestation: poverty, agricultural expansion, and road building. 



Variables récupérées:

- Indice de GINI : SI.POV.GINI
- agricultural land (% of land area) : AG.LND.AGRI.ZS
- forest area (% of land area): AG.LND.FRST.ZS
- GDP (US$): NY.GDP.MKTP.CD
- GDP GROWTH : NY.GDP.MKTP.KD.GZ


Nous allons récupérer les données de la Banque Mondiale de deux manières différentes : la première avec un seul indicateur (au choix) pour cibler, la seconde avec tous les indicateurs en même temps pour avoir une vue d'ensemble de ce qui est disponible. 

In [2]:
import requests
import pandas as pd

# URL de base de l'API
base_url = "https://api.worldbank.org/v2/country/all/indicator/NY.GDP.MKTP.CD?date=1960:2024&format=json"

# Initialisation des variables
all_records = []
page = 1

# Requête initiale pour obtenir le nombre total de pages
url = f"{base_url}&page={page}"
req = requests.get(url)
data_eco = req.json()

# Vérification de la structure de la réponse et extraction du nombre total de pages
if len(data_eco) > 0 and isinstance(data_eco[0], dict) and "pages" in data_eco[0]:
    total_pages = data_eco[0]["pages"]
    print(f"Nombre total de pages : {total_pages}")
else:
    print("Impossible de déterminer le nombre de pages.")
    exit()

# Récupérer les données pour toutes les pages
while page <= total_pages:
    url = f"{base_url}&page={page}"
    req = requests.get(url)
    data_eco = req.json()

    # Vérification si des données existent pour cette page
    if len(data_eco) > 1 and isinstance(data_eco[1], list):
        all_records.extend(data_eco[1])  # Ajouter les données de la page actuelle
    page += 1  # Passer à la page suivante

# Transformation des données en DataFrame pandas
df = pd.DataFrame(all_records)

# Vérification et affichage des colonnes pertinentes
if "country" in df.columns and "date" in df.columns and "value" in df.columns:
    table = df[["date", "value", "country"]]
    print(table.head())  # Afficher les premières lignes du tableau
else:
    print("Les colonnes attendues ne sont pas disponibles dans les données récupérées.")


Nombre total de pages : 341


KeyboardInterrupt: 

In [None]:
df

Unnamed: 0,indicator,country,countryiso3code,date,value,unit,obs_status,decimal
0,"{'id': 'NY.GDP.MKTP.CD', 'value': 'GDP (curren...","{'id': 'ZH', 'value': 'Africa Eastern and Sout...",AFE,2023,1.236163e+12,,,0
1,"{'id': 'NY.GDP.MKTP.CD', 'value': 'GDP (curren...","{'id': 'ZH', 'value': 'Africa Eastern and Sout...",AFE,2022,1.183962e+12,,,0
2,"{'id': 'NY.GDP.MKTP.CD', 'value': 'GDP (curren...","{'id': 'ZH', 'value': 'Africa Eastern and Sout...",AFE,2021,1.086772e+12,,,0
3,"{'id': 'NY.GDP.MKTP.CD', 'value': 'GDP (curren...","{'id': 'ZH', 'value': 'Africa Eastern and Sout...",AFE,2020,9.290741e+11,,,0
4,"{'id': 'NY.GDP.MKTP.CD', 'value': 'GDP (curren...","{'id': 'ZH', 'value': 'Africa Eastern and Sout...",AFE,2019,1.006527e+12,,,0
...,...,...,...,...,...,...,...,...
17019,"{'id': 'NY.GDP.MKTP.CD', 'value': 'GDP (curren...","{'id': 'ZW', 'value': 'Zimbabwe'}",ZWE,1964,1.217138e+09,,,0
17020,"{'id': 'NY.GDP.MKTP.CD', 'value': 'GDP (curren...","{'id': 'ZW', 'value': 'Zimbabwe'}",ZWE,1963,1.159512e+09,,,0
17021,"{'id': 'NY.GDP.MKTP.CD', 'value': 'GDP (curren...","{'id': 'ZW', 'value': 'Zimbabwe'}",ZWE,1962,1.117602e+09,,,0
17022,"{'id': 'NY.GDP.MKTP.CD', 'value': 'GDP (curren...","{'id': 'ZW', 'value': 'Zimbabwe'}",ZWE,1961,1.096647e+09,,,0


In [None]:
import requests
import pandas as pd

def fetch_worldbank_data(indicator, start_date="1960", end_date="2024"):
    """
    Récupère les données de la Banque Mondiale pour un indicateur donné.
    
    Args:
        indicator (str): Code de l'indicateur (ex. "NY.GDP.MKTP.CD").
        start_date (str): Année de début des données (par défaut "1960").
        end_date (str): Année de fin des données (par défaut "2024").
    
    Returns:
        pd.DataFrame: Tableau contenant les données récupérées, ou None en cas d'échec.
    """
    base_url = f"https://api.worldbank.org/v2/country/all/indicator/{indicator}?date={start_date}:{end_date}&format=json"
    all_records = []
    page = 1

    url = f"{base_url}&page={page}"
    req = requests.get(url)
    data_eco = req.json()

    if len(data_eco) > 0 and isinstance(data_eco[0], dict) and "pages" in data_eco[0]:
        total_pages = data_eco[0]["pages"]
        print(f"{indicator} - Nombre total de pages : {total_pages}")
    else:
        print(f"{indicator} - Impossible de déterminer le nombre de pages.")
        return None

    while page <= total_pages:
        url = f"{base_url}&page={page}"
        req = requests.get(url)
        data_eco = req.json()

        if len(data_eco) > 1 and isinstance(data_eco[1], list):
            all_records.extend(data_eco[1])
        page += 1

    df = pd.DataFrame(all_records)

    if "country" in df.columns and "date" in df.columns and "value" in df.columns:
        # Extraire le nom du pays depuis le dictionnaire dans la colonne 'country'
        df["country"] = df["country"].apply(lambda x: x["value"] if isinstance(x, dict) else x)
        table = df[["date", "value", "country"]]
        return table
    else:
        print(f"{indicator} - Les colonnes attendues ne sont pas disponibles.")
        return None

# Liste des indicateurs
indicators = {
    "NY.GDP.MKTP.CD": "PIB",
    "SI.POV.GINI": "GINI",
    "AG.LND.AGRI.ZS": "Part terres agricoles",
    "AG.LND.FRST.ZS": "Part terres foret",
}

# Récupérer les données pour chaque indicateur
data_frames = []
for indicator, name in indicators.items():
    data = fetch_worldbank_data(indicator, start_date="1960", end_date="2024")
    if data is not None:
        data["indicator"] = name  # Ajouter une colonne pour l'indicateur
        data_frames.append(data)

# Combiner toutes les données dans une table unique
merged_data = None
for df in data_frames:
    # Transformer la colonne 'value' pour avoir une colonne par indicateur
    indicator_name = df["indicator"].iloc[0]
    df = df.rename(columns={"value": indicator_name})
    df = df.drop(columns=["indicator"])
    if merged_data is None:
        merged_data = df
    else:
        merged_data = pd.merge(merged_data, df, on=["date", "country"], how="outer")

# Afficher le tableau final
print(merged_data.head())


NY.GDP.MKTP.CD - Nombre total de pages : 341
SI.POV.GINI - Nombre total de pages : 341
AG.LND.AGRI.ZS - Nombre total de pages : 341
AG.LND.FRST.ZS - Nombre total de pages : 341
   date           PIB                      country  GINI  \
0  1960           NaN                  Afghanistan   NaN   
1  1960  2.121696e+10  Africa Eastern and Southern   NaN   
2  1960  1.188413e+10   Africa Western and Central   NaN   
3  1960           NaN                      Albania   NaN   
4  1960  2.723615e+09                      Algeria   NaN   

   Part terres agricoles  Part terres foret  
0                    NaN                NaN  
1                    NaN                NaN  
2                    NaN                NaN  
3                    NaN                NaN  
4                    NaN                NaN  


In [6]:
merged_data

Unnamed: 0,date,PIB,country,GINI,Part terres agricoles,Part terres foret
0,1960,,Afghanistan,,,
1,1960,2.121696e+10,Africa Eastern and Southern,,,
2,1960,1.188413e+10,Africa Western and Central,,,
3,1960,,Albania,,,
4,1960,2.723615e+09,Algeria,,,
...,...,...,...,...,...,...
17019,2023,1.739630e+10,West Bank and Gaza,,,
17020,2023,1.054350e+14,World,,,
17021,2023,,"Yemen, Rep.",,,
17022,2023,2.816263e+10,Zambia,,,


In [7]:
# Affichage des pays présents dans le document
pays_bm = merged_data["country"].unique()
print(pays_bm)

['Afghanistan' 'Africa Eastern and Southern' 'Africa Western and Central'
 'Albania' 'Algeria' 'American Samoa' 'Andorra' 'Angola'
 'Antigua and Barbuda' 'Arab World' 'Argentina' 'Armenia' 'Aruba'
 'Australia' 'Austria' 'Azerbaijan' 'Bahamas, The' 'Bahrain' 'Bangladesh'
 'Barbados' 'Belarus' 'Belgium' 'Belize' 'Benin' 'Bermuda' 'Bhutan'
 'Bolivia' 'Bosnia and Herzegovina' 'Botswana' 'Brazil'
 'British Virgin Islands' 'Brunei Darussalam' 'Bulgaria' 'Burkina Faso'
 'Burundi' 'Cabo Verde' 'Cambodia' 'Cameroon' 'Canada'
 'Caribbean small states' 'Cayman Islands' 'Central African Republic'
 'Central Europe and the Baltics' 'Chad' 'Channel Islands' 'Chile' 'China'
 'Colombia' 'Comoros' 'Congo, Dem. Rep.' 'Congo, Rep.' 'Costa Rica'
 "Cote d'Ivoire" 'Croatia' 'Cuba' 'Curacao' 'Cyprus' 'Czechia' 'Denmark'
 'Djibouti' 'Dominica' 'Dominican Republic' 'Early-demographic dividend'
 'East Asia & Pacific' 'East Asia & Pacific (IDA & IBRD countries)'
 'East Asia & Pacific (excluding high income)' 'Ecu

Pour pouvoir merger les données de la banque mondiale qui sont en anglais avec celles de la FAO en français (les noms ne correspondent donc pas, impossible de merge tel quel), on utilise le package pycountry pour obtenir les codes pays iso 3166 

In [8]:
#%pip install 'pycountry'

import pycountry


# Fonction pour récupérer le code pays ISO 3166
def get_country_code(country_name):
    try:
        # Recherche dans pycountry
        country = pycountry.countries.lookup(country_name)
        return country.alpha_3  # Retourne le code à 3 lettres
    except LookupError:
        return None  # Si le pays n'est pas trouvé

# Ajouter une colonne 'code_pays' avec les codes ISO 3166
merged_data['code_pays'] = merged_data['country'].apply(get_country_code)

data_BM=merged_data
# Afficher le résultat
print(merged_data)


       date           PIB                      country  GINI  \
0      1960           NaN                  Afghanistan   NaN   
1      1960  2.121696e+10  Africa Eastern and Southern   NaN   
2      1960  1.188413e+10   Africa Western and Central   NaN   
3      1960           NaN                      Albania   NaN   
4      1960  2.723615e+09                      Algeria   NaN   
...     ...           ...                          ...   ...   
17019  2023  1.739630e+10           West Bank and Gaza   NaN   
17020  2023  1.054350e+14                        World   NaN   
17021  2023           NaN                  Yemen, Rep.   NaN   
17022  2023  2.816263e+10                       Zambia   NaN   
17023  2023  2.653827e+10                     Zimbabwe   NaN   

       Part terres agricoles  Part terres foret code_pays  
0                        NaN                NaN       AFG  
1                        NaN                NaN      None  
2                        NaN                NaN    

In [10]:
data_BM


Unnamed: 0,date,PIB,country,GINI,Part terres agricoles,Part terres foret,code_pays
0,1960,,Afghanistan,,,,AFG
1,1960,2.121696e+10,Africa Eastern and Southern,,,,
2,1960,1.188413e+10,Africa Western and Central,,,,
3,1960,,Albania,,,,ALB
4,1960,2.723615e+09,Algeria,,,,DZA
...,...,...,...,...,...,...,...
17019,2023,1.739630e+10,West Bank and Gaza,,,,
17020,2023,1.054350e+14,World,,,,
17021,2023,,"Yemen, Rep.",,,,
17022,2023,2.816263e+10,Zambia,,,,ZMB


In [11]:
# Export des données en csv
data_BM.to_csv('data_BM.csv', index=False)


In [1]:
data_BM["GINI"].mean()

NameError: name 'data_BM' is not defined

In [4]:
import pycountry

def traduire_nom_pays(nom_pays, langue='fr'):
    try:
        # Recherche du pays par nom
        country = pycountry.countries.get(name=nom_pays)
        if not country:
            return f"Le pays '{nom_pays}' n'a pas été trouvé."

        # Recherche de la traduction du nom du pays
        translations = pycountry.translations.get(country.alpha_2)
        if not translations:
            return f"Aucune traduction trouvée pour le pays '{nom_pays}'."

        translated_name = translations.get(langue)
        if not translated_name:
            return f"Aucune traduction trouvée pour le pays '{nom_pays}' en langue '{langue}'."

        return translated_name
    except Exception as e:
        return f"Une erreur s'est produite : {e}"

# Exemple d'utilisation
nom_pays = "Germany"
langue = "fr"
print(traduire_nom_pays(nom_pays, langue))  # Affiche "Allemagne"

Une erreur s'est produite : module 'pycountry' has no attribute 'translations'


In [None]:
import requests

def traduire_nom_pays_api(nom_pays, langue='fr'):
    try:
        # Utilisation de l'API Restcountries pour obtenir les informations sur le pays
        response = requests.get(f'https://restcountries.com/v3.1/name/{nom_pays}')
        if response.status_code != 200:
            return f"Le pays '{nom_pays}' n'a pas été trouvé."

        country_data = response.json()
        
        # Recherche de la traduction dans la langue donnée
        country_info = country_data[0]
        translations = country_info.get('translations', {})
        translated_name = translations.get(langue)

        if translated_name:
            return translated_name
        else:
            return f"Aucune traduction trouvée pour le pays '{nom_pays}' en langue '{langue}'."
    
    except Exception as e:
        return f"Une erreur s'est produite : {e}"

# Exemple d'utilisation
nom_pays = "Germany"
langue = "fr"
print(traduire_nom_pays_api(nom_pays, langue))  # Affiche "Allemagne"
