In [3]:
# import packages
import requests
import pandas as pd


Le Global Health Observatory (GHO) est une plateforme de données de l'OMS dédiée à la collecte, l’analyse et la diffusion des données de santé mondiales. 

## Création d'une fonction pour se connecter à l'API de l'OMS, récupérer les jeux de données et créer un dataframe

In [4]:
def get_indicator_data(url, columns=None):
    """
    Récupère et filtre les données d'un indicateur de l'OMS depuis l'API.

    Paramètres :
    - url (str) : URL de l'indicateur dans l'API de l'OMS.
    - columns (list, optionnel) : Liste des colonnes à conserver. Si None, conserve toutes les colonnes.

    Retourne :
    - pd.DataFrame : DataFrame avec les données récupérées et filtrées.
      Retourne None si la requête échoue.
    """
    # Effectuer la requête vers l'API
    response = requests.get(url)
    
    if response.status_code == 200:
        # Charger les données JSON dans un DataFrame
        data = response.json()
        df = pd.DataFrame(data['value'])
        
        # Filtrer les colonnes si une liste est fournie
        if columns:
            existing_columns = [col for col in columns if col in df.columns]
            df_filtered = df[existing_columns]
        else:
            # Conserver toutes les colonnes si 'columns' est None
            df_filtered = df
        
        # Supprimer les lignes entièrement vides (optionnel)
        df_filtered = df_filtered.dropna(how='all')
        
        return df_filtered
    else:
        # Afficher un message d'erreur si la requête échoue
        print("Erreur lors de la récupération des données.")
        return None



In [20]:
columns = ['SpatialDim', 'TimeDim', 'Value', 'NumericValue', 'Low', 'High',"Dim1"]

data_alcohol= get_indicator_data("https://ghoapi.azureedge.net/api/SA_0000001743",columns)


In [21]:
data_alcohol.columns

Index(['SpatialDim', 'TimeDim', 'Value', 'NumericValue', 'Low', 'High',
       'Dim1'],
      dtype='object')

In [22]:
data_alcohol.head(2)

Unnamed: 0,SpatialDim,TimeDim,Value,NumericValue,Low,High,Dim1
0,AUT,2019,2.2 [-0.2 - 4.4],2.20072,-0.1707,4.41506,SEX_FMLE
1,CPV,2019,13.2 [10.2 - 16.1],13.23164,10.2412,16.06331,SEX_MLE


In [28]:
# Renommer les colonnes pour qu'elles soient plus compréhensibles
noms_colonnes = {
    'SpatialDim': 'pays',
    'TimeDim': 'annee',
    'Dim1': 'sexe',
    'NumericValue': 'pourcentage_deces'
}

# Appliquer la sélection et le renommage sur le DataFrame
data_alcohol = data_alcohol[columns].rename(columns=noms_colonnes)



In [29]:
# Afficher un aperçu des données
data_alcohol.head()

Unnamed: 0,pays,annee,Value,pourcentage_deces,Low,High
0,AUT,2019,2.2 [-0.2 - 4.4],2.20072,-0.1707,4.41506
1,CPV,2019,13.2 [10.2 - 16.1],13.23164,10.2412,16.06331
2,BOL,2019,2.4 [1.5 - 3.6],2.37865,1.46098,3.60384
3,ROU,2019,8.8 [6.7 - 11.1],8.76505,6.6716,11.09415
4,CRI,2019,6.0 [4.1 - 8.2],6.01584,4.07295,8.20691


Création de la fonction pour appeler data_alcohol

In [None]:
def load_data_alcohol():
    """
    Charge et prépare les données sur les décès attribuables à l'alcool.
    """
    # URL de l'API pour les décès liés à l'alcool
    api_url = "https://ghoapi.azureedge.net/api/SA_0000001743"

    # Colonnes à extraire
    columns = ['SpatialDim', 'TimeDim', 'Value', 'NumericValue', 'Low', 'High',"Dim1"]

    # Charger les données depuis l'API
    data_alcohol = get_indicator_data(api_url, columns)

    # Renommer les colonnes pour les rendre plus compréhensibles
    noms_colonnes = {
        'SpatialDim': 'pays',
        'TimeDim': 'annee',
        'Value': 'valeur',
        'NumericValue': 'pourcentage_deces',
        'Low': 'borne_inferieure',
        'High': 'borne_superieure',
        "Dim1":"sexe"
    }
    data_alcohol = data_alcohol.rename(columns=noms_colonnes)

    # Nettoyer ou transformer les données si nécessaire (par exemple, retirer les valeurs nulles)
    data_alcohol = data_alcohol.dropna(subset=['pourcentage_deces'])

    return data_alcohol

## Fonction spécifique à un jeu de données

## Préparer les données venant de site Global Burden of Disease (GBD) / Pas d'api ici

Le site Global Burden of Disease (GBD) est une plateforme en ligne qui fournit des données et des analyses sur la santé mondiale, en particulier sur la charge mondiale de morbidité (global burden of disease). Ce projet, géré par l'Institute for Health Metrics and Evaluation (IHME) de l'Université de Washington, a pour but de quantifier l'impact des maladies, des blessures et des facteurs de risque dans le monde entier, en mesurant leur effet sur la mortalité et la qualité de vie.


In [None]:
# Evolution de chaque facteurs de risque
def load_evolution_facteurs(filepath="datas/evolution_chaque_facteurs/evolution_facteurs.csv"):
    import pandas as pd
    """Charge les données sur l'évolution des facteurs de risque."""
    return pd.read_csv(filepath, encoding="utf-8")  


In [104]:
data=load_evolution_facteurs()

In [105]:
data

Unnamed: 0,measure,location,sex,age,cause,rei,metric,year,val,upper,lower
0,Décès,Global,Homme,25 + ans,Toutes causes,"Eau, hygiène et assainissement",#,1990,5.575259e+05,9.127198e+05,312118.504077
1,Décès,Global,Femme,25 + ans,Toutes causes,"Eau, hygiène et assainissement",#,1990,5.903150e+05,9.953348e+05,317685.203782
2,Décès,Global,Les deux,25 + ans,Toutes causes,"Eau, hygiène et assainissement",#,1990,1.147841e+06,1.715821e+06,728883.867683
3,Décès,Global,Homme,25 + ans,Toutes causes,"Eau, hygiène et assainissement",%,1990,3.249086e-02,5.262791e-02,0.018058
4,Décès,Global,Femme,25 + ans,Toutes causes,"Eau, hygiène et assainissement",%,1990,3.976965e-02,6.721245e-02,0.021400
...,...,...,...,...,...,...,...,...,...,...,...
131643,Décès,Global,Femme,<70 ans,Toutes causes,Maltraitance de l’enfance,#,2021,2.187303e+03,4.713540e+03,345.270815
131644,Décès,Global,Les deux,<70 ans,Toutes causes,Maltraitance de l’enfance,#,2021,1.115561e+04,2.533907e+04,1935.625492
131645,Décès,Global,Homme,<70 ans,Toutes causes,Maltraitance de l’enfance,%,2021,4.450220e-04,1.017823e-03,0.000079
131646,Décès,Global,Femme,<70 ans,Toutes causes,Maltraitance de l’enfance,%,2021,1.711646e-04,3.765797e-04,0.000026
