# Assignment: Application Data visualisation avec des données Marocaines

<br>

### Objectifs du TP:

> **Création d une application Data visualisation**
  
![green-divider](https://user-images.githubusercontent.com/7065401/52071924-c003ad80-2562-11e9-8297-1c6595f8a7ff.png)

# Exploration et description du dataset

## Introduction
Ce notebook décrit le dataset utilisé pour l application de visualisation de données interactive. Le dataset provient des objectifs du millénaire pour le développement en Afrique, avec un focus particulier sur les données marocaines.

## Chargement du dataset
python

In [2]:
import pandas as pd

## Lire le fichier Excel

In [3]:
file_path = r'C:\Users\Dell\Downloads\africa-millennium-development-goals.xlsx'
df = pd.read_excel(file_path)

## Afficher les premières lignes du dataset

In [4]:
print(df.head())

  CountryName  Country                        GoalName        Goal  \
0       Kenya       25  Goal 4: Reduce child mortality  KN.1000030   
1       Kenya       25  Goal 4: Reduce child mortality  KN.1000030   
2       Kenya       25  Goal 4: Reduce child mortality  KN.1000030   
3       Kenya       25  Goal 4: Reduce child mortality  KN.1000030   
4       Kenya       25  Goal 4: Reduce child mortality  KN.1000030   

                                IndicatorName  Indicator Social GroupName  \
0  Infant mortality rate per 1000 live births   20267305            Women   
1  Infant mortality rate per 1000 live births   20267305            Women   
2  Infant mortality rate per 1000 live births   20267305            Women   
3  Infant mortality rate per 1000 live births   20267305            Women   
4  Infant mortality rate per 1000 live births   20267305            Women   

   Social Group  Units  Scale Frequency        Date  Value  
0      20136705    NaN      1         A  1990-01-01  12

## Afficher les colonnes disponibles

In [5]:
print(df.columns)

Index(['CountryName', 'Country', 'GoalName', 'Goal', 'IndicatorName',
       'Indicator', 'Social GroupName', 'Social Group', 'Units', 'Scale',
       'Frequency', 'Date', 'Value'],
      dtype='object')


## Description du dataset
python

In [6]:
df.describe()

Unnamed: 0,Country,Indicator,Social Group,Units,Scale,Value
count,10610.0,10610.0,10610.0,0.0,10610.0,10610.0
mean,27.962677,20267660.0,20137020.0,,1.0,6365.211
std,15.145405,1734.153,163.0599,,0.0,129894.2
min,1.0,20265000.0,20136600.0,,1.0,0.0
25%,14.0,20266400.0,20137000.0,,1.0,10.5
50%,30.0,20267300.0,20137100.0,,1.0,39.4
75%,39.0,20269300.0,20137100.0,,1.0,73.1
max,53.0,20270700.0,20137100.0,,1.0,4366048.0


## Informations sur les données
python

In [7]:
df.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 10610 entries, 0 to 10609
Data columns (total 13 columns):
 #   Column            Non-Null Count  Dtype  
---  ------            --------------  -----  
 0   CountryName       10610 non-null  object 
 1   Country           10610 non-null  int64  
 2   GoalName          10610 non-null  object 
 3   Goal              10610 non-null  object 
 4   IndicatorName     10610 non-null  object 
 5   Indicator         10610 non-null  int64  
 6   Social GroupName  10610 non-null  object 
 7   Social Group      10610 non-null  int64  
 8   Units             0 non-null      float64
 9   Scale             10610 non-null  int64  
 10  Frequency         10610 non-null  object 
 11  Date              10610 non-null  object 
 12  Value             10610 non-null  float64
dtypes: float64(2), int64(4), object(7)
memory usage: 1.1+ MB


# Création de l'application de visualisation avec Bokeh

Pour cette étape, nous allons créer une application de visualisation interactive avec Bokeh. Nous allons inclure plusieurs graphiques et interactions.

## Installer Bokeh

In [8]:
!pip install pandas bokeh



## Importation du bibliothéque

In [16]:
from bokeh.io import output_notebook, show, curdoc
from bokeh.layouts import column, row
from bokeh.models import ColumnDataSource, Select
from bokeh.models import CustomJS
from bokeh.plotting import figure
from bokeh.io import push_notebook

In [None]:
## Configuration du Bokeh pour fonctionner dans le notebook

In [17]:
output_notebook()

## Utilisation des noms de colonnes corrects

In [18]:
x_column = 'Date'
y_column = 'Value'

## Création d une source de données pour Bokeh

In [19]:
source = ColumnDataSource(df)

## Création des graphiques de base

In [20]:
p1 = figure(title="Graphique 1", x_axis_label='Date', y_axis_label='Valeur', x_axis_type='datetime')
p1.line(x=x_column, y=y_column, source=source, line_width=2)

p2 = figure(title="Graphique 2", x_axis_label='Date', y_axis_label='Valeur', x_axis_type='datetime')
p2.line(x=x_column, y=y_column, source=source, line_width=2, color="green")

## Création d une sélection pour l'interactivité

In [21]:
select = Select(title="Sélectionner une colonne", options=list(df.columns), value=y_column)

## Mettre à jour la source de données en fonction de la sélection en utilisant CustomJS

In [22]:
select.js_on_change('value', CustomJS(args=dict(source=source, df=df.to_dict('list'), p2=p2), code="""
    var selected_column = cb_obj.value;
    var data = source.data;
    data['y'] = df[selected_column];
    source.change.emit();
    p2.title.text = "Graphique 2 - " + selected_column;
"""))

## Disposition des éléments du tableau de bord

In [23]:
layout = column(select, row(p1, p2))

## Affichage de layout dans le notebook

In [24]:
show(layout, notebook_handle=True)