# ANIP - Challenge 1 – Visualisation de Données

# Tâche 2 : Exploration & Analyse

Cette tâche vise à transformer un dataset consolidé en un support d’analyse riche et pertinent, en combinant rigueur statistique, créativité analytique et préparation pour un usage décisionnel (Power BI).
cette tache necessite maîtrise de l’analyse exploratoire, la détection d’anomalies, la création d’indicateurs dérivés, et la structuration de données prêtes pour un tableau de bord interactif.

In [None]:
import pandas as pd 
import numpy as np 
import matplotlib.pyplot as plt 
import seaborn as sns 
import plotly.express as px
import plotly.graph_objects as go
import geopandas as gpd

## Importation de toutes les bases de données 

In [None]:
data_pib=pd.read_excel("../data/PIB_benin.xlsx")

In [None]:
data_pib

# Economie du Benin 

In [None]:
data_pib["year"].unique()

In [None]:

# Réorganisation : passage du format large au format long
data_pib_long = data_pib.melt(
    id_vars=['year'],      # colonne contenant les libellés des indicateurs
    var_name='annee',      # nouvelle colonne pour les années
    value_name='valeur'    # nouvelle colonne pour les valeurs
)

# Conversion du type année en entier
data_pib_long['annee'] = data_pib_long['annee'].astype(int)

# Vérification du résultat
print(data_pib_long.head())



In [None]:
data_pib_long

In [None]:
data_pib_long.columns=["Indicateur","Annee","Valeur"]

In [None]:
data_pib_long

In [None]:
data_pib_long.to_excel("PIB_Benin_final.xlsx")

In [None]:
# Séparer les deux indicateurs
data_croissance = data_pib_long[data_pib_long['Indicateur'].str.contains("Percent change")]
data_pib_valeur = data_pib_long[data_pib_long['Indicateur'].str.contains("Per capita")]


In [None]:
import matplotlib.pyplot as plt
import seaborn as sns

# Séparer passé et prévisions
data_croissance_passee = data_croissance[data_croissance['Annee'] < 2025]
data_croissance_previsions = data_croissance[data_croissance['Annee'] >= 2025]

plt.figure(figsize=(10,5))

# Tracer la partie passée
sns.lineplot(
    data=data_croissance_passee,
    x='Annee',
    y='Valeur',
    marker='o',
    color='blue',
    label='Historique'
)

# Tracer la partie prévisions
sns.lineplot(
    data=data_croissance_previsions,
    x='Annee',
    y='Valeur',
    marker='o',
    color='orange',
    label='Prévisions'
)

plt.title("Taux de croissance du PIB du Bénin (1989-2030)")
plt.xlabel("Année")
plt.ylabel("Taux de croissance (%)")
plt.grid(True)
plt.legend()
plt.savefig("graphique_PIB.jpg", dpi=300)  # meilleure résolution
plt.show()



## Analyse de l'évolution du PIB du Bénin (1989-2030)

### Tendances macroéconomiques significatives

La visualisation du taux de croissance du PIB béninois sur la période 1989-2030 révèle plusieurs enseignements majeurs :

**Transformation structurelle de l'économie**
- La trajectoire montre une transition d'une économie volatile vers une croissance plus stable et soutenue
- Les années 1990 présentent des fluctuations importantes, reflétant les ajustements structurels
- À partir des années 2000, on observe une consolidation progressive de la croissance

**Performance économique remarquable**
- Le pic de croissance de 1990 (+8,98%) correspond très probablement aux effets des réformes économiques post-adjustement structurel
- La période récente (2021-2030) affiche une croissance robuste autour de 6%, supérieure à la moyenne régionale
- Cette performance soutenue témoigne de la résilience de l'économie béninoise

**Perspectives optimistes mais réalistes**
- Les projections jusqu'en 2030 anticipent une croissance maintenue autour de 6%
- Cette trajectoire positionne le Bénin parmi les économies les plus dynamiques d'Afrique de l'Ouest
- La stabilité des prévisions suggère une confiance des institutions dans les fondamentaux économiques du pays

### Implications politiques et économiques

**✅ Points forts :**
- Transition réussie vers une croissance stable
- Capacité à maintenir une dynamique positive sur le long terme
- Attractivité confirmée pour les investissements

**⚠️ Défis à surveiller :**
- Nécessité de diversifier les sources de croissance au-delà des secteurs traditionnels
- Importance de transformer la croissance en développement inclusif
- Besoin d'adaptation face aux chocs externes (climat, prix des matières premières)

*Cette analyse souligne le parcours remarquable du Bénin, qui s'est imposé comme un modèle de stabilité et de croissance en Afrique de l'Ouest.*

In [None]:
# Séparer passé et prévisions
data_pib_valeur_passee = data_pib_valeur[data_pib_valeur['Annee'] < 2025]
data_pib_valeur_previsions = data_pib_valeur[data_pib_valeur['Annee'] >= 2025]

plt.figure(figsize=(10,5))

# Tracer la partie passée
sns.lineplot(
    data=data_pib_valeur_passee,
    x='Annee',
    y='Valeur',
    marker='o',
    color='green',
    label='Historique'
)

# Tracer la partie prévisions
sns.lineplot(
    data=data_pib_valeur_previsions,
    x='Annee',
    y='Valeur',
    marker='o',
    color='red',
    label='Prévisions'
)

plt.title("PIB par habitant du Bénin (PPA, 1989-2030)")
plt.xlabel("Année")
plt.ylabel("PIB par habitant (dollars PPA)")
plt.grid(True)
plt.legend()
plt.savefig("graphique_PIB_hbt.jpg", dpi=300)  # meilleure résolution
plt.show()


## Analyse du PIB par habitant du Bénin (PPA 1989-2030)

### Évolution du niveau de vie et du pouvoir d'achat

**Croissance soutenue du niveau de vie**
- La courbe montre une progression constante et significative du PIB par habitant sur l'ensemble de la période
- Une accélération notable est observable à partir des années 2010, témoignant d'une amélioration tangible des conditions de vie
- La méthode de calcul en parité de pouvoir d'achat (PPA) permet une comparaison internationale plus réaliste du niveau de vie réel

**Transformation économique structurelle**
- La période 1989-2000 reflète une phase de consolidation après les ajustements structurels
- Les décennies 2000-2020 montrent une croissance régulière, signe d'une économie en maturation
- Les projections 2020-2030 anticipent une poursuite de cette tendance positive

**Impact sur le développement humain**
- Cette progression du PIB/habitant traduit une amélioration globale du pouvoir d'achat
- Elle reflète les effets cumulés de la croissance économique et des politiques de redistribution
- Le passage à une économie plus diversifiée et résiliente se matérialise dans ces chiffres

### Perspectives et enjeux de développement

**Réussites économiques :**
- Rattrapage économique constant depuis 30 ans
- Capacité à transformer la croissance macroéconomique en amélioration du niveau de vie
- Résilience face aux chocs externes et internationaux

**Défis pour la période 2020-2030 :**
- Assurer que la croissance bénéficie à l'ensemble de la population
- Maintenir cette trajectoire malgré les incertitudes globales
- Renforcer la transformation structurelle vers des activités à plus forte valeur ajoutée

*Cette évolution positive positionne le Bénin sur une trajectoire de développement durable et inclusif, avec des perspectives encourageantes pour la décennie à venir.*

## Tendances démographiques 

In [None]:
data_population=pd.read_excel("../data/donnees_benin_population.xlsx")
data_population_projections=pd.read_excel("../data/donnees_benin_population_projections.xlsx")

In [None]:
data_population

In [None]:
data_population_projections

In [None]:
data_population.info()

In [None]:
data_population.dtypes

In [None]:
data_population.describe()

In [None]:
variables_importantes = [
    'annee',
    'population_totale_milliers',
    'densite_population_personnes_km2',
    'age_median_ans',
    'taux_fertilite_total',
    'taux_brut_natalite_pour_1000',
    'esperance_vie_ans',
    'mortalite_infantile_pour_1000',
    'taux_croissance_population_pourcentage'
]

data_population = data_population[variables_importantes]


In [None]:
data_population.to_excel("data_population_final.xlsx")

In [None]:
data_population.to_csv("data_population_final.csv")

In [None]:
data_population.columns

In [None]:
variables = [
    'population_totale_milliers',
    'densite_population_personnes_km2',
    'age_median_ans',
    'taux_fertilite_total',
    'taux_brut_natalite_pour_1000',
    'esperance_vie_ans',
    'mortalite_infantile_pour_1000',
    'taux_croissance_population_pourcentage'
]

In [None]:


fig = go.Figure()

# Ajouter toutes les variables comme traces mais invisibles sauf la première
for i, var in enumerate(variables):
    fig.add_trace(go.Scatter(
        x=data_population['annee'],
        y=data_population[var],
        mode='lines+markers',
        name=var,
        visible=(i==0)  # seulement la première visible au départ
    ))

# Créer le menu déroulant
buttons = []
for i, var in enumerate(variables):
    visible = [False]*len(variables)
    visible[i] = True
    buttons.append(dict(label=var,
                        method="update",
                        args=[{"visible": visible},
                              {"title": f"Évolution de {var} au Bénin (1950-2023)",
                               "yaxis": {"title": var}}]))

fig.update_layout(
    updatemenus=[dict(active=0, buttons=buttons, x=1.5, y=0.8)],
    title=f"Évolution de {variables[0]} au Bénin (1950-2023)",
    xaxis_title="Année",
    yaxis_title=variables[0],
    template="plotly_white",
    width=900,
    height=500
)

fig.show()


# Analyse des Graphiques Démographiques du Bénin

Voici une analyse détaillée de chaque graphique fourni, basée sur les tendances visibles et complétée par des données et explications issues de sources fiables. Les graphiques couvrent la période de 1960 à 2023. La population du Bénin ne  fait que  croître depuis 1960 , atteignant environ 14,1 millions en 2023, avec un taux de croissance annuel de 2,52 %. Les analyses incluent les causes potentielles des changements, les impacts socio-économiques et des corrélations avec d'autres indicateurs.



## 1. Population Totale (en milliers)

Nous constatons  une croissance exponentielle de la population totale, passant d'environ 2 400 milliers (2,4 millions) en 1960 à plus de 14 000 milliers (14 millions) en 2023.

- **Tendances principales** : Croissance lente dans les années 1960-1970 (0,43 % à 1,09 % par an), puis accélération à partir des années 1980, quadruplant la population depuis l'indépendance.  
- **Raisons** : Fertilité élevée, amélioration de la santé, urbanisation croissante. La population rurale représente encore 52 % en 2023.  
- **Impacts** : Pression sur les ressources, chômage, migration vers les villes, mais potentiel de dividende démographique si investissements en éducation et emploi.



## 2. Densité de Population (personnes par km²)

Le graphique illustre une augmentation progressive de la densité, de 20 personnes/km² en 1960 à 120 en 2020.

- **Tendances principales** : Densité doublant presque tous les 30 ans, plus élevée au sud.  
- **Raisons** : Urbanisation rapide et migration interne vers le sud.  
- **Impacts** : Pression sur les infrastructures, déforestation, vulnérabilité au changement climatique.



## 3. Âge Médian (en ans)

L'âge médian diminue de 23 ans en 1960 à environ 16 ans vers 2000, puis remonte à 18 ans vers 2020.

- **Tendances principales** : Population jeune (43 % sous 15 ans en 2019), "youth bulge" de 47,8 %.  
- **Raisons** : Haute natalité, mortalité infantile en déclin, amélioration de l'éducation.  
- **Impacts** : Défis en emploi et éducation, potentiel de croissance économique si harnessé.



## 4. Taux de Fertilité Total

Le taux augmente de 6 en 1960 à un pic de 7 vers 1980, puis décline à 4,5 en 2020.

- **Tendances principales** : Pic années 1970-1980, baisse modeste ensuite.  
- **Raisons** : Urbanisation, éducation des femmes, accès aux contraceptifs.  
- **Impacts** : Réduction de la pression démographique, mais croissance rapide persistante.



## 5. Taux Brut de Natalité (pour 1000)

Augmente à un pic de 47 vers 1980, puis décline à 35 en 2020.

- **Tendances principales** : Pic post-indépendance suivi d’une baisse progressive.  
- **Raisons** : Fertilité initiale élevée, puis déclin via éducation et santé reproductive.  
- **Impacts** : Maintien d’une population jeune nécessitant des services sociaux.



## 6. Espérance de Vie (en ans)

Augmente linéairement de 35 en 1960 à 60 en 2020.

- **Tendances principales** : Gain de 25 ans, accélération post-1990.  
- **Raisons** : Vaccins, accès à l'eau potable, éducation, aide internationale.  
- **Impacts** : Population plus productive, défis liés aux maladies chroniques.



## 7. Mortalité Infantile (pour 1000)

Décline de 220 en 1960 à 60 en 2020.

- **Tendances principales** : Baisse constante, progrès accélérés post-1990.  
- **Raisons** : Vaccinations, soins prénataux, éducation maternelle, réduction des infections.  
- **Impacts** : Augmentation de la survie infantile, mais inégalités persistantes.



## 8. Taux de Croissance de la Population (en pourcentage)

Augmente de 1 % à 3 %, avec un pic abrupt à 5 % vers 1990, puis décline à 2 %.

- **Tendances principales** : Croissance stable autour de 3 % dans les années 1990-2000.  
- **Raisons** : Fertilité en déclin, ajustements censitaires.  
- **Impacts** : Croissance rapide augmente la pauvreté, mais décélération favorise la durabilité.



## 9. Tableau récapitulatif des indicateurs

| Indicateur | Valeur 1960 | Valeur 2020 | Changement Principal | Raison Principale |
|------------|-------------|-------------|--------------------|-----------------|
| Population Totale | ~2,4M | ~13M | x5 | Fertilité élevée, mortalité en baisse |
| Densité | ~20/km² | ~110/km² | x5,5 | Urbanisation |
| Âge Médian | 23 ans | 18 ans | -5 ans | Population jeune |
| Fertilité | 6 | 4,5 | -2,5 | Éducation des femmes |
| Natalité | ~41/1000 | ~35/1000 | -6/1000 | Contrôle des naissances |
| Espérance de Vie | 35 ans | 60 ans | +25 ans | Améliorations sanitaires |
| Mortalité Infantile | 220/1000 | 60/1000 | -160/1000 | Vaccins et soins |
| Croissance | ~1% | ~2,5% | Variable | Transition démographique |



Ces tendances indiquent une **transition démographique en cours au Bénin**, avec des opportunités pour une **croissance inclusive** si accompagnée d'investissements en éducation et santé.


# Base sociale et environnementale

In [None]:
data_so_env=pd.read_excel("../data/indicateurs_sociaux.xlsx")

In [None]:
data_so_env

In [None]:
data_so_env=data_so_env[["year","Carbon dioxide emissions per capita (production) (tonnes)"]]

In [None]:
data_so_env

In [None]:
data_so_env.columns=["Annee","production_co2_tonnes"]

In [None]:
data_so_env

Finalement  cette base contient que le taux d'emission du C02 

In [None]:


# Filtrer les années pour chaque base
data_pib_filtered = data_pib_long[(data_pib_long['Annee'] >= 1990) & (data_pib_long['Annee'] <= 2023)]
data_so_env_filtered = data_so_env[(data_so_env['Annee'] >= 1990) & (data_so_env['Annee'] <= 2023)]

# Pivot la base PIB pour avoir chaque indicateur en colonne (optionnel selon ton usage)
data_pib_wide = data_pib_filtered.pivot(index='Annee', columns='Indicateur', values='Valeur').reset_index()

# Fusionner avec la base environnementale sur la colonne 'Annee'
data_pib_co2 = pd.merge(data_pib_wide, data_so_env_filtered, on='Annee', how='inner')

# Afficher le résultat



In [None]:
data_pib_co2.head()

In [None]:
# Renommer les colonnes
data_pib_co2.rename(columns={
    'Annee': 'Annee',
    'Gross domestic product (GDP), Constant prices, Per capita, purchasing power parity (PPP) international dollar, ICP benchmark 2021': 'PIB_per_capita_PPA',
    'Gross domestic product (GDP), Constant prices, Percent change': 'PIB_croissance',
    'production_co2_tonnes': 'CO2_tonnes'
}, inplace=True)

# Afficher le résultat
print(data_pib_co2.head())


In [None]:
data_pib_co2

In [None]:
fig = px.line(
    data_pib_co2,
    x="Annee",
    y="CO2_tonnes",
    title="Évolution de la production de CO2 par an",
    labels={"Annee": "Années", "CO2_tonnes": "Production de CO2 (tonnes)"}
)

fig.show()

In [None]:

plt.figure(figsize=(10, 6))

# Tracer la courbe
plt.plot(
    data_pib_co2["Annee"],
    data_pib_co2["CO2_tonnes"],
    marker='o',
    linestyle='-',
    linewidth=2,
    color='royalblue',
    label="Production de CO₂"
)

# Titre et labels
plt.title("Évolution de la production de CO₂ par an", fontsize=14, fontweight='bold')
plt.xlabel("Années", fontsize=12)
plt.ylabel("Production de CO₂ (tonnes)", fontsize=12)

# Grille et légende
plt.grid(True, linestyle='--', alpha=0.6)
plt.legend()

# Affichage
plt.tight_layout()
plt.savefig("evolution_CO2_matplotlib.png", dpi=300, bbox_inches='tight')

plt.show()


# Analyse de l'Évolution de la Production de CO2 au Bénin (1990-2023)

Le graphique ci-dessus illustre l’évolution annuelle de la production de CO2 au Bénin entre 1990 et 2023. La série est mesurée en tonnes par habitant.

## Tendances générales
- **Croissance progressive** : La production de CO2 augmente lentement entre 1990 et 2000, passant d’environ 0,11 tonnes à 0,21 tonnes par habitant.
- **Accélération post-2000** : Une hausse plus rapide est observée à partir de 2000, avec des pics ponctuels autour de 2006-2010.
- **Stabilisation récente** : Après 2015, la production semble se stabiliser autour de 0,44 à 0,48 tonnes par habitant, avec une légère baisse vers 2023.

## Explications possibles
- L’augmentation des émissions jusqu’en 2010 peut être attribuée à la croissance économique, l’industrialisation et l’urbanisation rapide, entraînant une plus grande consommation d’énergie.
- La stabilisation récente pourrait être liée à des politiques environnementales, à l’efficacité énergétique, ou à un ralentissement de certaines activités industrielles.
- Les fluctuations ponctuelles peuvent correspondre à des variations dans la production industrielle ou dans la consommation énergétique des ménages.

## Impacts
- La hausse continue des émissions est un indicateur des pressions environnementales croissantes, pouvant affecter la qualité de l’air et contribuer au changement climatique.
- La stabilisation récente est encourageante, mais un suivi et des mesures supplémentaires sont nécessaires pour réduire les émissions par habitant à long terme.

## Synthèse
La production de CO2 au Bénin montre une tendance globale à la hausse jusqu’au milieu des années 2010, suivie d’une phase de stabilisation. Cela reflète l’équilibre entre la croissance économique et les efforts de limitation des émissions. Des politiques plus strictes et des énergies renouvelables pourraient accélérer la réduction future.


In [None]:
data_pib_co2.to_excel("PIB_CO2_production.xlsx")

In [None]:
data_pib_co2.to_csv("PIB_CO2_production.csv")

# Base EHCVM

In [None]:
data_ehcvm=pd.read_excel("../data/base_menage_indivdu_merged.xlsx")

In [None]:
data_ehcvm

ci dessous un rappel des différentes variables et de leurs des  variables : 

## Variables d'identification
| Variable | Description |
|-----------|--------------|
| **hhid** | Identifiant unique du ménage. |
| **grappe** | Numéro de la grappe (unité primaire de sondage). |
| **menage** | Numéro du ménage à l’intérieur de la grappe. |
| **numind** | Numéro de l’individu au sein du ménage. |
| **zae** | Zone d’agriculture ou d’échantillonnage économique. |
| **zaemil** | Milieu de résidence (urbain ou rural) associé à la zone d’échantillonnage. |
| **departement** | Département administratif de résidence. |
| **commune** | Commune de résidence. |
| **arrondissement** | Arrondissement de résidence. |
| **milieu** | Type de milieu : 1 = Urbain, 2 = Rural. |
| **hhweight** | Poids du ménage (poids d’échantillonnage). |
| **resid** | Statut de résidence (résident habituel ou visiteur). |
## Caractéristiques démographiques
| Variable | Description |
|-----------|--------------|
| **sexe** | Sexe de l’individu : 1 = Homme, 2 = Femme. |
| **age** | Âge de l’individu en années révolues. |
| **lien** | Lien de parenté avec le chef de ménage. |
| **religion** | Religion principale déclarée. |
| **nation** | Nationalité de l’individu. |

## Éducation
| Variable | Description |
|-----------|--------------|
| **ea** | Fréquentation actuelle ou passée d’un établissement d’enseignement. |
| **em** | Niveau ou cycle d’enseignement fréquenté. |
| **ej** | Dernier niveau d’études atteint. |
| **alfa** | Sait lire ou écrire dans une langue donnée. |
| **alfa2** | Alphabétisation dans une deuxième langue. |
| **scol** | Statut scolaire (actuellement scolarisé ou non). |
| **educ_hi** | Niveau d’éducation le plus élevé atteint. |
| **diplome** | Diplôme le plus élevé obtenu. |

## Santé
| Variable | Description |
|-----------|--------------|
| **mal30j** | A eu une maladie ou blessure au cours des 30 derniers jours. |
| **arrmal** | A dû interrompre ses activités à cause d’une maladie. |
| **hos12m** | A été hospitalisé au cours des 12 derniers mois. |
| **couvmal** | Dispose d’une couverture maladie (assurance, mutuelle, etc.). |
| **moustiq** | Utilisation d’une moustiquaire (oui/non). |

## Emploi et activité
| Variable | Description |
|-----------|--------------|
| **activ7j** | A eu une activité économique au cours des 7 derniers jours. |
| **activ12m** | A travaillé au cours des 12 derniers mois. |
| **emploi_sec** | Secteur d’emploi principal (agricole, informel, formel, etc.). |
| **bank** | Détient un compte bancaire ou mobile money. |

## Logement et conditions de vie
| Variable | Description |
|-----------|--------------|
| **logem** | Type de logement occupé. |
| **mur** | Matériau principal des murs. |
| **toit** | Matériau principal du toit. |
| **sol** | Matériau principal du sol. |
| **eauboi_ss** | Source principale d’eau de boisson (saison sèche). |
| **eauboi_sp** | Source principale d’eau de boisson (saison pluvieuse). |
| **elec_ac** | Accès à l’électricité à courant alternatif. |
| **elec_ur** | Source d’électricité (réseau urbain/rural). |
| **elec_ua** | Autre type de source électrique (générateur, solaire, etc.). |
| **ordure** | Méthode principale d’évacuation des ordures ménagères. |
| **toilet** | Type de toilettes utilisées par le ménage. |
| **eva_toi** | Mode d’évacuation des eaux usées des toilettes. |
| **eva_eau** | Mode d’évacuation des eaux ménagères. |

## Biens et équipements
| Variable | Description |
|-----------|--------------|
| **tv** | Possession d’un téléviseur. |
| **fer** | Possession d’un fer à repasser. |
| **frigo** | Possession d’un réfrigérateur. |
| **cuisin** | Possession d’une cuisinière ou gazinière. |
| **ordin** | Possession d’un ordinateur. |
| **decod** | Possession d’un décodeur TV. |
| **car** | Possession d’une voiture. |
| **grosrum** | Possession d’un gros ruminant (bovins). |
| **petitrum** | Possession d’un petit ruminant (ovins/caprins). |
| **porc** | Possession de porcs. |
| **lapin** | Possession de lapins. |
| **volail** | Possession de volailles. |

## Modules additionnels (sécurité, violences, etc.)
| Variable | Description |
|-----------|--------------|
| **sh_id_demo** | Identifiant du module démographique. |
| **sh_co_natu** | A subi des catastrophes naturelles. |
| **sh_co_eco** | A subi des chocs économiques. |
| **sh_id_eco** | Identifiant du module économique. |
| **sh_co_vio** | A subi des violences ou insécurités. |
| **sh_co_oth** | A subi d’autres types de chocs. |


In [None]:


# === Distribution de l'âge ===
plt.figure(figsize=(8,4))
sns.histplot(data_ehcvm['age'], bins=50, kde=True, color='blue')
plt.title("Distribution de l'âge des individus")
plt.xlabel("Âge (années)")
plt.ylabel("Effectif")
plt.savefig("age.png", dpi=300, bbox_inches='tight')
plt.show()




In [None]:
data_ehcvm['age'].describe()

la population Beninoise est majoritairement jejune avec un age moyen de 22 ans . La moitié de la population Beninoise a moins de 17 . Cette jeunesse de la population répresente a la fois de nombreuses potentialités et de nombreux défis . 

In [None]:
# === Répartition par sexe ===
fig = px.pie(data_ehcvm, names='sexe', title="Répartition par sexe", hole=0.3)
fig.show()



In [None]:
# === Niveau d’éducation le plus élevé atteint ===
edu_counts = data_ehcvm['educ_hi'].value_counts(normalize=True)*100
fig = px.bar(edu_counts, x=edu_counts.index, y=edu_counts.values,
             title="Répartition du niveau d'éducation le plus élevé",
             labels={'x': 'Niveau d’éducation', 'y': 'Pourcentage (%)'})
fig.show()




In [None]:
edu_counts

Près de la moitié de la population n'est pas éduqué et seulement 2% a atteint un niveau superieur  ce qui represente un gros défis  pour le domaine de l'éducation 

In [None]:
# === Accès à l’électricité ===
fig = px.pie(data_ehcvm, names='elec_ac', title="Accès à l’électricité (Oui/Non)")
fig.show()

Plus de la moitié de la population n'a pas accès  à l'electricité 
Fracture énergétique majeure : Plus des 2/3 de la population privée d'électricité
Taux d'accès très faible : Moins d'un tiers des ménages électrifiés
Écart significatif avec les objectifs de développement durable


### Impacts Socio-Économiques

**Effets sur le Développement Humain :**
- **Limitation de l'éducation** : Difficultés pour étudier après la tombée de la nuit
- **Santé compromise** : Absence de réfrigération pour les médicaments et vaccins
- **Productivité réduite** : Activités économiques limitées aux heures diurnes

**Conséquences Économiques :**
- **Entreprises handicapées** : Pas d'énergie pour les outils modernes
- **Fracture numérique** : Accès limité aux technologies de l'information
- **Développement industriel** entravé par le manque d'infrastructure énergétique



In [None]:
# === Activité économique ===
fig = px.histogram(data_ehcvm, x='internet', title="Disponibilité d'internet par milieu de résidence",
                   color='milieu', barmode='group')
fig.show()

Nous remarquons que les habitants du milieu urbain dispose plus d'internet que ceux du milieu Rural ce qui montre une fracture en terme de connectivité . 

In [None]:


# === Biens et équipements ===
assets = ['tv', 'frigo', 'cuisin', 'ordin', 'car']

# Calcul du taux de possession (en %)
df_assets = data_ehcvm[assets].mean().sort_values(ascending=False) * 100
df_assets = df_assets.reset_index()
df_assets.columns = ['Bien', 'Taux_possession']

# Création du graphique interactif avec Plotly
fig = px.bar(
    df_assets,
    x='Bien',
    y='Taux_possession',
    text='Taux_possession',
    color='Bien',
    color_discrete_sequence=px.colors.sequential.Viridis,  # ✅ correction ici
    title='Taux de possession de biens durables (%)'
)

# Personnalisation du rendu
fig.update_traces(texttemplate='%{text:.1f}%', textposition='outside')
fig.update_layout(
    xaxis_title="Biens",
    yaxis_title="Pourcentage (%)",
    plot_bgcolor='white',
    showlegend=False
)

# Affichage
fig.show()


# Analyse : Taux de possession de biens durables au Bénin

## Description du graphique
Ce graphique présente le pourcentage de ménages possédant différents types de biens durables au Bénin.

## Données observées

| Bien durable | Taux de possession (%) |
|--------------|----------------------|
| Télévision (tv) | 23% |
| Réfrigérateur (frigo) | ~3.6% |
| Voiture (car) | ~3.3% |
| Ordinateur (ordin) | ~2.2% |
| Cuisinière (cuisin) | ~1.8% |

## Analyse des résultats

### Biens les plus répandus
- **La télévision** est un bien durable un peu plus répandu 
- **Le réfrigérateur** arrive en deuxième position

### Biens moins courants
- **La voiture** et **l'ordinateur** ont des taux de possession faibles
- **La cuisinière** est un bien le moins répandu (moins de 2%)

## Interprétation socio-économique

1. **Niveau de vie** : Les faibles pourcentages indiquent un niveau de vie modeste dans l'ensemble
2. **Accès à l'électricité** : La possession de biens électriques suggère des limitations dans l'accès à l'énergie
3. **Fracture numérique** : Le faible taux d'ordinateurs (2-3%) reflète une faible pénétration du numérique
4. **Mobilité** : Le taux très bas de possession de voitures indique des modes de transport alternatifs dominants

## Perspective
Ces données illustrent les défis de développement auxquels fait face le Bénin en matière d'équipement des ménages et d'accès aux technologies modernes.

In [None]:
fig = px.pie(
    data_ehcvm,
    names='couvmal',
    title='Couverture maladie (assurance, mutuelle, etc.)',
    color_discrete_sequence=px.colors.qualitative.Safe
)
fig.show()


Rares sont les individus disposant d'une couverture maladie 

# Agrégations par région/commune

In [None]:
agg_sante = data_ehcvm.groupby(['departement']).agg({
    'couvmal': lambda x: (x == 1).mean() * 100,  # Couverture maladie
    'moustiq': lambda x: (x == 1).mean() * 100  # Utilisation moustiquaire
})

In [None]:
agg_sante

In [None]:
# 4. INDICATEURS D'EMPLOI
agg_bank = data_ehcvm.groupby(['departement']).agg({
    'bank': lambda x: (x == 1).mean() * 100    # Bancarisation
})

In [None]:
agg_bank

In [None]:
agg_bank = agg_bank.reset_index().rename(columns={'index': 'departement'})
agg_bank['departement'] =agg_bank['departement'].str.capitalize()

In [None]:
agg_bank

In [None]:
agg_merged = pd.merge(agg_sante, agg_bank, on='departement', how='inner')

# Sauvegarder pour Power BI
agg_merged.to_csv("agg_sante_bank.csv", index=False)

In [None]:
agg_merged

In [None]:

benin_map = gpd.read_file("../data/gadm41_BEN_shp/gadm41_BEN_1.shp")

In [None]:
benin_map

In [None]:
benin_map = benin_map.merge(agg_bank, left_on='NAME_1', right_on='departement')

In [None]:


# (Supposons que benin_map soit déjà fusionné avec age_emploi)

# Carte choroplèthe avec labels
fig, ax = plt.subplots(1, 1, figsize=(12, 12))
benin_map.plot(column='bank', cmap='Greens', linewidth=0.8, edgecolor='black', legend=True, ax=ax)
ax.set_title("Taux de bancarisation par département au Bénin", fontsize=16)
ax.axis('off')

# Ajouter les labels (noms des départements)
for idx, row in benin_map.iterrows():
    plt.text(x=row['geometry'].centroid.x, 
             y=row['geometry'].centroid.y, 
             s=row['departement'], 
             horizontalalignment='center', 
             fontsize=9, 
             fontweight='bold')
    
plt.savefig("bank.png", dpi=300, bbox_inches='tight')
plt.show()


les régions du SUD sont plus bancarisées 

In [None]:
benin_map = gpd.read_file("../data/gadm41_BEN_shp/gadm41_BEN_1.shp")

In [None]:
agg_sante = agg_sante.reset_index().rename(columns={'index': 'departement'})
agg_sante['departement'] =agg_sante['departement'].str.capitalize()

In [None]:
agg_sante

In [None]:
agg_sante.to_csv("agg_sante.csv")

In [None]:
# 4. Fusionner les données avec le shapefile
benin_map = benin_map.merge(agg_sante, left_on='NAME_1', right_on='departement')


In [None]:
# Affiche les lignes avec géométrie nulle
print(benin_map[benin_map['geometry'].isnull()])

# Supprimer les lignes avec géométrie vide
benin_map = benin_map[~benin_map['geometry'].isnull()]


In [None]:
# Certaines géométries peuvent être invalides (auto-intersection, etc.)
benin_map['geometry'] = benin_map['geometry'].buffer(0)


In [None]:
# Carte choroplèthe avec labels
fig, ax = plt.subplots(1, 1, figsize=(12, 12))
benin_map.plot(column='couvmal', cmap='Greens', linewidth=0.8, edgecolor='black', legend=True, ax=ax)
ax.set_title("Taux de Couverture santitaire   par département au Bénin", fontsize=16)
ax.axis('off')

# Ajouter les labels (noms des départements)
for idx, row in benin_map.iterrows():
    plt.text(x=row['geometry'].centroid.x, 
             y=row['geometry'].centroid.y, 
             s=row['departement'], 
             horizontalalignment='center', 
             fontsize=9, 
             fontweight='bold')

plt.show()

In [None]:
# Carte choroplèthe avec labels
fig, ax = plt.subplots(1, 1, figsize=(12, 12))
benin_map.plot(column='moustiq', cmap='Greens', linewidth=0.8, edgecolor='black', legend=True, ax=ax)
ax.set_title("Taux de disposition de  moustiquaire par département au Bénin", fontsize=16)
ax.axis('off')

# Ajouter les labels (noms des départements)
for idx, row in benin_map.iterrows():
    plt.text(x=row['geometry'].centroid.x, 
             y=row['geometry'].centroid.y, 
             s=row['departement'], 
             horizontalalignment='center', 
             fontsize=9, 
             fontweight='bold')

plt.savefig("moustiq.png", dpi=300, bbox_inches='tight')
plt.show()