a) Diagramme en barres : Répartition des statuts d’éligibilité

In [1]:
import pandas as pd
import plotly.graph_objects as go

# Fonction généralisée pour créer le graphique avec fréquences relatives
def plot_frequencies_by_category(df, category_col, group_col):

    # Vérification des colonnes nécessaires
    if not all(col in df.columns for col in [category_col, group_col]):
        raise ValueError(f"Les colonnes '{category_col}' et '{group_col}' doivent être présentes dans le DataFrame.")
    
    # Nettoyage des données : Remplacer les valeurs manquantes dans group_col par 'Non précisé'
    df[group_col] = df[group_col].fillna('Non précisé')
    
    # Compter les catégories par groupe
    counts = df.groupby([category_col, group_col]).size().unstack(fill_value=0)
    
    # Calcul des fréquences relatives (pourcentages) par catégorie principale
    category_totals = counts.sum(axis=1)  # Total par catégorie
    percentages = counts.div(category_totals, axis=0) * 100  # Conversion en %
    
    # Extraction des catégories et des groupes
    categories = percentages.index.tolist()
    group_names = percentages.columns.tolist()
    
    # Création du graphique
    fig = go.Figure()
    
    # Couleurs prédéfinies (extensibles selon le nombre de groupes)
    colors = ['blue', 'pink', 'green', 'orange', 'purple']  # Ajoute plus si nécessaire
    
    # Ajout d'une barre pour chaque groupe
    for i, group in enumerate(group_names):
        group_values = percentages[group].tolist()
        fig.add_trace(go.Bar(
            x=categories,
            y=group_values,
            name=group,
            marker_color=colors[i % len(colors)],  # Cycle à travers les couleurs
            text=[f"<b>{val:.1f}%</b>" for val in group_values],  # Étiquettes en gras avec balise HTML
            textposition='inside',  # Positionnées à l'intérieur des barres
            textfont=dict(
                size=16,  # Taille augmentée (18 au lieu de la valeur par défaut)
                color='black',  # Couleur contrastante pour lisibilité
                family='Arial Black'  # Police en gras
            )
        ))
    
    # Mise en page
    fig.update_layout(
        title=f"Répartition relative de '{category_col}' par '{group_col}' (Pourcentages)",
        xaxis_title=category_col,
        yaxis_title='Pourcentage (%)',
        yaxis=dict(range=[0, 100]),  # Échelle de 0 à 100%
        barmode='stack',  # Barres empilées pour atteindre 100%
        legend_title=group_col,
        template='plotly_white',
        bargap=0.2  # Espacement entre les barres
    )
    
    return fig


In [5]:
data=pd.read_excel('last.xlsx')
# Appel de la fonction avec les colonnes spécifiques
fig = plot_frequencies_by_category(data, 'ÉLIGIBILITÉ_AU_DON.', 'Genre_')
fig.show()

In [4]:
import pandas as pd
import plotly.graph_objects as go
from collections import Counter

# Fonction pour diagramme en barres
def plot_bar_reasons(df, eligibility_type='Temporairement Non-eligible', gender=None):
    # Filtrer par type d'éligibilité
    filtered_df = df[df['ÉLIGIBILITÉ_AU_DON'] == eligibility_type]
    
    # Filtrer par genre si spécifié
    if gender:
        filtered_df = filtered_df[filtered_df['Genre_'] == gender]
    
    # Extraire et compter les raisons (séparées par des virgules)
    reasons_list = filtered_df['Raison indisponibilité fusionnee'].dropna().str.split(',').explode().str.strip()
    reason_counts = Counter(reasons_list)
    
    # Préparer les données pour le graphique
    reasons = list(reason_counts.keys())
    counts = list(reason_counts.values())
    
    # Création du graphique
    fig = go.Figure()
    fig.add_trace(go.Bar(
        x=reasons,
        y=counts,
        marker_color='#FF6347',  # Rouge tomate vif
        text=[str(val) for val in counts],  # Nombre affiché sur les barres
        textposition='auto',
        textfont=dict(size=16, color='white', family='Arial Black')
    ))
    
    # Mise en page
    title = f"Raisons de non-éligibilité ({eligibility_type})"
    if gender:
        title += f" - {gender}"
    fig.update_layout(
        title=title,
        xaxis_title="Raisons d’indisponibilité",
        yaxis_title="Nombre d’occurrences",
        template='plotly_white',
        bargap=0.2,
        xaxis=dict(tickangle=-45)  # Rotation des étiquettes pour lisibilité
    )
    
    return fig

# Fonction pour diagramme circulaire (Pie Chart)
def plot_pie_reasons(df, eligibility_type='Temporairement Non-eligible', gender=None):

    # Filtrer par type d'éligibilité
    filtered_df = df[df['ÉLIGIBILITÉ_AU_DON'] == eligibility_type]
    
    # Filtrer par genre si spécifié
    if gender:
        filtered_df = filtered_df[filtered_df['Genre_'] == gender]
    
    # Extraire et compter les raisons (séparées par des virgules)
    reasons_list = filtered_df['Raison indisponibilité fusionnee'].dropna().str.split(',').explode().str.strip()
    reason_counts = Counter(reasons_list)
    
    # Préparer les données pour le graphique
    reasons = list(reason_counts.keys())
    counts = list(reason_counts.values())
    
    # Couleurs vives et douces (rouge/orange)
    colors = ['#FF4040', '#FF8C00', '#FFB6C1', '#FFDAB9', '#FF6347']
    
    # Création du graphique
    fig = go.Figure()
    fig.add_trace(go.Pie(
        labels=reasons,
        values=counts,
        marker_colors=colors[:len(reasons)],  # Adapter le nombre de couleurs
        textinfo='label+percent',  # Afficher étiquettes et pourcentages
        textfont=dict(size=16, family='Arial Black'),
        hole=0.3  # Donut chart pour un style moderne
    ))
    
    # Mise en page
    title = f"Raisons de non-éligibilité ({eligibility_type})"
    if gender:
        title += f" - {gender}"
    fig.update_layout(
        title=title,
        template='plotly_white',
        legend_title="Raisons",
    )
    
    return fig


In [7]:
import pandas as pd
import plotly.graph_objects as go
from collections import Counter

# Fonction pour diagramme en barres
def plot_bar_reasons(df, eligibility_type='Temporairement Non-eligible', gender=None):
    
    # Filtrer par type d'éligibilité
    filtered_df = df[df['ÉLIGIBILITÉ_AU_DON.'] == eligibility_type]
    
    # Filtrer par genre si spécifié
    if gender:
        filtered_df = filtered_df[filtered_df['Genre_'] == gender]
    
    # Extraire et compter les raisons (séparées par des virgules)
    reasons_list = filtered_df['Raison_indisponibilité_fusionnée'].dropna().str.split(';').explode().str.strip()
    reason_counts = Counter(reasons_list)
    
    # Préparer les données pour le graphique
    reasons = list(reason_counts.keys())
    counts = list(reason_counts.values())
    
    # Création du graphique
    fig = go.Figure()
    fig.add_trace(go.Bar(
        x=reasons,
        y=counts,
        marker_color='#FF6347',  # Rouge tomate vif
        text=[str(val) for val in counts],  # Nombre affiché sur les barres
        textposition='auto',
        textfont=dict(size=16, color='white', family='Arial Black')
    ))
    
    # Mise en page
    title = f"Raisons de non-éligibilité ({eligibility_type})"
    if gender:
        title += f" - {gender}"
    fig.update_layout(
        title=title,
        xaxis_title="Raisons d’indisponibilité",
        yaxis_title="Nombre d’occurrences",
        template='plotly_white',
        bargap=0.2,
        xaxis=dict(tickangle=-45)  # Rotation des étiquettes pour lisibilité
    )
    
    return fig

# Fonction pour diagramme circulaire (Pie Chart)
def plot_pie_reasons(df, eligibility_type='Temporairement Non-eligible', gender=None):

    # Filtrer par type d'éligibilité
    filtered_df = df[df['ÉLIGIBILITÉ_AU_DON.'] == eligibility_type]
    
    # Filtrer par genre si spécifié
    if gender:
        filtered_df = filtered_df[filtered_df['Genre_'] == gender]
    
    # Extraire et compter les raisons (séparées par des virgules)
    reasons_list = filtered_df['Raison_indisponibilité_fusionnée'].dropna().str.split(';').explode().str.strip()
    reason_counts = Counter(reasons_list)
    
    # Préparer les données pour le graphique
    reasons = list(reason_counts.keys())
    counts = list(reason_counts.values())
    
    # Couleurs vives et douces (rouge/orange)
    colors = ['#FF4040', '#FF8C00', '#FFB6C1', '#FFDAB9', '#FF6347']
    
    # Création du graphique
    fig = go.Figure()
    fig.add_trace(go.Pie(
        labels=reasons,
        values=counts,
        marker_colors=colors[:len(reasons)],  # Adapter le nombre de couleurs
        textinfo='label+percent',  # Afficher étiquettes et pourcentages
        textfont=dict(size=16, family='Arial Black'),
        hole=0.3  # Donut chart pour un style moderne
    ))
    
    # Mise en page
    title = f"Raisons de non-éligibilité ({eligibility_type})"
    if gender:
        title += f" - {gender}"
    fig.update_layout(
        title=title,
        template='plotly_white',
        legend_title="Raisons",
    )
    
    return fig

df = pd.read_excel('last.xlsx')

# Exemples d’utilisation
# 1. Barres - Temporairement Non-éligible (tous)
fig_bar_temp = plot_bar_reasons(df, 'Temporairement Non-eligible')
fig_bar_temp.show()

# 2. Barres - Définitivement Non-éligible (tous)
fig_bar_def = plot_bar_reasons(df, 'Définitivement non-eligible')
fig_bar_def.show()

# 3. Barres - Temporairement Non-éligible (Femmes seulement)
fig_bar_temp_femme = plot_bar_reasons(df, 'Temporairement Non-eligible', 'Femme')
fig_bar_temp_femme.show()

# 4. Pie - Temporairement Non-éligible (tous)
fig_pie_temp = plot_pie_reasons(df, 'Temporairement Non-eligible')
fig_pie_temp.show()

# 5. Pie - Définitivement Non-éligible (tous)
fig_pie_def = plot_pie_reasons(df, 'Définitivement non-eligible')
fig_pie_def.show()

# 6. Pie - Temporairement Non-éligible (Femmes seulement)
fig_pie_temp_femme = plot_pie_reasons(df, 'Temporairement Non-eligible', 'Femme')
fig_pie_temp_femme.show()

Boîtes à moustaches (Box Plot) : Taux d’hémoglobine et éligibilité

In [8]:
import pandas as pd
import plotly.graph_objects as go

# Fonction optimisée pour créer un Box Plot
def plot_hemoglobin_box(df, eligibility_col='ÉLIGIBILITÉ_AU_DON.', hemoglobin_col='Taux d’hémoglobine'):

    # Vérification des colonnes nécessaires
    if not all(col in df.columns for col in [eligibility_col, hemoglobin_col]):
        raise ValueError(f"Les colonnes '{eligibility_col}' et '{hemoglobin_col}' doivent être présentes dans le DataFrame.")
    
    # Nettoyage des données
    # Convertir les taux d’hémoglobine en numérique, gérer les valeurs non valides
    df[hemoglobin_col] = pd.to_numeric(df[hemoglobin_col], errors='coerce')
    
    # Supprimer les lignes avec des taux d’hémoglobine manquants pour éviter les erreurs
    df_clean = df.dropna(subset=[hemoglobin_col])
    
    # Liste des statuts d’éligibilité uniques
    eligibility_status = df_clean[eligibility_col].unique()
    
    # Création du graphique
    fig = go.Figure()
    
    # Couleurs vives et douces pour différencier les statuts
    colors = ['#FF4040', '#FF8C00', '#FFB6C1']  # Rouge vif, Orange vif, Rose doux
    
    # Ajouter une boîte pour chaque statut d’éligibilité
    for i, status in enumerate(eligibility_status):
        status_data = df_clean[df_clean[eligibility_col] == status][hemoglobin_col]
        fig.add_trace(go.Box(
            y=status_data,
            name=status,
            marker_color=colors[i % len(colors)],  # Cycle à travers les couleurs
            boxpoints='all',  # Afficher tous les points pour plus de détails
            jitter=0.3,  # Écartement des points pour éviter les superpositions
            pointpos=-1.8,  # Position des points à gauche de la boîte
            line_width=2  # Épaisseur des lignes pour lisibilité
        ))
    
    # Mise en page
    fig.update_layout(
        title="Distribution des taux d’hémoglobine par statut d’éligibilité",
        xaxis_title="Statut d’éligibilité",
        yaxis_title="Taux d’hémoglobine (g/dL)",
        template='plotly_white',
        showlegend=True,
        height=600,
        margin=dict(l=50, r=50, t=100, b=50)
    )
    
    # Ajouter une ligne horizontale pour le seuil typique d’hémoglobine (ex. 12.5 g/dL pour femmes, 13 g/dL pour hommes)
    fig.add_hline(y=12.5, line_dash="dash", line_color="red", annotation_text="Seuil min (F)", annotation_position="top right")
    fig.add_hline(y=13.0, line_dash="dash", line_color="blue", annotation_text="Seuil min (H)", annotation_position="top right")
    
    return fig


In [9]:
plot_hemoglobin_box(df)

Graphique en barres groupées : Éligibilité par classe d’âge

In [15]:
import pandas as pd
import plotly.graph_objects as go

# Fonction pour créer un graphique en barres empilées à 100%
def plot_eligibility_by_age_group(df, age_col='Classe_Age', eligibility_col='ÉLIGIBILITÉ_AU_DON.', detailed=False):
    """
    Crée un graphique en barres empilées à 100% pour examiner l’éligibilité par classe d’âge.
    
    Parameters:
    - df (pandas.DataFrame): DataFrame contenant les données
    - age_col (str): Nom de la colonne pour les classes d’âge (par défaut: 'Classe_Age')
    - eligibility_col (str): Nom de la colonne pour le statut d’éligibilité (par défaut: 'ÉLIGIBILITÉ_AU_DON')
    - detailed (bool): Si True, détaille par type de non-éligibilité; si False, groupe en trois catégories
    
    Returns:
    - fig (plotly.graph_objects.Figure): Objet Plotly avec le graphique en barres empilées
    """
    # Vérification des colonnes nécessaires
    if not all(col in df.columns for col in [age_col, eligibility_col]):
        raise ValueError(f"Les colonnes '{age_col}' et '{eligibility_col}' doivent être présentes dans le DataFrame.")
    
    # Nettoyage des données : Remplacer les valeurs manquantes dans age_col par 'Non précisé'
    df[age_col] = df[age_col].fillna('Non précisé')
    
    # Définir les catégories d’éligibilité
    if detailed:
        # Utiliser les statuts tels quels (Éligible, Temporairement Non-eligible, Définitivement non-eligible)
        categories = df[eligibility_col].unique()
    else:
        # Regrouper en trois catégories : Éligible, Temporairement Non-éligible, Définitivement Non-éligible
        df['Eligibility_Simple'] = df[eligibility_col].apply(
            lambda x: 'Éligible' if x == 'Eligible' 
            else 'Temporairement Non-éligible' if x == 'Temporairement Non-eligible' 
            else 'Définitivement Non-éligible'
        )
        categories = ['Éligible', 'Temporairement Non-éligible', 'Définitivement Non-éligible']
    
    # Compter les occurrences par classe d’âge et statut d’éligibilité
    if detailed:
        counts = df.groupby([age_col, eligibility_col]).size().unstack(fill_value=0)
    else:
        counts = df.groupby([age_col, 'Eligibility_Simple']).size().unstack(fill_value=0)
    
    # Calculer les pourcentages pour chaque classe d’âge (100% par barre)
    percentages = counts.div(counts.sum(axis=1), axis=0) * 100
    
    # Classes d’âge (axe X)
    age_groups = percentages.index.tolist()
    
    # Couleurs inspirées du rouge et de la nature
    colors = [
        '#F4A460',  # Sable roux (orangé naturel, pour Éligible)
        '#CD5C5C',  # Rouge indien doux (pour Temporairement Non-éligible)
        '#8B4513'   # Brun terre (inspiré de la nature, pour Définitivement Non-éligible)
    ]
    
    # Création du graphique
    fig = go.Figure()
    
    # Ajouter une barre empilée pour chaque catégorie d’éligibilité
    for i, category in enumerate(categories):
        fig.add_trace(go.Bar(
            x=age_groups,
            y=percentages[category].tolist(),
            name=category,
            marker_color=colors[i % len(colors)],
            text=[f"{val:.1f}%" for val in percentages[category].tolist()],  # Afficher les pourcentages
            textposition='inside',  # Positionner à l’intérieur des barres
            textfont=dict(size=14, color='white', family='Arial Black')  # Blanc pour contraste
        ))
    
    # Mise en page
    title = "Répartition de l’éligibilité par classe d’âge (100%)" + (" (détaillé)" if detailed else " (trois catégories)")
    fig.update_layout(
        title=title,
        xaxis_title="Classe d’âge",
        yaxis_title="Pourcentage (%)",
        yaxis=dict(range=[0, 100]),  # Échelle fixée à 100%
        barmode='stack',  # Barres empilées
        template='plotly_white',
        bargap=0.2,
        legend_title="Statut d’éligibilité",
        height=600,
        margin=dict(l=50, r=50, t=100, b=50)
    )
    
    return fig



# Exemples d’utilisation
# 1. Barres empilées à 100% - Trois catégories
fig_simple = plot_eligibility_by_age_group(df, detailed=False)
fig_simple.show()