# Analyse bivariée : Évolution du nombre de femmes chefs étoilées par génération

Ce notebook vise à étudier la distribution des femmes chefs étoilées en fonction de leur génération de naissance. L'objectif est de déterminer s'il y a eu une évolution notable du nombre de femmes dans le champ gastronomique au fil du temps.

In [None]:
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt
from scipy.stats import chi2_contingency

In [None]:
# Chargement des données
df = pd.read_csv('wdt_donnees_chefs.csv')
df['birthDate'] = pd.to_datetime(df['birthDate'], errors='coerce')

In [None]:
# Création de la variable 'génération'
df['generation'] = pd.cut(
    df['birthDate'].dt.year,
    bins=[1900, 1940, 1960, 1980, 2000, 2025],
    labels=["1900–40", "1941–60", "1961–80", "1981–2000", "2001–2025"]
)

In [None]:
# Filtrer uniquement les femmes avec génération définie
df_femmes = df[(df['genderLabel'] == 'féminin') & (df['generation'].notnull())]

In [None]:
# Créer tableau croisé génération × nombre de femmes
femmes_par_gen = df_femmes['generation'].value_counts().sort_index()
femmes_par_gen = femmes_par_gen[femmes_par_gen > 0]  # Retirer les 0

In [None]:
# Visualisation du nombre de femmes par génération
sns.set(style="whitegrid")
plt.figure(figsize=(6, 4))
sns.barplot(x=femmes_par_gen.index, y=femmes_par_gen.values)
plt.title("Nombre de femmes chefs étoilées par génération")
plt.xlabel("Génération")
plt.ylabel("Nombre de femmes")
plt.tight_layout()
plt.show()

In [None]:
# Test du Chi-2 sur genre × génération
df['generation'] = pd.Categorical(df['generation'])
crosstab = pd.crosstab(df['generation'], df['genderLabel'])
chi2, p, dof, expected = chi2_contingency(crosstab)
print(f"Chi2 = {chi2:.2f}, p-value = {p:.4f}")