In [2]:
import pandas as pd
import matplotlib.pyplot as plt
import numpy as np
import plotly.express as px
import seaborn as sns
from scipy.stats import ttest_ind

df = pd.read_csv("../Speed_dating.csv", encoding='ISO-8859-1')

In [3]:
import pandas as pd
import plotly.express as px

# Calculer taux de "oui" et de "match" par ordre de rendez-vous
order_analysis = df.groupby('order').agg({
    'dec': 'mean',         # décision individuelle (1 = oui)
    'match': 'mean',       # match réciproque (1 si les deux ont dit oui)
    'iid': 'count'         # nombre de dates à cet ordre
}).rename(columns={
    'dec': 'Taux de oui',
    'match': 'Taux de match',
    'iid': 'Nombre de dates'
}).reset_index()

# Tracer le taux de "oui"
fig = px.line(
    order_analysis,
    x='order',
    y='Taux de oui',
    markers=True,
    title="Taux de 'oui' en fonction de l'ordre du rendez-vous",
    labels={'order': "Ordre du rendez-vous", 'Taux de oui': "Probabilité d'un 'oui'"},
    template='plotly_white'
)
fig.update_traces(line=dict(width=2))
fig.show()


In [5]:
# Mapping lisible pour la variable condtn
df['groupe_condtn'] = df['condtn'].map({
    1: 'Choix limité (petit groupe)',
    2: 'Choix étendu (grand groupe)'
})

# Calcul du taux de "oui" par ordre et type de condition
grouped_by_condtn = df.groupby(['groupe_condtn', 'order']).agg({
    'dec': 'mean',
    'iid': 'count'
}).rename(columns={'dec': 'Taux de oui', 'iid': 'Nombre de dates'}).reset_index()

# Tracer avec Plotly
import plotly.express as px

fig = px.line(
    grouped_by_condtn,
    x='order',
    y='Taux de oui',
    color='groupe_condtn',
    markers=True,
    title="Effet de l'ordre selon le type de condition (choix limité vs étendu)",
    labels={
        'order': "Ordre du rendez-vous",
        'Taux de oui': "Probabilité d'un 'oui'",
        'groupe_condtn': "Type de groupe"
    },
    template="plotly_white"
)
fig.update_traces(line=dict(width=2))
fig.show()


In [6]:
summary_by_gender = df.groupby('gender')[['dec', 'match']].mean().rename(
    index={0: 'Femmes', 1: 'Hommes'}
).round(3).reset_index()
print(summary_by_gender)


   gender    dec  match
0  Femmes  0.365  0.165
1  Hommes  0.474  0.165


In [7]:
import plotly.express as px

mean_by_order_gender = df.groupby(['order', 'gender']).agg({
    'dec': 'mean',
    'match': 'mean'
}).reset_index()

mean_by_order_gender['Genre'] = mean_by_order_gender['gender'].map({0: 'Femmes', 1: 'Hommes'})

fig1 = px.line(
    mean_by_order_gender,
    x='order',
    y='dec',
    color='Genre',
    markers=True,
    title="Effet de l'ordre sur le taux de 'oui' selon le genre (toutes vagues)",
    labels={'order': "Ordre du rendez-vous", 'dec': "Taux de oui"},
    template="plotly_white"
)
fig1.update_traces(line=dict(width=2))
fig1.show()


In [8]:
fig2 = px.line(
    mean_by_order_gender,
    x='order',
    y='match',
    color='Genre',
    markers=True,
    title="Effet de l'ordre sur le taux de match selon le genre (toutes vagues)",
    labels={'order': "Ordre du rendez-vous", 'match': "Taux de match"},
    template="plotly_white"
)
fig2.update_traces(line=dict(width=2))
fig2.show()
