# Simulation d'une table de facteurs de risque pour la dépression

Ce notebook simule un tableau de 100 personnes avec 6 facteurs de risque (obésité, solitude, inactivité, comportement sédentaire, stress, manque de sommeil) et une colonne maladie (dépression).


In [None]:
import numpy as np
import pandas as pd

## Définir les prévalences et les odds ratios pour chaque facteur de risque


In [None]:
# Remplacez ces valeurs par vos données médicales réelles
prevalences = {
    'obesite': 0.25,
    'solitude': 0.20,
    'inactivite': 0.30,
    'sedentarite': 0.40,
    'stress': 0.35,
    'manque_sommeil': 0.28
}
odds_ratios = {
    'obesite': 2.0,
    'solitude': 2.5,
    'inactivite': 1.8,
    'sedentarite': 1.5,
    'stress': 3.0,
    'manque_sommeil': 2.2
}

## Générer les facteurs de risque pour 100 personnes


In [None]:
n = 100
np.random.seed(42)
data = {rf: np.random.binomial(1, p, n) for rf, p in prevalences.items()}
df = pd.DataFrame(data)

## Calculer la probabilité de dépression pour chaque personne (modèle logistique)


In [None]:
# Prévalence de base de la dépression (à ajuster selon vos données)
baseline_prevalence = 0.10
beta0 = np.log(baseline_prevalence / (1 - baseline_prevalence))
betas = {rf: np.log(oratio) for rf, oratio in odds_ratios.items()}
logit = beta0
for rf in prevalences.keys():
    logit += df[rf] * betas[rf]
prob = 1 / (1 + np.exp(-logit))

## Simuler la colonne dépression


In [None]:
df['depression'] = np.random.binomial(1, prob)

## Afficher les 10 premières lignes du tableau simulé


In [None]:
df.head(10)