In [4]:
# ////////////////////////////////////////// OBESIDADE ///////////////////////////////////

import numpy as np
import pandas as pd

np.random.seed(42)  # Para reprodutibilidade

n = 500  # número de registros

obesidade_data = {
    'idade': np.random.randint(18, 80, n),
    'sexo': np.random.choice(['masculino', 'feminino'], n),
    'altura_m': np.random.normal(1.65, 0.1, n).round(2),  # média de altura em metros
    'peso_kg': np.random.normal(80, 20, n).round(1),  # média de peso em kg
    'atividade_fisica': np.random.randint(0, 2, n),  # 0 = sedentário, 1 = ativo
    'alimentacao_ruim': np.random.randint(0, 2, n),  # 0 = saudável, 1 = ruim
    'historico_familiar_obesidade': np.random.randint(0, 2, n),  # 0 = não, 1 = sim
    'disturbio_metabolico': np.random.randint(0, 2, n),  # 0 = não, 1 = sim
}

# Função para calcular IMC
def calcular_imc(row):
    return round(row['peso_kg'] / (row['altura_m'] ** 2), 1)

# Função para determinar obesidade
def determinar_obesidade(row):
    imc = calcular_imc(row)
    score = 0

    if imc >= 30:  # Obesidade pela OMS
        score += 2
    elif imc >= 25:
        score += 1  # Sobrepeso

    if row['atividade_fisica'] == 0:
        score += 1
    if row['alimentacao_ruim'] == 1:
        score += 1
    if row['historico_familiar_obesidade'] == 1:
        score += 1
    if row['disturbio_metabolico'] == 1:
        score += 1

    # Considera obesidade se score >= 4 (alta chance)
    return 1 if score >= 4 else 0

# Criar DataFrame e aplicar funções
df = pd.DataFrame(obesidade_data)
df["imc"] = df.apply(calcular_imc, axis=1)
df["tem_obesidade"] = df.apply(determinar_obesidade, axis=1)

# Visualizar os primeiros dados
print(df.head())

# Salvar se quiser
df.to_csv("../dados/dados_obesidade.csv", index=False)


   idade       sexo  altura_m  peso_kg  atividade_fisica  alimentacao_ruim  \
0     56   feminino      1.72     66.2                 0                 0   
1     69  masculino      1.64     89.9                 1                 0   
2     46   feminino      1.64     88.4                 0                 1   
3     32  masculino      1.62     88.0                 1                 1   
4     60  masculino      1.68     75.5                 0                 1   

   historico_familiar_obesidade  disturbio_metabolico   imc  tem_obesidade  
0                             0                     1  22.4              0  
1                             0                     0  33.4              0  
2                             1                     1  32.9              1  
3                             0                     0  33.5              0  
4                             1                     0  26.8              1  
