In [3]:
# /////////////////////////////////// DIABETES ////////////////////////////////////////

import numpy as np
import pandas as pd

np.random.seed(42)  # Reprodutibilidade

n = 500

diabetes_data = {
    'idade': np.random.randint(20, 80, n),
    'glicemia_em_jejum': np.random.normal(100, 20, n).round(1),  # mg/dL
    'hbA1c': np.random.normal(5.8, 1.2, n).round(1),  # %
    'ttgo': np.random.normal(140, 30, n).round(1),  # mg/dL após 2h
    'imc': np.random.normal(27, 5, n).round(1),  # Índice de massa corporal
    'atividade_fisica': np.random.randint(0, 2, n),  # 0 = sedentário, 1 = ativo
    'alcool': np.random.randint(0, 2, n),  # 0 = não, 1 = sim
    'historico_familiar_diabetes': np.random.randint(0, 2, n),
    'uso_de_medicamentos_diabetes': np.random.randint(0, 2, n),
    'sintomas_classicos_diabetes': np.random.randint(0, 2, n),
}

# Lógica simples para marcar presença de Diabetes
# Ex: Se creatinina > 1.5 ou ureia > 50 e proteinuria = sim
# Exemplo para diabetes
def determinar_diabetes(row):
    score = 0
    if row["glicemia_em_jejum"] > 126:
        score += 1
    if row["hbA1c"] > 6.5:
        score += 1
    if row["ttgo"] > 200:
        score += 1
    if row["imc"] > 30:
        score += 1
    if row["historico_familiar_diabetes"] == 1:
        score += 1
    if row["sintomas_classicos_diabetes"] == 1:
        score += 1

    # Diagnóstico se 3 ou mais fatores presentes
    if score >= 3:
        return 1
    return 0


df = pd.DataFrame(diabetes_data)
df["tem_diabetes"] = df.apply(determinar_diabetes, axis=1)

# Visualizar as primeiras linhas
print(df.head())

# Salvar se quiser
df.to_csv("../dados/dados_diabetes.csv", index=False)

   idade  glicemia_em_jejum  hbA1c   ttgo   imc  atividade_fisica  alcool  \
0     58              110.3    3.3   97.9  26.3                 1       1   
1     71              177.1    7.8  192.5  22.1                 1       1   
2     48              111.4    6.1  102.7  32.5                 0       0   
3     34              122.7    5.7  119.2  26.4                 0       1   
4     62              119.1    5.1  118.4  16.1                 1       0   

   historico_familiar_diabetes  uso_de_medicamentos_diabetes  \
0                            0                             1   
1                            0                             1   
2                            1                             0   
3                            0                             1   
4                            1                             1   

   sintomas_classicos_diabetes  tem_diabetes  
0                            1             0  
1                            1             1  
2          