In [1]:
# ////////////////////////////////////////// DOENÇA CARDIOVASCULAR ///////////////////////////////////

import numpy as np
import pandas as pd
from calcular_pontucao import calcular_pontuacao_cardiovascular

np.random.seed(42)  # Para reprodutibilidade

n = 500  # número de registros

cardio_data = {
    'idade': np.random.randint(30, 90, n),
    'sexo': np.random.randint(0, 2, n),  # 0 = feminino, 1 = masculino
    'fumante': np.random.randint(0, 2, n),
    'obeso': np.random.randint(0, 2, n),
    'colesterol_alto': np.random.randint(0, 2, n),
    'hipertensao': np.random.randint(0, 2, n),
    'diabetes': np.random.randint(0, 2, n),
    'atividade_fisica': np.random.randint(0, 2, n),
    'historico_familiar_cardiovascular': np.random.randint(0, 2, n),
    'pressao_sistolica': np.random.normal(130, 20, n).round(1),  # pressão sistólica média
    'colesterol_total': np.random.normal(200, 30, n).round(1),  # colesterol total médio
}

# Lógica simples para marcar presença de doença cardiovascular
def determinar_cardio(row):
    score = calcular_pontuacao_cardiovascular(
        idade=row['idade'],
        sexo=row['sexo'],  
        fumante=row['fumante'],
        obeso=row['obeso'],
        colesterol_alto=row['colesterol_alto'],
        hipertensao=row['hipertensao'],
        diabetes=row['diabetes'],
        atividade_fisica=row['atividade_fisica'],
        historico_familiar_cardiovascular=row['historico_familiar_cardiovascular'],
        pressao_sistolica=row['pressao_sistolica'], 
        colesterol_total=row['colesterol_total'] 
    )
    
    return 1 if score >= 70 else 0

# Criar DataFrame e aplicar função
df = pd.DataFrame(cardio_data)
df["tem_doenca_cardiovascular"] = df.apply(determinar_cardio, axis=1)

# Visualizar os primeiros dados
print(df.head())

# Salvar se quiser
df.to_csv("../dados/dados_cardiovascular.csv", index=False)


   idade  sexo  fumante  obeso  colesterol_alto  hipertensao  diabetes  \
0     68     1        0      0                0            1         0   
1     81     0        0      1                0            0         1   
2     58     0        1      0                1            1         1   
3     44     1        0      0                0            0         0   
4     72     0        0      0                1            0         1   

   atividade_fisica  historico_familiar_cardiovascular  pressao_sistolica  \
0                 0                                  1              132.5   
1                 1                                  1              141.0   
2                 0                                  1              130.9   
3                 0                                  1              163.9   
4                 0                                  0              117.5   

   colesterol_total  tem_doenca_cardiovascular  
0             184.9                        