In [3]:

# ////////////////////////////////////////// HIV / AIDS ///////////////////////////////////

import numpy as np
import pandas as pd

np.random.seed(42)  # Para reprodutibilidade

n = 500  # número de registros

aids_data = {
    'idade': np.random.randint(18, 70, n),
    'parceiros_sexuais': np.random.randint(0, 10, n),  # número de parceiros sexuais no último ano
    'uso_preservativo': np.random.randint(0, 2, n),  # 0 = não usa, 1 = usa
    'relacao_sexual_sem_protecao': np.random.randint(0, 2, n),  # 0 = não, 1 = sim
    'drogas_injetaveis': np.random.randint(0, 2, n),  # 0 = não, 1 = sim
    'transfusao_sanguinea': np.random.randint(0, 2, n),  # 0 = não, 1 = sim
    'relacao_com_pessoa_hiv': np.random.randint(0, 2, n),  # contato íntimo com pessoa HIV+
    'sintomas_iniciais': np.random.randint(0, 2, n),  # febre, perda de peso, linfonodos, etc.
    'quantidade_celulas_por_milimetro_cubico': np.random.randint(0, 800, n)
}

# Lógica simples para marcar presença de AIDS
def determinar_aids(row):
    score = 0
    if row['relacao_sexual_sem_protecao'] == 1:
        score += 1
    if row['drogas_injetaveis'] == 1:
        score += 1
    if row['transfusao_sanguinea'] == 1:
        score += 1
    if row['relacao_com_pessoa_hiv'] == 1:
        score += 1
    if row['sintomas_iniciais'] == 1:
        score += 1
    if row['parceiros_sexuais'] >= 3 and row['uso_preservativo'] == 0:
        score += 1
    if row['quantidade_celulas_por_milimetro_cubico'] < 200:
        score += 1

    # Considera AIDS se tiver 3 ou mais fatores de risco
    return 1 if score >= 3 else 0

# Criar DataFrame e aplicar função
df = pd.DataFrame(aids_data)
df["tem_aids"] = df.apply(determinar_aids, axis=1)

# Visualizar os primeiros dados
print(df.head())

# Salvar em CSV
df.to_csv("../dados/dados_aids.csv", index=False)


   idade  parceiros_sexuais  uso_preservativo  relacao_sexual_sem_protecao  \
0     56                  6                 0                            1   
1     69                  4                 1                            0   
2     46                  5                 1                            0   
3     32                  6                 1                            0   
4     60                  2                 1                            1   

   drogas_injetaveis  transfusao_sanguinea  relacao_com_pessoa_hiv  \
0                  1                     0                       1   
1                  1                     0                       0   
2                  0                     0                       0   
3                  1                     0                       1   
4                  1                     0                       0   

   sintomas_iniciais  quantidade_celulas_por_milimetro_cubico  tem_aids  
0                  0                