In [3]:
import pandas as pd
import os

obesityDT = pd.read_csv('MSWithInsulin (1).csv')
pd.set_option('display.max_columns', None)
pd.set_option('display.max_rows', None)
# Redefinir o índice do DataFrame para iniciar em 0
obesityDT = obesityDT.reset_index(drop=True)

# Remover as colunas não necessárias para o algoritmo Apriori do DataFrame
obesityDT = obesityDT.drop(columns=['age', 'sex', 'annual_income', 'race', 'seqn', 'fname', 'lname', 'marital_status', 'smoking'])

# Define os valores de referência para cada variável
reference_values = {
    'WaistCirc': 90,  # Exemplo: Valor de referência para circunferência da cintura
    'BMI': 30,  # Exemplo: Valor de referência para índice de massa corporal (IMC)
    'albuminuria': 1,  # Exemplo: Valor de referência para albuminúria
    'UrAlbCr': 30,  # Exemplo: Valor de referência para relação albumina/creatinina na urina
    'UricAcid': 7,  # Exemplo: Valor de referência para ácido úrico
    'GGT': 50,  # Exemplo: Valor de referência para Gama-GT
    'ALT': 35,  # Exemplo: Valor de referência para Alanina Aminotransferase (ALT)
    'AST': 40,  # Exemplo: Valor de referência para Aspartato Aminotransferase (AST)
    'CPK': 170,  # Exemplo: Valor de referência para Creatina Quinase (CPK)
    'HOMA': 2,  # Exemplo: Valor de referência para HOMA-IR
    'BloodGlucose': 100,  # Exemplo: Valor de referência para glicose no sangue
    'BloodInsulin': 20,  # Exemplo: Valor de referência para insulina no sangue
    'HDL': 40,  # Exemplo: Valor de referência para HDL
    'Trigylcerides': 150  # Exemplo: Valor de referência para triglicérides
}

# Transforma os dados em binários com base nos valores de referência
for variable, reference_value in reference_values.items():
    obesityDT[variable] = obesityDT[variable] > reference_value
    
# Inverter a transformação, atribuindo 1 para 'True' e 0 para 'False'
obesityDT = obesityDT.apply(lambda x: (x == True).astype(int))

# Converter todas as colunas do DataFrame para tipos de dados booleanos
obesityDT= obesityDT.astype(bool)

# Importar a biblioteca mlxtend para Apriori
from mlxtend.frequent_patterns import apriori
from mlxtend.frequent_patterns import association_rules

# Aplicar o algoritmo Apriori para encontrar itens frequentes com um suporte mínimo
frequent_itemsets = apriori(obesityDT, min_support=0.1, use_colnames=True)

# Gerar regras de associação com uma confiança mínima
rules = association_rules(frequent_itemsets, metric="confidence", min_threshold=0.5)

# Remover as colunas especificadas permanentemente
rules = rules.drop(['antecedent support', 'consequent support', 'leverage', 'zhangs_metric'], axis=1)

# Exibir as regras de associação formatadas como CSV no console
print(rules.head(20).to_string(index=False))


obesityDT.head(5)

       antecedents     consequents  support  confidence     lift  conviction
             (BMI)     (WaistCirc) 0.355636    0.995677 1.452403   72.745582
       (WaistCirc)           (BMI) 0.355636    0.518769 1.452403    1.335783
        (UricAcid)     (WaistCirc) 0.118374    0.874525 1.275677    2.506168
             (ALT)     (WaistCirc) 0.112712    0.799270 1.165902    1.566593
             (CPK)     (WaistCirc) 0.176016    0.753304 1.098851    1.274695
            (HOMA)     (WaistCirc) 0.597015    0.742638 1.083292    1.221865
       (WaistCirc)          (HOMA) 0.597015    0.870871 1.083292    1.518546
    (BloodGlucose)     (WaistCirc) 0.393206    0.833152 1.215325    1.884718
       (WaistCirc)  (BloodGlucose) 0.393206    0.573574 1.215325    1.238313
    (BloodInsulin)     (WaistCirc) 0.167267    0.950292 1.386200    6.326239
             (HDL)     (WaistCirc) 0.522388    0.640783 0.934715    0.875410
       (WaistCirc)           (HDL) 0.522388    0.762012 0.934715    0.776366

Unnamed: 0,WaistCirc,BMI,albuminuria,UrAlbCr,UricAcid,GGT,ALT,AST,CPK,HOMA,BloodGlucose,BloodInsulin,HDL,Trigylcerides,Hypertension,Dyslipidemia_HDL,Dyslipidemia,Hyperglycemia,Obesity,MetabolicSyndrome
0,False,False,False,False,False,False,False,False,False,True,False,False,True,False,False,False,False,False,False,False
1,False,False,False,False,False,False,False,False,True,False,False,False,False,False,False,True,False,False,False,False
2,False,False,False,False,False,False,False,False,False,True,True,False,True,False,False,False,False,True,False,False
3,True,True,False,False,False,False,False,False,False,True,True,False,True,False,False,False,False,True,True,False
4,True,False,False,False,False,False,False,False,False,True,True,False,True,False,False,False,False,True,True,False
