In [6]:
# pip install mlxtend pandas

In [None]:
import pandas as pd
from mlxtend.frequent_patterns import apriori, association_rules

# Carrega a base
base = pd.read_csv('../Bases/Criados/5.1_base_reduzida.csv')

# Mapeia a variável alvo (1 = Doença, 2 = Saudável)
base['Q03001'] = base['Q03001'].map({1: 'Doenca', 2: 'Saudavel'})

# Converte todos os dados para string (necessário para get_dummies funcionar corretamente)
df = base.astype(str)

# One-hot encoding de todas as colunas
df_encoded = pd.get_dummies(df)

# Aplica Apriori com suporte e confiança altos para regras mais relevantes
frequent_items = apriori(df_encoded, min_support=0.05, use_colnames=True, low_memory=True)

# Gera regras com confiança mínima de 0.9
regras = association_rules(frequent_items, metric="confidence", min_threshold=0.9)

# Filtra regras onde o consequente é a presença ou ausência da doença
regras_alvo = regras[
    (regras['consequents'].astype(str).str.contains("Q03001_Doenca")) |
    (regras['consequents'].astype(str).str.contains("Q03001_Saudavel"))
]

# Ordena por lift decrescente
regras_ordenadas = regras_alvo.sort_values(by='lift', ascending=False)

# Mostra as 3 principais regras
print(regras_ordenadas[['antecedents', 'consequents', 'support', 'confidence', 'lift']].head(3))