In [5]:
# pip install mlxtend pandas

In [7]:
import pandas as pd 
from mlxtend.frequent_patterns import apriori, association_rules

# Carrega a base
base = pd.read_csv('../Bases/Criados/6.1_base_final.csv')

# Mapeia a variÃ¡vel alvo
base['DoenÃ§a_cardÃ­aca'] = base['DoenÃ§a_cardÃ­aca'].map({1: 'Doenca', 2: 'Saudavel'})

# Converte tudo para string
df = base.astype(str)

# One-hot encoding
df_encoded = pd.get_dummies(df)

# Aplica Apriori com suporte mais alto para reduzir o nÃºmero de combinaÃ§Ãµes
frequent_items = apriori(df_encoded, min_support=0.2, use_colnames=True, low_memory=True)

# Gera regras com confianÃ§a alta
regras = association_rules(frequent_items, metric="confidence", min_threshold=0.95)

# Filtra para regras com consequente sendo a classe alvo
regras_alvo = regras[
    (regras['consequents'].astype(str).str.contains("DoenÃ§a_cardÃ­aca_Doenca")) |
    (regras['consequents'].astype(str).str.contains("DoenÃ§a_cardÃ­aca_Saudavel"))
]

# Ordena as regras por lift decrescente
regras_ordenadas = regras_alvo.sort_values(by='lift', ascending=False).reset_index(drop=True)

# Converte conjuntos para strings legÃ­veis
regras_ordenadas['antecedents'] = regras_ordenadas['antecedents'].apply(lambda x: ', '.join(list(x)))
regras_ordenadas['consequents'] = regras_ordenadas['consequents'].apply(lambda x: ', '.join(list(x)))

# RelatÃ³rio final completo (sem arredondar nada)
relatorio_final = regras_ordenadas[['antecedents', 'consequents', 'support', 'confidence', 'lift', 'leverage', 'conviction']].head(10)

# Exibe relatÃ³rio
print("ðŸ“‹ RELATÃ“RIO COMPLETO DAS REGRAS DE ASSOCIAÃ‡ÃƒO")
print("="*60)
print(relatorio_final.to_string(index=False))

ðŸ“‹ RELATÃ“RIO COMPLETO DAS REGRAS DE ASSOCIAÃ‡ÃƒO
                                                                                                                                       antecedents                                                                                                consequents  support  confidence     lift  leverage  conviction
                                                       FrequÃªncia_falta_de_interesse_1.0, Quantidade_de_trabalhos_0, Diabetes_2.0, DoenÃ§a_mental_2                            Jornada_de_Trabalho_0, Uso_aparelhos_com_nicotina_4.0, DoenÃ§a_cardÃ­aca_Saudavel 0.209961    0.954324 2.474410  0.125108   13.449491
                                                           Diabetes_2.0, FrequÃªncia_falta_de_interesse_1.0, Jornada_de_Trabalho_0, DoenÃ§a_mental_2                        DoenÃ§a_cardÃ­aca_Saudavel, Quantidade_de_trabalhos_0, Uso_aparelhos_com_nicotina_4.0 0.209961    0.954324 2.474410  0.125108   13.449491
                      

In [8]:
import pandas as pd
from mlxtend.frequent_patterns import apriori, association_rules

# Seu cÃ³digo para carregar e preparar a base, encoding, Apriori etc, vai aqui
base = pd.read_csv('../Bases/Criados/6.1_base_final.csv')
base['DoenÃ§a_cardÃ­aca'] = base['DoenÃ§a_cardÃ­aca'].map({1: 'Doenca', 2: 'Saudavel'})
df = base.astype(str)
df_encoded = pd.get_dummies(df)
frequent_items = apriori(df_encoded, min_support=0.2, use_colnames=True, low_memory=True)
regras = association_rules(frequent_items, metric="confidence", min_threshold=0.95)
regras_alvo = regras[
    (regras['consequents'].astype(str).str.contains("DoenÃ§a_cardÃ­aca_Doenca")) |
    (regras['consequents'].astype(str).str.contains("DoenÃ§a_cardÃ­aca_Saudavel"))
]
regras_ordenadas = regras_alvo.sort_values(by='lift', ascending=False)

# FunÃ§Ã£o para interpretar e gerar o relatÃ³rio
def gerar_relatorio_amigavel(df_regras):
    relatorio = "ðŸ“‹ RELATÃ“RIO COMPLETO DAS REGRAS DE ASSOCIAÃ‡ÃƒO\n"
    relatorio += "="*60 + "\n\n"
    
    for i, row in df_regras.iterrows():
        antecedents = ", ".join(list(row['antecedents']))
        consequents = ", ".join(list(row['consequents']))
        support = row['support']
        confidence = row['confidence']
        lift = row['lift']
        
        relatorio += f"Regra {i+1}:\n"
        relatorio += f"Se uma pessoa tem [{antecedents}], entÃ£o provavelmente tem [{consequents}].\n"
        relatorio += f"Suporte da regra: {support:.6f} (proporÃ§Ã£o dos dados onde isso ocorre)\n"
        relatorio += f"ConfianÃ§a da regra: {confidence:.6f} (probabilidade da consequÃªncia dado o antecedente)\n"
        relatorio += f"Lift da regra: {lift:.6f} (forÃ§a da associaÃ§Ã£o, >1 Ã© significativo)\n"
        relatorio += "-"*60 + "\n"
    
    return relatorio

print(gerar_relatorio_amigavel(regras_ordenadas.head(5)))  # mostra as 5 principais regras


ðŸ“‹ RELATÃ“RIO COMPLETO DAS REGRAS DE ASSOCIAÃ‡ÃƒO

Regra 113604:
Se uma pessoa tem [FrequÃªncia_falta_de_interesse_1.0, Quantidade_de_trabalhos_0, Diabetes_2.0, DoenÃ§a_mental_2], entÃ£o provavelmente tem [Jornada_de_Trabalho_0, Uso_aparelhos_com_nicotina_4.0, DoenÃ§a_cardÃ­aca_Saudavel].
Suporte da regra: 0.209961 (proporÃ§Ã£o dos dados onde isso ocorre)
ConfianÃ§a da regra: 0.954324 (probabilidade da consequÃªncia dado o antecedente)
Lift da regra: 2.474410 (forÃ§a da associaÃ§Ã£o, >1 Ã© significativo)
------------------------------------------------------------
Regra 113603:
Se uma pessoa tem [Diabetes_2.0, FrequÃªncia_falta_de_interesse_1.0, Jornada_de_Trabalho_0, DoenÃ§a_mental_2], entÃ£o provavelmente tem [DoenÃ§a_cardÃ­aca_Saudavel, Quantidade_de_trabalhos_0, Uso_aparelhos_com_nicotina_4.0].
Suporte da regra: 0.209961 (proporÃ§Ã£o dos dados onde isso ocorre)
ConfianÃ§a da regra: 0.954324 (probabilidade da consequÃªncia dado o antecedente)
Lift da regra: 2.474410 (forÃ§a da ass