In [2]:
pip install scikit-learn

Note: you may need to restart the kernel to use updated packages.


In [3]:
pip install matplotlib

Note: you may need to restart the kernel to use updated packages.


In [4]:
pip install seaborn

Note: you may need to restart the kernel to use updated packages.


In [5]:
pip install mlxtend

Note: you may need to restart the kernel to use updated packages.


In [6]:
import pandas as pd
from mlxtend.preprocessing import TransactionEncoder
from mlxtend.frequent_patterns import apriori, association_rules

In [7]:
# Para esta prática, vamos criar um dataset de transaçõesdiretamente no código.
# Cada lista interna representa uma cesta de compras de um cliente.
transactions = [
 ['leite', 'pao', 'manteiga'],
 ['cerveja', 'fraldas', 'batata_chips'],
 ['leite', 'fraldas', 'pao', 'cerveja'],
 ['pao', 'manteiga', 'geleia'],
 ['cafe', 'pao', 'acucar'],
 ['leite', 'pao', 'cerveja'],
 ['cerveja', 'fraldas'],
 ['leite', 'cafe', 'pao', 'manteiga']
]


In [8]:
# O algoritmo Apriori precisa de dados em um formato específico (one-hot encoded).
# O TransactionEncoder faz essa conversão para nós.
te = TransactionEncoder()
te_ary = te.fit(transactions).transform(transactions)
df_encoded = pd.DataFrame(te_ary, columns=te.columns_)
print("Dados transformados (formato one-hot):")
display(df_encoded)

Dados transformados (formato one-hot):


Unnamed: 0,acucar,batata_chips,cafe,cerveja,fraldas,geleia,leite,manteiga,pao
0,False,False,False,False,False,False,True,True,True
1,False,True,False,True,True,False,False,False,False
2,False,False,False,True,True,False,True,False,True
3,False,False,False,False,False,True,False,True,True
4,True,False,True,False,False,False,False,False,True
5,False,False,False,True,False,False,True,False,True
6,False,False,False,True,True,False,False,False,False
7,False,False,True,False,False,False,True,True,True


In [9]:
# O Apriori encontra conjuntos de itens que aparecem juntos com uma frequência mínima.
# `min_support` é a frequência mínima para um conjunto de itens ser considerado "frequente".
# Suporte = (Nº de transações com o item) / (Total de transações)
frequent_itemsets = apriori(df_encoded, min_support=0.25,
use_colnames=True)
print("\nConjuntos de Itens Frequentes (Suporte >= 25%):")
display(frequent_itemsets)


Conjuntos de Itens Frequentes (Suporte >= 25%):


Unnamed: 0,support,itemsets
0,0.25,(cafe)
1,0.5,(cerveja)
2,0.375,(fraldas)
3,0.5,(leite)
4,0.375,(manteiga)
5,0.75,(pao)
6,0.25,"(cafe, pao)"
7,0.375,"(fraldas, cerveja)"
8,0.25,"(leite, cerveja)"
9,0.25,"(pao, cerveja)"


In [10]:
# A partir dos itens frequentes, geramos as regras de associação.
# Métrica principal: 'confidence' (Confiança) ou 'lift' (Elevação).
# Confiança({A} -> {B}) = Quão frequentemente B é comprado quando A é comprado.
# Lift({A} -> {B}) = Quão mais provável é comprar B quando A é comprado, em comparação com a probabilidade normal de comprar B.
# Lift > 1 indica uma associação positiva.
rules = association_rules(frequent_itemsets, metric="lift",
min_threshold=1.2)
# Filtrar e ordenar para ver as regras mais interessantes
rules_filtered = rules[rules['confidence'] >=
0.6].sort_values(by='lift', ascending=False)
print("\nRegras de Associação Geradas (Lift > 1.2 e Confiança >=60%):")
display(rules_filtered)



Regras de Associação Geradas (Lift > 1.2 e Confiança >=60%):


Unnamed: 0,antecedents,consequents,antecedent support,consequent support,support,confidence,lift,representativity,leverage,conviction,zhangs_metric,jaccard,certainty,kulczynski
2,(fraldas),(cerveja),0.375,0.5,0.375,1.0,2.0,1.0,0.1875,inf,0.8,0.75,1.0,0.875
3,(cerveja),(fraldas),0.5,0.375,0.375,0.75,2.0,1.0,0.1875,2.5,1.0,0.75,0.6,0.875
11,"(pao, cerveja)",(leite),0.25,0.5,0.25,1.0,2.0,1.0,0.125,inf,0.666667,0.5,1.0,0.75
0,(cafe),(pao),0.25,0.75,0.25,1.0,1.333333,1.0,0.0625,inf,0.333333,0.333333,1.0,0.666667
5,(manteiga),(leite),0.375,0.5,0.25,0.666667,1.333333,1.0,0.0625,1.5,0.4,0.4,0.333333,0.583333
6,(leite),(pao),0.5,0.75,0.5,1.0,1.333333,1.0,0.125,inf,0.5,0.666667,1.0,0.833333
9,(manteiga),(pao),0.375,0.75,0.375,1.0,1.333333,1.0,0.09375,inf,0.4,0.5,1.0,0.75
7,(pao),(leite),0.75,0.5,0.5,0.666667,1.333333,1.0,0.125,1.5,1.0,0.666667,0.333333,0.833333
10,"(leite, cerveja)",(pao),0.25,0.75,0.25,1.0,1.333333,1.0,0.0625,inf,0.333333,0.333333,1.0,0.666667
15,"(leite, manteiga)",(pao),0.25,0.75,0.25,1.0,1.333333,1.0,0.0625,inf,0.333333,0.333333,1.0,0.666667
