# FP-Growth (Frequent Pattern Growth)

A diferencia del algoritmo Apriori, no genera candidatos. En su lugar, construye un árbol FP para representar transacciones de forma compacta y luego extrae patrones directamente.

¿Qué es un Árbol FP?

Un árbol FP representa las transacciones de un dataset de forma jerárquica, donde:

- Cada nodo representa un ítem y su frecuencia.
- Las ramas representan secuencias de ítems comunes entre transacciones.
- Se construyen a partir de las transacciones ordenando los ítems por frecuencia decreciente.

Las ventajas de este modelo por sobre Apriori es su velocidad en datasets grandes y un menor consumo de memoria.

Carguemos las liberías a utilizar.

In [None]:
import pandas as pd
from mlxtend.preprocessing import TransactionEncoder
from mlxtend.frequent_patterns import association_rules
from mlxtend.frequent_patterns import fpgrowth

Creemos un dataset para poder ver la realización del modelo.

In [None]:
dataset = [
    ['pan', 'leche'],
    ['pan', 'pañales', 'cerveza', 'huevos'],
    ['leche', 'pañales', 'cerveza', 'coca'],
    ['pan', 'leche', 'pañales', 'cerveza'],
    ['pan', 'leche', 'pañales', 'coca']
]

Preprocesamiento: Transformemoslo a una matriz de transacciones.

In [None]:
te = TransactionEncoder()
te_ary = te.fit(dataset).transform(dataset)
df = pd.DataFrame(te_ary, columns=te.columns_)

In [None]:
df

Unnamed: 0,cerveza,coca,huevos,leche,pan,pañales
0,False,False,False,True,True,False
1,True,False,True,False,True,True
2,True,True,False,True,False,True
3,True,False,False,True,True,True
4,False,True,False,True,True,True


Por último, apliquemos el modelo FP-Growth al dataset creado.

In [None]:
frequent_itemsets_fp = fpgrowth(df, min_support=0.6, use_colnames=True)
rules_fp = association_rules(frequent_itemsets_fp, metric="confidence", min_threshold=0.7)
print(rules_fp[['antecedents', 'consequents', 'support', 'confidence', 'lift']])

  antecedents consequents  support  confidence    lift
0   (pañales)       (pan)      0.6        0.75  0.9375
1       (pan)   (pañales)      0.6        0.75  0.9375
2     (leche)       (pan)      0.6        0.75  0.9375
3       (pan)     (leche)      0.6        0.75  0.9375
4     (leche)   (pañales)      0.6        0.75  0.9375
5   (pañales)     (leche)      0.6        0.75  0.9375
6   (pañales)   (cerveza)      0.6        0.75  1.2500
7   (cerveza)   (pañales)      0.6        1.00  1.2500
