In [1]:
import pandas as pd
from mlxtend.preprocessing import TransactionEncoder
from mlxtend.frequent_patterns import apriori, association_rules

In [2]:

# Ejemplo de datos: lista de libros
data = [
    {"title": "Libro A", "author": "Autor 1", "genre": ["Fantasía", "Aventura"]},
    {"title": "Libro B", "author": "Autor 2", "genre": ["Ciencia Ficción"]},
    {"title": "Libro C", "author": "Autor 1", "genre": ["Fantasía"]},
    {"title": "Libro D", "author": "Autor 3", "genre": ["Historia", "Biografía"]},
    {"title": "Libro E", "author": "Autor 2", "genre": ["Ciencia Ficción", "Fantasía"]},
    {"title": "Libro F", "author": "Autor 3", "genre": ["Historia"]},
]

In [7]:
# Crear transacciones combinando autor y géneros
transactions = []
for book in data:
    transactions.append([book["author"]] + book["genre"])
transactions

[['Autor 1', 'Fantasía', 'Aventura'],
 ['Autor 2', 'Ciencia Ficción'],
 ['Autor 1', 'Fantasía'],
 ['Autor 3', 'Historia', 'Biografía'],
 ['Autor 2', 'Ciencia Ficción', 'Fantasía'],
 ['Autor 3', 'Historia']]

In [6]:
# Codificación de las transacciones para el formato adecuado
te = TransactionEncoder()
te_ary = te.fit(transactions).transform(transactions)
df = pd.DataFrame(te_ary, columns=te.columns_)

# Aplicar el algoritmo Apriori
frequent_itemsets = apriori(df, min_support=0.2, use_colnames=True)

# Generar reglas de asociación
rules = association_rules(frequent_itemsets, metric="confidence", min_threshold=0.5)

# print(frequent_itemsets)
print(rules[['antecedents', 'consequents', 'support', 'confidence', 'lift']].sort_values("confidence", ascending=False))

         antecedents        consequents   support  confidence  lift
1          (Autor 1)         (Fantasía)  0.333333    1.000000   2.0
2          (Autor 2)  (Ciencia Ficción)  0.333333    1.000000   3.0
3  (Ciencia Ficción)          (Autor 2)  0.333333    1.000000   3.0
4          (Autor 3)         (Historia)  0.333333    1.000000   3.0
5         (Historia)          (Autor 3)  0.333333    1.000000   3.0
0         (Fantasía)          (Autor 1)  0.333333    0.666667   2.0
