In [1]:
import pandas as pd
from mlxtend.preprocessing import TransactionEncoder
from mlxtend.frequent_patterns import apriori, association_rules

In [2]:

# Ejemplo de datos: lista de libros
data = [
    {"title": "Libro A", "author": "Autor 1", "genre": ["Fantasía", "Aventura"]},
    {"title": "Libro B", "author": "Autor 2", "genre": ["Ciencia Ficción"]},
    {"title": "Libro C", "author": "Autor 1", "genre": ["Fantasía"]},
    {"title": "Libro D", "author": "Autor 3", "genre": ["Historia", "Biografía"]},
    {"title": "Libro E", "author": "Autor 2", "genre": ["Ciencia Ficción", "Fantasía"]},
    {"title": "Libro F", "author": "Autor 3", "genre": ["Historia"]},
]

In [3]:
# Crear transacciones combinando autor y géneros
transactions = []
for book in data:
    transactions.append([book["author"]] + book["genre"])

In [4]:
# Codificación de las transacciones para el formato adecuado
te = TransactionEncoder()
te_ary = te.fit(transactions).transform(transactions)
df = pd.DataFrame(te_ary, columns=te.columns_)

# Aplicar el algoritmo Apriori
frequent_itemsets = apriori(df, min_support=0.2, use_colnames=True)

# Generar reglas de asociación
rules = association_rules(frequent_itemsets, metric="confidence", min_threshold=0.5)

# print(frequent_itemsets)
print(rules)

    support                    itemsets
0  0.333333                   (Autor 1)
1  0.333333                   (Autor 2)
2  0.333333                   (Autor 3)
3  0.333333           (Ciencia Ficción)
4  0.500000                  (Fantasía)
5  0.333333                  (Historia)
6  0.333333         (Fantasía, Autor 1)
7  0.333333  (Autor 2, Ciencia Ficción)
8  0.333333         (Autor 3, Historia)
         antecedents        consequents  antecedent support  \
0         (Fantasía)          (Autor 1)            0.500000   
1          (Autor 1)         (Fantasía)            0.333333   
2          (Autor 2)  (Ciencia Ficción)            0.333333   
3  (Ciencia Ficción)          (Autor 2)            0.333333   
4          (Autor 3)         (Historia)            0.333333   
5         (Historia)          (Autor 3)            0.333333   

   consequent support   support  confidence  lift  leverage  conviction  \
0            0.333333  0.333333    0.666667   2.0  0.166667         2.0   
1       