#### Ejercicio 3: Análisis de Ventas en una Librería
##### Contexto: Eres el gerente de Libros & Más, una librería que quiere optimizar sus recomendaciones y disposición de productos. Tienes datos de 10 transacciones recientes:
##### Tareas:
##### 1. Preprocesamiento de Datos :Convierte las transacciones a formato one-hot usando TransactionEncoder.
##### 2. Itemsets Frecuentes: Aplica el algoritmo Apriori con min_support=0.3. Identifica los 3 itemsets de tamaño 2 más frecuentes.
##### 3. Generación de Reglas: Encuentra reglas con min_confidence=0.6. Filtra las reglas con lift > 1.2 (asociaciones más fuertes).

##### Preguntas clave: 
##### Basado en la regla con mayor lift:
##### ¿Qué productos recomendarías empaquetar juntos en una promoción?
##### ¿Qué sección de la tienda podría reorganizarse para aumentar ventas cruzadas?

In [1]:
from mlxtend.preprocessing import TransactionEncoder
from mlxtend.frequent_patterns import apriori, association_rules
import pandas as pd

In [2]:
transacciones = [
    ['Novela', 'Café', 'Marcadores'],
    ['Libro de Ciencia', 'Cuaderno', 'Lápiz'],
    ['Novela', 'Café', 'Lápiz'],
    ['Libro de Historia', 'Marcadores', 'Post-it'],
    ['Cuaderno', 'Lápiz', 'Post-it'],
    ['Novela', 'Libro de Ciencia', 'Café'],
    ['Libro de Historia', 'Cuaderno'],
    ['Café', 'Post-it', 'Marcadores'],
    ['Novela', 'Lápiz'],
    ['Libro de Ciencia', 'Cuaderno', 'Post-it']
]

print("Dataset original")
for i, trans in enumerate(transacciones, 1):
    print(f"Transacción {i}: {trans}")

Dataset original
Transacción 1: ['Novela', 'Café', 'Marcadores']
Transacción 2: ['Libro de Ciencia', 'Cuaderno', 'Lápiz']
Transacción 3: ['Novela', 'Café', 'Lápiz']
Transacción 4: ['Libro de Historia', 'Marcadores', 'Post-it']
Transacción 5: ['Cuaderno', 'Lápiz', 'Post-it']
Transacción 6: ['Novela', 'Libro de Ciencia', 'Café']
Transacción 7: ['Libro de Historia', 'Cuaderno']
Transacción 8: ['Café', 'Post-it', 'Marcadores']
Transacción 9: ['Novela', 'Lápiz']
Transacción 10: ['Libro de Ciencia', 'Cuaderno', 'Post-it']


In [4]:
te = TransactionEncoder()
te_ary = te.fit(transacciones).transform(transacciones)
df = pd.DataFrame(te_ary, columns=te.columns_)
print("\nDataFrame transformado (One-Hot Encoding): ")
print(df)


DataFrame transformado (One-Hot Encoding): 
    Café  Cuaderno  Libro de Ciencia  Libro de Historia  Lápiz  Marcadores  \
0   True     False             False              False  False        True   
1  False      True              True              False   True       False   
2   True     False             False              False   True       False   
3  False     False             False               True  False        True   
4  False      True             False              False   True       False   
5   True     False              True              False  False       False   
6  False      True             False               True  False       False   
7   True     False             False              False  False        True   
8  False     False             False              False   True       False   
9  False      True              True              False  False       False   

   Novela  Post-it  
0    True    False  
1   False    False  
2    True    False  
3   False   

In [7]:
frequent_itemsets = apriori(df, min_support=0.3, use_colnames=True)
frequent_itemsets['length'] = frequent_itemsets['itemsets'].apply(lambda x: len(x))
print("\nItemsets frecuentes (soporte >= %30):")
print(frequent_itemsets.sort_values('support', ascending=False))


Itemsets frecuentes (soporte >= %30):
   support            itemsets  length
0      0.4              (Café)       1
1      0.4          (Cuaderno)       1
3      0.4             (Lápiz)       1
5      0.4            (Novela)       1
6      0.4           (Post-it)       1
2      0.3  (Libro de Ciencia)       1
4      0.3        (Marcadores)       1
7      0.3      (Café, Novela)       2


In [12]:
top_3_itemsets = frequent_itemsets[(frequent_itemsets['length'] == 2)].sort_values('support', ascending=False).head(3)
print("Top 3 itemsets de tamaño 2 más frecuentes:")
print(top_3_itemsets)

Top 3 itemsets de tamaño 2 más frecuentes:
   support        itemsets  length
7      0.3  (Café, Novela)       2


In [11]:
rules = association_rules(frequent_itemsets, metric="confidence", min_threshold=0.6)
rules = rules[rules['lift'] > 1.2]
print("\nReglas de asociación (confianza >= 60% sin lift > 1):")
print(rules[['antecedents', 'consequents', 'support', 'confidence', 'lift']].sort_values('lift', ascending=False))


Reglas de asociación (confianza >= 60% sin lift > 1):
  antecedents consequents  support  confidence   lift
0      (Café)    (Novela)      0.3        0.75  1.875
1    (Novela)      (Café)      0.3        0.75  1.875


In [None]:
#¿Qué productos recomendarías empaquetar juntos en una promoción?
'''Cafe y novela'''

#¿Qué sección de la tienda podría reorganizarse para aumentar ventas cruzadas?
'''Literatura y poner bebidas como cafe para comprar novelas y un cafe'''