## Ejercicio 1: Análisis Básico de Canasta de Compra Contexto: Eres analista en MiniMarket ABC. Tienes datos de 8 transacciones:

#### Tareas: 
#### 1. Preprocesa los datos con TransactionEncoder.
####  2. Encuentra itemsets frecuentes con min_support=0.4. 
#### 3. Genera reglas con min_confidence=0.6 y filtra por lift > 1. 
#### Pregunta clave: ¿Qué producto está más asociado a "Pan"? Usa el lift como criterio

In [None]:
#Importamos las librerias
import pandas as pd
from mlxtend.frequent_patterns import apriori, association_rules 
from mlxtend.preprocessing import TransactionEncoder 

In [3]:

transacciones = [
['Pan', 'Leche'],
['Pan', 'Pañales', 'Cerveza'],
['Leche', 'Pañales'],
['Pan', 'Leche', 'Pañales', 'Huevos'],
['Huevos', 'Leche'],
['Pan', 'Huevos'],
['Pañales', 'Cerveza'],
['Pan', 'Leche', 'Huevos']
]

print("Dataset original")
for i, trans in enumerate(transacciones, 1):
    print(f"Transacción {i}: {trans}")

Dataset original
Transacción 1: ['Pan', 'Leche']
Transacción 2: ['Pan', 'Pañales', 'Cerveza']
Transacción 3: ['Leche', 'Pañales']
Transacción 4: ['Pan', 'Leche', 'Pañales', 'Huevos']
Transacción 5: ['Huevos', 'Leche']
Transacción 6: ['Pan', 'Huevos']
Transacción 7: ['Pañales', 'Cerveza']
Transacción 8: ['Pan', 'Leche', 'Huevos']


In [4]:
te = TransactionEncoder()
te_ary = te.fit(transacciones).transform(transacciones)
df = pd.DataFrame(te_ary, columns=te.columns_)
print("\nDataFrame transformado (One-Hot Encoding): ")
print(df)


DataFrame transformado (One-Hot Encoding): 
   Cerveza  Huevos  Leche    Pan  Pañales
0    False   False   True   True    False
1     True   False  False   True     True
2    False   False   True  False     True
3    False    True   True   True     True
4    False    True   True  False    False
5    False    True  False   True    False
6     True   False  False  False     True
7    False    True   True   True    False


In [19]:
frequent_itemsets = apriori(df, min_support=0.4, use_colnames=True)

print("\nItemsets frecuentes (soporte >= %40):")
print(frequent_itemsets.sort_values('support', ascending=False))


Itemsets frecuentes (soporte >= %40):
   support   itemsets
1    0.625    (Leche)
2    0.625      (Pan)
0    0.500   (Huevos)
3    0.500  (Pañales)


In [20]:
#Generamos reglas con confianza mínima del 60%
rules = association_rules(frequent_itemsets, metric="confidence", min_threshold=0.6)

#Filtramos reglas con lift > 1
rules = rules[rules['lift'] > 1]

print("\nReglas de asociación (confianza >= 60% y lift > 1):")
print(rules[['antecedents', 'consequents', 'support', 'confidence', 'lift']].sort_values('lift', ascending=False))


Reglas de asociación (confianza >= 60% y lift > 1):
Empty DataFrame
Columns: [antecedents, consequents, support, confidence, lift]
Index: []


#### Como se generan muy pocos datos con min_support=0.4, bajare a min_support=0.3 para bajar el soporte minimo de apriori

In [35]:
frequent_itemsets = apriori(df, min_support=0.3, use_colnames=True)

print("\nItemsets frecuentes (soporte >= %30):")
print(frequent_itemsets.sort_values('support', ascending=False))


Itemsets frecuentes (soporte >= %30):
   support         itemsets
1    0.625          (Leche)
2    0.625            (Pan)
0    0.500         (Huevos)
3    0.500        (Pañales)
4    0.375  (Huevos, Leche)
5    0.375    (Huevos, Pan)
6    0.375     (Leche, Pan)


In [34]:
rules = association_rules(frequent_itemsets, metric="confidence", min_threshold=0.6)

rules = rules[rules['lift'] > 1]

print("\nReglas de asociación (confianza >= 60% y lift > 1):")
print(rules[['antecedents', 'consequents', 'support', 'confidence', 'lift']].sort_values('lift', ascending=False))


Reglas de asociación (confianza >= 60% y lift > 1):
  antecedents consequents  support  confidence  lift
0    (Huevos)     (Leche)    0.375        0.75   1.2
1     (Leche)    (Huevos)    0.375        0.60   1.2
2    (Huevos)       (Pan)    0.375        0.75   1.2
3       (Pan)    (Huevos)    0.375        0.60   1.2


¿Qué producto está más asociado a "Pan"? Usa el lift como criterio.

Huevos