In [None]:
from mlxtend.frequent_patterns import apriori, association_rules
from mlxtend.preprocessing import TransactionEncoder


In [None]:
# Generate frequent itemsets
frequent_itemsets = apriori(df_encoded, min_support=0.01, use_colnames=True)

# Display frequent itemsets
frequent_itemsets.head()


In [None]:
# Generate association rules
rules = association_rules(frequent_itemsets, metric="lift", min_threshold=1)

# Display rules sorted by lift
rules.sort_values('lift', ascending=False).head()

In [None]:
#### Columnas clave y su significado

-  `Antecedentes`: Los ítem(s) en el lado izquierdo de la regla. Piensa en estos como "Si un comprador compra...".

-  `Consecuentes`: Los ítem(s) en el lado derecho de la regla. Piensa en estos como "... entonces también tienden a comprar...".

-  `Soporte del antecedente`: La fracción de todas las transacciones que incluyen todos los ítems en el antecedente. Por ejemplo, 0.012284 significa que el 1.2284% de todas las facturas contenían "POPPY'S PLAYHOUSE BEDROOM".

-  `Soporte del consecuente`: La fracción de todas las transacciones que incluyen todos los ítems en el consecuente. Por ejemplo, 0.013249 significa que el 1.3249% de las facturas contenían "POPPY'S PLAYHOUSE KITCHEN".

-  `Soporte`: La fracción de todas las transacciones que contienen tanto el antecedente como el consecuente. Si esto es 0.010584, significa que el 1.0584% de las facturas contenían tanto "POPPY'S PLAYHOUSE BEDROOM" como "POPPY'S PLAYHOUSE KITCHEN" juntos.

-  `Confianza`: Esto responde a la pregunta: "De las transacciones que tuvieron el antecedente, ¿cuántas también tuvieron el consecuente?" Formalmente:

    ```bash
    confianza = soporte(antecedente + consecuente) / soporte(antecedente)
    ```

    Una confianza de 0.86 (o 86%) significa: "Cada vez que alguien compró POPPY'S PLAYHOUSE BEDROOM, había un 86% de probabilidad de que también comprara POPPY'S PLAYHOUSE KITCHEN."

-  `Lift`: El lift te indica cuántas veces más a menudo aparecen el antecedente y el consecuente juntos de lo que esperarías si fueran independientes (es decir, por pura casualidad). Un lift de 65 es extremadamente alto; indica que los dos ítems co-ocurren mucho más a menudo de lo que sugeriría el azar. Un lift > 1 generalmente significa que los ítems se influyen positivamente entre sí en las ventas.


#### Conclusiones

- **Pares con alto lift**: Son indicadores fuertes de productos que se compran con frecuencia juntos (muy por encima del azar).

- **Confianza**: Muestra cuán consistentemente el antecedente "lleva consigo" al consecuente.
- **Soporte**: Te advierte cuán común o rara es realmente esa combinación (incluso si el lift es alto, un soporte muy bajo podría significar que la regla solo aparece en una pequeña fracción de todas las transacciones).

En resumen, estas reglas te ayudan a ver qué productos tienden a ser comprados juntos en el conjunto de datos. Desde un punto de vista comercial, puedes usar esto para:

- Agrupar o hacer promociones cruzadas de artículos comprados con frecuencia juntos.

- Verificar productos complementarios o relacionados que podrían ser exhibidos juntos en una tienda o en un sitio web.

En general, el análisis te dice que "Poppy’s Playhouse Bedroom" se vende fuertemente junto con "Poppy’s Playhouse Kitchen", "Green Regency Teacup and Saucer" se vende fuertemente junto con "Roses Regency Teacup and Saucer", y así sucesivamente, junto con las medidas numéricas de cuán a menudo y cuán fuertemente ocurren estas combinaciones.

#### Interpretación del Análisis de Cesta de Mercado

El análisis de cesta de mercado implica entender tres métricas clave: **Soporte**, **Confianza** y **Lift**, cada una proporcionando diferentes perspectivas:

- **Soporte**: Indica con qué frecuencia aparece un conjunto de ítems en todas las transacciones. Un conjunto de ítems con alto soporte es común y podría justificar una ubicación destacada en los estantes o una posición cerca de la caja para compras impulsivas. Sin embargo, un soporte alto por sí solo no garantiza una relación fuerte entre los ítems; algunos productos populares simplemente se venden bien de forma independiente.
  
- **Confianza**: Refleja la fuerza o fiabilidad de la regla, mostrando la probabilidad de comprar el ítem B cuando el ítem A ya ha sido comprado. Una alta confianza sugiere una relación robusta; aquí es donde los paquetes o promociones dirigidas tienen éxito. Una baja confianza indica que los ítems no co-ocurren tan a menudo, incluso si ambos son populares por separado, por lo que agruparlos podría no ser tan efectivo.

- **Lift**: Mide con qué frecuencia los ítems A y B ocurren juntos comparado con lo que se esperaría si fueran independientes.

  - **Lift > 1**: Los ítems exhiben una asociación positiva, lo que los convierte en buenos candidatos para ser agrupados, para promociones cruzadas o para ser colocados juntos en los estantes.
  - **Lift = 1**: Los ítems son neutrales entre sí; no se sugiere ninguna ventaja especial en cuanto a marketing o ubicación.
  - **Lift < 1**: Los ítems están negativamente asociados o se canibalizan las ventas entre sí. Evita promoverlos juntos o colocarlos lado a lado.

### Interpretación detallada por escenario

- **Alto Soporte & Alta Confianza**: Una regla donde tanto el soporte como la confianza son altos indica una asociación común y poderosa. Por ejemplo, los clientes compran filtros de café regularmente cada vez que compran granos de café. Agrupa estos productos, ofrece descuentos al comprarlos juntos o colócalos lado a lado.

- **Alto Soporte & Baja Confianza**: Los ítems son populares pero no necesariamente comprados juntos. Por ejemplo, el pan y la leche pueden tener un alto soporte, pero si la confianza de comprarlos juntos es baja, esto implica que muchos clientes compran uno sin el otro. Colócalos por separado pero de forma destacada y considera promociones distintas.

- **Bajo Soporte & Alta Confianza**: Aunque la frecuencia general es baja, cuando estos ítems aparecen, co-ocurren fuertemente. Esta es una asociación de nicho. Dirige el marketing a un segmento más pequeño de clientes que prefieren estos ítems juntos, potencialmente a través de paquetes especializados o promociones estacionales.

- **Bajo Soporte & Baja Confianza**: Estos ítems no son comprados con frecuencia ni juntos. Considera discontinuar uno o ambos si la rentabilidad es baja, o enfócate en generar demanda para cada ítem por separado si son estratégicamente importantes.

### Resumiendo Todo

- Si el lift es significativamente superior a 1, tu estrategia de agrupación o venta cruzada puede ser altamente efectiva para esos pares de ítems.
- Si el lift es 1 o cercano a 1, no hay correlación especial, trata los ítems de forma independiente.
- Si el lift es inferior a 1, corres el riesgo de canibalización o una asociación negativa.

### Ejemplo de Interpretación Robusta

"Si 'Tazas de Té' y 'Teteras' muestran un alto soporte y un lift superior a 1, significa que los clientes compran regularmente estos ítems juntos más de lo esperado. Ofrecerlos en un paquete con descuento o colocarlos juntos en la tienda podría aumentar aún más las ventas. Si, sin embargo, tienes ítems con alto soporte pero baja confianza (por ejemplo, productos que se compran con frecuencia pero rara vez co-ocurren), deberían ser promovidos independientemente o posicionados en diferentes partes de la tienda para maximizar las ventas generales."

### Métricas Adicionales: Leverage y Conviction

Leverage y Conviction son dos métricas adicionales que pueden ayudar a profundizar tu comprensión de las relaciones entre productos.

- **Leverage**:
  - Mide cuánto más (o menos) dos ítems ocurren juntos de lo que se esperaría por azar.
  - Un leverage positivo (>0) indica co-ocurrencia por encima del azar, sugiriendo una posible sinergia.
  - Un leverage cercano a cero indica que no hay una relación real, mientras que los valores negativos (<0) indican una co-ocurrencia menos frecuente que el azar.

  **Interpretación**: Incluso si el lift es >1, un valor de leverage muy pequeño implica que la probabilidad conjunta no es significativamente mayor en términos absolutos. Un leverage positivo grande significa que la frecuencia combinada de compra está notablemente por encima del azar.

- **Conviction**:
  - Mide cuán frecuentemente no se compra el consecuente (B) cuando aparece el antecedente (A).
  - Una convicción de 1 indica independencia (sin correlación).
  - Una mayor convicción (>1) señala una asociación más fuerte; (por ejemplo, una convicción >2 suele ser bastante robusta).

  **Interpretación**: Si la convicción es mucho mayor que 1, significa que cada vez que se compra A, la probabilidad de no comprar B es considerablemente más baja en relación con la tasa base de ausencia de B.

### Ejemplos de Leverage y Conviction en la práctica

- **Ejemplo de Leverage**: Supongamos que tenemos dos ítems: chips y refrescos. Observamos:

soporte(chips) = 0.30
soporte(refrescos) = 0.40
soporte(chips & refrescos) = 0.20

El soporte esperado si chips y refrescos fueran independientes es 0.30 × 0.40 = 0.12. El soporte conjunto observado es 0.20, por lo que leverage = 0.20 - 0.12 = 0.08 (positivo). Esto indica que chips y refrescos aparecen juntos con más frecuencia que el azar, lo que los convierte en una combinación fuerte para promoción cruzada.

- **Ejemplo de Conviction**: Supongamos que tenemos una regla A → B con:

confianza(A → B) = 0.80
soporte(B) = 0.50

Entonces, la convicción podría ser (1 - 0.50) / (1 - 0.80) = 0.50 / 0.20 = 2.5 (>1). Esto señala una fuerte asociación: cada vez que se compra A, la posibilidad de no comprar B es mucho más baja en relación con la tasa general de ausencia de B.

Este formato Markdown es adecuado para documentación o análisis más detallados en tus proyectos. ¿Necesitas ajustar algún punto o agregar algo más?