| **Inicio** | **atrás 4** | **Siguiente 6** |
|----------- |-------------- |---------------|
| [🏠](../../README.md) | [⏪](./4.Clustering.ipynb)| [⏩](./6.Reinforcement_Learning.ipynb)|

# **5. Reglas de Asociación**

## **Apriori**

Apriori es un algoritmo utilizado en el aprendizaje automático para descubrir patrones y relaciones entre conjuntos de elementos. En particular, se utiliza en la minería de datos y las reglas de asociación para descubrir patrones frecuentes en conjuntos de datos transaccionales.

El algoritmo Apriori se basa en la idea de que los conjuntos de elementos que aparecen con frecuencia juntos en un conjunto de datos son importantes y pueden utilizarse para hacer predicciones sobre nuevos conjuntos de datos. Por lo tanto, el algoritmo Apriori utiliza un enfoque de fuerza bruta para identificar patrones frecuentes, generando todas las combinaciones posibles de elementos y calculando su frecuencia.

El algoritmo Apriori consta de tres etapas principales:

**1. Generar conjuntos de elementos candidatos:**

 Se comienza con conjuntos de un solo elemento y se van generando conjuntos de elementos más grandes combinando conjuntos previos, asegurándose de que cada conjunto candidato tenga un tamaño específico.

**2. Evaluar la frecuencia de cada conjunto candidato:**

 Se escanea la base de datos para contar la frecuencia de cada conjunto candidato.

**3. Eliminar conjuntos infrecuentes:**

 Los conjuntos de elementos cuya frecuencia no cumple con un umbral predefinido son eliminados.

Este proceso se repite iterativamente hasta que ya no se pueden generar conjuntos de elementos más grandes o hasta que no se encuentren patrones de interés.

En el área de Machine Learning, las Reglas de Asociación son una técnica utilizada para encontrar patrones interesantes en conjuntos de datos. La regla de asociación más conocida es la Regla de Asociación Apriori. Esta técnica se utiliza para encontrar patrones frecuentes en conjuntos de datos y, a continuación, utilizar esos patrones para crear reglas de asociación.

La Regla de Asociación Apriori se basa en el principio de que si un conjunto de elementos aparece con frecuencia en un conjunto de datos, entonces los elementos individuales de ese conjunto también aparecerán con frecuencia. En otras palabras, si un conjunto de elementos se cumple, también se cumplirán todos los subconjuntos de ese conjunto.

Por ejemplo, si un cliente compra pan y leche juntos con frecuencia, entonces es probable que también compre pan o leche por separado. Utilizando la Regla de Asociación Apriori, podemos identificar patrones frecuentes como este en los datos.

Aquí te dejo un ejemplo de código en Python utilizando la biblioteca `mlxtend` para aplicar la Regla de Asociación Apriori en un conjunto de datos de compras de supermercado:

In [5]:
import pandas as pd
from mlxtend.frequent_patterns import apriori
from mlxtend.frequent_patterns import association_rules

# Cargamos los datos
df = pd.read_csv('https://raw.githubusercontent.com/stedy/Machine-Learning-with-R-datasets/master/groceries.csv', header=None, sep=';')

# Convertimos los datos a un formato adecuado para la biblioteca mlxtend
# (cada fila es una transacción y cada columna representa un producto)
df_onehot = pd.get_dummies(df[0].str.split(',', expand=True).stack()).sum(level=0)

# Generamos los conjuntos de elementos frecuentes
frequent_itemsets = apriori(df_onehot, min_support=0.01, use_colnames=True)

# Generamos las reglas de asociación a partir de los conjuntos de elementos frecuentes
rules = association_rules(frequent_itemsets, metric="lift", min_threshold=1)

# Visualizamos las reglas de asociación
print(rules)

  df_onehot = pd.get_dummies(df[0].str.split(',', expand=True).stack()).sum(level=0)


                          antecedents                       consequents  \
0                              (beef)                (other vegetables)   
1                  (other vegetables)                            (beef)   
2                        (rolls/buns)                            (beef)   
3                              (beef)                      (rolls/buns)   
4                              (beef)                 (root vegetables)   
..                                ...                               ...   
593  (whole milk, whipped/sour cream)                          (yogurt)   
594      (yogurt, whipped/sour cream)                      (whole milk)   
595                      (whole milk)      (yogurt, whipped/sour cream)   
596                          (yogurt)  (whole milk, whipped/sour cream)   
597              (whipped/sour cream)              (whole milk, yogurt)   

     antecedent support  consequent support   support  confidence      lift  \
0              0.052

En este ejemplo, utilizamos la biblioteca `mlxtend` para cargar los datos de un conjunto de compras de supermercado y transformarlos en un formato adecuado para la Regla de Asociación Apriori. A continuación, generamos los conjuntos de elementos frecuentes utilizando el método apriori, y generamos las reglas de asociación utilizando el método `association_rules`. Finalmente, visualizamos las reglas de asociación resultantes.

En cuanto a la visualización de los resultados, se pueden utilizar gráficas de barras para mostrar los conjuntos de elementos frecuentes y los valores de soporte asociados, así como gráficas de red para mostrar las reglas de asociación y sus valores de confianza y lift.

## **Eclat**

`Eclat` es otro algoritmo utilizado en el área de Reglas de Asociación de Machine Learning, al igual que Apriori. El algoritmo `Eclat` significa "Equivalence Class Clustering and bottom-up Lattice Traversal". Este algoritmo se basa en encontrar los conjuntos de elementos que aparecen juntos con mayor frecuencia en un conjunto de transacciones.

El algoritmo `Eclat` funciona de manera similar al algoritmo Apriori, pero en lugar de calcular el soporte de cada conjunto de elementos, se calcula la intersección de cada par de elementos y su soporte.

En términos de complejidad computacional, `Eclat` es más rápido que Apriori, especialmente cuando se trabaja con conjuntos de datos grandes. Además, `Eclat` puede manejar conjuntos de datos más grandes que Apriori.

A continuación, se muestra un ejemplo de cómo utilizar el algoritmo `Eclat` en Python utilizando la biblioteca `mlxtend`:

In [8]:
import pandas as pd
from mlxtend.frequent_patterns import apriori
from mlxtend.frequent_patterns import association_rules

# Cargamos los datos
df = pd.read_csv('https://raw.githubusercontent.com/stedy/Machine-Learning-with-R-datasets/master/groceries.csv', header=None, sep=';')

# Convertimos los datos a un formato adecuado para la biblioteca mlxtend
# (cada fila es una transacción y cada columna representa un producto)
df_onehot = pd.get_dummies(df[0].str.split(',', expand=True).stack()).sum(level=0)

# Generamos los conjuntos de elementos frecuentes utilizando el algoritmo Apriori
frequent_itemsets = apriori(df_onehot, min_support=0.01, use_colnames=True)

# Generamos las reglas de asociación a partir de los conjuntos de elementos frecuentes
rules = association_rules(frequent_itemsets, metric="lift", min_threshold=1)

# Visualizamos las reglas de asociación
print(rules)


  df_onehot = pd.get_dummies(df[0].str.split(',', expand=True).stack()).sum(level=0)


                          antecedents                       consequents  \
0                              (beef)                (other vegetables)   
1                  (other vegetables)                            (beef)   
2                        (rolls/buns)                            (beef)   
3                              (beef)                      (rolls/buns)   
4                              (beef)                 (root vegetables)   
..                                ...                               ...   
593  (whole milk, whipped/sour cream)                          (yogurt)   
594      (yogurt, whipped/sour cream)                      (whole milk)   
595                      (whole milk)      (yogurt, whipped/sour cream)   
596                          (yogurt)  (whole milk, whipped/sour cream)   
597              (whipped/sour cream)              (whole milk, yogurt)   

     antecedent support  consequent support   support  confidence      lift  \
0              0.052

| **Inicio** | **atrás 4** | **Siguiente 6** |
|----------- |-------------- |---------------|
| [🏠](../../README.md) | [⏪](./4.Clustering.ipynb)| [⏩](./6.Reinforcement_Learning.ipynb)|