# Reglas de asociación y *market basket analysis*.

## Reglas de asociación.

Las reglas de asociación en *Machine Learning* son técnicas que se utilizan para descubrir hechos que ocurren en común dentro de un determinado conjunto de datos.

Estas técnicas y algoritmos permiten definir relaciones (reglas) de afinidad entre elementos las cuales no necesariamente son intuitivas, de tal forma que una *regla fuerte* describe una relación de afinidad entre uno o más elementos con otro elemento.

Las reglas de asociación son uitilizadas para poder identificar conjuntos de elementos afines y su aplicación en mercadotecnia, bioinformática y análisis de redes sociales es muy popular.

$$
\{leche, cereal\} \rightarrow {mermelada}
$$

### Soporte.

El soporte es una relación ente el un conjunto de elementos asociados y las veces que dicho conjunto aparecen en una transacción.

$$
support(X) = \frac{|X|}{|D|} 
$$

En las que $X$ es el número de veces que aparece un conjuto de elementos en una transacción y $D$ es el total de las transacciones.

## Confianza.

La confianza de una regla $ X \rightarrow Y$ se calcula de la siguiente manera.

$$
confidence(X \rightarrow Y) = \frac{support(X,Y)}{support(Y)}
$$

### Alzada o *lift*.

El *lift* de una regla estima el aumento de probabilidad de que un producto sea escogido al escoger otro.

$$
lift(X \rightarrow Y) = \frac{confidence(X \rightarrow Y)}{support(Y)}
$$

## *Market basket analysis*.

El llamando *Market basket analysis* es una técnica de mercadotecnia que permite identificar patrones en la compra de productos a partir del análisis de una gran numéro de observaciones.

## El algoritmo *Apriori*.

Creado por Rakesh Agrawal y Ramakrishnan Srikant. Este algoritmo permite analizar grandes *datasets* de transacciones y productos.

https://en.wikipedia.org/wiki/Apriori_algorithm

## El paquete ```arules```.

Este paquete permite realizar pruebas de asociación en grandes volúmenes de transacciones.

https://cran.r-project.org/web/packages/arules/index.html

https://www.jstatsoft.org/article/view/v014i15

In [None]:
install.packages("arules")

In [None]:
library(arules)

### La funcion ```read.transactions()```.

In [None]:
compras <- read.transactions("data/14/groceries.csv", sep=",")

In [None]:
summary(compras)

### La función ```inspect()```.

In [None]:
inspect(compras)

### La función ```itemFrequency()```.

In [None]:
itemFrequency(compras[, 1:3])

### La función ```itemFrequencyPlot()```.

In [None]:
itemFrequencyPlot(compras, support = 0.1)

In [None]:
itemFrequencyPlot(compras, topN = 20)

### La función ```image()```.

In [None]:
image(compras[1:5])

In [None]:
image(sample(compras, 100))

## La función ```aprori()```.

In [None]:
apriori(compras)

In [None]:
reglas <- apriori(compras, parameter = list(support =0.006, confidence = 0.25, minlen = 2))

In [None]:
reglas

In [None]:
summary(reglas)

In [None]:
inspect(reglas[1:3])

In [None]:
inspect(sort(reglas, by = "lift")[1:5])

In [None]:
reglas_frutos_rojos <- subset(groceryrules, items %in% "berries")

In [None]:
inspect(reglas_frutos_rojos)

<p style="text-align: center"><a rel="license" href="http://creativecommons.org/licenses/by/4.0/"><img alt="Licencia Creative Commons" style="border-width:0" src="https://i.creativecommons.org/l/by/4.0/80x15.png" /></a><br />Esta obra está bajo una <a rel="license" href="http://creativecommons.org/licenses/by/4.0/">Licencia Creative Commons Atribución 4.0 Internacional</a>.</p>
<p style="text-align: center">&copy; José Luis Chiquete Valdivieso. 2020.</p>