# Algoritmo Apriori

Utilizaremos este comando para instalar el paquete `efficient-apriori` desde el repositorio de PyPI (Python Package Index). Este comando instalará la biblioteca `efficient-apriori`, que proporciona una implementación eficiente del algoritmo Apriori en Python.

Después de ejecutar esta celda, importaremos y utilizaremos el paquete `efficient-apriori` en las siguientes celdas de código para realizar tareas relacionadas con la minería de datos utilizando el algoritmo Apriori.

In [1]:
!pip install efficient-apriori 



**Importación de la función apriori desde la librería efficient_apriori**:Esta línea importa la función `apriori` desde la librería `efficient_apriori`, lo que nos permite utilizarla en nuestro código para aplicar el algoritmo Apriori.

   **Definición de las transacciones**:Aquí se define una lista llamada `transacciones`, donde cada elemento de la lista es una tupla que representa una transacción. Cada transacción contiene los elementos comprados en esa transacción.


In [75]:
# Importamos la función apriori desde la librería efficient_apriori
from efficient_apriori import apriori

# Definimos las transacciones como una lista de tuplas, donde cada tupla representa una transacción
transacciones = [
    ("LIBRETA", "LAPICES", "BORRADOR", "PLUMONES"),
    ("GOMA", "REGLA", "LAPICES", "PLUMAS"),
    ("LIBRETA", "POST-IT", "PLUMONES"),
    ("PLUMONES", "BORRADOR", "GOMA", "POST-IT"),
    ("POST-IT", "LIBRETA", "GOMA"),
    ("PLUMONES", "PLUMAS"),
    ("REGLA", "PLUMAS", "LAPICES", "GOMA", "BORRADOR"),
    ("BORRADOR", "PLUMONES", "GOMA"),
    ("POST-IT", "LIBRETA", "GOMA", "REGLA"),
    ("GOMA", "BORRADOR", "LIBRETA"),
    ("LAPICES", "PLUMAS", "GOMA", "POST-IT", "REGLA"),
    ("PLUMAS", "LIBRETA", "GOMA"),
    ("PLUMONES", "POST-IT", "LIBRETA"),
    ("LIBRETA", "REGLA", "LAPICES", "PLUMONES")
]

Ahora en el siguiente fragmento de codigo se aplica:
1. **Aplicación del algoritmo Apriori**:
   Se utiliza para encontrar conjuntos de ítems frecuentes y reglas de asociación en las transacciones, con un soporte mínimo del 35% y una confianza mínima del 35%.

2. **Filtrado y visualización de reglas de asociación**:
   Se recorren las reglas generadas y se imprimen solo aquellas que tienen un solo elemento en el lado derecho (consecuente). Esto ayuda a identificar relaciones más simples entre los ítems.

Este proceso permite identificar y mostrar reglas de asociación significativas entre los ítems en las transacciones.

In [88]:
# Utilizamos la función apriori para generar conjuntos de ítems frecuentes y reglas de asociación
# Aplicando que la regla de asosiacion con soporte y confianza de al menos 35%
conjuntos, reglas = apriori(transacciones, min_support=0.35, min_confidence=0.35)

contador = 0 
# Filtramos y mostramos
for regla in reglas:
    # Verificamos si la regla tiene un solo elemento en el consecuente
    if len(regla.rhs) == 1:
        # Imprimimos la regla de asociación
        print(regla)
        contador = contador+1
if(contador==0):
    print("No se encontro alguna regla con las condiciones establecidas")

No se encontro alguna regla con las condiciones establecidas


El algoritmo Apriori puede no encontrar ninguna regla de asociación si el soporte y la confianza mínimos son demasiado altos para el conjunto de datos dado. En este caso fue asi, parece que no hay ninguna regla de asociación con un soporte y una confianza de al menos 35% .

Así que se trato de disminuir el soporte y la confianza mínimos para ver si el algoritmo puede encontrar alguna regla de asociación. Y nos dimos cuenta que el algoritmo responde con un soporte  mínimo de 28%

In [89]:
# Utilizamos la función apriori para generar conjuntos de ítems frecuentes y reglas de asociación
# Aplicando que la regla de asosiacion con soporte y confianza de al menos 35%
conjuntos, reglas = apriori(transacciones, min_support=0.28, min_confidence=0.35)

contador = 0 
# Filtramos y mostramos
for regla in reglas:
    # Verificamos si la regla tiene un solo elemento en el consecuente
    if len(regla.rhs) == 1:
        # Imprimimos la regla de asociación
        print(regla)
        contador = contador+1
if(contador==0):
    print("No se encontro alguna regla con las condiciones establecidas")

{GOMA} -> {BORRADOR} (conf: 0.444, supp: 0.286, lift: 1.244, conv: 1.157)
{BORRADOR} -> {GOMA} (conf: 0.800, supp: 0.286, lift: 1.244, conv: 1.786)
{LIBRETA} -> {GOMA} (conf: 0.500, supp: 0.286, lift: 0.778, conv: 0.714)
{GOMA} -> {LIBRETA} (conf: 0.444, supp: 0.286, lift: 0.778, conv: 0.771)
{PLUMAS} -> {GOMA} (conf: 0.800, supp: 0.286, lift: 1.244, conv: 1.786)
{GOMA} -> {PLUMAS} (conf: 0.444, supp: 0.286, lift: 1.244, conv: 1.157)
{POST-IT} -> {GOMA} (conf: 0.667, supp: 0.286, lift: 1.037, conv: 1.071)
{GOMA} -> {POST-IT} (conf: 0.444, supp: 0.286, lift: 1.037, conv: 1.029)
{REGLA} -> {GOMA} (conf: 0.800, supp: 0.286, lift: 1.244, conv: 1.786)
{GOMA} -> {REGLA} (conf: 0.444, supp: 0.286, lift: 1.244, conv: 1.157)
{REGLA} -> {LAPICES} (conf: 0.800, supp: 0.286, lift: 2.240, conv: 3.214)
{LAPICES} -> {REGLA} (conf: 0.800, supp: 0.286, lift: 2.240, conv: 3.214)
{PLUMONES} -> {LIBRETA} (conf: 0.571, supp: 0.286, lift: 1.000, conv: 1.000)
{LIBRETA} -> {PLUMONES} (conf: 0.500, supp: 0.286

En este caso pudimos encontrar 16 reglas que fueron:
   * {GOMA} -> {BORRADOR} 
   * {BORRADOR} -> {GOMA} 
* {LIBRETA} -> {GOMA} 
* {GOMA} -> {LIBRETA} 
* {PLUMAS} -> {GOMA} 
* {GOMA} -> {PLUMAS} 
* {POST-IT} -> {GOMA} 
* {GOMA} -> {POST-IT} 
* {REGLA} -> {GOMA} 
* {GOMA} -> {REGLA} 
* {REGLA} -> {LAPICES} 
* {LAPICES} -> {REGLA} 
* {PLUMONES} -> {LIBRETA} 
* {LIBRETA} -> {PLUMONES} 
* {POST-IT} -> {LIBRETA} 
* {LIBRETA} -> {POST-IT} 

## Ahora como DataFrame
Mostraremos las reglas obtenidas a traves de un DataFrame

In [99]:
import pandas as pd

# Creamos una lista para almacenar las reglas
reglas_lista = []

# Filtramos y guardamos las reglas
for regla in reglas:
    if len(regla.rhs) == 1:
        reglas_lista.append([regla.lhs, regla.rhs[0], regla.support, regla.confidence])

# Si no se encontraron reglas que cumplan con las condiciones
if not reglas_lista:
    print("No se encontró alguna regla con las condiciones establecidas")
else:
    # Creamos un DataFrame de pandas con las reglas
    df_reglas = pd.DataFrame(reglas_lista, columns=['Antecedente', 'Consecuente', 'Soporte', 'Confianza'])
    print(df_reglas)

    Antecedente Consecuente   Soporte  Confianza
0       (GOMA,)    BORRADOR  0.285714   0.444444
1   (BORRADOR,)        GOMA  0.285714   0.800000
2    (LIBRETA,)        GOMA  0.285714   0.500000
3       (GOMA,)     LIBRETA  0.285714   0.444444
4     (PLUMAS,)        GOMA  0.285714   0.800000
5       (GOMA,)      PLUMAS  0.285714   0.444444
6    (POST-IT,)        GOMA  0.285714   0.666667
7       (GOMA,)     POST-IT  0.285714   0.444444
8      (REGLA,)        GOMA  0.285714   0.800000
9       (GOMA,)       REGLA  0.285714   0.444444
10     (REGLA,)     LAPICES  0.285714   0.800000
11   (LAPICES,)       REGLA  0.285714   0.800000
12  (PLUMONES,)     LIBRETA  0.285714   0.571429
13   (LIBRETA,)    PLUMONES  0.285714   0.500000
14   (POST-IT,)     LIBRETA  0.285714   0.666667
15   (LIBRETA,)     POST-IT  0.285714   0.500000
