![logo](images/untumbes.PNG)

<center><b>Prof. Dr. Jorge Zavaleta - zavaleta.jorge@gmail.com</b></center>

# Reglas de asociación

In [None]:
#librarys
import pandas as pd
import numpy as np
#
import heapq
from mlxtend.frequent_patterns import apriori
from mlxtend.frequent_patterns import association_rules
from mlxtend.preprocessing import TransactionEncoder
#
from surprise import Dataset, Reader, KNNBasic
# ml
from surprise.model_selection import train_test_split

# graphics
import matplotlib.pylab as plt
%matplotlib inline
#
import warnings
warnings.filterwarnings("ignore")

>## Situación a resolver

1. Una tienda que vende accesorios para teléfonos móviles realiza una promoción en placas frontales.
2. Los clientes que compren varias placas frontales entre una selección de seis colores diferentes obtienen un descuento.
3. Los gerentes de la tienda, que querían saber qué colores de placas frontales es probable que los clientes compren juntos, recopilaron la base de datos de transacciones [1]

In [None]:
# Load and preprocess data set
data = pd.read_csv('data/Faceplate.csv')
data.set_index('Transaction', inplace=True)
data.head(10)

In [None]:
data.shape

>## Crear las frequencias

In [None]:
# create frequent itemsets
itemsets = apriori(data, min_support=0.2, use_colnames=True)
itemsets[['itemsets','support']]

>## Convertir las frecuencias en reglas

![bm](images/bm.png)

![lift](images/lift.png)

In [None]:
# convert into rules
rules = association_rules(itemsets, metric='confidence', min_threshold=0.5)
rules.sort_values(by=['lift'], ascending=False).head(6)

In [None]:
regras = rules.sort_values(by=['lift'], ascending=False)
rules_dataset = regras.drop(columns=['antecedent support', 'consequent support', 'conviction'])
rules_dataset.head()

>## Comestibles

In [None]:
# Load and preprocess data set
comes = pd.read_csv('data/basket.csv')
comes.head()

In [None]:
#tratando valores NaN
comes.replace(np.nan,0,inplace=True)
comes.head(10)

In [None]:
# crear funcion lambda para mover los valosres x!=0 para uma lista
def removerTodosZerosLista(lista):
    return list(filter(lambda x: x!=0, lista))

In [None]:
#transformando en lista
lista_todas_transacciones = []
for index, row in comes.iterrows():
    lista_de_trans = row.values.tolist()
    lista_de_trans = removerTodosZerosLista(lista_de_trans)
    # adiciona a la lista general
    lista_todas_transacciones.append(lista_de_trans)
    
# visualiza lista
lista_todas_transacciones[0:10]

In [None]:
# usando a biblioteca "mlxtend" para realizar preprocesamiento y ML.
#
Te = TransactionEncoder()
#
data_te = Te.fit(lista_todas_transacciones).transform(lista_todas_transacciones)
data_te #one-hot-encoding

In [None]:
# one-hot-encoding transformo todos los elementos comprados en columnas
Te.columns_[0:10]

In [None]:
# tamanho de la lista
len(Te.columns_)

In [None]:
# construyendo el DataFrame de los datos de las transacciones
T_data = pd.DataFrame(data_te, columns=Te.columns_)
T_data.head()

In [None]:
# usando el algoritmo apriori
frecuentes_itemsets = apriori(T_data, min_support=0.003,use_colnames=True)
# ordenar de mayor para menor
frecuentes_itemsets.sort_values(by=['support'],ascending=False)
#
frecuentes_itemsets[['itemsets','support']][0:10]

In [None]:
# importando y usando la asociacion de reglas
reglas = association_rules(frecuentes_itemsets,metric='confidence',min_threshold=0.001)
#
reglas_data = reglas.sort_values(by=['lift'],ascending=False)
reglas_data.head()

In [None]:
# lift > 1
rd = reglas_data.drop(['antecedent support','consequent support','leverage','conviction'], axis=1)
rd.head(10)

> ### Análisis?

[1] Shmueli, G. bruce, P.C. Gedeck, P. Patel, N.R. Data mining for Business Analytics: Concepts, techniques and Application in Python. John Wiley & Sons, Inc. 2020.

---
<center><b>&copy;Jorge Zavaleta, 2024</b></center>