# Práctica 1 (reglas de Asociación)
Usa  la  librería  mlxtend  que  nos  permita  solucionar  todos  los  problemas  relacionados  con  las  reglas  de 
asociación. Para ello tendremos que usar el algoritmo Apriori y una serie de métodos para obtener la distinta 
información  que  este  genera.  Usaremos  la  librería  con  el  Dataset  Supermercado.csv  que  se  ha 
proporcionado. Prueba al menos tres configuraciones de soporte y da respuesta a las siguientes preguntas. 
Estas deben estar sustentadas con datos obtenidos durante la práctica y razonadas debidamente. 
Nota: También se pueden usar otras librerías como Orange3-Associate o Efficient-A priori.

Primer soporte = 0.1

In [43]:
# Importar librerías necesarias
import pandas as pd
from mlxtend.frequent_patterns import apriori, association_rules
from mlxtend.preprocessing import TransactionEncoder

# Cargar el dataset
supermercado_df = pd.read_csv("Supermercado.csv")

# Convertir los tickets en listas de productos
supermercado_df['Ticket'] = supermercado_df['Ticket'].apply(lambda x: x.split(', '))

# Preparar los datos para Apriori
te = TransactionEncoder()
transacciones = supermercado_df["Ticket"].tolist()
trans_encoded = te.fit(transacciones).transform(transacciones)
df_transacciones = pd.DataFrame(trans_encoded, columns=te.columns_)

# Definir los parámetros
min_support = 0.1  # Soporte mínimo bajo
confidence_threshold = 0.2  # Umbral de confianza

# ---- Generar itemsets frecuentes iterativamente ----
k = 1  # Nivel inicial
all_frequent_itemsets = []
current_itemsets = apriori(df_transacciones, min_support=min_support, use_colnames=True)

while not current_itemsets.empty:
    # Filtrar solo los itemsets de tamaño K y resetear el índice para quitar números en la izquierda
    current_itemsets["Tamaño"] = current_itemsets["itemsets"].apply(len)
    current_itemsets = current_itemsets[current_itemsets["Tamaño"] == k].reset_index(drop=True)

    if current_itemsets.empty:
        break  # Detener si no hay más combinaciones posibles

    # Guardar itemsets actuales
    all_frequent_itemsets.append(current_itemsets)

    # Mostrar resultados de la iteración actual sin números en la izquierda
    print(f"\nTabla K={k}: Itemsets con soporte")
    print(current_itemsets.to_string(index=False))

    # Generar el siguiente nivel de combinaciones
    k += 1
    current_itemsets = apriori(df_transacciones, min_support=min_support, use_colnames=True, max_len=k)

# Concatenar todos los itemsets generados y eliminar números de la izquierda
final_frequent_itemsets = pd.concat(all_frequent_itemsets, ignore_index=True)

# ---- Generar reglas de asociación finales ----
rules = association_rules(final_frequent_itemsets, metric="confidence", min_threshold=confidence_threshold)

# Mostrar reglas finales si existen sin números en la izquierda
if not rules.empty:
    print("\nReglas de asociación finales:")
    print(rules.to_string(index=False))
else:
    print("\n No se generaron reglas de asociación con los parámetros dados.")

# Guardar reglas en un archivo CSV
rules.to_csv("Reglas_Asociacion0.05.csv", index=False)
print("\nReglas de asociación guardadas en 'Reglas_Asociacion_0.05.csv'")





Tabla K=1: Itemsets con soporte
 support          itemsets  Tamaño
0.114286 (Aceite de oliva)       1
0.142857          (Azúcar)       1
0.142857            (Café)       1
0.128571        (Cebollas)       1
0.214286        (Galletas)       1
0.100000          (Harina)       1
0.114286           (Jabón)       1
0.457143           (Leche)       1
0.100000         (Patatas)       1
0.100000         (Pescado)       1
0.128571        (Plátanos)       1
0.100000           (Queso)       1
0.157143              (Té)       1
0.142857           (Yogur)       1
0.128571      (Zanahorias)       1

Tabla K=2: Itemsets con soporte
 support          itemsets  Tamaño
     0.1 (Leche, Galletas)       2

Reglas de asociación finales:
antecedents consequents  antecedent support  consequent support  support  confidence     lift  representativity  leverage  conviction  zhangs_metric  jaccard  certainty  kulczynski
    (Leche)  (Galletas)            0.457143            0.214286      0.1    0.218750 1.02083

Segundo soporte = 0.07

In [44]:
# Cargar el dataset
supermercado_df = pd.read_csv("Supermercado.csv")

# Convertir los tickets en listas de productos
supermercado_df['Ticket'] = supermercado_df['Ticket'].apply(lambda x: x.split(', '))

# Preparar los datos para Apriori
te = TransactionEncoder()
transacciones = supermercado_df["Ticket"].tolist()
trans_encoded = te.fit(transacciones).transform(transacciones)
df_transacciones = pd.DataFrame(trans_encoded, columns=te.columns_)

# Definir los parámetros
min_support = 0.07  # Soporte mínimo bajo
confidence_threshold = 0.2  # Umbral de confianza

# ---- Generar itemsets frecuentes iterativamente ----
k = 1  # Nivel inicial
all_frequent_itemsets = []
current_itemsets = apriori(df_transacciones, min_support=min_support, use_colnames=True)

while not current_itemsets.empty:
    # Filtrar solo los itemsets de tamaño K y resetear el índice para quitar números en la izquierda
    current_itemsets["Tamaño"] = current_itemsets["itemsets"].apply(len)
    current_itemsets = current_itemsets[current_itemsets["Tamaño"] == k].reset_index(drop=True)

    if current_itemsets.empty:
        break  # Detener si no hay más combinaciones posibles

    # Guardar itemsets actuales
    all_frequent_itemsets.append(current_itemsets)

    # Mostrar resultados de la iteración actual sin números en la izquierda
    print(f"\nTabla K={k}: Itemsets con soporte")
    print(current_itemsets.to_string(index=False))

    # Generar el siguiente nivel de combinaciones
    k += 1
    current_itemsets = apriori(df_transacciones, min_support=min_support, use_colnames=True, max_len=k)

# Concatenar todos los itemsets generados y eliminar números de la izquierda
final_frequent_itemsets = pd.concat(all_frequent_itemsets, ignore_index=True)

# ---- Generar reglas de asociación finales ----
rules = association_rules(final_frequent_itemsets, metric="confidence", min_threshold=confidence_threshold)

# Mostrar reglas finales si existen sin números en la izquierda
if not rules.empty:
    print("\nReglas de asociación finales:")
    print(rules.to_string(index=False))
else:
    print("\n No se generaron reglas de asociación con los parámetros dados.")

# Guardar reglas en un archivo CSV
rules.to_csv("Reglas_Asociacion_0.1.csv", index=False)
print("\nReglas de asociación guardadas en 'Reglas_Asociacion_0.1.csv'")





Tabla K=1: Itemsets con soporte
 support          itemsets  Tamaño
0.114286 (Aceite de oliva)       1
0.085714           (Arroz)       1
0.142857          (Azúcar)       1
0.142857            (Café)       1
0.085714           (Carne)       1
0.128571        (Cebollas)       1
0.071429       (Chocolate)       1
0.214286        (Galletas)       1
0.100000          (Harina)       1
0.085714          (Huevos)       1
0.114286           (Jabón)       1
0.457143           (Leche)       1
0.085714         (Lechuga)       1
0.085714        (Manzanas)       1
0.085714             (Pan)       1
0.100000         (Patatas)       1
0.100000         (Pescado)       1
0.128571        (Plátanos)       1
0.100000           (Queso)       1
0.071429         (Tomates)       1
0.157143              (Té)       1
0.142857           (Yogur)       1
0.128571      (Zanahorias)       1

Tabla K=2: Itemsets con soporte
 support            itemsets  Tamaño
0.071429       (Café, Leche)       2
0.071429   (Leche, C

Tercer soporte = 0.03

In [47]:
# Cargar el dataset
supermercado_df = pd.read_csv("Supermercado.csv")

# Convertir los tickets en listas de productos
supermercado_df['Ticket'] = supermercado_df['Ticket'].apply(lambda x: x.split(', '))

# Preparar los datos para Apriori
te = TransactionEncoder()
transacciones = supermercado_df["Ticket"].tolist()
trans_encoded = te.fit(transacciones).transform(transacciones)
df_transacciones = pd.DataFrame(trans_encoded, columns=te.columns_)

# Definir los parámetros
min_support = 0.03  # Soporte mínimo bajo
confidence_threshold = 0.2  # Umbral de confianza

# ---- Generar itemsets frecuentes iterativamente ----
k = 1  # Nivel inicial
all_frequent_itemsets = []
current_itemsets = apriori(df_transacciones, min_support=min_support, use_colnames=True)

while not current_itemsets.empty:
    # Filtrar solo los itemsets de tamaño K y resetear el índice para quitar números en la izquierda
    current_itemsets["Tamaño"] = current_itemsets["itemsets"].apply(len)
    current_itemsets = current_itemsets[current_itemsets["Tamaño"] == k].reset_index(drop=True)

    if current_itemsets.empty:
        break  # Detener si no hay más combinaciones posibles

    # Guardar itemsets actuales
    all_frequent_itemsets.append(current_itemsets)

    # Mostrar resultados de la iteración actual sin números en la izquierda
    print(f"\nTabla K={k}: Itemsets con soporte")
    print(current_itemsets.to_string(index=False))

    # Generar el siguiente nivel de combinaciones
    k += 1
    current_itemsets = apriori(df_transacciones, min_support=min_support, use_colnames=True, max_len=k)

# Concatenar todos los itemsets generados y eliminar números de la izquierda
final_frequent_itemsets = pd.concat(all_frequent_itemsets, ignore_index=True)

# ---- Generar reglas de asociación finales ----
rules = association_rules(final_frequent_itemsets, metric="confidence", min_threshold=confidence_threshold)
# Seleccionar solo las columnas que queremos en la tabla final
rules = rules[[
    "antecedents", "consequents", "antecedent support", "consequent support",
    "support", "confidence", "lift", "leverage", "conviction"
]]

# Renombrar las columnas al español
rules.rename(columns={
    "antecedents": "Antecedente",
    "consequents": "Consecuente",
    "antecedent support": "Soporte del antecedente",
    "consequent support": "Soporte del consecuente",
    "support": "Soporte",
    "confidence": "Confianza",
    "lift": "Elevación (Lift)",
    "leverage": "Ventaja",
    "conviction": "Convicción"
}, inplace=True)
# Mostrar reglas finales si existen sin números en la izquierda
if not rules.empty:
    print("\nReglas de asociación finales:")
    print(rules.to_string(index=False))
else:
    print("\n No se generaron reglas de asociación con los parámetros dados.")







Tabla K=1: Itemsets con soporte
 support          itemsets  Tamaño
0.114286 (Aceite de oliva)       1
0.085714           (Arroz)       1
0.142857          (Azúcar)       1
0.142857            (Café)       1
0.085714           (Carne)       1
0.128571        (Cebollas)       1
0.071429       (Chocolate)       1
0.214286        (Galletas)       1
0.100000          (Harina)       1
0.085714          (Huevos)       1
0.114286           (Jabón)       1
0.457143           (Leche)       1
0.085714         (Lechuga)       1
0.085714        (Manzanas)       1
0.085714             (Pan)       1
0.057143           (Pasta)       1
0.100000         (Patatas)       1
0.100000         (Pescado)       1
0.128571        (Plátanos)       1
0.100000           (Queso)       1
0.042857             (Sal)       1
0.071429         (Tomates)       1
0.157143              (Té)       1
0.142857           (Yogur)       1
0.128571      (Zanahorias)       1

Tabla K=2: Itemsets con soporte
 support                

Con un soporte mínimo bajo explica que itemsets frecuentes se generan. Interpreta al menos dos de las reglas 
que se obtienen con dicho soporte.  (1 punto)

¿Qué tipo reglas desaparecen según aumentamos el valor de los soportes usados? ¿Por qué? (1 punto) 

Establece  ahora  el  soporte  mínimo  a  0,3  y  juega  con  la  confianza.  Primero  establécela  en  un  valor  bajo  y 
luego  en  uno  alto.  Explica  que  cambios  ves  en  las  reglas  y  porque  crees  que  ocurren  dichos  cambios. 
Interpreta la regla que veas más significativa. (1 punto)

Obtén una configuración de soporte y confianza que funcione mejor según tu criterio. Razona y explica cómo 
has tomado la decisión. (1 punto)

Dadas  la  que  consideres  mejor  configuración  de  soporte  y  confianza.  ¿Existen  reglas  o  patrones  que  se 
repitan?  ¿Podemos  generalizar  de  alguna  manera  como  se  comportan  los  clientes  del  supermercado?  (1 
punto)

Con los resultados del apartado anterior, interpreta que ocurre con el lift para al menos dos instancias. (1 
punto)

Con la configuración anterior. Primero elimina un número de instancias del producto que crea que es más 
crítico  para  generar  reglas  (deja  al  menos  una  instancia).  Segundo,  realiza  un  proceso  parecido,  pero 
eliminando  transacciones.  ¿Qué  ves  que  ocurre?  Razona  porque  sucede  esto.  (1  punto) 
