# Preprocesamiento de datos para el sistema del filtro colaborativo

In [1]:
import pandas as pd
import os


# Definir ruta del archivo
base_dir = os.path.dirname(os.getcwd())

try:
    # Cargar el archivo
    url = os.path.join(base_dir, "data", "processed", "processed_data.csv")
    data = pd.read_csv(url, sep=",", encoding="utf-8")
    print("Carga exítosa, el archivo tiene un tamaño de:", data.shape)
    
except FileNotFoundError:
    print("Error: archivo no encontrado. Verífica la ruta.")
    
except PermissionError:
    print("Error: No tienes permiso para acceder al archivo.")
    
except pd.errors.EmptyDataError:
    print("El error esta vacío")
    
except pd.errors.ParserError:
    print("Error: Fallo al analizar el archivo. Verifica el formato")
    
except Exception as e:
    print(f"Error inesperado: {e}")

Carga exítosa, el archivo tiene un tamaño de: (51290, 9)


### Filtrando productos de tecnología

In [2]:
# Filtrado de productos solo tecnología
data = data[data["Category"] == "Technology"]

### Creando matriz usuarios-items

In [3]:
# Creando la matriz usuarios-items
user_matriz_item = data.pivot_table(
    index="Customer ID", 
    columns="Product ID", 
    values="Quantity", 
    fill_value=0
    )

# Convertir a valores binarios (1 si hay compra, 0 si no hay)
user_matriz_item = (user_matriz_item > 0).astype(int)

### Filtrando usuarios que realizarón compras

In [4]:
# Eliminar usuarios(filas) que no hayan realizado compras
user_matriz_item = user_matriz_item.loc[
    (user_matriz_item != 0).any(axis=1)
    ]

# Mostrar el tamaño de la matriz resultante
user_matriz_item.shape

(1301, 2375)

### Exportando la matriz usuarios-items

In [5]:
# Definir la ruta de guardado de la matriz
save_url = (
    "C:/Users/USUARIO/Desktop/Proyectos/Sistema_recomendacion/data/processed/users_matriz_items.csv"
            )

# Guardar la matriz en formato csv
user_matriz_item.to_csv(save_url, index=True)

print(f"Archivo guardado exítosamente en: {save_url}")

Archivo guardado exítosamente en: C:/Users/USUARIO/Desktop/Proyectos/Sistema_recomendacion/data/processed/users_matriz_items.csv
