# Customer shopping

## Librerías

In [1]:
import json
import os
import pandas as pd
import json
import zipfile

from kaggle.api.kaggle_api_extended import KaggleApi

## Configuración del API de Kaggle

1. Iniciar sesión en tu cuenta de Kaggle en `https://www.kaggle.com`
2. Hacer clic en tu foto de perfil en la esquina superior derecha de la página y seleccionar "Cuenta" en el menú desplaable.
3. Desplazar hacia abajo hasta la sección `API` y haz clic en `Crear nueva clave de API`.
4. Se descargará automáticamente el archivo `kaggle.json` que contiene las credenciales de API de Kaggle.
5. Guardar el archivo kaggle.json en una `input`.

In [2]:
def set_environ_kaggle(path: str) -> None:
    """Establece las variables de entorno para la autenticación 
     de la API de Kaggle.

    Args:
        path: Ruta al archivo kaggle.json que contiene las 
         credenciales de API de Kaggle.

    """
    with open(path, 'r') as f:
        data = json.load(f)

    os.environ['KAGGLE_USERNAME'] = data['username']
    os.environ['KAGGLE_KEY'] = data['key']

In [3]:
kaggle_path = os.path.join('..', 'input', 'kaggle.json')

In [4]:
# Se configura el entorno para autenticarse en KAGGLE.
set_environ_kaggle(kaggle_path)

## Descargar el conjunto de datos

In [5]:
def download_dataset(dataset_name: str, output_path: str) -> None:
    """Descarga un conjunto de datos de Kaggle y lo extrae en 
     la ubicación especificada.

    Args:
        dataset_name: Nombre del conjunto de datos en Kaggle.
         Debe seguir el formato 'nombre-usuario/nombre-conjunto-datos'.
        output_path: Ruta donde se extraerán los archivos 
         del conjunto de datos.

    """
    api = KaggleApi()
    api.authenticate()

    api.dataset_download_files(dataset_name)

    file_name = dataset_name.split('/')[1]
    with zipfile.ZipFile(f'{file_name}.zip', 'r') as zip_ref:
        zip_ref.extractall(output_path)

    os.remove(f'{file_name}.zip')

El dataset se encuentra en el link: https://www.kaggle.com/datasets/mehmettahiraslan/customer-shopping-dataset

In [6]:
dataset_name = 'mehmettahiraslan/customer-shopping-dataset'

In [7]:
data_path = os.path.join('..', 'data')

In [8]:
download_dataset(dataset_name, data_path)

### Se muestra el resultado

In [9]:
path_df = os.path.join('..', 'data', 'customer_shopping_data.csv')

customers = pd.read_csv(path_df)

In [10]:
customers.head()

Unnamed: 0,invoice_no,customer_id,gender,age,category,quantity,price,payment_method,invoice_date,shopping_mall
0,I138884,C241288,Female,28,Clothing,5,1500.4,Credit Card,5/8/2022,Kanyon
1,I317333,C111565,Male,21,Shoes,3,1800.51,Debit Card,12/12/2021,Forum Istanbul
2,I127801,C266599,Male,20,Clothing,1,300.08,Cash,9/11/2021,Metrocity
3,I173702,C988172,Female,66,Shoes,5,3000.85,Credit Card,16/05/2021,Metropol AVM
4,I337046,C189076,Female,53,Books,4,60.6,Cash,24/10/2021,Kanyon
