# Estudio de las Ventas de una Ferretería

>Autor: Diana Chacón Ocariz

## Contexto:

Se trata de estudiar las ventas de una pequeña ferretería a partir del 01/01/2020.

Esta empresa maneja un poco más de 3.000 productos distintos. Poseen un software de gestión genérico que les provee una gran cantidad de reportes, básicamente tablas con números, díficiles de analizar (un reporte puede constar de varias decenas de páginas).

Por otro lado, los montos manejados están en Bs (Bolívares, moneda nacional venezolana). Durante el período de estudio, las grandes tasas de inflación, además de un cambio de moneda (eliminación de 6 ceros), dificultan el análisis. Por eso ha sido necesario transformar los montos a dólares según la tasa del día.


## Objetivos del negocio:

**Tener más visibilidad sobre las ventas para poder mejorar el proceso de compras y la toma de decisiones en general:** 

    - Analizar objetivamente las ventas.
    - Identificar los productos más vendidos y que no pueden faltar (productos indispensables).
    - Determinar los productos que podrían entrar en rotura de stock al final de un período.
    - Predecir las ventas futuras.
    

## Objetivos académicos:

    - Estudiar un caso real, con datos reales y cuyo resultado pueda ayudar a alguien a resolver un problema. 
    - Demostrar que la ciencia de datos puede ayudar a cualquier empresa, incluso PYMES.
    - Conocer y practicar el uso de herramientas de ciencia de datos.
    
    
## Fuentes de datos:

Los datos provienen de reportes sacados del software de gestión de la empresa. Se trata de archivos .xls que contienen sólo los datos de reportes sobre facturas (2020), ventas por producto (2021 y 2022) e inventario a la fecha.

Por razones de seguridad, para este estudio eliminamos toda la información concerniente a los clientes. Cualquier uso de los datos fuera de este estudio, deberá ser notificado a la empresa.

También se utilizan los datos del [histórico de la tasa de cambio del dólar](https://monitordolarvenezuela.com/historial#2a) que se obtiene a través de un [scraper](https://github.com/dchaconoca/proyecto-ventas/blob/master/NB5_scraper_tasa_dolar.ipynb).

Más detalles de los archivos utilizados, en el [NB1: Carga y limpieza de los Datos](https://github.com/dchaconoca/proyecto-ventas/blob/master/NB1_analisis_ventas_load.ipynb)


## Notebooks del Estudio:

1. [NB1: Carga y limpieza de los Datos](https://github.com/dchaconoca/proyecto-ventas/blob/master/NB1_analisis_ventas_load.ipynb): Carga, limpieza y transformación de los datos. Almacenamiento de los datos en archivos .parquet y .xlsx para uso en los otros notebooks y Google Data Studio.
1. [NB2: EDA y Visualización de los Datos](https://github.com/dchaconoca/proyecto-ventas/blob/master/NB2_analisis_ventas_eda.ipynb): Exploración de los datos y análisis para responder preguntas del negocio.
1. [NB3: Reporte Análisis de Ventas](https://github.com/dchaconoca/proyecto-ventas/blob/master/NB3_analisis_ventas_reporte.ipynb): Reporte de Negocio, dirigido a los directivos de la empresa con conclusiones y recomendaciones.
1. [NB4: Predicción de Ventas - Estudio de una Serie Temporal](https://github.com/dchaconoca/proyecto-ventas/blob/master/NB4_prediccion_ventas.ipynb): Estudio de series temporales y predicciones de ventas.
1. [NB5: Scraper Tasa de Cambio Dólar](https://github.com/dchaconoca/proyecto-ventas/blob/master/NB5_scraper_tasa_dolar.ipynb): Scraper para obtener el histórico de la tasa de cambio del USD.


## Reporte de Análisis de Ventas:

Reporte interactivo destinado a los gerentes de la empresa:

1. [Reporte en Google Data Studio](https://datastudio.google.com/reporting/a4e9910d-447d-417a-80a9-a1e5ae4a4b22)


## Hallazgos y resultados:

1. Hemos identificado algunos errores a nivel de los datos debidos a malas prácticas al momento de introducirlos: Reutilización de códigos de productos, productos mal clasificados dentro de las líneas de productos. Acciones correctivas serán aplicadas por el cliente para mejorar la calidad de los datos.
2. El cliente tiene hoy una visión más clara sobre cómo evolucionan las ventas, los momentos de mayor flujo de clientes, las líneas de productos y los productos que más se venden...
3. La definición e identificación de lo que son los productos indispensables (aquellos con ventas regulares y que no pueden faltar) es hasta ahora lo más útil del estudio, pues permite al cliente mejorar su proceso de compras. 


## Limitaciones y dificultades:

EL proyecto aún no ha terminado. Falta:

1. Buscar datos sobre las últimas entradas en stock de los productos para identificar aquellos que no se venden.
1. Terminar los reportes dirigidos a los gerentes de la empresa (NB3 y Reporte Google Data Studio).
1. Terminar el estudio de la serie temporal y afinar los modelos, tanto para la predicción de ventas en USD como la predicción de las ventas de los productos indispensables.
1. Automatizar el proceso una vez validado el estudio.

Lo que más se me ha dificultado ha sido todo lo concerniente al estudio de las series temporales y las predicciones: Significado de los gráficos, elección de los modelos y ajuste de los parámetros de los mismos para conseguir los mejores resultados.


## Instrucciones para la ejecución del proyecto:

1. Debe ejecutarse primero el NB1 que se encarga de cargar los datos brutos (raw). Los archivos con los datos se encuentran en el subdirectorio **datos/in**
2. En el mismo subdirectorio, también se encuentra el archivo **tasa_dolar.csv** que contiene el histórico de las tasas de cambio del día hasta el 01/03/2022. Si este archivo no está presente, puede ejecutarse el NB5
3. Una vez ejecutado el NB1, obtendremos en el subdirectorio **datos/out** todos los archivos con los datos necesarios para la ejecución de los notebooks NB2, NB3 y NB4. La ejecución de cada notebook es independiente
    