## Predicción de ventas en productos de joyería con Machine Learning y DARTS

##### Juan Esteban Puyo Cubillos

##### Diplomado en Ciencia de Datos, Universidad Nacional de Colombia

##### Prof Daniel Montenegro

##### Agosto 13 de 2023

#### Introducción

La gestión de los costes de producción es un factor clave para aumentar la competitividad industrial. En el mercado de joyería, los metales preciosos y las piedras preciosas comprenden el 65% del costo del material de joyería. El otro porcentaje es dividos en otros recursos (personal, tiempo y energía).

Administrar el costo de la materia prima es una tarea desafiante, especialmente cuando el precio fluctúa mucho. Puesto que, una alternativa viable para gestionar los costos es la predicción de ventas.

La predicción de ventas permite gestionar el inventario, apoyar en la creación de una estimación de gastos y hasta mejorar la eficiencia en la producción (evitando problemas como la subutilización de recursos o la sobreproducción)

El presente trabajo presenta la predicción de ventas en productos de joyería con Machine Learning y DARTS, una librería de python.

#### Definición del problema

La joyería es parte de la historia de Colombia, un elemento profundamente arraigado a su idiosincrasia, donde la tradición y la modernidad encuentran un punto medio dentro del desarrollo socioeconómico del país. 

Por este motivo, es importante preguntarse si realmente le estamos sacando provecho a la materia prima, la tradición y la mano de obra local. Según FENALCO (2015) el 98% del mercado de joyería en Colombia es informal. Lo que significa que, a diferencia de micro empresas y empresas bien constituidas, no se crean estrategias que potencien las ventas, optimicen los procesos de producción y gestionen los gastos.

La predicción de ventas es una herramienta valiosa que puede ayudar a las joyerías en Colombia a evaluar su rentabilidad, controlar sus gastos y optimizar sus procesos de producción. Es un primer paso en la creación de un plan que proporcione información valiosa para tomar decisiones informadas.  

Con base en lo anterior, el presente trabajo presenta un modelo de ciencia de datos que predice las ventas de productos de joyería con la utilización de machine learning y DARTS, una librería de python.

#### Fuentes de los datos

Este archivo contiene datos de compras de diciembre de 2018 a diciembre de 2021 (3 años) de una tienda en línea de joyería de tamaño mediano. Cada fila del archivo representa un producto comprado. Varios productos del mismo pedido/compra se enumeran en líneas separadas y se unen mediante el campo order_id.

In [2]:
import pandas as pd

In [3]:
jew = pd.read_csv("jewelry.csv")

In [7]:
jew.head(100)

Unnamed: 0,2018-12-01 11:40:29 UTC,1924719191579951782,1842195256808833386,1,1806829201890738522,jewelry.earring,0,561.51,1515915625207851155,Unnamed: 9,red,gold,diamond
0,2018-12-01 17:38:31 UTC,1924899396621697920,1806829193678291446,1,1.806829e+18,,,212.14,1.515916e+18,,yellow,gold,
1,2018-12-02 13:53:42 UTC,1925511016616034733,1842214461889315556,1,1.806829e+18,jewelry.pendant,1.0,54.66,1.515916e+18,f,white,gold,sapphire
2,2018-12-02 17:44:02 UTC,1925626951238681511,1835566849434059453,1,1.806829e+18,jewelry.pendant,0.0,88.90,1.515916e+18,f,red,gold,diamond
3,2018-12-02 21:30:19 UTC,1925740842841014667,1873936840742928865,1,1.806829e+18,jewelry.necklace,0.0,417.67,1.515916e+18,,red,gold,amethyst
4,2018-12-02 22:09:34 UTC,1925760595336888995,1835566854827934449,1,1.806829e+18,jewelry.earring,1.0,102.27,1.515916e+18,,red,gold,
...,...,...,...,...,...,...,...,...,...,...,...,...,...
95,2018-12-19 16:23:01 UTC,1937907359061901878,1857928178572460326,1,1.806829e+18,jewelry.ring,1.0,200.85,1.515916e+18,,white,gold,diamond
96,2018-12-19 16:53:23 UTC,1937922645941027618,1870506514704236918,1,1.806829e+18,jewelry.ring,1.0,150.55,1.515916e+18,f,red,gold,diamond
97,2018-12-20 12:24:45 UTC,1938512213568389226,1806829198015201339,1,1.806829e+18,jewelry.ring,2.0,171.25,1.515916e+18,,red,gold,fianit
98,2018-12-20 12:47:00 UTC,1938523410967560554,1839476427351654532,1,1.806829e+18,jewelry.pendant,,0.99,1.515916e+18,,,silver,fianit


#### ETL

El proceso de transformación y limpieza permitirá desde poner etiquetas a cada una de las columnas con el fin de saber que información contienen hasta eliminar campos nulos y terminos redundates (ej, jewelry.ring)

#### Exploración de los datos

Las ventas son variables cuantitativas continuas que podría analizar utilizando las funciones densidad de una distribución normal.

Por otro lado, se visualizarán gráficas de pie para clasificar los tipos de productos en relación con sus ventas y el tipo de material utilizado.

#### Técnicas de modelación propuestas 

Para el proyecto, se utilizará DARTS, una biblioteca de Python para pronósticos fáciles de usar y detección de anomalías en series temporales. Contiene una variedad de modelos, desde clásicos como ARIMA hasta redes neuronales profundas. Todos los modelos de pronóstico se pueden usar de la misma manera, Uso y funciones, similar a scikit-learn.

#### Conocimientos requeridos para el desarrollo del proyecto

Python, Intermedio

Series de tiempo, intermedio

Modelos supervisados predictivos, básico

#### Resultados Esperados

Un modelo mátemático capaz de hacer una predicción de ventas a través del tiempo para productos de joyería.

#### Tiempo de desarrollo: 5 semanas

#### Referencias

State of fashion: watches and jewellery. (2021, 14 junio). McKinsey & Company. https://www.mckinsey.com/industries/retail/our-insights/state-of-fashion-watches-and-jewellery

Análisis económico sobre el sector joyero en Colombia. (s. f.) FENALCO. https://es.slideshare.net/FenalcoAntioquia/anlisis-econmico-sobre-el-sector-joyero-en-colombia