---
documentclass: report
output:
  pdf_document:
    keep_tex: no
    pandoc_args: [
      "-H", "preamble.tex"
    ]
header-includes:
  - \usepackage{biblatex}
  - \addbibresource{references.bib}
---

\renewcommand\refname{Bibliografía}
\renewcommand{\contentsname}{Contenido}
\renewcommand{\listfigurename}{Lista de Figuras}
\linespread{1.3}

\begin{titlepage}
    \centering
    \vspace*{2cm}
    \LARGE
    \textbf{Análisis del impacto que tienen las promociones en las ventas de desodorantes en aerosol}
    
    \vspace{1cm}
    \large
    Análisis de las ventas de desodorantes en aerosol en cinco cadenas de supermercados ubicados en Argentina
    
    \vspace{2cm}
    
    \begin{tabular}{c}
        \Large Erika Ortiz \\
        \Large Romina Iglesias \\
        \Large Carme Alegret \\
    \end{tabular}
    
    \vfill
    \large
    Este reporte se presenta como requisito para el Master en Data Science y Advanced Analytics 
    
    \vspace{0.5cm}
    Universitat Internacional de Catalunya\\
    Barcelona, España\\
    Abril 2023
\end{titlepage}

\newpage

\tableofcontents

\newpage

\listoffigures

\newpage

\section{Introducción}

En este trabajo se llevará a cabo un análisis exploratorio de datos de los movimientos de ventas de desodorantes en aerosol y las diferentes promociones aplicadas a los distintos productos. El producto seleccionado para el estudio son los desodorantes en aerosol pertenecientes a la familia de productos de limpieza para el baño y el hogar distribuidos en diferentes supermercados de Argentina.

El análisis se realizará con cadenas de supermercados ubicados en Argentina durante el período del 15 de julio de 2016 al 14 de julio de 2019. Para el análisis tenemos cuatro datasets, los cuales son: movimientos, promociones, proveedores_productos y locales, que tienen los siguientes tamaños:


1. Movimientos de ventas: 8,347,817 registros
2. Promociones: 15,270 registros
3. Locales: 175 registros
4. Productos y proveedores: 82 registros

En este análisis, se identifaron 5 cadenas de supermercados de las cuales Jumbo y Disco son puntos de distribucción.  Los nombres de las cadenas se describen a continuación: 

1. Plaza Vea
2. Vea
3. Disco
4. Jumbo
5. Rincón Jumbo


El dataset contiene productos suministrados por 4 proveedores principales que son: 

1. S.C. Johnson & Son de Argentina S.A. 
2. Clorox Argentina S.A.
3. Reckitt Benckiser Argentina S.A.
4. Industrias Iberia S.A.I.C.

Además, se encontraron 82 referencias de desodorantes en aerosol pertenecientes a la familia Limpieza de Baño y Hogar. 

En resumen, el objetivo de este trabajo es desarrollar un análisis de las ventas de desodorantes en función de las promociones para poder predecir el volumen de ventas. También se identificarán patrones y tendencias en la venta de desodorantes en aerosol y, potencialmente, se brindará información útil a las cadenas de supermercados involucradas para mejorar sus estrategias de ventas.

\newpage

\section{Objetivos}

1. Determinar el efecto de las promociones en las ventas de desodorantes en aerosol a partir del análisis del dataset disponible desde el 15 de Julio de 2016 hasta  14 de Julio de 2019.

2. Evaluar las ventas de desodorantes en aerosol que no fueron promocionados para identificar patrones y tendencias en la demanda.

3. Desarrollar un modelo predictivo que permita estimar el volumen de ventas de desodorantes en aerosol cuando se implementa una promoción.

4. Establecer una arquitectura adecuada para la creación, mantenimiento y despliegue del modelo predictivo, considerando factores como la escalabilidad y la eficiencia del proceso.

\newpage

\section{Análisis Exploratorio de los Datos}

## Limpieza de los datasets 

Para realizar el estudio de las ventas de desodorantes, se cuentan con cuatro fuentes de información que son las siguientes: 

#### Dataset No. 1 Movimientos de ventas 

1. La tabla de movimientos de ventas contiene un total de 8.347.817 registros.

2. Esta tabla es transaccional y registra las ventas realizadas por cada producto, la cantidad vendida en unidades, el stock en unidades, el precio de venta unitario y la fecha de transacción.

3. El dataset contiene registros desde el 15 de julio de 2016 hasta el 14 de julio de 2019.

4. El número de registros por año se distribuye de la siguiente manera:

- 2016: 1.177.264
- 2017: 2.343.400
- 2018: 2.914.155
- 2019: 1.912.998

5. La tabla no presenta valores faltantes ni duplicados.

6. En el dataset se encontraron 92 referencias únicas de desodorantes.


#### Dataset No. 2 Promociones 

1. Durante el análisis exploratorio de datos, se encontraron 268,692 registros duplicados en la tabla de promociones. Tras verificar que efectivamente eran registros duplicados, se procedió a eliminarlos del dataset.

2. La tabla de promociones resultante quedó con un total de 15,270 registros y contiene información sobre el identificador del producto, el id de la promoción, la fecha de inicio y finalización, la cantidad de ventas estimadas y el local en el cual se realizó la promoción. Además, se realizó una operación left join con la tabla de movimientos para establecer los movimientos que tengan promociones asociadas.

3. El dataset contiene información sobre las promociones realizadas desde el 19 de julio de 2016 hasta el 16 de julio de 2019.

4. Durante la revisión del dataset, se notó que la columna "porcentaje_dcto", que contenía información sobre el descuento aplicado, no correspondía a un porcentaje. Al verificar la diferencia entre las fechas de finalización y de inicio de las promociones, se concluyó que la columna hacía referencia a la duración de la promoción en días. Por lo tanto, se creó la columna "duracion_promo", calculando el tiempo transcurrido entre la fecha de inicio y la fecha de finalización de la promoción.



#### Dataset No. 3 Proveedores y descripción de Productos

1. Se puede concluir que en el dataset hay un total de 82 productos únicos suministrados por cuatro proveedores principales. Todos los productos son desodorantes en aerosol que pertenecen a la categoría de productos de limpieza para el hogar y baño.

2. Para este análisis, se han seleccionado únicamente las columnas de razon social, id del proveedor, id del producto y descripción del producto, eliminando las demás columnas del dataset. 

3. Es importante mencionar que se eliminaron las columnas que no eran relevantes para los objetivos específicos del análisis, tales como la columna de familia, subfamilia y gran familia, ya que todos los productos del dataset corresponden a la misma familia, subfamilia y gran familia.

La agrupación de los productos por gran familia, familia y subfamilia se muestra en la siguiente tabla:

| **desc_sector** | **desc_seccion** | **desc_gran_flia** | **desc_flia**             | **desc_sub_flia**       |
|:---------------:|:----------------:|:------------------:|:-------------------------:|:-----------------------:|
| Almacén         | Limpieza         | Baño y Hogar       | Desodorantes de ambientes | Desodorantes en aerosol |
|                 |                  |                    |                           | **Total productos: 82** |


4. Se encontraron 10 referencias de productos que no tienen correspondencia en la tabla proveedores_productos. La tabla movimientos contiene 92 referencias únicas, mientras que la tabla proveedores_productos solo tiene 82 referencias únicas. Por lo tanto, 10 referencias no tienen información sobre la descripción del producto o la razón social.

5. Según el análisis de la cantidad de desodorantes en aerosol suministrados por proveedor (ver Figura 1), se puede concluir lo siguiente:

\begin{figure}
\centering % imagen centrada
\captionsetup{justification=centering,margin=2cm}
\includegraphics[width=1\textwidth]{images/productos_por_proveedor.png}
\caption{Figura 1.Análisis de la cantidad de desodorantes en aeresol suministrado por proveedor}
Figura 1. Análisis de la cantidad de desodorantes en aeresol suministrado por proveedor
\end{figure}

- S.C. Johnson & Son de Argentina S.A. suministra 50 referencias, lo que representa el 61% de las referencias incluidas en el análisis.
- Clorox Argentina S.A. suministra 21 referencias.
- Reckitt Benckiser Argentina S.A. suministra 10 referencias.
- Industrias Iberia S.A.I.C. suministra 1 referencia.


#### Dataset No. 4 Locales 

1. El dataset incluye 6 centros de distribución y 169 locales de supermercado.

2. La tabla de locales proporciona información sobre la ubicación y coordenadas geográficas de cada tienda, así como su ID de región correspondiente.

3. La Figura 2 muestra la distribución de locales entre las diferentes cadenas de supermercados.

\begin{figure}
\centering % imagen centrada
\captionsetup{justification=centering,margin=2cm}
\includegraphics[width=1\textwidth]{images/porcentaje_locales.png}
\caption{Figura 2. Porcentaje de locales por cadena de supermercado}
Figura 2. Porcentaje de locales por cadena de supermercado
\end{figure}

| **Cadena**   | **Total Locales** |
|:------------:|:-----------------:|
| Vea          | 68                |
| Disco        | 61                |
| Jumbo        | 31                |
| Rincon Jumbo | 10                |
| Plaza Vea    | 5                 |
| **Total**    | **175**           |


5. Al analizar la tabla de locales, se puede concluir que las cadenas de supermercados Vea y Disco tienen la mayor cantidad de locales, seguidas por la cadena Jumbo. En último lugar, se encuentran las tiendas de la cadena Plaza Vea. Asimismo, se observó que la mayoría de las ventas corresponden a los locales de las cadenas Vea, Disco y Jumbo. 
 

## Unión del dataset final 

Para realizar la unión de los cuatro datasets se han utilizado los siguientes servicios:  

- Google Cloud Storage: Crear un bucket llamada deodorants y subir los cuatro datasets limpios previavemente en formato .csv. 
- BigQuery: Crear un dataset utilizando los arhivos csv almacenados en Google Storage y crear una SQL query para unir las diferentes tablas usando las primary keys. 

El resultado final despues de realizar un proceso de limpieza y tratamiento de valores missing y/o nulos es un dataset final de 8.272.128 registros y 28 columnas identificadas de la siguiente manera:

**1. Variables numéricas:**

- idb: Identificador interno del local.
- id_producto: Identificador interno del producto.
- fecha_trans: Fecha de la transacción (un día antes de la fecha actual).
- stock_unidades: Número de unidades de producto en el local.
- venta_unidades: Número de unidades vendidas.
- precio_unitario: Precio de venta unitario.
- mov_month.
- mov_year.
- mov_weekday.
- id_cadena: Identificador interno de la cadena.
- id_region: Identificador interno de la región.
- latitud: Ubicación en el eje Y de la boca.
- longitud: Ubicación en el eje X de la boca.
- ventas_estimadas_promo: Estimación de ventas en unidades durante la promoción.
- nro_prom: Número de la promoción.
- duracion_promo: Duración de la promoción (diferencia entre fecha_desde y fecha_hasta).

**2. Variables binarias:**

- cd_abast: Identificador de la ubicación de la tienda que suministra el producto a la ubicación actual.
- sigue_prod_en_rol: Indica si el producto sigue en rol (SI) o no (NO) en la ubicación actual.
- punto_distr: Indica si el valor es 1 que es un centro de distribución, de lo contrario es un local.
- local: Indica si el valor es 1 que es un local, si es 0 no es un local.
- is_weekend.
- tiene_promo.

**3. Variables categóricas:**

- desc_cadena: Tiene 5 subniveles: Plaza Vea, Vea, Jumbo, Disco y Rincón Jumbo.
- dia_semana.
- estación.
- zona.

**4. Variables string:**

- desc_producto.
- razon_social.

#### Columnas que se eliminaron

- desc_region: Tiene 1 subnivel, el cual es Buenos Aires para todos los registros, lo que indica que solo hay una región para todos. Se decidió eliminarla para el propósito del análisis.
- desc_local: Debido a que no aporta información relevante para el análisis y se dispone de las coordenadas de latitud y longitud.
- fecha_desde: Fecha de inicio de la promoción, ya que se calculó la columna duracion_promo con base en estos resultados.
- fecha_hasta: Fecha de finalización de la promoción.
- Las columnas relacionadas con familia, subfamilia y gran familia, ya que solo teníamos un nivel para todos los productos del dataset, lo que no lo hace relevante para el análisis.

#### Feature Engineering 


Las siguientes columnas fueron creadas  para ayudarnos con el análisis exploratorio de los datos. 

- duración_promo: se refiere a la diferencia de tiempo entre la fecha de inicio y la fecha de finalización de una promoción.

- is_weekend: es una variable binaria que toma el valor 1 si el día es fin de semana (sábado o domingo) y 0 si es día entre semana.

- Se crearon las columnas mov_year, mov_month y mov_day, dia_semana.

- tiene_promo: es una variable binaria que toma el valor 1 si el producto tiene una promoción y 0 si no tiene promoción.

- estacion: contiene la clasificación de las estaciones del año (invierno, verano, primavera y otoño). Se establecieron las fechas para cada estación de la siguiente manera:

    - Invierno: del 21 de diciembre al 20 de marzo.
    - Primavera: del 21 de marzo al 20 de junio.
    - Verano: del 21 de junio al 20 de septiembre.
    - Otoño: del 21 de septiembre al 20 de diciembre.

- zona: Creadas con base en los cuadrantes de las coordenadas, se establecoieron los siguientes cuadrantes: 
    - zona 1: latitude >= -34.0 y longitud >= -58.0
    - zona 2: latitude >= -34.0 y longitud < -58.0
    - zona 3: latitude < -34.0 y longitud >= -58.0
    - zona 4: valores de latitud y longitud que no cumplan con las condiciones anteriores.
    
    
    
#### Outliers y Distribuccion de las columnas ventas, duracion promocion, stock_unidades y ventas_estimadas en promocion. 


\begin{figure}
\centering % imagen centrada
\captionsetup{justification=centering,margin=2cm}
\includegraphics[width=1\textwidth]{images/valores_outliers.png}
\caption{Figura 3. Valores Outliers}
Figura 3. Valores Outliers Ventas, Stock y Duración de la promoción
\end{figure}


#### Tratamiento de registros 

Durante el análisis del dataset se encontraron registros con valores missing, otros con valores de stock negativos y unos valores de latitud y longitud con valores 0,0, a continuación se describe el tratamiento que se dio a cada caso en particular. 

##### Valores missing 

Para los valores missing se hizo el siguiente tratamiento:

| **Columna**            | **Total de valores missing**| **Tratamiento**                               |
|------------------------|-----------------------------|-----------------------------------------------|
| nro_prom               | 8220158                     | Relleno con 0.0 para productos sin promoción* |
| ventas_estimadas_promo | 8220158                     | Relleno con 0.0 para productos sin promoción* |
| duracion_promo         | 8220158                     | Relleno con 0.0 para productos sin promoción* |
| desc_producto          | 598448                      | Relleno con 'missing'                         |
| id_region              | 598448                      | Relleno con 1.0 como valor por defecto        |
| razon_social           | 598448                      | Relleno con 'unknown'                         |
| latitud                | 35                          | Relleno con la media de la latitud            |
| longitud               | 35                          | Relleno con la media de la longitud           |

***Producto sin promocion:*** Son aquellos productos en los cuales las columnas nro_prom, ventas_estimadas_promo y duracion_prom se encuentran vacias debido a que el dataset final contiene productos con promoción y sin promoción. 


##### Valores de stock negativos 


Se encontraron 45,527 registros con valores negativos en la columna de stock_unidades, lo que equivale a aproximadamente el 0.545% del total de registros. Para evitar posibles errores en el análisis y para brindar mayor claridad y precisión en los datos, se ha decidido reemplazar estos valores negativos por cero. 

| **Columna**   | **Total valores negativos** | **Tratamiento** |
|---------------|-----------------------------|-----------------|
| stock_unidad  | 45527                       | Relleno con 0.0 |

La presencia de valores negativos en la columna de stock_unidades puede generar confusiones e interpretaciones erróneas por parte de los usuarios, por lo que es importante corregir esta inconsistencia en la información. Además, se recomienda analizar la causa raíz de estos errores de inventario para evitar futuras inconsistencias en los datos.


##### Valores de latitud y longitud con 0.0.

Se encontraron 14 registros con valores de 0.0 en las columnas latitud y longitud, para solucionar esto, se hizo una busqueda en Google para encontrar las coordenadas de esas calles y se realizaron las imputaciones necesarias.


#### Eliminacion de registros 

Durante el proceso de exploración de datos del dataset final merged se identificaron los siguientes casos de datos con valores negativos y faltantes que aportarian informacion incorrecta al analisis sino se tratan de forma adecuada. 


##### Ventas no significativas 

Se encontraron ventas que cumplian las siguientes características: 

```
(deodorants_df.venta_unidades == 0) &
(deodorants_df.desc_producto == 'missing') &
(deodorants_df.razon_social == 'unknown') &
(deodorants_df.stock_unidades == 0) &
(deodorants_df.tiene_promo == 0) &
(deodorants_df.nro_prom == 0.0)
```

El total del registro corresponde a menos del 1% de los datos del dataset, por lo cual se decidio eliminar esos registros  registros ya que se concluyo que no proporcionaban información significativa al análisis y podrían distorsionar los resultados. 

##### Ventas con valores negativos 

Se detectaron 580 registros con valores negativos en la columna de venta_unidades. Para continuar con un análisis libre de sesgo, se ha decidido eliminar estas filas. En total, corresponden al 0.006943% del total de los datos de ventas.

\newpage

## Análisis descriptivo de las ventas de desodorantes 


A continuación, presentamos un análisis descriptivo de las columnas de ventas, precio unitario, ventas estimadas en promociones y duración de la promoción. Para obtener mas detalles veamos la figura.

\begin{figure}
\centering % imagen centrada
\captionsetup{justification=centering,margin=2cm}
\includegraphics[width=1\textwidth]{images/deodorants_stats.png}
\caption{Figura 3. Análisis Descriptivo de los movimientos de desodorantes}
Figura 3. Análisis Descriptivo de los movimientos de desodorantes
\end{figure}

Podemos concluir lo siguiente: 

1. El total medio de unidades en stock es de 21 unidades.
2. El total de ventas en unidades de desodorantes en aerosol es de 0.314 unidades por día.
3. El máximo de ventas de desodorantes en aerosol fue de 612 unidades
4. En promedio, se venden 0.39 unidades diarias de desodorantes en aerosol durante una promoción. 
5. El precio unitario medio de un desodorante en aerosol es de $64 pesos argentinos.
6. La duración máxima de una promoción es de 18 días.

#### Histograma de Distribuccion de las ventas 

CARME AGREGAR AQUI LA GRAFICA DE DISTRIBUCCION VENTAS 

\begin{figure}
\centering % imagen centrada
\captionsetup{justification=centering,margin=2cm}
\includegraphics[width=1\textwidth]{images/ventas_hist.png}
\caption{Figura 4. Distribucción de las ventas}
Figura 4. Distribucción de las ventas de desodorantes en unidades
\end{figure}

\newpage

## Análisis del impacto de variables en las ventas de desodorantes 

Para realizar el analisis explotario de datos vamos a responder las siguientes preguntas para definir el impacto de las demás variables en las ventas de desodorantes en aerosol. 

Vamos a realizar una análisis de los productos con mayor volumen de ventas y el efecto de las promociones sobre las ventas asi mismo el movimiento de inventarios. 


#### Volumen de ventas por producto y por zona  


1. ¿Cuáles son los top 10 productos con mayor y menor volumen de ventas? 

##### Desodorantes de aerosol más vendidos

A continuación se muestra un gráfico que presenta los 10 desodorantes más vendidos durante el período de julio de 2016 hasta julio de 2019.

\begin{figure}
\centering % imagen centrada
\captionsetup{justification=centering,margin=2cm}
\includegraphics[width=1\textwidth]{images/ventas_desodorantes_top10.png}
\caption{Figura 4. Top 10 de desodorantes de ambiente en aerosol con mayor volumen de ventas}
Figura 4. Top 10 desodorantes de ambiente en aerosol con mayor volumen de ventas
\end{figure}

- Podemos concluir que el desodorante más vendido es el producto con el ID 342686 y la descripción "glade desodorante de ambientes lavander nueva formula 751 cc", suministrado por S. C. Johnson. Se vendieron un total de 109531 unidades de este producto.

- El segundo producto más vendido es el producto con el ID 240911 y la descripción "poett ambiental lavanda nuevo d 0.377 kg", suministrado por Clorox Argentina S.A. Se vendieron un total de 100861 unidades de este producto.


##### Desodorantes de aerosol menos vendidos

El siguiente gráfico presenta los 10 desodorantes menos vendidos durante el período de julio de 2016 hasta julio de 2019.

\begin{figure}
\centering % imagen centrada
\captionsetup{justification=centering,margin=2cm}
\includegraphics[width=1\textwidth]{images/ventas_desodorantes_bot10.png}
\caption{Figura 5. Top 10 desodorantes de ambiente en aerosol con menor volumen de ventas}
Figura 5. Top 10 desodorantes de ambiente en aerosol con menor volumen de ventas
\end{figure}

Observamos que los primeros tres productos con menor volumen de ventas no tienen descripción en la tabla de productos, posiblemente debido a un error en la recopilación de datos. Sin embargo, en cuarto lugar se encuentra el desodorante con id 466069 y descripción "glade toque aromatizante de ambientes campos" del proveedor S.C. Johnson, con un total de 2812 unidades vendidas.


2. ¿Cuál es el local con mayor volumen de ventas y en qué zona se encuentra? 
3. ¿Hay alguna marca de desodorante con mejor venta en ciertas zonas? 




\newpage

#### Impacto de las promociones sobre las ventas 

ROMINA 

4. ¿Cuantas promociones se han realizado por año, mes y por local?  
5. ¿Cuál es el comportamiento de ventas de productos que nunca han tenido una promoción?   (ERIKA)  
6. ¿Cuál es la comportamiento de las ventas por cada de supermercado? 
En el siguiente gráfico se puede observar las cadenas que presentan ventas de productos.
 
\begin{figure}
\centering % imagen centrada
\captionsetup{justification=centering,margin=2cm}
\includegraphics[width=1\textwidth]{images/Cantidad_de_productos_vendidos_por_cadena.png}
\caption{Figura 6. Cantidad de productos vendidos por cadena}
Figura 6. Cantidad de productos vendidos por cadena
\end{figure}

Tal como se indicó anteriormente, se puede observar que de las cinco cadenas existentes, sólo las cadenas Disco, Jumbo y Vea son las que presentan ventas productos.

7. ¿Existe un patrón estacional en las ventas de desodorantes? 
Con el objetivo de determinar si existe un factor estacional en las ventas, se llevó a cabo un análisis de las ventas a lo largo de los años. Al graficar la sumatoria de las ventas mensuales por año, se obtuvo el siguiente resultado:

\begin{figure}
\centering % imagen centrada
\captionsetup{justification=centering,margin=2cm}
\includegraphics[width=1\textwidth]{images/Ventas_por_meses.png}
\caption{Figura 7. Ventas por meses}
Figura 7. Ventas por meses
\end{figure}

Con el fin de analizar la existencia de estacionalidad en las ventas, es conveniente centrarse en los años en los que se disponen de datos para todos los meses. En este caso, se tomaron en cuenta los años 2017 y 2018.

En el caso del año 2017, se puede observar que los meses de verano (enero, febrero y diciembre) presentan valores de ventas menores, mientras que el mes de marzo presenta un pequeño pico que coincide con la llegada del otoño. Sin embargo, en los meses de julio y agosto se produce una fuerte subida en las ventas, lo que está directamente relacionado con los meses más fríos del año (invierno). A partir del análisis del año 2017, se puede concluir que la venta de desodorantes ambientales presenta estacionalidad, y su aumento de ventas se produce durante los meses más fríos, cuando las personas pasan más tiempo en sus hogares y hay menos ventilación natural.

En cuanto al año 2018, se observa una tendencia similar a la del año anterior, incluso con un aumento mayor de las ventas en el mes de marzo en comparación con el año anterior. Sin embargo, a partir del mes de julio se produce una caída significativa en las ventas, que no coincide con la estacionalidad del producto. Este efecto se debe a una fuerte devaluación del peso argentino en julio de 2018, lo que genera una nueva "crisis" económica que afecta la venta de los desodorantes de ambientes, al no ser estos productos de primera necesidad.


8. Qué impacto tiene la duración de la promoción en el volumen de ventas?
Se realizó una comparación entre la media de las ventas y la duración de la promoción, para observar cómo varían las ventas en función de los días que dura la promoción.

\begin{figure}
\centering % imagen centrada
\captionsetup{justification=centering,margin=2cm}
\includegraphics[width=1\textwidth]{images/Media_ventas_de_acuerdo_a_la_duración_de_la_promoción.png}
\caption{Figura 8. Media de ventas de acuerdo a la duración de la promoción}
Figura 8. Media de ventas de acuerdo a la duración de la promoción
\end{figure}

Después de analizar el gráfico, se puede observar que las promociones que duran 16 días registran la mayor cantidad de ventas, seguidas por las que duran 11 y 14 días.

9. Análisis de ventas con promoción y sin promoción en función del dia de la semana.
En el siguiente gráfico podemos observar como varía la media de las ventas de los productos con promoción (1) y sin promoción (0) de acuerdo al día de la semana.

\begin{figure}
\centering % imagen centrada
\captionsetup{justification=centering,margin=2cm}
\includegraphics[width=1\textwidth]{images/Media_ventas_por_dia_de_semana_con_y_sin_promoción.png}
\caption{Figura 9. Media de ventas de producto con y sin promoción por día de semana}
Figura 9. Media de ventas de producto con y sin promoción por día de semana
\end{figure}

Al analizar los datos, se puede concluir que los días de mayor venta son los domingos y jueves, tanto para las promociones como para las ventas regulares.


10. ¿Hay una relación entre la ubicación geográfica y las ventas de desodorantes? 
11. Análisis de medias de ventas con promoción y sin promoción. En qué % de productos las promociones son efectivas. Hay productos que las promociones no son efectivas?. 
Se realizó un análisis de las ventas medias de productos con y sin promoción, y sólo se tuvieron en cuenta aquellos que contaban con ventas en ambas categorías. Para determinar la efectividad de las promociones, se calculó un ratio para cada producto, definido como la media de ventas con promoción dividida por la media de ventas sin promoción. Si el ratio resultante es mayor a 1, se considera que la promoción fue efectiva en impulsar las ventas de dicho producto.
Los resultados obtenidos se muestran en el siguinete gráfico:

\begin{figure}
\centering % imagen centrada
\captionsetup{justification=centering,margin=2cm}
\includegraphics[width=1\textwidth]{images/Ratio_de_ventas_por_productos.png}
\caption{Figura 11. Ratio de ventas por productos}
Figura 11. Ratio de ventas por productos
\end{figure}

El análisis reveló que el 82.89% de los productos presentaron un ratio de ventas mayor a 1, lo que indica que en la mayoría de los casos (82.89%), la promoción tuvo un efecto positivo en el aumento de las ventas.

12. Cuál es la mejor promoción a nivel general 

De acuerdo a la media de las ventas, se pudo determinar a nivel general que las mejores 10 promociones son las siguientes:

\begin{figure}
\centering % imagen centrada
\captionsetup{justification=centering,margin=2cm}
\includegraphics[width=1\textwidth]{images/Mejores_promociones.png}
\caption{Figura 12. Mejores promociones}
Figura 12. Mejores promociones
\end{figure}

13. Análisis de ventas con y sin promoción por año
Se comparó la media de las ventas con y sin promoción para cada año, y se presentan los resultados en el siguiente gráfico:

\begin{figure}
\centering % imagen centrada
\captionsetup{justification=centering,margin=2cm}
\includegraphics[width=1\textwidth]{images/Media_ventas_por_año_con_y_sin_promoción.png}
\caption{Figura 13. Media de ventas de producto con y sin promoción por año}
Figura 13. Media de ventas de producto con y sin promoción por año
\end{figure}

Se evidencia que en todos los años la presencia de promociones se correlaciona con una media de ventas superior.

14. Análisis de ventas con y sin promoción por zona
Siguiendo la misma metodología que en la sección anterior, se evaluó la media de ventas con y sin promoción por zona geográfica. El siguiente gráfico ilustra los resultados obtenidos:

\begin{figure}
\centering % imagen centrada
\captionsetup{justification=centering,margin=2cm}
\includegraphics[width=1\textwidth]{images/Media_ventas_por_zona_con_y_sin_promoción.png}
\caption{Figura 14. Media de ventas de producto con y sin promoción por zona}
Figura 14. Media de ventas de producto con y sin promoción por zona
\end{figure}

Al igual que en la sección anterior, se observa que la media de ventas con promoción es significativamente superior a la media de ventas sin promoción, lo que sugiere la efectividad de las promociones en todas las zonas analizadas.



#### Efectos del inventario sobre las ventas 


13. ¿Cuál es el producto con la mayor y menor rotación por local, por año y por mes?
14. ¿Hay un efecto de las promociones con la rotación de stock mensual?
15. ¿Cambia el precio unitario de venta de los productos dependiendo del local?
16. ¿Qué tan precisas son las estimaciones de ventas en unidades de la promoción en comparación con las ventas reales del producto?
17. Productos con precio unitario por encima y por debajo de la media.



\newpage

\bibliographystyle{plain}
\bibliography{references}