# **Presentación**

## **Introducción y Objetivos del Proyecto**

En este proyecto de curso, desarrollaremos un análisis integral de un conjunto de datos de ventas de una tienda de retail. El objetivo es que los estudiantes apliquen lo aprendido en las diferentes secciones del curso, desde la manipulación básica de datos con NumPy, pasando por el análisis y visualización de datos con Pandas, hasta el uso de técnicas de machine learning para realizar predicciones. Este proyecto será una excelente adición al portafolio de los estudiantes y les permitirá demostrar su competencia en varias áreas clave de la ciencia de datos.

## **Descripción del Conjunto de Datos**

El Dataset está compuesto de las siguientes columnas:

1. **Transaction ID:** Un identificador único para cada transacción, que permite su seguimiento y referencia.
2. **Date:** La fecha en que se produjo la transacción, lo que permite conocer las tendencias de las ventas a lo largo del tiempo.
3. **Customer ID:** Un identificador único para cada cliente, que permite un análisis centrado en el cliente.
4. **Gender:** El sexo del cliente (hombre/mujer), que ofrece información sobre las pautas de compra en función del sexo 
5. **Age:** La edad del cliente, que facilita la segmentación y la exploración de las influencias relacionadas con la edad.
6. **Product Category:** La categoría del producto comprado (por ejemplo, electrónica, ropa, belleza), que ayuda a comprender las preferencias de producto.
7. **Quantity:** El número de unidades del producto comprado, lo que contribuye a comprender los volúmenes de compra.
8. **Price per Unit:** El precio de una unidad del producto, lo que ayuda a realizar cálculos relacionados con el gasto total.
9. **Total Amount:** El valor monetario total de la transacción, que muestra el impacto financiero de cada compra.

Cada columna de este conjunto de datos desempeña un papel fundamental a la hora de desentrañar la dinámica de las operaciones minoristas y el comportamiento de los clientes. Al explorar y analizar estos atributos, descubrirá tendencias, patrones y correlaciones que arrojan luz sobre la compleja interacción entre clientes y productos en un entorno minorista.


## **Principales Análisis y Hallazgos**
![image.png](attachment:image.png)

**Gráfico 1: Tendencia de Ventas por Mes y Categoría de Producto**

Este gráfico muestra la evolución mensual de las ventas de productos de belleza, ropa y electrónica a lo largo de un año, destacando la estacionalidad en el comportamiento de los consumidores. Se observan picos y valles en distintas épocas del año, posiblemente influenciados por festividades y promociones. Además, cada categoría exhibe un patrón único: belleza presenta una tendencia ligeramente decreciente, mientras que electrónica tiene una variabilidad más marcada. La sombra alrededor de cada línea indica la amplitud de la variabilidad en ventas para cada mes y categoría.

**Gráfico 2: Preferencias de Productos por Rango de Edad**

Este gráfico de barras permite visualizar las ventas totales de cada categoría de producto en relación con distintos grupos de edad. Los jóvenes adultos, especialmente los de 18-24 y 25-34 años, son los mayores compradores de productos de belleza y ropa, con una tendencia decreciente en las ventas de estas categorías a medida que aumenta la edad. En cuanto a los productos electrónicos, también son más populares entre los jóvenes, con un descenso progresivo en las ventas en grupos de mayor edad.

**Gráfico 3: Monto Total por Categoría de Producto**

Este gráfico de barras compara el monto total de ventas entre las categorías de ropa, electrónica y belleza, mostrando que ropa lidera significativamente en ventas, seguida de electrónica, y finalmente belleza. Las diferencias de montos sugieren una preferencia clara por productos de ropa sobre los demás, lo que indica una demanda sostenida y elevada en esta categoría.

**Gráfico 4: Monto Total por Mes y Categoría de Producto**

Este gráfico de barras apiladas muestra cómo las ventas mensuales varían para cada categoría, evidenciando una estacionalidad notable, especialmente en ropa y electrónica, con picos en ciertos meses. La categoría de ropa mantiene un volumen alto durante la mayor parte del año, mientras que electrónica muestra un crecimiento constante y supera a belleza en la mayoría de los meses. Este análisis permite identificar meses de alto rendimiento en ventas y tendencias en la demanda por categoría.

## **Mapa de Calor de Correlación**
![image-3.png](attachment:image-3.png)

#### **Visualización de la Correlación de Variables**

* Alta correlación entre precio unitario y monto total: Como era de esperar, existe una fuerte correlación positiva entre el precio unitario y el monto total de la transacción. Esto significa que a medida que aumenta el precio unitario, también aumenta el monto total de la compra.
* Correlación moderada entre cantidad y monto total: Existe una correlación positiva moderada entre la cantidad de productos comprados y el monto total de la transacción. Esto indica que, en general, a mayor cantidad de productos, mayor será el monto total.
* Baja correlación entre las demás variables: Las demás variables muestran una correlación débil o nula entre sí. Esto sugiere que no existe una relación lineal significativa entre ellas.

## **Conclusiones y Recomentaciones**
#### **Resumen General de las Interpretaciones:**

Hemos analizado una variedad de gráficos y visualizaciones de datos, cada uno de los cuales nos ha proporcionado información valiosa sobre diferentes aspectos de un conjunto de datos, probablemente relacionado con ventas o transacciones.

A continuación, un resumen general de las principales conclusiones obtenidas:

* Tendencias estacionales: En varios de los gráficos se observó una clara estacionalidad en las ventas, lo que sugiere que factores como festividades, cambios climáticos o promociones pueden influir significativamente en el comportamiento de compra de los clientes.
* Diferencias entre categorías de productos: Las diferentes categorías de productos (belleza, ropa, electrónica) presentan patrones de venta distintos. Algunas categorías tienen una mayor demanda en ciertas épocas del año o en determinados grupos demográficos.
* Relación entre variables: El mapa de calor de correlación nos permitió identificar las relaciones entre diferentes variables, como el precio unitario, la cantidad de productos comprados y el monto total de la transacción.
* Importancia de los grupos demográficos: Los gráficos que analizaron las preferencias de productos por rango de edad mostraron que los diferentes grupos demográficos tienen diferentes hábitos de compra.
* Factores que influyen en las ventas: Se identificaron varios factores que pueden influir en las ventas, como la temporada del año, el precio de los productos, las promociones y las características demográficas de los clientes.
Conclusiones:

Basándonos en los análisis realizados, podemos llegar a las siguientes conclusiones generales:

* La estacionalidad es un factor importante a considerar: Las empresas deben tener en cuenta los patrones estacionales de venta para planificar sus estrategias de marketing y producción.
* Las diferentes categorías de productos tienen características propias: Cada categoría de producto tiene sus propias dinámicas y requiere de estrategias de marketing específicas.
* Los clientes son diversos: Los clientes tienen diferentes preferencias y comportamientos de compra, por lo que es importante segmentar el mercado y desarrollar productos y promociones personalizadas.
* El precio y la cantidad son factores clave: El precio unitario y la cantidad de productos comprados son los principales determinantes del monto total de la transacción.
* Existen oportunidades para mejorar las ventas: Al identificar los patrones de compra y los factores que influyen en las ventas, las empresas pueden desarrollar estrategias para aumentar sus ingresos.
Recomendaciones:

