# "Ventas de Productos de Moda por Categoría y Región (Enero - Octubre 2024)"

Descripción:

Este dataset contiene información sobre las transacciones de ventas de productos de moda realizadas entre enero y octubre de 2024. Los registros incluyen detalles como la fecha de la venta, el nombre del cliente, el producto adquirido, la categoría del producto (Accesorios, Ropa Hombre, Ropa Mujer, Calzado), la cantidad comprada, el precio unitario, el total de la venta y la región de compra. Las categorías de productos más destacadas son los bolsos, zapatos, pantalones y sombreros, con ventas distribuidas en diversas regiones del país (Norte, Este, Oeste, Centro, Sur).

El análisis de este dataset permite observar tendencias de consumo por región y categoría, así como el comportamiento de precios y las cantidades más vendidas a lo largo del año. Además, proporciona información útil para optimizar estrategias de marketing y ventas dirigidas a diferentes segmentos geográficos y de productos.

Código para Subir y Cargar el CSV en Python:

In [2]:
from google.colab import files
uploaded = files.upload()

Saving datos_tienda_50_registros.csv to datos_tienda_50_registros.csv


In [None]:
import pandas as pd

# Cargar el archivo CSV desde la ruta
file_path = "datos_tienda_50_registros.csv"
df = pd.read_csv(file_path)

# Mostrar las primeras filas del dataframe para verificar que se ha cargado correctamente

print(df.head())


Si las fechas no están uniformes, puedes convertirlas a un formato estándar (por ejemplo, YYYY-MM-DD):

In [None]:
df['Fecha'] = pd.to_datetime(df['Fecha'], format='mixed', dayfirst=True)

# Verificar el resultado
print(df['Fecha'].head())

In [None]:
print(df.head())

Lidiar con valores NaT:
Podemos intentar limpiar las filas que no tienen una fecha válida. Si los valores son realmente vacíos o contienen texto inesperado, podemos:

Eliminar las filas con fechas no válidas.
Asignar una fecha predeterminada para los casos con NaT.
Eliminar las filas con NaT:

In [None]:
df_cleaned = df.dropna(subset=['Fecha'])
print(df_cleaned)

2. Eliminar los valores negativos en la columna 'Cantidad':
Puedes corregir los valores negativos con abs() para que todas las cantidades sean positivas:

In [None]:
df['Cantidad'] = df['Cantidad'].abs()

# Verificar los cambios
print(df['Cantidad'].head())

In [None]:
print(df.head())

4. Analizar las ventas por categoría:
Si deseas analizar cuál es la categoría más vendida, puedes agrupar por 'Categoría' y sumar la 'Cantidad':

In [None]:
categoria_ventas = df.groupby('Categoría')['Cantidad'].sum()

# Verificar el análisis
print(categoria_ventas)

5. Visualizar las ventas por región:
Para generar un gráfico con las ventas por región, puedes usar matplotlib:

In [None]:
import matplotlib.pyplot as plt

ventas_por_region = df.groupby('Región')['Total'].sum()

# Crear el gráfico de barras
ventas_por_region.plot(kind='bar', color='teal')
plt.title('Ventas Totales por Región')
plt.xlabel('Región')
plt.ylabel('Total Ventas')
plt.show()