# 📊**Dashboard interactivo de ventas del supermercado**
### 1. Introducción
El análisis de datos en entornos comerciales ha cobrado relevancia en la toma de decisiones estratégicas. En este contexto, el presente trabajo desarrolla un **dashboard interactivo** para la visualización y análisis de datos de ventas de un supermercado. La herramienta se ha implementado en **Google Colab** utilizando **Gradio** y **Plotly**, permitiendo una exploración detallada de las tendencias de ventas según distintos criterios, tales como la categoría de producto, la sucursal y el método de pago.

### 2. Revisión de la literatura
Diversos estudios han demostrado la importancia del análisis de datos en la optimización de estrategias de ventas y en la mejora de la experiencia del cliente (Chen et al., 2020; Davenport & Harris, 2017). La representación visual de datos facilita la interpretación de patrones y tendencias, permitiendo una toma de decisiones más informada (Few, 2012). Además, el uso de herramientas interactivas como Gradio y Plotly mejora la accesibilidad de los análisis para diferentes usuarios (McKinney, 2017).

### 3. Metodología

### 3.1 Descripción del Dataset
El dataset empleado en este estudio corresponde a registros transaccionales de un supermercado e incluye las siguientes variables:
- **ID de factura**
- **Sucursal y ciudad**
- **Tipo de cliente y género**
- **Categoría de producto**
- **Precio unitario y cantidad**
- **Impuestos y total de la compra**
- **Fecha y hora de la transacción**
- **Método de pago**
- **Costo de los bienes vendidos (COGS)**
- **Margen de ganancia y ganancias brutas**
- **Calificación de la experiencia del cliente**

### 3.2 Procedimiento
Se desarrollara un **dashboard interactivo** en Python con las siguientes funcionalidades:
- **Carga y preprocesamiento de datos**: Conversión de fechas, manejo de valores nulos y ajustes de nomenclatura.
- **Filtrado de datos**: Permite la selección de categoría de producto, sucursal y método de pago.
- **Visualización gráfica**: Implementación de gráficos interactivos con **Plotly** y despliegue de la interfaz mediante **Gradio**.





In [37]:
import gdown

# ID del archivo en Google Drive
file_id = "1PAjTpsNVqc1L9Ucqtx50KpbSE47Z8Voo"

# Ruta de destino
output = "supermarket_sales.csv"

# Descargar el archivo
gdown.download(f"https://drive.google.com/uc?id={file_id}", output, quiet=False)

# Verificar que se haya descargado correctamente
import pandas as pd
df = pd.read_csv(output)
df.head()

Downloading...
From: https://drive.google.com/uc?id=1PAjTpsNVqc1L9Ucqtx50KpbSE47Z8Voo
To: /content/supermarket_sales.csv
100%|██████████| 132k/132k [00:00<00:00, 62.7MB/s]


Unnamed: 0,Invoice ID,Branch,City,Customer type,Gender,Product line,Unit price,Quantity,Tax 5%,Total,Date,Time,Payment,cogs,gross margin percentage,gross income,Rating
0,750-67-8428,A,Yangon,Member,Female,Health and beauty,74.69,7,26.1415,548.9715,1/5/2019,13:08,Ewallet,522.83,4.761905,26.1415,9.1
1,226-31-3081,C,Naypyitaw,Normal,Female,Electronic accessories,15.28,5,3.82,80.22,3/8/2019,10:29,Cash,76.4,4.761905,3.82,9.6
2,631-41-3108,A,Yangon,Normal,Male,Home and lifestyle,46.33,7,16.2155,340.5255,3/3/2019,13:23,Credit card,324.31,4.761905,16.2155,7.4
3,123-19-1176,A,Yangon,Member,Male,Health and beauty,58.22,8,23.288,489.048,1/27/2019,20:33,Ewallet,465.76,4.761905,23.288,8.4
4,373-73-7910,A,Yangon,Normal,Male,Sports and travel,86.31,7,30.2085,634.3785,2/8/2019,10:37,Ewallet,604.17,4.761905,30.2085,5.3


In [66]:
import pandas as pd

#  Cargar los datos
df = pd.read_csv("supermarket_sales.csv")

# Diccionario de traducción
columnas_espanol = {
    "Invoice ID": "ID Factura",
    "Branch": "Sucursal",
    "City": "Ciudad",
    "Customer type": "Tipo de Cliente",
    "Gender": "Género",
    "Product line": "Línea de Producto",
    "Unit price": "Precio Unitario",
    "Quantity": "Cantidad",
    "Tax 5%": "Impuesto 5%",
    "Total": "Total",
    "Date": "Fecha",
    "Time": "Hora",
    "Payment": "Método de Pago",
    "cogs": "Costo de Mercancía",
    "gross margin percentage": "Porcentaje de Margen Bruto",
    "gross income": "Ingresos Brutos",
    "Rating": "Calificación"
}

# Renombrar columnas
df.rename(columns=columnas_espanol, inplace=True)

# Guardar el archivo modificado
df.to_csv("supermarket_sales_es.csv", index=False)

# Verificar los cambios
print(df.head())

    ID Factura Sucursal     Ciudad Tipo de Cliente  Género  \
0  750-67-8428        A     Yangon          Member  Female   
1  226-31-3081        C  Naypyitaw          Normal  Female   
2  631-41-3108        A     Yangon          Normal    Male   
3  123-19-1176        A     Yangon          Member    Male   
4  373-73-7910        A     Yangon          Normal    Male   

        Línea de Producto  Precio Unitario  Cantidad  Impuesto 5%     Total  \
0       Health and beauty            74.69         7      26.1415  548.9715   
1  Electronic accessories            15.28         5       3.8200   80.2200   
2      Home and lifestyle            46.33         7      16.2155  340.5255   
3       Health and beauty            58.22         8      23.2880  489.0480   
4       Sports and travel            86.31         7      30.2085  634.3785   

       Fecha   Hora Método de Pago  Costo de Mercancía  \
0   1/5/2019  13:08        Ewallet              522.83   
1   3/8/2019  10:29           Cash  

In [59]:
!pip install gradio

Collecting gradio
  Downloading gradio-5.23.1-py3-none-any.whl.metadata (16 kB)
Collecting aiofiles<24.0,>=22.0 (from gradio)
  Downloading aiofiles-23.2.1-py3-none-any.whl.metadata (9.7 kB)
Collecting fastapi<1.0,>=0.115.2 (from gradio)
  Downloading fastapi-0.115.12-py3-none-any.whl.metadata (27 kB)
Collecting ffmpy (from gradio)
  Downloading ffmpy-0.5.0-py3-none-any.whl.metadata (3.0 kB)
Collecting gradio-client==1.8.0 (from gradio)
  Downloading gradio_client-1.8.0-py3-none-any.whl.metadata (7.1 kB)
Collecting groovy~=0.1 (from gradio)
  Downloading groovy-0.1.2-py3-none-any.whl.metadata (6.1 kB)
Collecting pydub (from gradio)
  Downloading pydub-0.25.1-py2.py3-none-any.whl.metadata (1.4 kB)
Collecting python-multipart>=0.0.18 (from gradio)
  Downloading python_multipart-0.0.20-py3-none-any.whl.metadata (1.8 kB)
Collecting ruff>=0.9.3 (from gradio)
  Downloading ruff-0.11.2-py3-none-manylinux_2_17_x86_64.manylinux2014_x86_64.whl.metadata (25 kB)
Collecting safehttpx<0.2.0,>=0.1.6 

In [69]:
import gradio as gr
import matplotlib.pyplot as plt
import pandas as pd

# Descargar los datos desde Google Drive
!gdown --id 1PAjTpsNVqc1L9Ucqtx50KpbSE47Z8Voo -O supermarket_sales.csv
df = pd.read_csv("supermarket_sales.csv")

# Diccionario de traducción de columnas
columnas_espanol = {
    "Invoice ID": "ID Factura",
    "Branch": "Sucursal",
    "City": "Ciudad",
    "Customer type": "Tipo de Cliente",
    "Gender": "Género",
    "Product line": "Línea de Producto",
    "Unit price": "Precio Unitario",
    "Quantity": "Cantidad",
    "Tax 5%": "Impuesto 5%",
    "Total": "Total",
    "Date": "Fecha",
    "Time": "Hora",
    "Payment": "Método de Pago",
    "cogs": "Costo de Mercancía",
    "gross margin percentage": "Porcentaje de Margen Bruto",
    "gross income": "Ingresos Brutos",
    "Rating": "Calificación"
}

# Renombrar las columnas
df.rename(columns=columnas_espanol, inplace=True)

# Función para generar los gráficos
def dashboard():
    fig, axes = plt.subplots(2, 3, figsize=(18, 10))  # Cinco gráficos distribuidos en una cuadrícula

    # Gráfico 1. Ventas por Línea de Producto
    ventas_por_categoria = df.groupby("Línea de Producto")["Total"].sum()
    ventas_por_categoria.plot(kind="bar", ax=axes[0, 0], color="skyblue", edgecolor="black")
    axes[0, 0].set_title("Ventas por Línea de Producto")
    axes[0, 0].set_ylabel("Ventas Totales")
    axes[0, 0].tick_params(axis="x", rotation=45)

    # Gráfico 2. Ingresos Totales por Sucursal
    ventas_por_sucursal = df.groupby("Sucursal")["Total"].sum()
    ventas_por_sucursal.plot(kind="bar", ax=axes[0, 1], color=["red", "green", "blue"], edgecolor="black")
    axes[0, 1].set_title("Ingresos por Sucursal")
    axes[0, 1].set_ylabel("Ingresos Totales")

    # Gráfico 3. Métodos de Pago más Usados
    metodos_pago = df["Método de Pago"].value_counts()
    metodos_pago.plot(kind="pie", ax=axes[0, 2], autopct="%1.1f%%", colors=["gold", "lightblue", "lightgreen"])
    axes[0, 2].set_title("Métodos de Pago")
    axes[0, 2].set_ylabel("")  # Ocultar la etiqueta del eje Y

    # Gráfico 4. Ventas por Género
    ventas_por_genero = df.groupby("Género")["Total"].sum()
    ventas_por_genero.plot(kind="bar", ax=axes[1, 0], color=["purple", "orange"], edgecolor="black")
    axes[1, 0].set_title("Ventas por Género")
    axes[1, 0].set_ylabel("Ventas Totales")

    # Gráfico 5. Tendencia de Ventas por Día
    df["Fecha"] = pd.to_datetime(df["Fecha"])
    ventas_diarias = df.groupby("Fecha")["Total"].sum()
    ventas_diarias.plot(ax=axes[1, 1], color="teal", linewidth=2)
    axes[1, 1].set_title("Tendencia de Ventas Diarias")
    axes[1, 1].set_ylabel("Ventas Totales")

    # Eliminar el gráfico vacío en (1,2)
    fig.delaxes(axes[1, 2])

    plt.tight_layout()

    # Retornamos la figura y la puntuación promedio de clientes
    calificacion_promedio = f"⭐ Puntuación Promedio de Clientes: {df['Calificación'].mean():.2f} / 10"
    return fig, calificacion_promedio

# Crear la Interfaz con Gradio
iface = gr.Interface(
    fn=dashboard,
    inputs=[],
    outputs=["plot", "text"],
    title="📊 Dashboard Interactivo de Ventas del Supermercado",
    description="🔍 Análisis visual de ventas por línea de producto, ingresos por sucursal, métodos de pago, ventas por género y tendencia de ventas diarias.",
)

iface.launch()

Downloading...
From: https://drive.google.com/uc?id=1PAjTpsNVqc1L9Ucqtx50KpbSE47Z8Voo
To: /content/supermarket_sales.csv
100% 132k/132k [00:00<00:00, 75.3MB/s]
Running Gradio in a Colab notebook requires sharing enabled. Automatically setting `share=True` (you can turn this off by setting `share=False` in `launch()` explicitly).

Colab notebook detected. To show errors in colab notebook, set debug=True in launch()
* Running on public URL: https://44928113fbcebc3ddf.gradio.live

This share link expires in 72 hours. For free permanent hosting and GPU upgrades, run `gradio deploy` from the terminal in the working directory to deploy to Hugging Face Spaces (https://huggingface.co/spaces)




In [70]:
import gdown
import gradio as gr
import pandas as pd
import plotly.express as px

# Descargar los datos desde Google Drive
gdown.download("https://drive.google.com/uc?id=1PAjTpsNVqc1L9Ucqtx50KpbSE47Z8Voo", "supermercado_ventas.csv", quiet=False)
df = pd.read_csv("supermercado_ventas.csv")

# Diccionario de traducción de columnas
columnas_espanol = {
    "Invoice ID": "ID Factura",
    "Branch": "Sucursal",
    "City": "Ciudad",
    "Customer type": "Tipo de Cliente",
    "Gender": "Género",
    "Product line": "Línea de Producto",
    "Unit price": "Precio Unitario",
    "Quantity": "Cantidad",
    "Tax 5%": "Impuesto 5%",
    "Total": "Total",
    "Date": "Fecha",
    "Time": "Hora",
    "Payment": "Método de Pago",
    "cogs": "Costo de Mercancía",
    "gross margin percentage": "Porcentaje de Margen Bruto",
    "gross income": "Ingresos Brutos",
    "Rating": "Calificación"
}

# Renombrar las columnas
df.rename(columns=columnas_espanol, inplace=True)

# Convertir la columna de fecha
df["Fecha"] = pd.to_datetime(df["Fecha"])

# Paleta de colores personalizada
colores_personalizados = px.colors.qualitative.Vivid  # También puedes probar Bold, Dark24, Set1, etc.

# Función para gráficos interactivos
def dashboard_interactivo(categoria, sucursal, metodo_pago):
    df_filtrado = df.copy()

    if categoria != "Todos":
        df_filtrado = df_filtrado[df_filtrado["Línea de Producto"] == categoria]

    if sucursal != "Todas":
        df_filtrado = df_filtrado[df_filtrado["Sucursal"] == sucursal]

    if metodo_pago != "Todos":
        df_filtrado = df_filtrado[df_filtrado["Método de Pago"] == metodo_pago]

    # Gráfico 1. Ventas por Categoría
    grafico1 = px.bar(df_filtrado, x="Línea de Producto", y="Total", color="Línea de Producto",
                      title="Ventas por Línea de Producto", color_discrete_sequence=colores_personalizados)

    # Gráfico 2. Ingresos por Sucursal
    grafico2 = px.bar(df_filtrado, x="Sucursal", y="Total", color="Sucursal",
                      title="Ingresos por Sucursal", color_discrete_sequence=colores_personalizados)

    # Gráfico 3. Métodos de Pago
    grafico3 = px.pie(df_filtrado, names="Método de Pago", values="Total", title="Métodos de Pago",
                      color_discrete_sequence=colores_personalizados)

    # Gráfico 4. Ventas por Género
    grafico4 = px.bar(df_filtrado, x="Género", y="Total", color="Género",
                      title="Ventas por Género", color_discrete_sequence=colores_personalizados)

    # Gráfico 5. Tendencia de Ventas por Día
    ventas_diarias = df_filtrado.groupby("Fecha")["Total"].sum().reset_index()
    grafico5 = px.line(ventas_diarias, x="Fecha", y="Total", title="Tendencia de Ventas Diarias",
                       line_shape="spline", color_discrete_sequence=colores_personalizados)

    return grafico1, grafico2, grafico3, grafico4, grafico5

# 🌟 Crear la Interfaz con Gradio
categorias = ["Todos"] + df["Línea de Producto"].unique().tolist()
sucursales = ["Todas"] + df["Sucursal"].unique().tolist()
metodos_pago = ["Todos"] + df["Método de Pago"].unique().tolist()

iface = gr.Interface(
    fn=dashboard_interactivo,
    inputs=[
        gr.Dropdown(choices=categorias, label="Línea de Producto", value="Todos"),
        gr.Dropdown(choices=sucursales, label="Sucursal", value="Todas"),
        gr.Dropdown(choices=metodos_pago, label="Método de Pago", value="Todos")
    ],
    outputs=[gr.Plot() for _ in range(5)],
    title="📊 Dashboard Interactivo de Ventas del Supermercado",
    description="🔍 Filtra los datos por línea de producto, sucursal y método de pago para visualizar gráficos interactivos con colores personalizados.",
)

iface.launch()

Downloading...
From: https://drive.google.com/uc?id=1PAjTpsNVqc1L9Ucqtx50KpbSE47Z8Voo
To: /content/supermercado_ventas.csv
100%|██████████| 132k/132k [00:00<00:00, 38.7MB/s]


Running Gradio in a Colab notebook requires sharing enabled. Automatically setting `share=True` (you can turn this off by setting `share=False` in `launch()` explicitly).

Colab notebook detected. To show errors in colab notebook, set debug=True in launch()
* Running on public URL: https://0a1731da46b891a3c6.gradio.live

This share link expires in 72 hours. For free permanent hosting and GPU upgrades, run `gradio deploy` from the terminal in the working directory to deploy to Hugging Face Spaces (https://huggingface.co/spaces)




## 4. Resultados

### 4.1 Gráficos
1. **Ventas por categoría de producto**: Representación en **barras** del total de ventas agrupado por categoría.
2. **Ingresos por sucursal**: Comparación en **barras** de los ingresos generados en cada sucursal.
3. **Distribución de métodos de pago**: Gráfico de **torta** mostrando la proporción de cada método de pago utilizado.
4. **Ventas por género**: Representación en **barras** de las ventas realizadas por clientes de diferentes géneros.
5. **Tendencia de ventas diarias**: Gráfico de **líneas** que muestra la evolución de las ventas a lo largo del tiempo.

## 5. Discusión
Los resultados obtenidos permiten identificar patrones clave en las ventas del supermercado. La visualización de los datos contribuye a una mejor comprensión del comportamiento del consumidor y facilita la detección de oportunidades de mejora en la estrategia comercial. Adicionalmente, la interactividad del dashboard permite personalizar el análisis según las necesidades del usuario.

## 6. Conclusión
El presente estudio evidencia el valor de las herramientas interactivas para el análisis de datos comerciales. La implementación de un dashboard basado en Python, con el uso de **Gradio** y **Plotly**, facilita la exploración de tendencias de ventas, proporcionando una herramienta útil para la toma de decisiones estratégicas.

### Referencias
- Chen, H., Chiang, R. H., & Storey, V. C. (2020). Business intelligence and analytics: From big data to big impact. *MIS Quarterly, 36*(4), 1165-1188.
- Davenport, T. H., & Harris, J. G. (2017). *Competing on analytics: The new science of winning*. Harvard Business Press.
- Few, S. (2012). *Show me the numbers: Designing tables and graphs to enlighten*. Analytics Press.
- McKinney, W. (2017). *Python for data analysis: Data wrangling with Pandas, NumPy, and IPython*. O'Reilly Media.
