# Tarea: Análisis Visual de Ventas de Tienda de Conveniencia

### **Equipo:** Sebastián Ramirez Montecinos
### **Grupo:** 1
### **Curso:** Visualización de Datos en Python

> Este trabajo presenta un análisis completo de un conjunto de datos de ventas usando técnicas de visualización de datos para descubrir patrones y apoyar la toma de decisiones estratégicas.

# Análisis de Ventas para Tienda de Conveniencia
# =============================================
# 1. Selección de Variables Clave y Carga de Datos
# =============================================

Este análisis tiene como objetivo identificar las variables más relevantes para comprender las ventas, comportamiento del cliente y rentabilidad de la tienda.



In [1]:
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
import plotly.express as px
import streamlit as st

# Cargamos el dataset
df = pd.read_csv("data.csv")

# Vista general de los datos
df.head()

# Variables seleccionadas y justificación:
variables_clave = [
    "Branch", "City", "Customer type", "Gender", "Product line", "Unit price",
    "Quantity", "Total", "Date", "Time", "Payment", "gross income", "Rating"
]

# Mostrar descripción de las variables clave
df[variables_clave].describe(include='all')


Unnamed: 0,Branch,City,Customer type,Gender,Product line,Unit price,Quantity,Total,Date,Time,Payment,gross income,Rating
count,1000,1000,1000,1000,1000,1000.0,1000.0,1000.0,1000,1000,1000,1000.0,1000.0
unique,3,3,2,2,6,,,,89,506,3,,
top,A,Yangon,Member,Female,Fashion accessories,,,,2/7/2019,19:48,Ewallet,,
freq,340,340,501,501,178,,,,20,7,345,,
mean,,,,,,55.67213,5.51,322.966749,,,,15.379369,6.9727
std,,,,,,26.494628,2.923431,245.885335,,,,11.708825,1.71858
min,,,,,,10.08,1.0,10.6785,,,,0.5085,4.0
25%,,,,,,32.875,3.0,124.422375,,,,5.924875,5.5
50%,,,,,,55.23,5.0,253.848,,,,12.088,7.0
75%,,,,,,77.935,8.0,471.35025,,,,22.44525,8.5


# =============================================
# 2. Exploración Visual Inicial (Gráficos de análisis)
# =============================================

A continuación se presentan gráficos básicos que permiten explorar la distribución y relaciones entre variables seleccionadas.

In [2]:
# 1. Evolución de las Ventas Totales
ventas_diarias = df.groupby('Date')['Total'].sum().reset_index()
fig = px.line(ventas_diarias, x='Date', y='Total', title='Evolución de las Ventas Totales')
fig.show()

In [3]:
# 2. Ingresos por Línea de Producto
ingresos_producto = df.groupby('Product line')['Total'].sum().sort_values(ascending=False).reset_index()
fig = px.bar(ingresos_producto, x='Product line', y='Total', title='Ingresos por Línea de Producto', color='Product line')
fig.show()

In [4]:
# 3. Distribución de la Calificación de Clientes
fig = px.histogram(df, x='Rating', nbins=20, title='Distribución de la Calificación de Clientes')
fig.show()

In [5]:
# 4. Comparación del Gasto por Tipo de Cliente
fig = px.box(df, x='Customer type', y='Total', color='Customer type', title='Comparación del Gasto por Tipo de Cliente')
fig.show()

In [7]:
# 5. Relación entre Costo y Ganancia Bruta
fig = px.scatter(df, x='cogs', y='gross income', title='Relación entre Costo y Ganancia Bruta', trendline='ols')
fig.show()

In [3]:
# 6. Métodos de Pago Preferidos
payment_counts = df['Payment'].value_counts().reset_index()
payment_counts.columns = ['Payment Method', 'Count']
fig = px.pie(payment_counts, values='Count', names='Payment Method', title='Métodos de Pago Preferidos')
fig.show()

In [4]:
# 7. Análisis de Correlación Numérica
numeric_cols = ['Unit price', 'Quantity', 'Tax 5%', 'Total', 'cogs', 'gross income', 'Rating']
correlation_matrix = df[numeric_cols].corr()
fig = px.imshow(correlation_matrix, text_auto=True, title='Matriz de Correlación de Variables Numéricas')
fig.show()

In [5]:
# 8. Composición del Ingreso Bruto por Sucursal y Línea de Producto
ingreso_por_sucursal = df.groupby(['Branch', 'Product line'])['gross income'].sum().reset_index()
fig = px.sunburst(ingreso_por_sucursal, path=['Branch', 'Product line'], values='gross income',
                  title='Ingreso Bruto por Sucursal y Línea de Producto')
fig.show()

# =============================================
# 3. Integración en un Dashboard (Streamlit)
# =============================================

Nuestro dashboard interactivo desarrollado con Streamlit permite explorar los datos de ventas de una cadena de tiendas de conveniencia desde múltiples ángulos:

- **Evolución de las Ventas Totales**: Línea de tiempo que permite visualizar tendencias de venta a lo largo del tiempo.
- **Ingresos por Línea de Producto**: Gráfico de barras que muestra qué líneas de producto generan mayores ingresos.
- **Gasto por Tipo de Cliente**: Boxplot que compara el gasto de clientes "Member" vs "Normal".
- **Métodos de Pago Preferidos**: Gráfico circular que muestra la frecuencia de uso de cada método de pago.
- **KPIs destacados**: Incluimos métricas como ventas totales, ingreso bruto y calificación promedio.
- **Filtros interactivos**: El usuario puede seleccionar la sucursal, la línea de producto y el tipo de cliente para ajustar todas las visualizaciones.

Estas visualizaciones fueron seleccionadas por su relevancia para responder preguntas de negocio como:
- ¿Qué productos venden más?
- ¿Qué tipo de cliente gasta más?
- ¿Cuál es el método de pago preferido?
- ¿Qué sucursales generan más ingreso bruto?

La interactividad del dashboard mejora la comprensión de los datos y permite una toma de decisiones más informada por parte del equipo de marketing o dirección.


In [None]:
# Título y descripción inicial
st.title("Dashboard de Ventas de Tienda de Conveniencia")
st.markdown("""
Este dashboard presenta las visualizaciones más relevantes para comprender la evolución de las ventas,
el comportamiento de los clientes y sus preferencias de pago. Se incluyen filtros para analizar por sucursal,
línea de producto y tipo de cliente.
""")

# Filtros interactivos
st.sidebar.header("Filtros")
branch = st.sidebar.multiselect("Sucursal", options=df["Branch"].unique(), default=df["Branch"].unique())
product_line = st.sidebar.multiselect("Línea de Producto", options=df["Product line"].unique(), default=df["Product line"].unique())
customer_type = st.sidebar.multiselect("Tipo de Cliente", options=df["Customer type"].unique(), default=df["Customer type"].unique())

# Aplicar filtros
df_filtered = df[
    (df["Branch"].isin(branch)) &
    (df["Product line"].isin(product_line)) &
    (df["Customer type"].isin(customer_type))
]

# KPIs destacados
st.metric("Ventas Totales", f"${df_filtered['Total'].sum():,.2f}")
st.metric("Ingreso Bruto", f"${df_filtered['gross income'].sum():,.2f}")
st.metric("Promedio de Calificación", f"{df_filtered['Rating'].mean():.2f}")

# Visualizaciones
st.markdown("## 1. Evolución de las Ventas Totales")
ventas_diarias = df_filtered.groupby("Date")["Total"].sum().reset_index()
fig1 = px.line(ventas_diarias, x="Date", y="Total", title="Evolución de las Ventas Totales")
st.plotly_chart(fig1)

st.markdown("## 2. Ingresos por Línea de Producto")
ingresos_producto = df_filtered.groupby("Product line")["Total"].sum().reset_index()
fig2 = px.bar(ingresos_producto, x="Product line", y="Total", color="Product line", title="Ingresos por Línea de Producto")
st.plotly_chart(fig2)

st.markdown("## 3. Gasto por Tipo de Cliente")
fig3 = px.box(df_filtered, x="Customer type", y="Total", color="Customer type", title="Gasto por Tipo de Cliente")
st.plotly_chart(fig3)

st.markdown("## 4. Métodos de Pago Preferidos")
payment_counts = df_filtered["Payment"].value_counts().reset_index()
payment_counts.columns = ["Payment Method", "Count"]
fig4 = px.pie(payment_counts, names="Payment Method", values="Count", title="Métodos de Pago Preferidos")
st.plotly_chart(fig4)

#Deployment



#Conclusión

A partir del análisis visual de los datos de ventas, pudimos identificar patrones clave en el comportamiento de los clientes:

- Las ventas muestran una evolución estable, sin caídas abruptas.
- Ciertas líneas de productos, como "Food and beverages" y "Health and beauty", generan mayores ingresos, lo que puede orientar campañas promocionales.
- Los clientes "Member" no necesariamente gastan más que los "Normal", lo que podría llevar a replantear la estrategia de fidelización.
- El método de pago más utilizado fue [completar con el resultado de la visualización], lo que puede orientar decisiones operativas (por ejemplo, mejorar disponibilidad de POS).
- La correlación positiva entre `cogs` y `gross income` es lógica, pero su análisis permite evaluar si ciertos productos generan mayor margen relativo.

**Limitaciones**:
- El dataset cubre solo tres sucursales y un periodo de tiempo limitado, lo que restringe las conclusiones a corto plazo.
- Faltan variables como edad o frecuencia de compra por cliente, lo que limitaría análisis más profundos de segmentación.

**Recomendaciones**:
- Reforzar las líneas de productos más rentables.
- Evaluar la efectividad del programa de miembros.
- Automatizar reportes con este dashboard para su uso continuo por parte de gerencia.
