# Tarea: Análisis Visual de Ventas de Tienda de Conveniencia

### **Equipo:** [Inserte nombres de los integrantes]
### **Grupo:** [Inserte número de grupo]
### **Curso:** Visualización de Datos en Python

## Descripción del Caso

Una cadena de tiendas de conveniencia quiere analizar sus ventas y el comportamiento de los clientes para mejorar su estrategia de marketing. Para ello, han recopilado un conjunto de datos que incluye información sobre las ventas, los productos y los clientes. Su misión será usar las técnicas de visualización de datos aprendidas para analizar y presentar los resultados de este conjunto de datos.

## Indicaciones Generales

1.  **Dataset:** Utilizarán el dataset "Supermarket Sales" disponible en Kaggle (data.csv).
2.  **Entorno:** Trabajen según las indicaciones de este notebook.
3.  **Colaboración:** Esta es una tarea grupal. Asegúrense de coordinar el trabajo.
4.  **Streamlit:** Se requiere crear un dashboard interactivo usando la librería Streamlit. Deberán escribir y ejecutar su código como script the python (archivo .py), pero deben también escribir el código en una celda dentro de éste jupyter notebook para su revisión.
5.  **Pensamiento Crítico:** Incluyan reflexiones y justificaciones para sus elecciones de visualización y análisis.
6.  **Entrega:** Entreguen este notebook completado según las indicaciones.

## 1. Selección de Variables y desarrollo de Análisis


a.  Examinen el conjunto de datos proporcionado (`df.info()`, `df.describe()`, `df.columns`).

b.  Identifiquen y **justifiquen** las variables que consideren más relevantes para un análisis significativo del comportamiento de ventas y clientes. 

c.  Reflexionen sobre la importancia de cada variable seleccionada en el contexto del caso de estudio (¿Qué preguntas de negocio pueden ayudar a responder?).

## Análisis Requeridos:

1.  **Evolución de las Ventas Totales:**
    *   **Objetivo:** Mostrar cómo han variado las ventas totales (`Total`) a lo largo del tiempo (`Date`).

2.  **Ingresos por Línea de Producto:**
    *   **Objetivo:** Comparar los ingresos (`Total`) generados por cada `Product line`.

3.  **Distribución de la Calificación de Clientes:**
    *   **Objetivo:** Analizar la distribución de las calificaciones (`Rating`) de los clientes.

4.  **Comparación del Gasto por Tipo de Cliente:**
    *   **Objetivo:** Comparar la distribución del gasto total (`Total`) entre clientes `Member` y `Normal`.

5.  **Relación entre Costo y Ganancia Bruta:**
    *   **Objetivo:** Visualizar la relación entre el costo de bienes vendidos (`cogs`) y el ingreso bruto (`gross income`).

6.  **Métodos de Pago Preferidos:**
    *   **Objetivo:** Identificar los métodos de pago (`Payment`) más frecuentes.

7.  **Análisis de Correlación Numérica:**
    *   **Objetivo:** Explorar relaciones lineales entre variables numéricas (`Unit price`, `Quantity`, `Tax 5%`, `Total`, `cogs`, `gross income`, `Rating`).

8.  **Composición del Ingreso Bruto por Sucursal y Línea de Producto:**
    *   **Objetivo:** Mostrar la contribución de cada `Product line` al `gross income` dentro de cada `Branch`.

---

## Requisitos Adicionales:
*   Implementación en Streamlit.
*   Gráficos claros (títulos, etiquetas).
*   Interactividad (filtros) donde sea apropiado.
*   Aplicación de buenas prácticas de visualización (claridad).

## 2. Integración en un Dashboard (Streamlit)

a.  Utilizando Streamlit, integren **algunas** de sus visualizaciones y hallazgos clave en un dashboard interactivo.

b.  Asegúrense de que el dashboard sea intuitivo y bien organizado (usen títulos, texto explicativo, widgets interactivos como sliders o selectores para filtrar datos).

c.  Reflexionen sobre cómo la interactividad del dashboard mejora la experiencia del usuario y el proceso de toma de decisiones basado en los datos presentados.

**Instrucciones:**
1.  Escriban el código completo de su aplicación Streamlit en la celda de código de abajo.
2.  Copien ese código a un archivo de texto simple llamado `dashboard_tarea.py` (o el nombre que prefieran).
3.  Abran una terminal o Anaconda Prompt, naveguen a la carpeta donde guardaron el archivo.
4.  Ejecuten el comando: `streamlit run dashboard_tarea.py`
5.  Interactúen con su dashboard en el navegador.
6.  **Importante:** En la celda de Markdown siguiente, describan su dashboard, qué visualizaciones incluye, qué interacciones permite, y adjunten el código de su script de python.

# Descripción de gráficos

### Evolución de las Ventas Totales:
Objetivo: Mostrar cómo han variado las ventas totales (Total) a lo largo del tiempo (Date).

- El gráfico de la evolución de las ventas totales a lo largo del periodo permite evaluar cómo es el volumen de las ventas a través del tiempo, pudiendo identificar aquellos periodos de menores y mayores ventas, con el fin de estar preparados para esos periodos y ajustar el stock de los productos. Además, esto puede asociarse a ciertos eventos temporales y permitir predecir posibles comportamientos en el futuro.
### Ingresos por Línea de Producto:
Objetivo: Comparar los ingresos (Total) generados por cada Product line.

- El siguiente gráfico permite el análisis de la venta de los diferentes productos ofrecidos, pudiendo identificar aquellos que tienen una mayor venta según el periodo en evaluación. Este análisis permite poder definir el nivel de stocks por productos a considerar y su aporte al total de ingresos de la venta generadas.
### Distribución de la Calificación de Clientes:
Objetivo: Analizar la distribución de las calificaciones (Rating) de los clientes.

- Se clasifican las calificaciones de los productos en base al género (femenino y masculino), si bien se observa que existen algunos peacks de calificación que difieren entre los géneros en algunos periodos, estos en el tiempo se mantienen entre una calificación promedio de 6 a 8. Se podría identificar qué productos son los que tienen una menor evaluación y mejor e identificar a qué factores puede deberse.
Por otro lado, se visualiza un gráfico de frecuencia de las calificaciones, en donde se observa que la media es de 6.84. teniendo una buena evaluación de los productos pero con hartas posibilidades de mejoras también.
### Comparación del Gasto por Tipo de Cliente:
Objetivo: Comparar la distribución del gasto total (Total) entre clientes Member y Normal.

- En estos gráficos se puede observar que el porcentaje de ventas total esta representado en un 51.2% por aquellos clientes que cuentan con una membresía, sin embargo, a lo largo del tiempo se observa que existen periodos en donde las ventas de los clientes normales son mayores a aquellos con membresía. Este gráfico permite identificar aquellos periodos en donde existe un potencial para capturar nuevos clientes que se suscriban a la membresía del local.
### Relación entre Costo y Ganancia Bruta:
Objetivo: Visualizar la relación entre el costo de bienes vendidos (cogs) y el ingreso bruto (gross income).

- El gráfico muestra un alto costo de adquisición de los productos que se venden, no estando retribuido dichos costos en el ingreso bruto de estos. El gráfico nos indica que el ingreso bruto esta muy por debajo de los costos, por lo que la ganancia neta por la venta de productos estaría generando pérdidas en el negocio.
### Métodos de Pago Preferidos:
Objetivo: Identificar los métodos de pago (Payment) más frecuentes.

- En cuánto al método de pago se muestra que existe una preferencia por el pago en efectivo y ewallet. Es importante este tipo de análisis para identificar que es necesario un buen flujo de efectivo en caja.
Por otro lado, también se destaca que el uso de plataformas digitales para el método de pago ha ido imponiéndose por sobre las ventas con tarjeta de crédito.
### Análisis de Correlación Numérica:
Objetivo: Explorar relaciones lineales entre variables numéricas (Unit price, Quantity, Tax 5%, Total, cogs, gross income, Rating).

- Este gráfico es una herramienta útil para entender cómo se relacionan las variables y para identificar posibles redundancias o patrones en los datos. Mientras las variables sean cercanas a 1, quiere decir que las variables van en la misma dirección, mientras que si es más cercano a -1 las variables van en direcciones opuestas. Por otro lado, si las variables son cercanas a 0 no existe una relación lineal entre ellas.
### Composición del Ingreso Bruto por Sucursal y Línea de Producto:
### Objetivo: Mostrar la contribución de cada Product line al gross income dentro de cada Branch.







In [None]:
# --- Describan su Dashboard (Gráficos Utilizados y Justificación de su uso) --- 

''' ESCRIBIR AQUÍ SU DESCRIPCIÓN DEL DASHBOARD'''

In [None]:
# --- CÓDIGO PARA dashboard_tarea_grupo_X.py --- 
# (Este bloque NO se ejecuta directamente en Jupyter)

''' PEGAR A CONTINUACIÓN EL CÓDIGO DEL DASHBOARD '''

# 3. Deployment

a.  Desplieguen su dashboard en Streamlit Cloud.

b.  Asegúrense de que el dashboard sea accesible públicamente.

c.  Proporcionen el enlace al dashboard desplegado en la celda de Markdown siguiente.

d.  Reflexionen sobre el proceso de despliegue y cualquier desafío que hayan enfrentado.


En el caso que no hayan podido deployar:

In [None]:
'''
Comentar si hubo problemas con el código o si no se ejecutó correctamente que les impidieron realizar el análisis completo y el deployment del dashboard.
'''

En el caso que hayan podido deployar:

In [None]:
'''
Poner aquí la url de su dashboard en el servidor de Streamlit.
Ejemplo: https://share.streamlit.io/streamlit/demo-uber-nyc-pickups
'''

# 4. Conclusiones Generales

Reflexionen sobre el proceso de análisis y visualización. ¿Qué aprendieron sobre los datos de la tienda? ¿Qué limitaciones encontraron en los datos o en las técnicas de visualización? ¿Qué recomendaciones (basadas en los datos) podrían darle a la cadena de tiendas?

In [None]:
'''
Escriban acá su reflexión sobre el Dashboard.
'''

# 5. Referencias

Listar las fuentes utilizadas (dataset, bibliotecas principales, material de referencia adicional si aplica).

In [None]:
'''
Escriban aquí las referencias.
'''

## NOTA FINAL:
### Asegúrense de sólo subir el jupyter notebook a la plataforma, con un formato del tipo: "Trabajo_Grupo_X.ipynb".
### No es necesario incluir el archivo .py del dashboard, pero sí el código dentro de este cuaderno en el apartado correspondiente.