# Tarea: Análisis Visual de Ventas de Tienda de Conveniencia

### **Equipo:** Ignacio Andana, Pablo Calquín, Felipe Caniguante, Simón Espinosa, Marcelo Soto.
### **Grupo:** 50
### **Curso:** Visualización de Datos en Python

## Descripción del Caso

Una cadena de tiendas de conveniencia quiere analizar sus ventas y el comportamiento de los clientes para mejorar su estrategia de marketing. Para ello, han recopilado un conjunto de datos que incluye información sobre las ventas, los productos y los clientes. Su misión será usar las técnicas de visualización de datos aprendidas para analizar y presentar los resultados de este conjunto de datos.

## Indicaciones Generales

1.  **Dataset:** Utilizarán el dataset "Supermarket Sales" disponible en Kaggle (data.csv).
2.  **Entorno:** Trabajen según las indicaciones de este notebook.
3.  **Colaboración:** Esta es una tarea grupal. Asegúrense de coordinar el trabajo.
4.  **Streamlit:** Se requiere crear un dashboard interactivo usando la librería Streamlit. Deberán escribir y ejecutar su código como script the python (archivo .py), pero deben también escribir el código en una celda dentro de éste jupyter notebook para su revisión.
5.  **Pensamiento Crítico:** Incluyan reflexiones y justificaciones para sus elecciones de visualización y análisis.
6.  **Entrega:** Entreguen este notebook completado según las indicaciones.

## 1. Selección de Variables y desarrollo de Análisis


a.  Examinen el conjunto de datos proporcionado (`df.info()`, `df.describe()`, `df.columns`).

b.  Identifiquen y **justifiquen** las variables que consideren más relevantes para un análisis significativo del comportamiento de ventas y clientes. 

c.  Reflexionen sobre la importancia de cada variable seleccionada en el contexto del caso de estudio (¿Qué preguntas de negocio pueden ayudar a responder?).

## Análisis Requeridos:

1.  **Evolución de las Ventas Totales:**
    *   **Objetivo:** Mostrar cómo han variado las ventas totales (`Total`) a lo largo del tiempo (`Date`).

2.  **Ingresos por Línea de Producto:**
    *   **Objetivo:** Comparar los ingresos (`Total`) generados por cada `Product line`.

3.  **Distribución de la Calificación de Clientes:**
    *   **Objetivo:** Analizar la distribución de las calificaciones (`Rating`) de los clientes.

4.  **Comparación del Gasto por Tipo de Cliente:**
    *   **Objetivo:** Comparar la distribución del gasto total (`Total`) entre clientes `Member` y `Normal`.

5.  **Relación entre Costo y Ganancia Bruta:**
    *   **Objetivo:** Visualizar la relación entre el costo de bienes vendidos (`cogs`) y el ingreso bruto (`gross income`).

6.  **Métodos de Pago Preferidos:**
    *   **Objetivo:** Identificar los métodos de pago (`Payment`) más frecuentes.

7.  **Análisis de Correlación Numérica:**
    *   **Objetivo:** Explorar relaciones lineales entre variables numéricas (`Unit price`, `Quantity`, `Tax 5%`, `Total`, `cogs`, `gross income`, `Rating`).

8.  **Composición del Ingreso Bruto por Sucursal y Línea de Producto:**
    *   **Objetivo:** Mostrar la contribución de cada `Product line` al `gross income` dentro de cada `Branch`.

---

## Requisitos Adicionales:
*   Implementación en Streamlit.
*   Gráficos claros (títulos, etiquetas).
*   Interactividad (filtros) donde sea apropiado.
*   Aplicación de buenas prácticas de visualización (claridad).

## 2. Integración en un Dashboard (Streamlit)

a.  Utilizando Streamlit, integren **algunas** de sus visualizaciones y hallazgos clave en un dashboard interactivo.

b.  Asegúrense de que el dashboard sea intuitivo y bien organizado (usen títulos, texto explicativo, widgets interactivos como sliders o selectores para filtrar datos).

c.  Reflexionen sobre cómo la interactividad del dashboard mejora la experiencia del usuario y el proceso de toma de decisiones basado en los datos presentados.

**Instrucciones:**
1.  Escriban el código completo de su aplicación Streamlit en la celda de código de abajo.
2.  Copien ese código a un archivo de texto simple llamado `dashboard_tarea.py` (o el nombre que prefieran).
3.  Abran una terminal o Anaconda Prompt, naveguen a la carpeta donde guardaron el archivo.
4.  Ejecuten el comando: `streamlit run dashboard_tarea.py`
5.  Interactúen con su dashboard en el navegador.
6.  **Importante:** En la celda de Markdown siguiente, describan su dashboard, qué visualizaciones incluye, qué interacciones permite, y adjunten el código de su script de python.

In [None]:
# --- Describan su Dashboard (Gráficos Utilizados, Justificación de su uso e Interacciones) ---

texto_justificacion = """
Justificación de los Gráficos Utilizados e Interacciones

1. Evolución de las Ventas Totales
   Gráfico utilizado: Línea
   Justificación: El gráfico de línea es ideal para visualizar la evolución de un valor continuo a lo largo del tiempo, como las ventas diarias
   o mensuales. Permite detectar tendencias generales, estacionalidades, y caídas o picos en las ventas de forma clara. Además, facilita la
   comparación entre distintos periodos temporales.
   Interacción: No tiene filtros interactivos, pero muestra las ventas totales agrupadas por mes.

2. Ingresos por Línea de Producto
   Gráfico utilizado: Barra
   Justificación: Los gráficos de barras permiten comparar categorías entre sí de forma directa, como las distintas líneas de productos. Este
   tipo de gráfico facilita identificar cuáles son las líneas más rentables y permite jerarquizar los productos en función de sus ingresos
   generados.
   Interacción: Incluye un filtro para seleccionar una sucursal específica o visualizar todas las sucursales juntas.

3. Distribución de la Calificación de Clientes
   Gráfico utilizado: Histograma con curva de densidad (KDE)
   Justificación: El histograma permite observar cómo se distribuyen las calificaciones de los clientes, mostrando la frecuencia de cada rango de
   puntuación. Al combinarlo con una curva de densidad (KDE), se obtiene una visión más suave y continua de la forma de la distribución, lo que
   ayuda a identificar sesgos o concentraciones.
   Interacción: Incluye un filtro para seleccionar una sucursal específica o visualizar todas las sucursales juntas.

4. Comparación del Gasto por Tipo de Cliente
   Gráfico utilizado: Boxplot (diagrama de caja)
   Justificación: El boxplot es una herramienta poderosa para comparar la distribución de una variable continua (como el gasto total) entre
   categorías (como tipos de cliente). Muestra la mediana, la dispersión y los valores atípicos, lo que permite entender las diferencias en el
   comportamiento de gasto entre clientes 'Member' y 'Normal'.
   Interacción: No tiene filtros interactivos.

5. Relación entre Costo y Ganancia Bruta
   Gráfico utilizado: Dispersión (Scatter plot) con línea de regresión
   Justificación: El gráfico de dispersión es ideal para analizar la relación entre dos variables numéricas, en este caso, el costo de bienes
   vendidos y la ganancia bruta. Al agregar una línea de regresión, se puede observar si existe una relación lineal entre ambas variables y su
   dirección (positiva o negativa), útil para el análisis financiero.
   Interacción: No tiene filtros interactivos.

6. Métodos de Pago Preferidos  
   Gráfico utilizado: Torta (Pie chart)  
   Justificación: El gráfico de torta es útil para representar proporciones relativas dentro de un total, como la frecuencia de uso de los 
   distintos métodos de pago. Aunque limitado a pocas categorías, permite visualizar de manera rápida y efectiva qué método es más popular entre 
   los clientes y la proporción que representan los demás.  
   Interacción: Incluye un filtro interactivo para seleccionar una sucursal específica o visualizar todas las sucursales juntas. Además, 
   permite hacer clic en la leyenda para activar o desactivar la visualización de métodos de pago específicos.

7. Análisis de Correlación Numérica
   Gráfico utilizado: Mapa de calor (Heatmap) de correlaciones
   Justificación: El heatmap de correlaciones permite analizar rápidamente la relación entre múltiples variables numéricas. Es ideal para
   identificar variables altamente correlacionadas, lo cual es útil en análisis exploratorio y para evitar multicolinealidad en modelos 
   predictivos. El uso de colores mejora la interpretación visual de los coeficientes.
   Interacción: Permite seleccionar las columnas numéricas que se desean incluir en el análisis de correlación.

8. Composición del Ingreso Bruto por Sucursal y Línea de Producto  
   Gráfico utilizado: Dispersión 3D (Scatter 3D)  
   Justificación: El gráfico 3D permite visualizar simultáneamente dos dimensiones categóricas (Sucursal y Línea de Producto) y una 
   numérica (Ingreso Bruto) en un solo espacio tridimensional. Esto facilita identificar patrones, comparar el desempeño de las líneas de 
   producto en cada sucursal y detectar rápidamente cuáles son las combinaciones más rentables.  
   Interacción: Permite rotar, acercar y alejar la visualización para explorar los datos desde diferentes ángulos, así como filtrar 
   visualmente las líneas de producto desde la leyenda.
"""

# Mostrar el texto en la salida del cuaderno Jupyter
print(texto_justificacion)

In [None]:
# --- CÓDIGO PARA dashboard_tarea_grupo_50.py --- 
# (Este bloque NO se ejecuta directamente en Jupyter)

import streamlit as st
import pandas as pd
import numpy as np
import seaborn as sns
import matplotlib.pyplot as plt
import plotly.express as px
import io
import locale
import plotly.graph_objects as go

# -------------------------- Configuración de Streamlit -----------------

# Configurar el idioma local a español
# locale.setlocale(locale.LC_TIME, 'es_ES.UTF-8')  # Para sistemas basados en Unix (Linux/Mac)
locale.setlocale(locale.LC_TIME, 'Spanish_Spain.1252')  # Para Windows

# -------------------------------------------------------------------------------------

# Cargar los datos
@st.cache_data
def load_data():
    ventasHeader = [
        'ID de Factura', 'Sucursal', 'Ciudad', 'Tipo de Cliente', 'Género', 'Línea de Producto', 'Precio Unitario', 'Cantidad', 'Impuesto 5%', 'Total',
        'Fecha', 'Hora', 'Método de Pago', 'Costo de Bienes Vendidos', 'Porcentaje de Margen Bruto', 'Ingreso Bruto', 'Calificación']
    df_ventas = pd.read_csv(r'C:\Users\Ignacio\Desktop\Streamlit\data.csv', sep=',', header=0, names=ventasHeader)

    return df_ventas

df_ventas = load_data()

# Título
st.title("Dashboard de Ventas")

# -------------------------- Analisis Exploratorio ----------------------
st.subheader("Análisis Exploratorio")

if st.checkbox("Mostrar exploración inicial del DataFrame", key="analisis_exploratorio"):
    st.subheader("Información del DataFrame")
    
    # Usar StringIO como buffer
    buffer = io.StringIO()
    df_ventas.info(buf=buffer)
    info_str = buffer.getvalue()
    st.text(info_str)

    st.subheader("Estadísticas descriptivas")
    st.write(df_ventas.describe())

    st.subheader("Nombres de las columnas")
    st.write(df_ventas.columns.tolist())

# -------------------------- Variables Relevantes ----------------------
st.subheader("Variables Relevantes")

if st.checkbox("Mostrar variables relevantes y su justificación", key="variables_relevantes"):
    # Definir los datos como una lista de tuplas
    datos = [
        ("ID de Factura", "Único identificador de cada transacción, útil para evitar duplicados y rastrear operaciones individuales"),
        ("Sucursal", "Permite analizar el desempeño por ubicación física de la empresa"),
        ("Ciudad", "Ayuda a entender patrones geográficos de ventas y preferencias regionales"),
        ("Tipo de Cliente", "Permite segmentar a los clientes y evaluar diferencias en comportamiento de compra"),
        ("Género", "Útil para análisis demográfico y personalización de estrategias de marketing"),
        ("Línea de Producto", "Es clave para medir el rendimiento de categorías de productos y optimizar inventario"),
        ("Precio Unitario", "Fundamental para calcular ingresos y márgenes por producto"),
        ("Cantidad", "Muestra el volumen vendido, lo que ayuda a identificar productos populares o estacionales"),
        ("Total", "Indicador directo del valor de venta final, esencial para medir ingresos totales"),
        ("Fecha", "Permite realizar análisis temporales: ventas por día, mes, hora pico, etc"),
        ("Hora", "Permite realizar análisis de patrones horarios de compra"),
        ("Método de Pago", "Informa sobre preferencias de pago de los clientes, útil para decisiones operativas y financieras"),
        ("Ingreso Bruto", "Mide la rentabilidad antes de costos adicionales; útil para comparar líneas de producto o sucursales")
    ]

    # Crear el DataFrame
    df_variables_relevantes = pd.DataFrame(datos, columns=["Variable", "Justificación"])

    # Mostrar el DataFrame en Streamlit
    st.write(df_variables_relevantes)

# -------------------------- Preguntas de Negocio ----------------------
st.subheader("Preguntas de Negocio")

if st.checkbox("Mostrar preguntas de negocio", key="preguntas_negocio"):

    # Lista de tuplas: (Variable, Pregunta)
    datos = [
        # 1. ID de Factura
        ("ID de Factura", "¿Existen transacciones duplicadas?"),
        ("ID de Factura", "¿Cómo se distribuyen las ventas por número de factura?"),

        # 2. Sucursal / Ciudad
        ("Sucursal / Ciudad", "¿Cuál sucursal tiene mejor desempeño?"),
        ("Sucursal / Ciudad", "¿Hay diferencias significativas en las preferencias de producto entre ciudades?"),

        # 3. Tipo de Cliente
        ("Tipo de Cliente", "¿Qué tipo de cliente genera más ingresos?"),
        ("Tipo de Cliente", "¿Existen patrones de compra distintos según el tipo de cliente?"),

        # 4. Género
        ("Género", "¿Existe predominio de un género en ciertos tipos de productos?"),
        ("Género", "¿Cómo diseñar estrategias de marketing basadas en género?"),

        # 5. Línea de Producto
        ("Línea de Producto", "¿Qué categorías generan mayores ingresos o margen bruto?"),
        ("Línea de Producto", "¿Qué productos tienen mayor rotación?"),

        # 6. Precio Unitario / Cantidad / Total
        ("Precio Unitario / Cantidad / Total", "¿Cuáles son los productos más vendidos?"),
        ("Precio Unitario / Cantidad / Total", "¿Cómo afecta el precio al volumen de ventas?"),
        ("Precio Unitario / Cantidad / Total", "¿Cuál es el promedio de gasto por cliente?"),

        # 7. Fecha / Hora
        ("Fecha / Hora", "¿En qué días/horas hay mayor volumen de ventas?"),
        ("Fecha / Hora", "¿Hay estacionalidad en ciertas líneas de producto?"),

        # 8. Método de Pago
        ("Método de Pago", "¿Cuál es el método de pago más usado?"),
        ("Método de Pago", "¿Hay relación entre método de pago y monto total de la factura?"),

        # 9. Ingreso Bruto
        ("Ingreso Bruto", "¿Cuál línea de producto genera más ganancias?"),
        ("Ingreso Bruto", "¿Cómo varía la rentabilidad por sucursal?"),

        # 10. Calificación
        ("Calificación", "¿Existe una correlación entre calificación y monto gastado?"),
        ("Calificación", "¿Las sucursales con mejor servicio también tienen mayores ventas?")
    ]

    # Creamos el DataFrame
    df_preguntas_por_variable = pd.DataFrame(datos, columns=["Variable", "Pregunta"])

    # Aplicar estilo: alinear a la izquierda y centrar encabezado
    styled_df = df_preguntas_por_variable.style.set_properties(**{'text-align': 'left'}).set_table_styles([
        {'selector': 'th', 'props': [('text-align', 'center')]},
    ])

    # Mostrar el DataFrame con estilo
    st.write(styled_df)


# ----------------------------------- DASHABOARD ---------------------------------------
# ---------------- 1. Evolución de Ventas Totales a lo largo del tiempo -----------------

st.subheader("Evolución de ventas totales a lo largo del tiempo")

# Convertir la columna 'Fecha' a tipo datetime
df_ventas['Fecha'] = pd.to_datetime(df_ventas['Fecha'])

# Agrupar por mes
ventas_por_mes = df_ventas.resample('ME', on='Fecha')['Total'].sum().reset_index()

# Crear el gráfico con Plotly
fig = go.Figure()

# Agregar la línea de ventas totales
fig.add_trace(go.Scatter(
    x=ventas_por_mes['Fecha'],
    y=ventas_por_mes['Total'],
    mode='lines+markers',
    marker=dict(color='steelblue'),
    line=dict(color='steelblue'),
    name='Ventas Totales'
))

# Formatear manualmente los valores del eje y
formatted_y_values = [f"{int(y):,}".replace(",", ".") for y in ventas_por_mes['Total']]

# Configurar el diseño del gráfico
fig.update_layout(
    title=dict(
        text='Ventas Totales por Mes',
        x=0.5, 
        xanchor='center',
        font=dict(size=20)
    ),
    xaxis=dict(
        title='Mes',
        tickmode='array',
        tickvals=ventas_por_mes['Fecha'],
        ticktext=[fecha.strftime('%b').capitalize() + ' - ' + fecha.strftime('%Y') for fecha in ventas_por_mes['Fecha']], 
        tickangle=45 
    ),
    yaxis=dict(
        title='Total de Ventas',
        ticktext=formatted_y_values,
    ),
    plot_bgcolor='white',
    margin=dict(l=40, r=40, t=60, b=40)
)

# Mostrar el gráfico en Streamlit
st.plotly_chart(fig)


# ---------------- 2. Ingresos por Línea de Producto ------------------------------------------
st.subheader("Ingresos por Línea de Producto")

# Crear un filtro interactivo para seleccionar la sucursal
sucursales_disponibles = ["Todas las sucursales"] + sorted(df_ventas['Sucursal'].unique())
sucursal_seleccionada = st.selectbox("Selecciona una sucursal:", options=sucursales_disponibles, index=0)

# Filtrar los datos según la sucursal seleccionada
if sucursal_seleccionada == "Todas las sucursales":
    df_filtrado = df_ventas
else:
    df_filtrado = df_ventas[df_ventas['Sucursal'] == sucursal_seleccionada]

# Agrupar los ingresos por línea de producto
product_totals = df_filtrado.groupby('Línea de Producto')['Total'].sum().reset_index()

# Crear el gráfico de barras con colores diferentes por línea de producto
fig = px.bar(
    product_totals,
    x='Línea de Producto',
    y='Total',
    color='Línea de Producto',
    title=f"Ingresos por Línea de Producto - {sucursal_seleccionada}"
)

# Configurar el diseño del gráfico
fig.update_layout(
    title=dict(
        text=f"Ingresos por Línea de Producto - {sucursal_seleccionada}",
        x=0.5,
        xanchor='center',
        font=dict(size=20)
    ),
    xaxis=dict(
        title="Línea de Producto"
    ),
    yaxis=dict(
        title="Total de Ingresos"
    ),
    plot_bgcolor='white',
    margin=dict(l=40, r=40, t=60, b=40)
)

# Mostrar el gráfico en Streamlit
st.plotly_chart(fig)


# ---------------- 3. Distribución de la Calificación de Clientes --------------------------------
st.subheader("Distribución de Calificaciones (Rating)")

# Crear un filtro interactivo para seleccionar la sucursal
sucursales_disponibles = ["Todas las sucursales"] + sorted(df_ventas['Sucursal'].unique())
sucursal_seleccionada = st.selectbox("Selecciona una sucursal para el análisis de calificaciones:", options=sucursales_disponibles, index=0)

# Filtrar los datos según la sucursal seleccionada
if sucursal_seleccionada == "Todas las sucursales":
    df_filtrado = df_ventas
else:
    df_filtrado = df_ventas[df_ventas['Sucursal'] == sucursal_seleccionada]

# Crear el histograma con Plotly
fig = px.histogram(
    df_filtrado,
    x='Calificación',
    nbins=10,
    title=f"Distribución de Calificaciones - {sucursal_seleccionada}",
    labels={'Calificación': 'Calificación', 'count': 'Cantidad'},
    opacity=0.6,
)

# Crear un rango de valores para la curva KDE
x_kde = np.linspace(df_filtrado['Calificación'].min(), df_filtrado['Calificación'].max(), 200)
kde = sns.kdeplot(df_filtrado['Calificación'], bw_adjust=1, fill=False).get_lines()[0].get_data()

# Escalar la curva KDE para que coincida con la escala del histograma
hist_data = np.histogram(df_filtrado['Calificación'], bins=10)
kde_scaled = kde[1] * max(hist_data[0]) / max(kde[1])

# Agregar la curva KDE al gráfico
fig.add_trace(
    go.Scatter(
        x=kde[0],
        y=kde_scaled,
        mode='lines',
        line=dict(color='red', width=2),
        name='Curva KDE'
    )
)

# Configurar el diseño del gráfico
fig.update_layout(
    title=dict(
        text=f"Distribución de Calificaciones - {sucursal_seleccionada}",
        x=0.5,
        xanchor='center',
        font=dict(size=20) 
    ),
    xaxis=dict(
        title="Calificación",
        range=[3, 12],
        dtick=1 
    ),
    yaxis=dict(
        title="Cantidad"
    ),
    bargap=0.2,
    plot_bgcolor='white',
    margin=dict(l=40, r=40, t=60, b=40) 
)

# Mostrar el gráfico en Streamlit
st.plotly_chart(fig)


# ---------------- 4. Comparación del Gasto por Tipo de Cliente --------------------------------
st.subheader("Gasto por Tipo de Cliente")

# Crear el gráfico de caja con Plotly
fig = px.box(
    df_ventas,
    x='Tipo de Cliente',
    y='Total',
    title="Distribución del Gasto Total por Tipo de Cliente",
    labels={'Total': 'Monto Total (Gasto)', 'Tipo de Cliente': 'Tipo de Cliente'}
)

# Configurar el diseño del gráfico
fig.update_layout(
    title=dict(
        text="Distribución del Gasto Total por Tipo de Cliente",
        x=0.5, 
        xanchor='center',
        font=dict(size=20)
    ),
    xaxis=dict(
        title="Tipo de Cliente"
    ),
    yaxis=dict(
        title="Monto Total (Gasto)"
    ),
    plot_bgcolor='white',
    margin=dict(l=40, r=40, t=60, b=40)
)

# Mostrar el gráfico en Streamlit
st.plotly_chart(fig)


# ---------------- 5. Relación entre Costo y Ganancia Bruta --------------------------------
st.subheader("Relación entre Costo y Ganancia Bruta")

# Crear el gráfico de dispersión con línea de tendencia
fig = px.scatter(
    df_ventas,
    x='Costo de Bienes Vendidos',
    y='Ingreso Bruto',
    trendline='ols',  # Agregar línea de tendencia
    title="Relación entre Costo de Bienes Vendidos e Ingreso Bruto",
    labels={'Costo de Bienes Vendidos': 'Costo de Bienes Vendidos', 'Ingreso Bruto': 'Ingreso Bruto'}
)

# Personalizar los colores de los puntos y la línea de tendencia
fig.update_traces(
    marker=dict(color='blue', size=8),  # Cambiar el color y tamaño de los puntos
    selector=dict(mode='markers')  # Aplicar solo a los puntos
)

# Personalizar la línea de tendencia
for trace in fig.data:
    if trace.mode == 'lines':
        trace.line.color = 'red'
        trace.line.width = 3 

# Configurar el diseño del gráfico
fig.update_layout(
    title=dict(
        text="Relación entre Costo de Bienes Vendidos e Ingreso Bruto",
        x=0.5,
        xanchor='center',
        font=dict(size=20)
    ),
    xaxis=dict(
        title="Costo de Bienes Vendidos"
    ),
    yaxis=dict(
        title="Ingreso Bruto"
    ),
    plot_bgcolor='white',
    margin=dict(l=40, r=40, t=60, b=40)
)

# Mostrar el gráfico en Streamlit
st.plotly_chart(fig)


# ---------------- 6. Métodos de Pago Preferidos ---------------------------------------
st.subheader("Métodos de Pago Preferidos")

# Contar los métodos de pago
payment_counts = df_ventas['Método de Pago'].value_counts().reset_index()
payment_counts.columns = ['Método de Pago', 'Cantidad']

# Traducir los valores de la columna 'Método de Pago'
payment_counts['Método de Pago'] = payment_counts['Método de Pago'].replace({
    'Cash': 'Efectivo',
    'Credit card': 'Tarjeta de Crédito',
    'Ewallet': 'Billetera Electrónica'
})

# Crear el gráfico de pastel con Plotly
fig = px.pie(
    payment_counts,
    values='Cantidad',
    names='Método de Pago',
    title="Métodos de Pago Preferidos"
)

# Configurar el diseño del gráfico
fig.update_layout(
    title=dict(
        text="Métodos de Pago Preferidos",
        x=0.5,  # Centrar el título
        xanchor='center',
        font=dict(size=20)  # Tamaño de la fuente del título
    )
)

# Mostrar el gráfico en Streamlit
st.plotly_chart(fig)


# ---------------- 7. Correlación Numérica --------------------------------------------
st.subheader("Mapa de Correlación Numérica")

# Definir las columnas numéricas disponibles
numeric_cols = ['Precio Unitario', 'Cantidad', 'Impuesto 5%', 'Total', 'Costo de Bienes Vendidos', 'Ingreso Bruto', 'Calificación']

# Crear un filtro interactivo para seleccionar columnas
selected_cols = st.multiselect(
    "Selecciona las columnas numéricas para el análisis de correlación:",
    options=numeric_cols,
    default=numeric_cols  # Seleccionar todas las columnas por defecto
)

# Verificar si se seleccionaron columnas
if selected_cols:
    # Calcular la matriz de correlación solo con las columnas seleccionadas
    correlation_matrix = df_ventas[selected_cols].corr()

    # Crear el gráfico de calor con Plotly
    fig = px.imshow(
        correlation_matrix,
        text_auto=True,
        color_continuous_scale='RdBu',
        labels=dict(color="Correlación")
    )

    # Ajustar el tamaño de la fuente de los valores en las celdas
    fig.update_traces(textfont_size=11)

    # Configurar el diseño del gráfico
    fig.update_layout(
        title=dict(
            text="Mapa de Correlación Numérica",
            x=0.5,
            xanchor='center',
            font=dict(size=20)
        ),
        xaxis=dict(
            tickangle=45,
            tickfont=dict(size=12),
            automargin=True
        ),
        yaxis=dict(
            tickfont=dict(size=12),
            automargin=True
        ),
        autosize=False,
        width=800,
        height=600,
        margin=dict(l=40, r=40, t=60, b=40),
        uniformtext_minsize=10,
        uniformtext_mode='show',
        xaxis_scaleanchor="y"
    )

    # Mostrar el gráfico en Streamlit con el ancho del contenedor
    st.plotly_chart(fig, use_container_width=True)
else:
    st.warning("Por favor, selecciona al menos una columna para calcular la correlación.")


# ---------------- 8. Composición del Ingreso Bruto por Sucursal y Línea de Producto ------------------------------
st.subheader("Ingreso Bruto por Sucursal y Línea de Producto")

# Traducir los valores de las columnas
pivot = df_ventas.groupby(['Sucursal', 'Línea de Producto'])['Ingreso Bruto'].sum().reset_index()

# Crear el gráfico de barras con Plotly
fig = px.bar(
    pivot,
    x='Sucursal',
    y='Ingreso Bruto',
    color='Línea de Producto',
    title="Ingreso Bruto por Sucursal y Línea de Producto"
)

# Configurar el diseño del gráfico
fig.update_layout(
    title=dict(
        text="Ingreso Bruto por Sucursal y Línea de Producto",
        x=0.5,
        xanchor='center',
        font=dict(size=20)
    ),
    xaxis=dict(
        title="Sucursal",
        title_standoff=30 
    ),
    yaxis=dict(
        title="Ingreso Bruto"
    ),
    plot_bgcolor='white',
    margin=dict(l=40, r=40, t=60, b=40),
    legend_title=dict(text="Línea de Producto"),
    legend=dict(
        title_font=dict(size=14),
        font=dict(size=12),
        orientation="h",
        yanchor="bottom",
        y=-0.6,
        xanchor="center",
        x=0.5
    )
)

# Mostrar el gráfico en Streamlit
st.plotly_chart(fig, use_container_width=True)


In [None]:
# Punto 2.C
texto_reflexion ="""
La interactividad de un dashboard mejora significativamente la experiencia del usuario y el proceso de toma de decisiones basado en datos al permitir 
una exploración dinámica, visual e intuitiva de la información. A diferencia de los informes estáticos o las tablas tradicionales, que presentan la 
información de manera lineal y poco flexible, los dashboards interactivos permiten una exploración dinámica, visual e intuitiva de indicadores clave.
Mediante funcionalidades como filtros por período, categorías de productos, segmentos de clientes o sucursales, los usuarios pueden adaptar la 
visualización de los datos a sus necesidades específicas, identificando patrones de comportamiento, oportunidades comerciales o variaciones en el 
rendimiento con mayor rapidez. Esta capacidad de análisis en tiempo real mejora la comprensión de la información y permite una respuesta ágil ante 
cambios en el mercado o en el desempeño interno.
Es en relación a lo mencionado anteriormente que, un dashboard interactivo no solo optimiza la experiencia del usuario al facilitar el acceso y la 
interpretación de los datos, sino que también fortalece la toma de decisiones estratégicas y operativas en entornos comerciales dinámicos y competitivos.
"""

# Mostrar el texto en la salida del cuaderno Jupyter
print(texto_reflexion)

# 3. Deployment

a.  Desplieguen su dashboard en Streamlit Cloud.

b.  Asegúrense de que el dashboard sea accesible públicamente.

c.  Proporcionen el enlace al dashboard desplegado en la celda de Markdown siguiente.

d.  Reflexionen sobre el proceso de despliegue y cualquier desafío que hayan enfrentado.


En el caso que no hayan podido deployar:

In [None]:
'''
Comentar si hubo problemas con el código o si no se ejecutó correctamente que les impidieron realizar el análisis completo y el deployment del dashboard.
'''

En el caso que hayan podido deployar:

In [None]:
'''
Poner aquí la url de su dashboard en el servidor de Streamlit.
Ejemplo: https://share.streamlit.io/streamlit/demo-uber-nyc-pickups
'''

# 4. Conclusiones Generales

Reflexionen sobre el proceso de análisis y visualización. ¿Qué aprendieron sobre los datos de la tienda? ¿Qué limitaciones encontraron en los datos o en las técnicas de visualización? ¿Qué recomendaciones (basadas en los datos) podrían darle a la cadena de tiendas?

In [None]:
'''
Escriban acá su reflexión sobre el Dashboard.
'''

# 5. Referencias

Listar las fuentes utilizadas (dataset, bibliotecas principales, material de referencia adicional si aplica).

In [None]:
https://docs.streamlit.io/
https://pandas.pydata.org/
https://numpy.org/es/
https://matplotlib.org/stable/api/pyplot_summary.html
https://seaborn.pydata.org/
https://plotly.com/python/plotly-express/
https://blog.streamlit.io/crafting-a-dashboard-app-in-python-using-streamlit/
https://docs.streamlit.io/develop/api-reference/charts
https://docs.kanaries.net/es/topics/Streamlit/streamlit-visualization
https://www.analyticsvidhya.com/blog/2020/10/create-interactive-dashboards-with-streamlit-and-python/
https://www.turing.com/kb/how-to-build-an-interactive-dashboard-in-python-using-streamlit
Dataset data(1).csv



## NOTA FINAL:
### Asegúrense de sólo subir el jupyter notebook a la plataforma, con un formato del tipo: "Trabajo_Grupo_X.ipynb".
### No es necesario incluir el archivo .py del dashboard, pero sí el código dentro de este cuaderno en el apartado correspondiente.