In [1]:
import streamlit as st 
import pandas as pd
import numpy as np
import plotly.express as px
import plotly.graph_objects as go
from plotly.subplots import make_subplots
import seaborn as sns
import matplotlib.pyplot as plt
from datetime import datetime, timedelta

In [2]:
# Datos 
np.random.seed(42)
fechas= pd.date_range('2023-01-01', '2024-12-31', freq='D') 
num_productos= ['Laptop', 'Mouse', 'Teclado', 'Monitor', 'Auriculares']
regiones = ['Norte', 'Sur', 'Este', 'Oeste', 'Centro']

# dataset
data = []

for fecha in fechas:
    for _ in range(np.random.poisson(10)):
        data.append({
            'fecha': fecha,
            'producto' : np.random.choice(num_productos),
            'region' : np.random.choice(regiones),
            'cantidad': np.random.randint(1, 6),
            'precio_unitario': np.random.uniform(50, 1500),
            'vendedor' : f'Vendedor_{np.random.randint(1, 21)}'
        })
        
df = pd.DataFrame(data)
df.head(10)


Unnamed: 0,fecha,producto,region,cantidad,precio_unitario,vendedor
0,2023-01-01,Mouse,Este,3,715.910893,Vendedor_4
1,2023-01-01,Teclado,Centro,2,1096.89822,Vendedor_6
2,2023-01-01,Mouse,Oeste,5,945.348189,Vendedor_12
3,2023-01-01,Laptop,Norte,3,937.186697,Vendedor_10
4,2023-01-01,Monitor,Oeste,3,604.569887,Vendedor_20
5,2023-01-01,Laptop,Este,5,930.940035,Vendedor_9
6,2023-01-01,Mouse,Oeste,1,1450.166448,Vendedor_18
7,2023-01-01,Mouse,Norte,2,191.624565,Vendedor_20
8,2023-01-01,Monitor,Oeste,4,768.00652,Vendedor_15
9,2023-01-01,Teclado,Norte,4,314.242327,Vendedor_4


In [3]:
# columna de ventas totales
df['venta_total'] = df['cantidad'] * df['precio_unitario']
df.head()

Unnamed: 0,fecha,producto,region,cantidad,precio_unitario,vendedor,venta_total
0,2023-01-01,Mouse,Este,3,715.910893,Vendedor_4,2147.73268
1,2023-01-01,Teclado,Centro,2,1096.89822,Vendedor_6,2193.79644
2,2023-01-01,Mouse,Oeste,5,945.348189,Vendedor_12,4726.740945
3,2023-01-01,Laptop,Norte,3,937.186697,Vendedor_10,2811.560092
4,2023-01-01,Monitor,Oeste,3,604.569887,Vendedor_20,1813.709662


EXPLORANDO DATOS

In [4]:
# Shape. (filas,columnas)
print(f'Shape del dataset: \n {df.shape}\n')

Shape del dataset: 
 (7253, 7)



In [5]:
# info. (tipo de datos, valores nulos, memoria)
print(f'Información general del dataset: \n {df.info()}\n')
df.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 7253 entries, 0 to 7252
Data columns (total 7 columns):
 #   Column           Non-Null Count  Dtype         
---  ------           --------------  -----         
 0   fecha            7253 non-null   datetime64[ns]
 1   producto         7253 non-null   object        
 2   region           7253 non-null   object        
 3   cantidad         7253 non-null   int64         
 4   precio_unitario  7253 non-null   float64       
 5   vendedor         7253 non-null   object        
 6   venta_total      7253 non-null   float64       
dtypes: datetime64[ns](1), float64(2), int64(1), object(3)
memory usage: 396.8+ KB
Información general del dataset: 
 None

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 7253 entries, 0 to 7252
Data columns (total 7 columns):
 #   Column           Non-Null Count  Dtype         
---  ------           --------------  -----         
 0   fecha            7253 non-null   datetime64[ns]
 1   producto         7253 n

In [6]:
# estadisticas descriptivas
print(f'Estadísticas descriptivas: \n {df.describe()}\n')

Estadísticas descriptivas: 
                                fecha     cantidad  precio_unitario  \
count                           7253  7253.000000      7253.000000   
mean   2023-12-28 05:04:33.486833152     3.011995       771.204622   
min              2023-01-01 00:00:00     1.000000        50.211363   
25%              2023-06-30 00:00:00     2.000000       416.385460   
50%              2023-12-26 00:00:00     3.000000       767.047548   
75%              2024-06-25 00:00:00     4.000000      1121.608562   
max              2024-12-31 00:00:00     5.000000      1499.962108   
std                              NaN     1.421020       412.857448   

       venta_total  
count  7253.000000  
mean   2324.939379  
min      50.349268  
25%     902.734548  
50%    1865.436770  
75%    3425.496465  
max    7499.221834  
std    1762.451173  



In [7]:
# ventas por mes
df_mes = df.groupby(df['fecha'].dt.to_period('M'))['venta_total'].sum().reset_index()
df_mes['fecha'] = df_mes['fecha'].astype(str)
df_mes 

Unnamed: 0,fecha,venta_total
0,2023-01,698236.092223
1,2023-02,771177.713696
2,2023-03,703929.40465
3,2023-04,681246.244939
4,2023-05,656314.326446
5,2023-06,665508.801351
6,2023-07,801100.457396
7,2023-08,769081.345479
8,2023-09,694692.878027
9,2023-10,654356.720898


In [8]:
# gráfico de lineas
fig_mes = px.line(df_mes, x='fecha', y='venta_total',
                  title='Tendencia de Ventas Mensuales',
                  labels={'venta_total': 'Ventas (€)', 'fecha': 'Mes'})

fig_mes.update_traces(line=dict(width=3))
#fig_mes.show()

In [9]:
# Top productos más vendidos
df_productos = df.groupby('producto')['venta_total'].sum().sort_values(ascending=True)
fig_products = px.bar(x=df_productos.values, y=df_productos.index,
                      orientation='h',title='Ventas por Producto',
                      labels={'x': 'Ventas Totales(€)', 'y': 'Producto'})
#fig_products.show()

In [10]:
# Análisis por región
df_region = df.groupby('region')['venta_total'].sum().reset_index()
fig_region = px.pie(df_region, values='venta_total', names='region',
                    title='Distribución de Ventas por Región',
                    labels={'venta_total': 'Ventas Totales(€)', 'region': 'Región'})    

#fig_region.show()

In [11]:
# correlacion entre variables
df_coor = df[['cantidad', 'precio_unitario', 'venta_total']].corr()

fig_heatmap = px.imshow(df_coor, text_auto=True, aspect='auto',
                        title='Correlación entre Variables Numéricas')
#fig_heatmap.show()

In [12]:
# Distribución de ventas 
fig_histograma = px.histogram(df, x='venta_total', nbins=20,
                              title='Distribución de Ventas Totales')
#fig_histograma.show()

#fig_histograma.show(renderer='browser')


CONFIGURACIÓN DEl DASHBOARD

In [13]:
# Titulo e icono
st.set_page_config(page_title='Dashboard de Ventas',
                   page_icon='📊', layout='wide')




In [14]:
# Título Principal
st.title('📊 Dashboard de Ventas')
st.markdown('---')

2025-06-02 11:51:21.729 
  command:

    streamlit run c:\Users\ander\Escritorio\PYTHON\Python 2025\dashboard_streamlit_plotly\dashboard_env\Lib\site-packages\ipykernel_launcher.py [ARGUMENTS]


DeltaGenerator()

In [15]:
# Slider para filtros
st.sidebar.header('Filtros')
productos_seleccionados = st.sidebar.multiselect(
    'Selecciona Productos:',
    options=df['producto'].unique(),
    default=df['producto'].unique()
)




In [16]:
# slider para regiones
regiones_seleccionadas = st.sidebar.multiselect(
    'Selecciona Regiones:',
    options=df['region'].unique(),
    default=df['region'].unique()
)



In [17]:
# filtrar datos basado en selecciones
df_filtrado = df[
    (df['producto'].isin(productos_seleccionados)) & 
    ( df['region'].isin(regiones_seleccionadas))
]

In [19]:
# Métricas Principales
col1, col2, col3, col4 = st.columns(4) 
with col1:
    st.metric(label='Total de Ventas',
              value=f'{df_filtrado["venta_total"].sum():,.0f} €'
             )
with col2:
    st.metric(label='Promedio de Ventas',
              value=f'{df_filtrado["venta_total"].mean():,.0f} €'
             )
with col3:
    st.metric("Número de Ventas",f'{len(df_filtrado)}'
             )
with col4:
    crecimiento = ((df_filtrado[df_filtrado['fecha'] >= '2024-01-01']['venta_total'].sum())/
                   (df_filtrado[df_filtrado['fecha'] < '2024-01-01']['venta_total'].sum())-1)*100
    st.metric(label='Crecimiento de Ventas 2024',
              value=f'{crecimiento:.2f}%'
             )



In [None]:
# Layout con dos colummnas
col1,col2 = st.columns(2)
with col1:
    st.plotly_chart(fig_mes, use_container_width=True),
    st.plotly_chart(fig_products, use_container_width=True)

with col2:
    st.plotly_chart(fig_region, use_container_width=True)
    st.plotly_chart(fig_heatmap, use_container_width=True)

# Gráfico completo en la parte inferior
st.plotly_chart(fig_histograma, use_container_width=True)




DeltaGenerator()