In [3]:
import pandas as pd 
import numpy as np
import plotly.express as px


In [29]:
np.random.seed(42)

# Listas base
paises = ['México', 'Estados Unidos', 'Brasil', 'Alemania', 'Japón']
productos = ['Laptop', 'Smartphone', 'Tablet', 'Monitor', 'Teclado']
categorias = {'Laptop': 'Electrónica', 'Smartphone': 'Electrónica',
              'Tablet': 'Electrónica', 'Monitor': 'Periféricos', 'Teclado': 'Periféricos'}
canales = ['Online', 'Tienda Física']

# Generar fechas
fechas = pd.date_range(start='2023-01-01', end='2023-12-31', freq='D')

# Número de filas (ventas simuladas)
n = 1000

# Generar datos
data = {
    'Fecha': np.random.choice(fechas, n),
    'País': np.random.choice(paises, n),
    'Producto': np.random.choice(productos, n),
    'Canal de venta': np.random.choice(canales, n),
    'Unidades vendidas': np.random.randint(1, 100, n),
}

# Convertir a DataFrame
df = pd.DataFrame(data)

# Agregar categoría y precio
df['Categoría'] = df['Producto'].map(categorias)
precios = {'Laptop': 15000, 'Smartphone': 10000, 'Tablet': 6000, 'Monitor': 4000, 'Teclado': 800}
df['Precio unitario'] = df['Producto'].map(precios)

# Calcular ingresos
df['Ingreso total'] = df['Unidades vendidas'] * df['Precio unitario']

# Mostrar las primeras filas
print(df.head())


       Fecha            País Producto Canal de venta  Unidades vendidas  \
0 2023-04-13          Brasil  Teclado  Tienda Física                 70   
1 2023-12-15          Brasil   Laptop         Online                 41   
2 2023-09-28          México   Laptop         Online                 16   
3 2023-04-17  Estados Unidos   Laptop         Online                 68   
4 2023-03-13  Estados Unidos   Laptop         Online                 99   

     Categoría  Precio unitario  Ingreso total  
0  Periféricos              800          56000  
1  Electrónica            15000         615000  
2  Electrónica            15000         240000  
3  Electrónica            15000        1020000  
4  Electrónica            15000        1485000  


In [34]:
# Analisis descriptivo de los datos
print(df.describe())



                            Fecha  Unidades vendidas  Precio unitario  \
count                        1000        1000.000000       1000.00000   
mean   2023-07-01 13:22:04.800000          50.806000       6988.80000   
min           2023-01-01 00:00:00           1.000000        800.00000   
25%           2023-04-08 00:00:00          27.000000       4000.00000   
50%           2023-07-01 12:00:00          52.000000       6000.00000   
75%           2023-09-27 06:00:00          74.000000      10000.00000   
max           2023-12-31 00:00:00          99.000000      15000.00000   
std                           NaN          28.022234       4901.97347   

       Ingreso total  
count   1.000000e+03  
mean    3.528772e+05  
min     1.600000e+03  
25%     6.800000e+04  
50%     2.620000e+05  
75%     5.285000e+05  
max     1.485000e+06  
std     3.352469e+05  


In [50]:
# Pais con más ventas
ventas_por_pais = df.groupby('País')['Unidades vendidas'].sum().reset_index()
ventas_por_pais = ventas_por_pais.sort_values(by='Unidades vendidas', ascending=False)
print("País con más ventas:")
print(ventas_por_pais.head(1))

País con más ventas:
             País  Unidades vendidas
2  Estados Unidos              10914


In [79]:
# Grafico de pie de ventas por país

fig_pie = px.pie(ventas_por_pais, names='País', values='Unidades vendidas',
                 title='Ventas por País', color='País', template= 'plotly_dark')

fig_pie.update_layout(
    font_family="Century Gothic",
    font_color="lightgreen"
)
fig_pie.show()

In [80]:
# Grafico de barras de ventas por producto
ventas_por_producto = df.groupby('Producto')['Unidades vendidas'].sum().reset_index()
ventas_por_producto = ventas_por_producto.sort_values(by='Unidades vendidas', ascending=False)      
print("Producto con más ventas:")
print(ventas_por_producto.head(1))  

fig_bar = px.bar(ventas_por_producto, x='Producto', y='Unidades vendidas',
                 title='Ventas por Producto', color='Producto', template='plotly_dark')
fig_bar.update_layout(
    font_family="Century Gothic",
    font_color="lightgreen"
)
fig_bar.show()

Producto con más ventas:
  Producto  Unidades vendidas
1  Monitor              12154


In [78]:
# analisis de series temporales de los productos más vendidos
ventas_por_fecha = df.groupby(['Fecha', 'Producto'])['Unidades vendidas'].sum().reset_index()
ventas_por_fecha = ventas_por_fecha.sort_values(by='Fecha')         
fig_time = px.line(ventas_por_fecha, x='Fecha', y='Unidades vendidas', color='Producto',
                   title='Ventas Diarias por Producto', template='plotly_dark')
fig_time.update_layout(
    font_family="monospace",
    font_color="lightgreen"
)
fig_time.show()