# Importaciones

In [1]:
import pandas as pd
import numpy as np
import os
import plotly.graph_objects as go
import datetime as dt
import plotly.express as px

# Declaraciones iniciales

## Variables globales

In [2]:

ruta_de_archivos = './Dataset de ventas2'


In [3]:
meses = ['Enero', 'Febrero', 'Marzo', 'Abril', 'Mayo', 'Junio',
        'Julio', 'Agosto', 'Septiembre', 'Octubre', 'Noviembre', 'Diciembre']
meses

['Enero',
 'Febrero',
 'Marzo',
 'Abril',
 'Mayo',
 'Junio',
 'Julio',
 'Agosto',
 'Septiembre',
 'Octubre',
 'Noviembre',
 'Diciembre']

In [274]:
dias_meses = {
    'Enero': 31,
    'Febrero': 28,
    'Marzo': 31,
    'Abril': 30,
    'Mayo': 31,
    'Junio': 30,
    'Julio': 31,
    'Agosto': 31,
    'Septiembre': 30,
    'Octubre': 31,
    'Noviembre': 30,
    'Diciembre': 31
}
dias_meses['Abril']

30

In [4]:
dias_semana = ['Lun', 'Mar', 'Mie', 'Jue', 'Vie', 'Sab', 'Dom'] 
dias_semana

['Lun', 'Mar', 'Mie', 'Jue', 'Vie', 'Sab', 'Dom']

In [5]:
horas = list(range(24))
horas

[0,
 1,
 2,
 3,
 4,
 5,
 6,
 7,
 8,
 9,
 10,
 11,
 12,
 13,
 14,
 15,
 16,
 17,
 18,
 19,
 20,
 21,
 22,
 23]

In [6]:
archivos = os.listdir(ruta_de_archivos)
archivos

['Dataset_de_ventas_Abril.csv',
 'Dataset_de_ventas_Agosto.csv',
 'Dataset_de_ventas_Diciembre.csv',
 'Dataset_de_ventas_Enero.csv',
 'Dataset_de_ventas_Febrero.csv',
 'Dataset_de_ventas_Julio.csv',
 'Dataset_de_ventas_Junio.csv',
 'Dataset_de_ventas_Marzo.csv',
 'Dataset_de_ventas_Mayo.csv',
 'Dataset_de_ventas_Noviembre.csv',
 'Dataset_de_ventas_Octubre.csv',
 'Dataset_de_ventas_Septiembre.csv']

## Carga de un diccionario de dataframes por mes

In [7]:
# diccionario vacio en el cual van a estar los df de ventas de cada mes
dataframes_meses = {}

for archivo in archivos:
    if archivo.endswith('.csv'):
        mes = archivo.split('_')[3].split('.')[0]
        print(mes)
        ruta_completa =  os.path.join(ruta_de_archivos, archivo)
        print(ruta_completa)
        df = pd.read_csv(ruta_completa)
        df_ventas = df.copy()
        #df_ventas.info()

        df_ventas['Cantidad Pedida'] = pd.to_numeric(df_ventas['Cantidad Pedida'], errors='coerce')  #El errors= 'coerce' transforma los valores no numericos a NaN'
        df_ventas['Precio Unitario'] = pd.to_numeric(df_ventas['Precio Unitario'], errors='coerce')
        #df_ventas.info()

        df_ventas = df_ventas.loc[~df_ventas['Cantidad Pedida'].isna()]
        df_ventas = df_ventas.loc[~df_ventas['Precio Unitario'].isna()]
        #df_ventas.info()

        # Elimino todos los Nan y me quedo solo con los valores numericos
        df_ventas = df_ventas.dropna()
        #df_ventas.info()

        # Transformo todos los valores numericos al tipo de dato int
        df_ventas['Cantidad Pedida'] = df_ventas['Cantidad Pedida'].astype(int)
        df_ventas['Precio Unitario'] = df_ventas['Precio Unitario'].astype(int)
        #df_ventas.info()
        
        # Se elimina los duplicados
        df_ventas = df_ventas.drop_duplicates()
        
        # Se resetea el index   
        df_ventas = df_ventas.reset_index(drop=True)
        

        dataframes_meses[mes] = df_ventas  # Agregar el DataFrame al diccionario usando el nombre del mes


Abril
./Dataset de ventas2\Dataset_de_ventas_Abril.csv
Agosto
./Dataset de ventas2\Dataset_de_ventas_Agosto.csv
Diciembre
./Dataset de ventas2\Dataset_de_ventas_Diciembre.csv
Enero
./Dataset de ventas2\Dataset_de_ventas_Enero.csv
Febrero
./Dataset de ventas2\Dataset_de_ventas_Febrero.csv
Julio
./Dataset de ventas2\Dataset_de_ventas_Julio.csv
Junio
./Dataset de ventas2\Dataset_de_ventas_Junio.csv


Marzo
./Dataset de ventas2\Dataset_de_ventas_Marzo.csv
Mayo
./Dataset de ventas2\Dataset_de_ventas_Mayo.csv
Noviembre
./Dataset de ventas2\Dataset_de_ventas_Noviembre.csv
Octubre
./Dataset de ventas2\Dataset_de_ventas_Octubre.csv
Septiembre
./Dataset de ventas2\Dataset_de_ventas_Septiembre.csv


In [8]:
df_ventas.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 11611 entries, 0 to 11610
Data columns (total 6 columns):
 #   Column              Non-Null Count  Dtype 
---  ------              --------------  ----- 
 0   ID de Pedido        11611 non-null  object
 1   Producto            11611 non-null  object
 2   Cantidad Pedida     11611 non-null  int32 
 3   Precio Unitario     11611 non-null  int32 
 4   Fecha de Pedido     11611 non-null  object
 5   Dirección de Envio  11611 non-null  object
dtypes: int32(2), object(4)
memory usage: 453.7+ KB


In [9]:
df_ventas[df_ventas.duplicated()]

Unnamed: 0,ID de Pedido,Producto,Cantidad Pedida,Precio Unitario,Fecha de Pedido,Dirección de Envio


In [10]:
print(df_ventas.isnull().sum())

ID de Pedido          0
Producto              0
Cantidad Pedida       0
Precio Unitario       0
Fecha de Pedido       0
Dirección de Envio    0
dtype: int64


In [11]:
dataframes_meses['Mayo'].info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 16540 entries, 0 to 16539
Data columns (total 6 columns):
 #   Column              Non-Null Count  Dtype 
---  ------              --------------  ----- 
 0   ID de Pedido        16540 non-null  object
 1   Producto            16540 non-null  object
 2   Cantidad Pedida     16540 non-null  int32 
 3   Precio Unitario     16540 non-null  int32 
 4   Fecha de Pedido     16540 non-null  object
 5   Dirección de Envio  16540 non-null  object
dtypes: int32(2), object(4)
memory usage: 646.2+ KB


In [12]:
dt.date.today().weekday()

6

## Funcion extraer_datos

In [13]:
def extraer_datos(datos):
  datos['Fecha de Pedido'] = pd.to_datetime(datos['Fecha de Pedido'])
  datos['Hora'] = datos['Fecha de Pedido'].dt.hour
  datos['Dia'] = datos['Fecha de Pedido'].dt.day
  datos['Dia semanal'] = datos['Fecha de Pedido'].dt.weekday
  
  return datos

In [14]:
dataframe_mes = dataframes_meses['Enero']
dataframe_mes

Unnamed: 0,ID de Pedido,Producto,Cantidad Pedida,Precio Unitario,Fecha de Pedido,Dirección de Envio
0,141234,iPhone,1,700,01/22/19 21:25,"944 Walnut St, Boston, MA 02215"
1,141235,Lightning Charging Cable,1,14,01/28/19 14:15,"185 Maple St, Portland, OR 97035"
2,141236,Wired Headphones,2,11,01/17/19 13:33,"538 Adams St, San Francisco, CA 94016"
3,141237,27in FHD Monitor,1,149,01/05/19 20:33,"738 10th St, Los Angeles, CA 90001"
4,141238,Wired Headphones,1,11,01/25/19 11:59,"387 10th St, Austin, TX 73301"
...,...,...,...,...,...,...
9666,150497,20in Monitor,1,109,01/26/19 19:09,"95 8th St, Dallas, TX 75001"
9667,150498,27in FHD Monitor,1,149,01/10/19 22:58,"403 7th St, San Francisco, CA 94016"
9668,150499,ThinkPad Laptop,1,999,01/21/19 14:31,"214 Main St, Portland, OR 97035"
9669,150500,AAA Batteries (4-pack),2,2,01/15/19 14:21,"810 2nd St, Los Angeles, CA 90001"


In [15]:
dataframe_mes = extraer_datos(dataframe_mes)
dataframe_mes

  datos['Fecha de Pedido'] = pd.to_datetime(datos['Fecha de Pedido'])


Unnamed: 0,ID de Pedido,Producto,Cantidad Pedida,Precio Unitario,Fecha de Pedido,Dirección de Envio,Hora,Dia,Dia semanal
0,141234,iPhone,1,700,2019-01-22 21:25:00,"944 Walnut St, Boston, MA 02215",21,22,1
1,141235,Lightning Charging Cable,1,14,2019-01-28 14:15:00,"185 Maple St, Portland, OR 97035",14,28,0
2,141236,Wired Headphones,2,11,2019-01-17 13:33:00,"538 Adams St, San Francisco, CA 94016",13,17,3
3,141237,27in FHD Monitor,1,149,2019-01-05 20:33:00,"738 10th St, Los Angeles, CA 90001",20,5,5
4,141238,Wired Headphones,1,11,2019-01-25 11:59:00,"387 10th St, Austin, TX 73301",11,25,4
...,...,...,...,...,...,...,...,...,...
9666,150497,20in Monitor,1,109,2019-01-26 19:09:00,"95 8th St, Dallas, TX 75001",19,26,5
9667,150498,27in FHD Monitor,1,149,2019-01-10 22:58:00,"403 7th St, San Francisco, CA 94016",22,10,3
9668,150499,ThinkPad Laptop,1,999,2019-01-21 14:31:00,"214 Main St, Portland, OR 97035",14,21,0
9669,150500,AAA Batteries (4-pack),2,2,2019-01-15 14:21:00,"810 2nd St, Los Angeles, CA 90001",14,15,1


In [16]:
# Separo la direccion de envio en calle ciudad y PO BOX
direccion_df = dataframe_mes['Dirección de Envio'].str.split(', ',expand=True)
direccion_df.columns = ['Calle','Ciudad','PO BOX']
direccion_df


Unnamed: 0,Calle,Ciudad,PO BOX
0,944 Walnut St,Boston,MA 02215
1,185 Maple St,Portland,OR 97035
2,538 Adams St,San Francisco,CA 94016
3,738 10th St,Los Angeles,CA 90001
4,387 10th St,Austin,TX 73301
...,...,...,...
9666,95 8th St,Dallas,TX 75001
9667,403 7th St,San Francisco,CA 94016
9668,214 Main St,Portland,OR 97035
9669,810 2nd St,Los Angeles,CA 90001


In [17]:
# Separo el PO BOX en Estado y Cod Postal
direccion_df[['Estado', 'Cod Postal']] = direccion_df['PO BOX'].str.split(' ',expand=True)
df_ventas_desglosado = pd.concat([dataframe_mes,direccion_df],axis=True)
df_ventas_desglosado

Unnamed: 0,ID de Pedido,Producto,Cantidad Pedida,Precio Unitario,Fecha de Pedido,Dirección de Envio,Hora,Dia,Dia semanal,Calle,Ciudad,PO BOX,Estado,Cod Postal
0,141234,iPhone,1,700,2019-01-22 21:25:00,"944 Walnut St, Boston, MA 02215",21,22,1,944 Walnut St,Boston,MA 02215,MA,02215
1,141235,Lightning Charging Cable,1,14,2019-01-28 14:15:00,"185 Maple St, Portland, OR 97035",14,28,0,185 Maple St,Portland,OR 97035,OR,97035
2,141236,Wired Headphones,2,11,2019-01-17 13:33:00,"538 Adams St, San Francisco, CA 94016",13,17,3,538 Adams St,San Francisco,CA 94016,CA,94016
3,141237,27in FHD Monitor,1,149,2019-01-05 20:33:00,"738 10th St, Los Angeles, CA 90001",20,5,5,738 10th St,Los Angeles,CA 90001,CA,90001
4,141238,Wired Headphones,1,11,2019-01-25 11:59:00,"387 10th St, Austin, TX 73301",11,25,4,387 10th St,Austin,TX 73301,TX,73301
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
9666,150497,20in Monitor,1,109,2019-01-26 19:09:00,"95 8th St, Dallas, TX 75001",19,26,5,95 8th St,Dallas,TX 75001,TX,75001
9667,150498,27in FHD Monitor,1,149,2019-01-10 22:58:00,"403 7th St, San Francisco, CA 94016",22,10,3,403 7th St,San Francisco,CA 94016,CA,94016
9668,150499,ThinkPad Laptop,1,999,2019-01-21 14:31:00,"214 Main St, Portland, OR 97035",14,21,0,214 Main St,Portland,OR 97035,OR,97035
9669,150500,AAA Batteries (4-pack),2,2,2019-01-15 14:21:00,"810 2nd St, Los Angeles, CA 90001",14,15,1,810 2nd St,Los Angeles,CA 90001,CA,90001


In [18]:
df_ventas_desglosado.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 9671 entries, 0 to 9670
Data columns (total 14 columns):
 #   Column              Non-Null Count  Dtype         
---  ------              --------------  -----         
 0   ID de Pedido        9671 non-null   object        
 1   Producto            9671 non-null   object        
 2   Cantidad Pedida     9671 non-null   int32         
 3   Precio Unitario     9671 non-null   int32         
 4   Fecha de Pedido     9671 non-null   datetime64[ns]
 5   Dirección de Envio  9671 non-null   object        
 6   Hora                9671 non-null   int32         
 7   Dia                 9671 non-null   int32         
 8   Dia semanal         9671 non-null   int32         
 9   Calle               9671 non-null   object        
 10  Ciudad              9671 non-null   object        
 11  PO BOX              9671 non-null   object        
 12  Estado              9671 non-null   object        
 13  Cod Postal          9671 non-null   object      

## Nueva Funcion extraer_datos


In [19]:
def extraer_datos(datos):
  datos['Fecha de Pedido'] = pd.to_datetime(datos['Fecha de Pedido'])
  datos['Hora'] = datos['Fecha de Pedido'].dt.hour
  datos['Dia'] = datos['Fecha de Pedido'].dt.day
  datos['Dia semanal'] = datos['Fecha de Pedido'].dt.weekday
  
  # Separo la direccion de envio en calle ciudad y PO BOX
  direccion_df = datos['Dirección de Envio'].str.split(', ',expand=True)
  direccion_df.columns = ['Calle','Ciudad','PO BOX']
  # Separo el PO BOX en Estado y Cod Postal
  direccion_df[['Estado', 'Cod Postal']] = direccion_df['PO BOX'].str.split(' ',expand=True)
  df_ventas_desglosado = pd.concat([datos,direccion_df],axis=True)
    
  return df_ventas_desglosado

In [20]:
dataframe_mes = dataframes_meses['Marzo']
dataframe_mes

Unnamed: 0,ID de Pedido,Producto,Cantidad Pedida,Precio Unitario,Fecha de Pedido,Dirección de Envio
0,162009,iPhone,1,700,03/28/19 20:59,"942 Church St, Austin, TX 73301"
1,162009,Lightning Charging Cable,1,14,03/28/19 20:59,"942 Church St, Austin, TX 73301"
2,162009,Wired Headphones,2,11,03/28/19 20:59,"942 Church St, Austin, TX 73301"
3,162010,Bose SoundSport Headphones,1,99,03/17/19 05:39,"261 10th St, San Francisco, CA 94016"
4,162011,34in Ultrawide Monitor,1,379,03/10/19 00:01,"764 13th St, San Francisco, CA 94016"
...,...,...,...,...,...,...
15124,176554,Lightning Charging Cable,1,14,03/24/19 11:14,"672 12th St, San Francisco, CA 94016"
15125,176555,27in FHD Monitor,1,149,03/22/19 20:27,"42 4th St, San Francisco, CA 94016"
15126,176556,AAA Batteries (4-pack),3,2,03/14/19 10:29,"871 7th St, Los Angeles, CA 90001"
15127,176557,iPhone,1,700,03/30/19 12:32,"83 Washington St, San Francisco, CA 94016"


In [21]:
dataframe_mes = extraer_datos(dataframe_mes)
dataframe_mes

  datos['Fecha de Pedido'] = pd.to_datetime(datos['Fecha de Pedido'])


Unnamed: 0,ID de Pedido,Producto,Cantidad Pedida,Precio Unitario,Fecha de Pedido,Dirección de Envio,Hora,Dia,Dia semanal,Calle,Ciudad,PO BOX,Estado,Cod Postal
0,162009,iPhone,1,700,2019-03-28 20:59:00,"942 Church St, Austin, TX 73301",20,28,3,942 Church St,Austin,TX 73301,TX,73301
1,162009,Lightning Charging Cable,1,14,2019-03-28 20:59:00,"942 Church St, Austin, TX 73301",20,28,3,942 Church St,Austin,TX 73301,TX,73301
2,162009,Wired Headphones,2,11,2019-03-28 20:59:00,"942 Church St, Austin, TX 73301",20,28,3,942 Church St,Austin,TX 73301,TX,73301
3,162010,Bose SoundSport Headphones,1,99,2019-03-17 05:39:00,"261 10th St, San Francisco, CA 94016",5,17,6,261 10th St,San Francisco,CA 94016,CA,94016
4,162011,34in Ultrawide Monitor,1,379,2019-03-10 00:01:00,"764 13th St, San Francisco, CA 94016",0,10,6,764 13th St,San Francisco,CA 94016,CA,94016
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
15124,176554,Lightning Charging Cable,1,14,2019-03-24 11:14:00,"672 12th St, San Francisco, CA 94016",11,24,6,672 12th St,San Francisco,CA 94016,CA,94016
15125,176555,27in FHD Monitor,1,149,2019-03-22 20:27:00,"42 4th St, San Francisco, CA 94016",20,22,4,42 4th St,San Francisco,CA 94016,CA,94016
15126,176556,AAA Batteries (4-pack),3,2,2019-03-14 10:29:00,"871 7th St, Los Angeles, CA 90001",10,14,3,871 7th St,Los Angeles,CA 90001,CA,90001
15127,176557,iPhone,1,700,2019-03-30 12:32:00,"83 Washington St, San Francisco, CA 94016",12,30,5,83 Washington St,San Francisco,CA 94016,CA,94016


In [22]:
dataframe_mes.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 15129 entries, 0 to 15128
Data columns (total 14 columns):
 #   Column              Non-Null Count  Dtype         
---  ------              --------------  -----         
 0   ID de Pedido        15129 non-null  object        
 1   Producto            15129 non-null  object        
 2   Cantidad Pedida     15129 non-null  int32         
 3   Precio Unitario     15129 non-null  int32         
 4   Fecha de Pedido     15129 non-null  datetime64[ns]
 5   Dirección de Envio  15129 non-null  object        
 6   Hora                15129 non-null  int32         
 7   Dia                 15129 non-null  int32         
 8   Dia semanal         15129 non-null  int32         
 9   Calle               15129 non-null  object        
 10  Ciudad              15129 non-null  object        
 11  PO BOX              15129 non-null  object        
 12  Estado              15129 non-null  object        
 13  Cod Postal          15129 non-null  object    

## Desglose de los dataframes del diccionario dataframes_meses 

In [23]:
for mes in meses:
    dataframe_mes = dataframes_meses[mes]
    dataframe_mes = extraer_datos(dataframe_mes)
    dataframes_meses[mes] = dataframe_mes

  datos['Fecha de Pedido'] = pd.to_datetime(datos['Fecha de Pedido'])
  datos['Fecha de Pedido'] = pd.to_datetime(datos['Fecha de Pedido'])
  datos['Fecha de Pedido'] = pd.to_datetime(datos['Fecha de Pedido'])
  datos['Fecha de Pedido'] = pd.to_datetime(datos['Fecha de Pedido'])
  datos['Fecha de Pedido'] = pd.to_datetime(datos['Fecha de Pedido'])
  datos['Fecha de Pedido'] = pd.to_datetime(datos['Fecha de Pedido'])
  datos['Fecha de Pedido'] = pd.to_datetime(datos['Fecha de Pedido'])
  datos['Fecha de Pedido'] = pd.to_datetime(datos['Fecha de Pedido'])
  datos['Fecha de Pedido'] = pd.to_datetime(datos['Fecha de Pedido'])
  datos['Fecha de Pedido'] = pd.to_datetime(datos['Fecha de Pedido'])


In [24]:
dataframes_meses['Julio']

Unnamed: 0,ID de Pedido,Producto,Cantidad Pedida,Precio Unitario,Fecha de Pedido,Dirección de Envio,Hora,Dia,Dia semanal,Calle,Ciudad,PO BOX,Estado,Cod Postal
0,222910,Apple Airpods Headphones,1,150,2019-07-26 16:51:00,"389 South St, Atlanta, GA 30301",16,26,4,389 South St,Atlanta,GA 30301,GA,30301
1,222911,Flatscreen TV,1,300,2019-07-05 08:55:00,"590 4th St, Seattle, WA 98101",8,5,4,590 4th St,Seattle,WA 98101,WA,98101
2,222912,AA Batteries (4-pack),1,3,2019-07-29 12:41:00,"861 Hill St, Atlanta, GA 30301",12,29,0,861 Hill St,Atlanta,GA 30301,GA,30301
3,222913,AA Batteries (4-pack),1,3,2019-07-28 10:15:00,"190 Ridge St, Atlanta, GA 30301",10,28,6,190 Ridge St,Atlanta,GA 30301,GA,30301
4,222914,AAA Batteries (4-pack),5,2,2019-07-31 02:13:00,"824 Forest St, Seattle, WA 98101",2,31,2,824 Forest St,Seattle,WA 98101,WA,98101
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
14268,236665,Wired Headphones,1,11,2019-07-20 16:16:00,"694 Meadow St, Atlanta, GA 30301",16,20,5,694 Meadow St,Atlanta,GA 30301,GA,30301
14269,236666,20in Monitor,1,109,2019-07-31 20:11:00,"866 14th St, San Francisco, CA 94016",20,31,2,866 14th St,San Francisco,CA 94016,CA,94016
14270,236667,AAA Batteries (4-pack),1,2,2019-07-17 22:29:00,"249 Cherry St, Dallas, TX 75001",22,17,2,249 Cherry St,Dallas,TX 75001,TX,75001
14271,236668,Wired Headphones,1,11,2019-07-30 19:28:00,"727 Wilson St, Austin, TX 73301",19,30,1,727 Wilson St,Austin,TX 73301,TX,73301


# Respuestas del análisis

## 1. Comportamiento de las ventas en los distintos meses:

In [25]:
dataframes_meses['Julio'].head()

Unnamed: 0,ID de Pedido,Producto,Cantidad Pedida,Precio Unitario,Fecha de Pedido,Dirección de Envio,Hora,Dia,Dia semanal,Calle,Ciudad,PO BOX,Estado,Cod Postal
0,222910,Apple Airpods Headphones,1,150,2019-07-26 16:51:00,"389 South St, Atlanta, GA 30301",16,26,4,389 South St,Atlanta,GA 30301,GA,30301
1,222911,Flatscreen TV,1,300,2019-07-05 08:55:00,"590 4th St, Seattle, WA 98101",8,5,4,590 4th St,Seattle,WA 98101,WA,98101
2,222912,AA Batteries (4-pack),1,3,2019-07-29 12:41:00,"861 Hill St, Atlanta, GA 30301",12,29,0,861 Hill St,Atlanta,GA 30301,GA,30301
3,222913,AA Batteries (4-pack),1,3,2019-07-28 10:15:00,"190 Ridge St, Atlanta, GA 30301",10,28,6,190 Ridge St,Atlanta,GA 30301,GA,30301
4,222914,AAA Batteries (4-pack),5,2,2019-07-31 02:13:00,"824 Forest St, Seattle, WA 98101",2,31,2,824 Forest St,Seattle,WA 98101,WA,98101


### ● ¿Cómo variaron las ventas a lo largo de los diferentes meses?

In [26]:
# Se crea una lista para almacenar los totales de ventas por mes, ingreso total por mes y los nombres de los meses
totales_ventas_mes = []
ingreso_totales_mes = []
nombres_meses = []


# Se recorre el diccionario de dataframes de ventas por mes
for mes in meses:
    # Se obtiene el dataframe de ventas del mes
    dataframe_mes = dataframes_meses[mes]
    
    # Se obtiene el total de ventas del mes
    total_ventas_mes = dataframe_mes['Cantidad Pedida'].sum()
    # Se agrega el total de ventas del mes a la lista de totales
    totales_ventas_mes.append(total_ventas_mes)
    
    # Se obtiene el ingreso de cada registro del mes
    dataframe_mes['Ingreso'] = dataframe_mes['Cantidad Pedida'] * dataframe_mes['Precio Unitario']
    # Se obtiene el ingreso total del mes
    ingreso_total_mes = dataframe_mes['Ingreso'].sum()
    # Se agrega el ingreso total del mes a la lista de ingresos
    ingreso_totales_mes.append(ingreso_total_mes)
    
    # Se agrega el nombre del mes a la lista de nombres
    nombres_meses.append(mes)
 


In [27]:

# Se crea el objeto de grafico de barras
fig = go.Figure(data=go.Bar(
    x=nombres_meses,
    y=totales_ventas_mes,
    marker=dict(color=totales_ventas_mes, colorscale='Cividis',colorbar=dict(title='Total de Ventas', x=1.0, thickness=15)),
    text=totales_ventas_mes,
    textposition='auto',
    ))
 

In [28]:
# Se configura los ejes y los titulos
fig.update_layout(
    title='Total de Ventas por Mes',
    xaxis=dict(title='Mes'),
    yaxis=dict(title='Total de Ventas'),
)

In [29]:
fig.show()

### ● ¿Hubo algún mes que se destacó en términos de ventas?

In [30]:
print('El mes que se destacó por tener mayor ventas fue', nombres_meses[totales_ventas_mes.index(max(totales_ventas_mes))], ', con un total de ventas de', max(totales_ventas_mes), '.')	

El mes que se destacó por tener mayor ventas fue Diciembre , con un total de ventas de 28081 .


### ● ¿Cuál es el ingreso total generado por mes?

In [31]:
   
# Se crea el objeto de grafico de barras
fig = go.Figure(data=go.Bar(
    x=nombres_meses,
    y=ingreso_totales_mes,
    marker=dict(color=ingreso_totales_mes, colorscale='Inferno',colorbar=dict(title='Total de Ingresos', x=1.0, thickness=15)),
    text=ingreso_totales_mes,
    textposition='auto',
    ))
 

In [32]:
# Se configura los ejes y los titulos
fig.update_layout(
    title='Total de Ingresos por Mes',
    xaxis=dict(title='Mes'),
    yaxis=dict(title='Total de Ingresos'),
)

## 2. Optimización de la publicidad y patrón de ventas por hora:

In [33]:
dataframes_meses['Junio'].head(15)

Unnamed: 0,ID de Pedido,Producto,Cantidad Pedida,Precio Unitario,Fecha de Pedido,Dirección de Envio,Hora,Dia,Dia semanal,Calle,Ciudad,PO BOX,Estado,Cod Postal,Ingreso
0,209921,USB-C Charging Cable,1,11,2019-06-23 19:34:00,"950 Walnut St, Portland, ME 04101",19,23,6,950 Walnut St,Portland,ME 04101,ME,4101,11
1,209922,Macbook Pro Laptop,1,1700,2019-06-30 10:05:00,"80 4th St, San Francisco, CA 94016",10,30,6,80 4th St,San Francisco,CA 94016,CA,94016,1700
2,209923,ThinkPad Laptop,1,999,2019-06-24 20:18:00,"402 Jackson St, Los Angeles, CA 90001",20,24,0,402 Jackson St,Los Angeles,CA 90001,CA,90001,999
3,209924,27in FHD Monitor,1,149,2019-06-05 10:21:00,"560 10th St, Seattle, WA 98101",10,5,2,560 10th St,Seattle,WA 98101,WA,98101,149
4,209925,Bose SoundSport Headphones,1,99,2019-06-25 18:58:00,"545 2nd St, San Francisco, CA 94016",18,25,1,545 2nd St,San Francisco,CA 94016,CA,94016,99
5,209926,Apple Airpods Headphones,1,150,2019-06-28 20:04:00,"386 Lake St, Seattle, WA 98101",20,28,4,386 Lake St,Seattle,WA 98101,WA,98101,150
6,209927,Lightning Charging Cable,1,14,2019-06-28 00:07:00,"29 Lincoln St, Los Angeles, CA 90001",0,28,4,29 Lincoln St,Los Angeles,CA 90001,CA,90001,14
7,209928,Apple Airpods Headphones,1,150,2019-06-16 21:30:00,"350 9th St, New York City, NY 10001",21,16,6,350 9th St,New York City,NY 10001,NY,10001,150
8,209929,Wired Headphones,1,11,2019-06-28 10:56:00,"612 Meadow St, Portland, OR 97035",10,28,4,612 Meadow St,Portland,OR 97035,OR,97035,11
9,209930,27in FHD Monitor,1,149,2019-06-02 11:22:00,"625 Ridge St, Los Angeles, CA 90001",11,2,6,625 Ridge St,Los Angeles,CA 90001,CA,90001,149


In [34]:
horas

[0,
 1,
 2,
 3,
 4,
 5,
 6,
 7,
 8,
 9,
 10,
 11,
 12,
 13,
 14,
 15,
 16,
 17,
 18,
 19,
 20,
 21,
 22,
 23]

In [35]:
# Se calcula el total de ventas por hora del mes de Junio
ventas_por_hora =  dataframes_meses['Junio'].groupby('Hora')['Cantidad Pedida'].count()
ventas_por_hora

Hora
0     300
1     166
2      80
3      66
4      64
5      79
6     164
7     278
8     474
9     658
10    799
11    925
12    889
13    878
14    787
15    771
16    736
17    805
18    918
19    883
20    899
21    813
22    655
23    450
Name: Cantidad Pedida, dtype: int64

In [36]:
ventas_por_hora.info()


<class 'pandas.core.series.Series'>
Index: 24 entries, 0 to 23
Series name: Cantidad Pedida
Non-Null Count  Dtype
--------------  -----
24 non-null     int64
dtypes: int64(1)
memory usage: 288.0 bytes


### ● ¿Cuál es el momento ideal del día para presentar la publicidad y aumentar la probabilidad de compra?

In [37]:
# Se crea una lista para almacenar el total de ventas por hora por mes y el total anual de ventas por hora 
total_ventas_hora_mes = []
total_ventas_anual_hora = []


# Se recorre el diccionario de dataframes de ventas por mes
for mes in meses:
    # Se obtiene el dataframe de ventas del mes
    dataframe_mes = dataframes_meses[mes]
    
    # Se obtiene el total de ventas por hora del mes
    total_ventas_hora_mes = dataframe_mes.groupby('Hora')['Cantidad Pedida'].count()
         
    # Se agrega el total de ventas por hora al anual 
    total_ventas_anual_hora.append(total_ventas_hora_mes)
 

In [38]:
total_ventas_anual_hora

[Hora
 0     209
 1     113
 2      77
 3      33
 4      45
 5      73
 6     137
 7     179
 8     324
 9     492
 10    598
 11    653
 12    669
 13    607
 14    542
 15    545
 16    553
 17    507
 18    635
 19    657
 20    620
 21    575
 22    455
 23    373
 Name: Cantidad Pedida, dtype: int64,
 Hora
 0     250
 1     159
 2      87
 3      60
 4      49
 5      83
 6     165
 7     242
 8     410
 9     587
 10    731
 11    754
 12    770
 13    782
 14    679
 15    658
 16    695
 17    738
 18    804
 19    802
 20    764
 21    744
 22    585
 23    370
 Name: Cantidad Pedida, dtype: int64,
 Hora
 0      296
 1      184
 2      111
 3       68
 4       58
 5      107
 6      209
 7      324
 8      495
 9      690
 10     860
 11    1063
 12    1007
 13    1040
 14     886
 15     819
 16     857
 17     850
 18    1022
 19    1098
 20     988
 21     868
 22     725
 23     504
 Name: Cantidad Pedida, dtype: int64,
 Hora
 0      377
 1      243
 2      132
 3       8

In [39]:
# Se pasa el arreglo de totales de ventas por hora a un dataframe
df_total_ventas_anual_hora= pd.concat(total_ventas_anual_hora, axis=1)
# Se asigna el nombre de las columnas
df_total_ventas_anual_hora.columns = meses
# Se calcula y se agrega la columna del promedio de ventas por hora pasado entero
df_total_ventas_anual_hora['promedio'] = df_total_ventas_anual_hora.mean(axis=1).round().astype(int)
df_total_ventas_anual_hora

Unnamed: 0_level_0,Enero,Febrero,Marzo,Abril,Mayo,Junio,Julio,Agosto,Septiembre,Octubre,Noviembre,Diciembre,promedio
Hora,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1,Unnamed: 12_level_1,Unnamed: 13_level_1
0,209,250,296,377,347,300,319,245,260,431,374,494,325
1,113,159,184,243,202,166,167,138,164,268,223,320,196
2,77,87,111,132,112,80,81,85,78,137,107,155,104
3,33,60,68,85,63,66,62,53,55,88,83,114,69
4,45,49,58,84,75,64,66,55,39,110,76,131,71
5,73,83,107,143,104,79,108,97,89,138,108,191,110
6,137,165,209,254,198,164,170,175,144,289,244,332,207
7,179,242,324,384,351,278,329,292,217,448,375,583,334
8,324,410,495,642,600,474,503,410,375,653,534,832,521
9,492,587,690,869,810,658,685,523,563,944,794,1125,728


In [40]:
# Se crea el objeto de grafico para representar el promedio de ventas por hora anual
fig = go.Figure()

# Se agrega a la figura un grafico de linea con las horas y el promedio de ventas por hora
fig.add_trace(go.Scatter(
    x=horas,
    y=df_total_ventas_anual_hora['promedio'],
    name='Promedio de Ventas por Hora',
    line=dict(color='firebrick', width=4, dash='dot')
    )
)          

# Se configura los ejes y los titulos
fig.update_layout(
    title='Promedio de Ventas Anual por Hora',
    xaxis=dict(title='Hora', tickvals=horas),
    yaxis=dict(title='Promedio de Ventas', side='left')
)    



In [41]:
#Se calcula el valor maximo del promedio de ventas por hora y la hora en la que se produjo
print('El valor maximo del promedio de ventas por hora es', df_total_ventas_anual_hora['promedio'].max(), 'y se produjo a las', df_total_ventas_anual_hora['promedio'].idxmax(), 'horas.')  


El valor maximo del promedio de ventas por hora es 1074 y se produjo a las 19 horas.


In [42]:
# se determina las horas con mayor promedio de ventas, que supere las 1000 ventas
df_total_ventas_anual_hora.loc[df_total_ventas_anual_hora['promedio'] > 1000].index

Index([11, 12, 13, 18, 19, 20], dtype='int32', name='Hora')

In [43]:
print('Los momentos ideales del día para fomentar publicidad, y así, aumentar la probabilidad de ventas, serían desde las 11 hasta las 13 horas y desde las 18 hasta las 20 horas. ')
   

Los momentos ideales del día para fomentar publicidad, y así, aumentar la probabilidad de ventas, serían desde las 11 hasta las 13 horas y desde las 18 hasta las 20 horas. 


### ● ¿Cómo cambian los patrones de ventas por hora a lo largo del año?

In [44]:
total_ventas_anual_hora

[Hora
 0     209
 1     113
 2      77
 3      33
 4      45
 5      73
 6     137
 7     179
 8     324
 9     492
 10    598
 11    653
 12    669
 13    607
 14    542
 15    545
 16    553
 17    507
 18    635
 19    657
 20    620
 21    575
 22    455
 23    373
 Name: Cantidad Pedida, dtype: int64,
 Hora
 0     250
 1     159
 2      87
 3      60
 4      49
 5      83
 6     165
 7     242
 8     410
 9     587
 10    731
 11    754
 12    770
 13    782
 14    679
 15    658
 16    695
 17    738
 18    804
 19    802
 20    764
 21    744
 22    585
 23    370
 Name: Cantidad Pedida, dtype: int64,
 Hora
 0      296
 1      184
 2      111
 3       68
 4       58
 5      107
 6      209
 7      324
 8      495
 9      690
 10     860
 11    1063
 12    1007
 13    1040
 14     886
 15     819
 16     857
 17     850
 18    1022
 19    1098
 20     988
 21     868
 22     725
 23     504
 Name: Cantidad Pedida, dtype: int64,
 Hora
 0      377
 1      243
 2      132
 3       8

In [45]:

data=total_ventas_anual_hora
fig = px.imshow(data,
                labels=dict(x="Horas del día", y="Meses", color="Ventas"),
                x=horas,
                y=meses
               )

#fig.update_xaxes(side="top")
fig.update_layout(
    title='Total de Ventas por Hora',
    xaxis=dict(title='Hora', tickvals=horas, ticktext=horas),
    yaxis=dict(title='Mes',side="left")
)
fig.show()

In [46]:
print('Los patrones de ventas por hora son muy similares en todos los meses, con un pico de ventas entre las 11 y las 13 horas y otro entre las 18 y las 20 horas. ')

Los patrones de ventas por hora son muy similares en todos los meses, con un pico de ventas entre las 11 y las 13 horas y otro entre las 18 y las 20 horas. 


### ● ¿Hay modificaciones en los patrones de ventas durante las horas de mayor actividad en los distintos meses?

In [47]:
print('Se puede observar que el mes de Diciembre es el que tiene mayor cantidad de ventas en esas horas mencionadas, seguido por los meses de Octubre y Abril. ')

Se puede observar que el mes de Diciembre es el que tiene mayor cantidad de ventas en esas horas mencionadas, seguido por los meses de Octubre y Abril. 


In [48]:
print('Por otro lado, el mes de Enero y Febrero son los de menor cantidad de ventas en esas horas mencionadas, seguido por los meses de Agosto y Septiembre. ')

Por otro lado, el mes de Enero y Febrero son los de menor cantidad de ventas en esas horas mencionadas, seguido por los meses de Agosto y Septiembre. 


## 3. Distribución de ventas por ubicación:

In [49]:
# Se analiza el mes de Octubre
dataframes_meses['Octubre'].head(15)

Unnamed: 0,ID de Pedido,Producto,Cantidad Pedida,Precio Unitario,Fecha de Pedido,Dirección de Envio,Hora,Dia,Dia semanal,Calle,Ciudad,PO BOX,Estado,Cod Postal,Ingreso
0,259358,34in Ultrawide Monitor,1,379,2019-10-28 10:56:00,"609 Cherry St, Dallas, TX 75001",10,28,0,609 Cherry St,Dallas,TX 75001,TX,75001,379
1,259359,27in 4K Gaming Monitor,1,389,2019-10-28 17:26:00,"225 5th St, Los Angeles, CA 90001",17,28,0,225 5th St,Los Angeles,CA 90001,CA,90001,389
2,259360,AAA Batteries (4-pack),2,2,2019-10-24 17:20:00,"967 12th St, New York City, NY 10001",17,24,3,967 12th St,New York City,NY 10001,NY,10001,4
3,259361,27in FHD Monitor,1,149,2019-10-14 22:26:00,"628 Jefferson St, New York City, NY 10001",22,14,0,628 Jefferson St,New York City,NY 10001,NY,10001,149
4,259362,Wired Headphones,1,11,2019-10-07 16:10:00,"534 14th St, Los Angeles, CA 90001",16,7,0,534 14th St,Los Angeles,CA 90001,CA,90001,11
5,259363,AAA Batteries (4-pack),1,2,2019-10-01 18:55:00,"976 Lake St, New York City, NY 10001",18,1,1,976 Lake St,New York City,NY 10001,NY,10001,2
6,259364,Wired Headphones,1,11,2019-10-29 11:02:00,"874 North St, Los Angeles, CA 90001",11,29,1,874 North St,Los Angeles,CA 90001,CA,90001,11
7,259365,Lightning Charging Cable,1,14,2019-10-29 11:19:00,"127 12th St, Los Angeles, CA 90001",11,29,1,127 12th St,Los Angeles,CA 90001,CA,90001,14
8,259366,Apple Airpods Headphones,1,150,2019-10-20 11:52:00,"955 9th St, Los Angeles, CA 90001",11,20,6,955 9th St,Los Angeles,CA 90001,CA,90001,150
9,259367,Apple Airpods Headphones,1,150,2019-10-16 16:19:00,"742 14th St, San Francisco, CA 94016",16,16,2,742 14th St,San Francisco,CA 94016,CA,94016,150


In [50]:
# Se agrupa por ciudad y se calcula el total de ventas por ciudad
total_ventas_ciudad =  dataframes_meses['Octubre'].groupby('Ciudad')['Cantidad Pedida'].count()

#se ordena de mayor a menor
total_ventas_ciudad.sort_values(ascending=False)


Ciudad
San Francisco    4755
Los Angeles      3290
New York City    2647
Boston           2173
Seattle          1677
Dallas           1635
Atlanta          1602
Portland         1384
Austin           1088
Name: Cantidad Pedida, dtype: int64

In [51]:
#Se guardan las 3 ciudades con mayor cantidad de ventas
top_ciudad_ventas = total_ventas_ciudad.sort_values(ascending=False).head(3)
top_ciudad_ventas


Ciudad
San Francisco    4755
Los Angeles      3290
New York City    2647
Name: Cantidad Pedida, dtype: int64

### ● ¿En qué ciudades se han registrado las mayores ventas?


In [52]:
# Se crea una lista para almacenar el total de ventas por ciudad por mes y el total anual de ventas por ciudad
total_ventas_ciudad_mes = []
total_ventas_anual_ciudad = []


# Se recorre el diccionario de dataframes de ventas por mes
for mes in meses:
    # Se obtiene el dataframe de ventas del mes
    dataframe_mes = dataframes_meses[mes]
    
    # Se obtiene el total de ventas por ciudad del mes
    total_ventas_ciudad_mes = dataframe_mes.groupby('Ciudad')['Cantidad Pedida'].count()
    
    # Se agrega el total de ventas por ciudad al anual
    total_ventas_anual_ciudad.append(total_ventas_ciudad_mes)
    

In [53]:
total_ventas_anual_ciudad

[Ciudad
 Atlanta           786
 Austin            527
 Boston           1045
 Dallas            784
 Los Angeles      1528
 New York City    1300
 Portland          623
 San Francisco    2352
 Seattle           726
 Name: Cantidad Pedida, dtype: int64,
 Ciudad
 Atlanta           935
 Austin            622
 Boston           1251
 Dallas            980
 Los Angeles      1899
 New York City    1611
 Portland          835
 San Francisco    2908
 Seattle           927
 Name: Cantidad Pedida, dtype: int64,
 Ciudad
 Atlanta          1244
 Austin            838
 Boston           1648
 Dallas           1201
 Los Angeles      2452
 New York City    1978
 Portland          981
 San Francisco    3591
 Seattle          1196
 Name: Cantidad Pedida, dtype: int64,
 Ciudad
 Atlanta          1470
 Austin            973
 Boston           1915
 Dallas           1348
 Los Angeles      3021
 New York City    2429
 Portland         1237
 San Francisco    4434
 Seattle          1440
 Name: Cantidad Pedida, dt

In [54]:
# Se pasa el arreglo de totales de ventas por ciudad a un dataframe
df_total_ventas_anual_ciudad= pd.concat(total_ventas_anual_ciudad, axis=1)

# Se asigna el nombre de las columnas
df_total_ventas_anual_ciudad.columns = meses

# Se calcula y se agrega la columna de la suma anual de ventas por ciudad 
df_total_ventas_anual_ciudad['total ventas'] = df_total_ventas_anual_ciudad.sum(axis=1)

df_total_ventas_anual_ciudad

Unnamed: 0_level_0,Enero,Febrero,Marzo,Abril,Mayo,Junio,Julio,Agosto,Septiembre,Octubre,Noviembre,Diciembre,total ventas
Ciudad,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1,Unnamed: 12_level_1,Unnamed: 13_level_1
Atlanta,786,935,1244,1470,1330,1103,1144,941,914,1602,1408,1986,14863
Austin,527,622,838,973,839,715,762,648,665,1088,866,1347,9890
Boston,1045,1251,1648,1915,1799,1386,1550,1244,1280,2173,1915,2695,19901
Dallas,784,980,1201,1348,1416,1065,1098,967,933,1635,1366,2004,14797
Los Angeles,1528,1899,2452,3021,2566,2199,2230,1863,1884,3290,2745,3887,29564
New York City,1300,1611,1978,2429,2266,1773,1928,1623,1534,2647,2353,3405,24847
Portland,623,835,981,1237,1166,939,919,820,738,1384,1162,1645,12449
San Francisco,2352,2908,3591,4434,3919,3302,3524,2828,2726,4755,4317,6006,44662
Seattle,726,927,1196,1440,1239,1055,1118,1005,937,1677,1419,1974,14713


In [55]:
# Se extra las ciudades de dataframe de ventas anual por ciudad
ciudades = df_total_ventas_anual_ciudad.index
ciudades

Index(['Atlanta', 'Austin', 'Boston', 'Dallas', 'Los Angeles', 'New York City',
       'Portland', 'San Francisco', 'Seattle'],
      dtype='object', name='Ciudad')

In [56]:
# Se extrae los totales de ventas anual por ciudad
totales_ventas_anual_ciudad = df_total_ventas_anual_ciudad['total ventas']
totales_ventas_anual_ciudad

Ciudad
Atlanta          14863
Austin            9890
Boston           19901
Dallas           14797
Los Angeles      29564
New York City    24847
Portland         12449
San Francisco    44662
Seattle          14713
Name: total ventas, dtype: int64

In [57]:
# Se crea el objeto de grafico para representar el total de ventas anual por ciudad
fig = go.Figure()

# Se agrega a la figura un grafico de linea con las ciudades y el total de ventas por ciudad
fig.add_trace(go.Bar(
    x = ciudades,
    y = totales_ventas_anual_ciudad,
    name='Total de Ventas por Ciudad Anual',
    marker=dict(color=totales_ventas_anual_ciudad, colorscale='Reds',colorbar=dict(title='Total de Ventas', x=1.0, thickness=15)),
    text=totales_ventas_anual_ciudad,
    textposition='auto',
    )
)


In [58]:
fig.update_layout(
    title='Total de Ventas Anual por Ciudad',
    xaxis=dict(title='Ciudad'),
    yaxis=dict(title='Total de Ventas')
)

In [59]:
#Se guardan las 3 ciudades con mayor cantidad de ventas
top_ciudad_ventas_anual = totales_ventas_anual_ciudad.sort_values(ascending=False).head(3)
top_ciudad_ventas_anual

Ciudad
San Francisco    44662
Los Angeles      29564
New York City    24847
Name: total ventas, dtype: int64

In [60]:
print('Las ciudades con mayores ventas anuales son: ')
for i in range(3):
    print(top_ciudad_ventas_anual.index[i], 'con', top_ciudad_ventas_anual.iloc[i], 'ventas.')


Las ciudades con mayores ventas anuales son: 
San Francisco con 44662 ventas.
Los Angeles con 29564 ventas.
New York City con 24847 ventas.


### ● ¿Cómo se comparan las ventas en diferentes estados o regiones?


In [61]:
# Se crea una lista para almacenar el total de ventas por estado por mes y el total anual de ventas por estado
total_ventas_estado_mes = []
total_ventas_anual_estado = []


# Se recorre el diccionario de dataframes de ventas por mes
for mes in meses:
    # Se obtiene el dataframe de ventas del mes
    dataframe_mes = dataframes_meses[mes]
    
    # Se obtiene el total de ventas por estado del mes
    total_ventas_estado_mes = dataframe_mes.groupby('Estado')['Cantidad Pedida'].count()
    
    # Se agrega el total de ventas por estado al anual
    total_ventas_anual_estado.append(total_ventas_estado_mes)
    

In [62]:
total_ventas_anual_estado

[Estado
 CA    3880
 GA     786
 MA    1045
 ME     123
 NY    1300
 OR     500
 TX    1311
 WA     726
 Name: Cantidad Pedida, dtype: int64,
 Estado
 CA    4807
 GA     935
 MA    1251
 ME     177
 NY    1611
 OR     658
 TX    1602
 WA     927
 Name: Cantidad Pedida, dtype: int64,
 Estado
 CA    6043
 GA    1244
 MA    1648
 ME     187
 NY    1978
 OR     794
 TX    2039
 WA    1196
 Name: Cantidad Pedida, dtype: int64,
 Estado
 CA    7455
 GA    1470
 MA    1915
 ME     243
 NY    2429
 OR     994
 TX    2321
 WA    1440
 Name: Cantidad Pedida, dtype: int64,
 Estado
 CA    6485
 GA    1330
 MA    1799
 ME     222
 NY    2266
 OR     944
 TX    2255
 WA    1239
 Name: Cantidad Pedida, dtype: int64,
 Estado
 CA    5501
 GA    1103
 MA    1386
 ME     195
 NY    1773
 OR     744
 TX    1780
 WA    1055
 Name: Cantidad Pedida, dtype: int64,
 Estado
 CA    5754
 GA    1144
 MA    1550
 ME     199
 NY    1928
 OR     720
 TX    1860
 WA    1118
 Name: Cantidad Pedida, dtype: int64,
 Estad

In [63]:
# Se pasa el arreglo de totales de ventas por estado a un dataframe
df_total_ventas_anual_estado= pd.concat(total_ventas_anual_estado, axis=1)

# Se asigna el nombre de las columnas
df_total_ventas_anual_estado.columns = meses

# Se calcula y se agrega la columna de la suma anual de ventas por estado 
df_total_ventas_anual_estado['total ventas'] = df_total_ventas_anual_estado.sum(axis=1)

df_total_ventas_anual_estado

Unnamed: 0_level_0,Enero,Febrero,Marzo,Abril,Mayo,Junio,Julio,Agosto,Septiembre,Octubre,Noviembre,Diciembre,total ventas
Estado,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1,Unnamed: 12_level_1,Unnamed: 13_level_1
CA,3880,4807,6043,7455,6485,5501,5754,4691,4610,8045,7062,9893,74226
GA,786,935,1244,1470,1330,1103,1144,941,914,1602,1408,1986,14863
MA,1045,1251,1648,1915,1799,1386,1550,1244,1280,2173,1915,2695,19901
ME,123,177,187,243,222,195,199,165,145,250,230,315,2451
NY,1300,1611,1978,2429,2266,1773,1928,1623,1534,2647,2353,3405,24847
OR,500,658,794,994,944,744,720,655,593,1134,932,1330,9998
TX,1311,1602,2039,2321,2255,1780,1860,1615,1598,2723,2232,3351,24687
WA,726,927,1196,1440,1239,1055,1118,1005,937,1677,1419,1974,14713


In [64]:
# Se extra los estados def dataframe de ventas anual por estado
estados = df_total_ventas_anual_estado.index
estados

Index(['CA', 'GA', 'MA', 'ME', 'NY', 'OR', 'TX', 'WA'], dtype='object', name='Estado')

In [65]:
# Se extrae los totales de ventas anual por estado
totales_ventas_anual_estado = df_total_ventas_anual_estado['total ventas']
totales_ventas_anual_estado

Estado
CA    74226
GA    14863
MA    19901
ME     2451
NY    24847
OR     9998
TX    24687
WA    14713
Name: total ventas, dtype: int64

In [66]:
# Se crea el objeto de grafico para representar el total de ventas anual por estado
fig = go.Figure()

# Se agrega a la figura un grafico de linea con los estados y el total de ventas por esos estados
fig.add_trace(go.Bar(
    x = estados,
    y = totales_ventas_anual_estado,
    name='Total de Ventas Estatales Anual',
    marker=dict(color=totales_ventas_anual_estado, colorscale='Purples',colorbar=dict(title='Total de Ventas', x=1.0, thickness=15)),
    text=totales_ventas_anual_estado,
    textposition='auto',
    )
)

In [67]:
fig.update_layout(
    title='Total de Ventas Anual por Estado',
    xaxis=dict(title='Estado'),
    yaxis=dict(title='Total de Ventas')
)
fig.update_traces(marker_line_color = 'black',
                  marker_line_width = 1, opacity = 1)

fig.show()


In [68]:
# Se crea una figura en forma de mapa de calor para representar el total de ventas anual por estado
fig = px.choropleth(df_total_ventas_anual_estado, locations=estados, color=totales_ventas_anual_estado,
                    locationmode="USA-states", color_continuous_scale='Mint',
                    title='Total de Ventas Anual por Estado',
                    scope="usa", labels={'color':'Total de Ventas'})



fig.show()



### ● ¿Existe variación en las ventas por estado a lo largo de los meses?

In [69]:
total_ventas_anual_estado

[Estado
 CA    3880
 GA     786
 MA    1045
 ME     123
 NY    1300
 OR     500
 TX    1311
 WA     726
 Name: Cantidad Pedida, dtype: int64,
 Estado
 CA    4807
 GA     935
 MA    1251
 ME     177
 NY    1611
 OR     658
 TX    1602
 WA     927
 Name: Cantidad Pedida, dtype: int64,
 Estado
 CA    6043
 GA    1244
 MA    1648
 ME     187
 NY    1978
 OR     794
 TX    2039
 WA    1196
 Name: Cantidad Pedida, dtype: int64,
 Estado
 CA    7455
 GA    1470
 MA    1915
 ME     243
 NY    2429
 OR     994
 TX    2321
 WA    1440
 Name: Cantidad Pedida, dtype: int64,
 Estado
 CA    6485
 GA    1330
 MA    1799
 ME     222
 NY    2266
 OR     944
 TX    2255
 WA    1239
 Name: Cantidad Pedida, dtype: int64,
 Estado
 CA    5501
 GA    1103
 MA    1386
 ME     195
 NY    1773
 OR     744
 TX    1780
 WA    1055
 Name: Cantidad Pedida, dtype: int64,
 Estado
 CA    5754
 GA    1144
 MA    1550
 ME     199
 NY    1928
 OR     720
 TX    1860
 WA    1118
 Name: Cantidad Pedida, dtype: int64,
 Estad

In [70]:
lista_estados=estados.to_list()
print(lista_estados)

['CA', 'GA', 'MA', 'ME', 'NY', 'OR', 'TX', 'WA']


In [71]:
data=total_ventas_anual_estado

fig = px.imshow(data,
                labels=dict(x="Estado", y="Meses", color="Ventas"),
                color_continuous_scale='algae',
                x=lista_estados,
                y=meses,
)

#fig.update_xaxes(side="top")
fig.update_layout(
    title='Total de Ventas por Estados',
    xaxis=dict(title='Estados', tickvals=lista_estados, ticktext=lista_estados),
    yaxis=dict(title='Mes',side="left")
)
fig.show()

In [72]:
print('Los patrones de ventas por estado son muy similares en todos los meses, con un pico de ventas en el estado de California, seguido por el estado de New York y el estado de Texas. ')

Los patrones de ventas por estado son muy similares en todos los meses, con un pico de ventas en el estado de California, seguido por el estado de New York y el estado de Texas. 


In [73]:
print('Los meses de mayor ventas en los estados son los meses de Diciembre, Octubre y Abril. ')

Los meses de mayor ventas en los estados son los meses de Diciembre, Octubre y Abril. 


## 4. Análisis del producto más vendido:


In [74]:
# Se analiza el mes de Marzo
dataframes_meses['Marzo'].head(15)

Unnamed: 0,ID de Pedido,Producto,Cantidad Pedida,Precio Unitario,Fecha de Pedido,Dirección de Envio,Hora,Dia,Dia semanal,Calle,Ciudad,PO BOX,Estado,Cod Postal,Ingreso
0,162009,iPhone,1,700,2019-03-28 20:59:00,"942 Church St, Austin, TX 73301",20,28,3,942 Church St,Austin,TX 73301,TX,73301,700
1,162009,Lightning Charging Cable,1,14,2019-03-28 20:59:00,"942 Church St, Austin, TX 73301",20,28,3,942 Church St,Austin,TX 73301,TX,73301,14
2,162009,Wired Headphones,2,11,2019-03-28 20:59:00,"942 Church St, Austin, TX 73301",20,28,3,942 Church St,Austin,TX 73301,TX,73301,22
3,162010,Bose SoundSport Headphones,1,99,2019-03-17 05:39:00,"261 10th St, San Francisco, CA 94016",5,17,6,261 10th St,San Francisco,CA 94016,CA,94016,99
4,162011,34in Ultrawide Monitor,1,379,2019-03-10 00:01:00,"764 13th St, San Francisco, CA 94016",0,10,6,764 13th St,San Francisco,CA 94016,CA,94016,379
5,162012,AA Batteries (4-pack),1,3,2019-03-20 21:33:00,"187 Ridge St, San Francisco, CA 94016",21,20,2,187 Ridge St,San Francisco,CA 94016,CA,94016,3
6,162013,34in Ultrawide Monitor,1,379,2019-03-15 23:05:00,"904 Main St, Austin, TX 73301",23,15,4,904 Main St,Austin,TX 73301,TX,73301,379
7,162014,USB-C Charging Cable,1,11,2019-03-01 21:33:00,"10 13th St, San Francisco, CA 94016",21,1,4,10 13th St,San Francisco,CA 94016,CA,94016,11
8,162015,AA Batteries (4-pack),1,3,2019-03-02 08:52:00,"949 Jefferson St, Boston, MA 02215",8,2,5,949 Jefferson St,Boston,MA 02215,MA,2215,3
9,162016,AAA Batteries (4-pack),5,2,2019-03-19 21:10:00,"469 Highland St, Atlanta, GA 30301",21,19,1,469 Highland St,Atlanta,GA 30301,GA,30301,10


In [75]:
# Se agrupa por producto y se calcula el total de ventas por producto
total_ventas_producto =  dataframes_meses['Marzo'].groupby('Producto')['Cantidad Pedida'].sum()
total_ventas_producto


Producto
20in Monitor                   325
27in 4K Gaming Monitor         479
27in FHD Monitor               608
34in Ultrawide Monitor         523
AA Batteries (4-pack)         2213
AAA Batteries (4-pack)        2476
Apple Airpods Headphones      1316
Bose SoundSport Headphones    1194
Flatscreen TV                  361
Google Phone                   463
LG Dryer                        50
LG Washing Machine              64
Lightning Charging Cable      1871
Macbook Pro Laptop             380
ThinkPad Laptop                344
USB-C Charging Cable          1940
Vareebadd Phone                174
Wired Headphones              1661
iPhone                         538
Name: Cantidad Pedida, dtype: int32

In [76]:
# Se recupera el nombre de los productos
productos = total_ventas_producto.index.to_list()
productos

['20in Monitor',
 '27in 4K Gaming Monitor',
 '27in FHD Monitor',
 '34in Ultrawide Monitor',
 'AA Batteries (4-pack)',
 'AAA Batteries (4-pack)',
 'Apple Airpods Headphones',
 'Bose SoundSport Headphones',
 'Flatscreen TV',
 'Google Phone',
 'LG Dryer',
 'LG Washing Machine',
 'Lightning Charging Cable',
 'Macbook Pro Laptop',
 'ThinkPad Laptop',
 'USB-C Charging Cable',
 'Vareebadd Phone',
 'Wired Headphones',
 'iPhone']

In [77]:
# Se recupera el producto con mayor cantidad de ventas
producto_mas_vendido = total_ventas_producto.idxmax()
producto_mas_vendido

'AAA Batteries (4-pack)'

### ● ¿Cuál es el producto más vendido en general y en cada mes?


In [78]:
# Se crea una lista para almacenar el total de ventas por producto por mes y el total anual de ventas por productos
total_ventas_producto_mes = []
total_ventas_anual_producto = []

# Se recorre el diccionario de dataframes de ventas por mes
for mes in meses:
    # Se obtiene el dataframe de ventas del mes
    dataframe_mes = dataframes_meses[mes]
    
    # Se obtiene el total de ventas por producto del mes
    total_ventas_producto_mes = dataframe_mes.groupby('Producto')['Cantidad Pedida'].sum()
    
    # Se agrega el total de ventas por producto al anual
    total_ventas_anual_producto.append(total_ventas_producto_mes)

total_ventas_anual_producto

[Producto
 20in Monitor                   215
 27in 4K Gaming Monitor         312
 27in FHD Monitor               419
 34in Ultrawide Monitor         314
 AA Batteries (4-pack)         1424
 AAA Batteries (4-pack)        1596
 Apple Airpods Headphones       813
 Bose SoundSport Headphones     659
 Flatscreen TV                  243
 Google Phone                   317
 LG Dryer                        39
 LG Washing Machine              42
 Lightning Charging Cable      1149
 Macbook Pro Laptop             235
 ThinkPad Laptop                217
 USB-C Charging Cable          1281
 Vareebadd Phone                125
 Wired Headphones              1079
 iPhone                         379
 Name: Cantidad Pedida, dtype: int32,
 Producto
 20in Monitor                   246
 27in 4K Gaming Monitor         427
 27in FHD Monitor               475
 34in Ultrawide Monitor         417
 AA Batteries (4-pack)         1734
 AAA Batteries (4-pack)        1974
 Apple Airpods Headphones      1012
 Bose 

In [79]:
# Se pasa el arreglo de totales de ventas por producto a un dataframe
df_total_ventas_anual_producto= pd.concat(total_ventas_anual_producto, axis=1)

# Se asigna el nombre de las columnas
df_total_ventas_anual_producto.columns = meses

# Se calcula y se agrega la columna de la suma anual de ventas por producto
df_total_ventas_anual_producto['Total de ventas'] = df_total_ventas_anual_producto.sum(axis=1)

df_total_ventas_anual_producto

Unnamed: 0_level_0,Enero,Febrero,Marzo,Abril,Mayo,Junio,Julio,Agosto,Septiembre,Octubre,Noviembre,Diciembre,Total de ventas
Producto,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1,Unnamed: 12_level_1,Unnamed: 13_level_1
20in Monitor,215,246,325,394,340,321,327,262,277,427,421,571,4126
27in 4K Gaming Monitor,312,427,479,565,542,452,483,438,382,722,578,859,6239
27in FHD Monitor,419,475,608,737,688,568,603,491,480,790,717,965,7541
34in Ultrawide Monitor,314,417,523,652,544,454,462,379,377,672,550,848,6192
AA Batteries (4-pack),1424,1734,2213,2821,2382,2092,2071,1826,1772,2938,2629,3713,27615
AAA Batteries (4-pack),1596,1974,2476,2933,2927,2159,2362,2017,1926,3356,3023,4237,30986
Apple Airpods Headphones,813,1012,1316,1523,1359,1165,1221,1009,964,1672,1509,2074,15637
Bose SoundSport Headphones,659,842,1194,1286,1172,980,1057,879,830,1462,1248,1821,13430
Flatscreen TV,243,314,361,458,399,367,399,331,294,524,460,663,4813
Google Phone,317,381,463,581,480,391,410,360,342,597,491,716,5529


In [158]:
# Se crea una figura en forma de torta para representar el total de ventas anual por producto
fig = go.Figure()

fig.add_trace(go.Pie(
    labels=productos,
    values=df_total_ventas_anual_producto['Total de ventas'],
    name='Total de Ventas Anual por Producto',
    textinfo='percent',
    hole=.2,
    pull = 0.2
    )
)
fig.update_traces(
    
    hoverinfo="label+percent+name",
     marker=dict(line=dict(color='#000000', width=1))
    )


fig.update_layout(
    title='Total de Ventas Anual por Producto')
    



In [157]:
fig = px.pie(
   data_frame=df_total_ventas_anual_producto['Total de ventas'],
   values='Total de ventas',
   names=productos,
   title='Total de Ventas Anual por Producto',
   color_discrete_sequence=px.colors.sequential.Aggrnyl,
   hole=0.4,
   
   template='plotly_dark'
)
fig.update_traces(
    pull= 0.1,
    hoverinfo="label+percent+name",
     marker=dict(line=dict(color='#ffffff', width=1))
    )

fig.show()


In [159]:
print('El producto más vendido en general es', df_total_ventas_anual_producto['Total de ventas'].idxmax(), 'con un total de', df_total_ventas_anual_producto['Total de ventas'].max(), 'ventas.')

El producto más vendido en general es AAA Batteries (4-pack) con un total de 30986 ventas.


In [195]:
fig = px.bar(
    df_total_ventas_anual_producto,
    x=productos,
    y=meses,
    title='Total de Ventas Anual por Producto',
    color=productos,
    color_continuous_scale='Aggrnyl',
    labels=dict(x="Producto", y="Mes", color="Ventas",value="Ventas"),
    text='Total de ventas',
    height=1000,
    text_auto=True,
    template='plotly_dark',
    
)
fig.show()

In [None]:
fig = px.bar(
    df_total_ventas_anual_producto,
    x=meses,
    y=productos,
    title='Total de Ventas Anual por Producto',
    color=productos,
    color_continuous_scale='Aggrnyl',
    labels=dict(x="Mes", y="Producto", color="Ventas",value="Ventas"),
    text='Total de ventas',
    height=1000,
    text_auto=True,
    template='plotly_dark',
    
)
fig.show()

In [196]:
data= total_ventas_anual_producto
fig = px.imshow(data,
                labels=dict(x="Producto", y="Meses", color="Ventas"),
                color_continuous_scale='speed',
                x=productos,
                y=meses,
)
fig.update_layout(
    title='Total de Ventas por Producto',
    xaxis=dict(title='Producto', tickvals=productos, ticktext=productos),
    yaxis=dict(title='Mes',tickvals=meses, ticktext=meses, side="left"),
    height=800,
    
    
)

fig.show()

In [197]:
print('El producto más vendido en cada mes es: ')
for mes in meses:
    print(mes, ':', df_total_ventas_anual_producto[mes].idxmax(), 'con', df_total_ventas_anual_producto[mes].max(), 'ventas.')  

El producto más vendido en cada mes es: 
Enero : AAA Batteries (4-pack) con 1596 ventas.
Febrero : AAA Batteries (4-pack) con 1974 ventas.
Marzo : AAA Batteries (4-pack) con 2476 ventas.
Abril : AAA Batteries (4-pack) con 2933 ventas.
Mayo : AAA Batteries (4-pack) con 2927 ventas.
Junio : AAA Batteries (4-pack) con 2159 ventas.
Julio : AAA Batteries (4-pack) con 2362 ventas.
Agosto : AAA Batteries (4-pack) con 2017 ventas.
Septiembre : AAA Batteries (4-pack) con 1926 ventas.
Octubre : AAA Batteries (4-pack) con 3356 ventas.
Noviembre : AAA Batteries (4-pack) con 3023 ventas.
Diciembre : AAA Batteries (4-pack) con 4237 ventas.


### ● ¿Qué factores crees que han contribuido al éxito de ese producto en particular?

In [198]:
print('Creemos que las Baterias AAA (pack de 4) fueron las más vendidas por su precio accesible y por ser un producto que se utiliza en la vida cotidiana.')

Creemos que las Baterias AAA (pack de 4) fueron las más vendidas por su precio accesible y por ser un producto que se utiliza en la vida cotidiana.


### 5. Tendencia ventas:


In [199]:
dataframes_meses['Enero'].head(15)

Unnamed: 0,ID de Pedido,Producto,Cantidad Pedida,Precio Unitario,Fecha de Pedido,Dirección de Envio,Hora,Dia,Dia semanal,Calle,Ciudad,PO BOX,Estado,Cod Postal,Ingreso
0,141234,iPhone,1,700,2019-01-22 21:25:00,"944 Walnut St, Boston, MA 02215",21,22,1,944 Walnut St,Boston,MA 02215,MA,2215,700
1,141235,Lightning Charging Cable,1,14,2019-01-28 14:15:00,"185 Maple St, Portland, OR 97035",14,28,0,185 Maple St,Portland,OR 97035,OR,97035,14
2,141236,Wired Headphones,2,11,2019-01-17 13:33:00,"538 Adams St, San Francisco, CA 94016",13,17,3,538 Adams St,San Francisco,CA 94016,CA,94016,22
3,141237,27in FHD Monitor,1,149,2019-01-05 20:33:00,"738 10th St, Los Angeles, CA 90001",20,5,5,738 10th St,Los Angeles,CA 90001,CA,90001,149
4,141238,Wired Headphones,1,11,2019-01-25 11:59:00,"387 10th St, Austin, TX 73301",11,25,4,387 10th St,Austin,TX 73301,TX,73301,11
5,141239,AAA Batteries (4-pack),1,2,2019-01-29 20:22:00,"775 Willow St, San Francisco, CA 94016",20,29,1,775 Willow St,San Francisco,CA 94016,CA,94016,2
6,141240,27in 4K Gaming Monitor,1,389,2019-01-26 12:16:00,"979 Park St, Los Angeles, CA 90001",12,26,5,979 Park St,Los Angeles,CA 90001,CA,90001,389
7,141241,USB-C Charging Cable,1,11,2019-01-05 12:04:00,"181 6th St, San Francisco, CA 94016",12,5,5,181 6th St,San Francisco,CA 94016,CA,94016,11
8,141242,Bose SoundSport Headphones,1,99,2019-01-01 10:30:00,"867 Willow St, Los Angeles, CA 90001",10,1,1,867 Willow St,Los Angeles,CA 90001,CA,90001,99
9,141243,Apple Airpods Headphones,1,150,2019-01-22 21:20:00,"657 Johnson St, San Francisco, CA 94016",21,22,1,657 Johnson St,San Francisco,CA 94016,CA,94016,150


In [202]:
dias_semana[1]

'Mar'

In [203]:
# Se agrupa por dia del mes y se calcula el total de ventas por ese dia
total_ventas_dia =  dataframes_meses['Enero'].groupby('Dia')['Cantidad Pedida'].count()
total_ventas_dia


Dia
1     308
2     323
3     296
4     293
5     308
6     290
7     308
8     283
9     317
10    336
11    340
12    293
13    319
14    281
15    328
16    311
17    291
18    320
19    320
20    347
21    305
22    328
23    277
24    348
25    297
26    369
27    311
28    327
29    320
30    300
31    277
Name: Cantidad Pedida, dtype: int64

In [204]:
# Se agrupa por dia de la semana del mes y se calcula el total de ventas por esos dias 
total_ventas_dia_semana =  dataframes_meses['Enero'].groupby('Dia semanal')['Cantidad Pedida'].count()
total_ventas_dia_semana


Dia semanal
0    1221
1    1561
2    1528
3    1548
4    1256
5    1290
6    1267
Name: Cantidad Pedida, dtype: int64

### ● ¿Existe alguna tendencia o patrón en las ventas que se repita a lo largo de los días en los diferentes meses?


In [205]:
# Se crea una lista para almacenar el total de ventas por dia por mes y el total anual de ventas por dia
total_ventas_dia_mes = []
total_ventas_anual_dia = []

# Se crea una lista para almacenar el total de ventas por dia de la semana por mes y el total anual de ventas por dia de la semana
total_ventas_dia_semana_mes = []
total_ventas_anual_dia_semana = []

# Se recorre el diccionario de dataframes de ventas por mes
for mes in meses:
    # Se obtiene el dataframe de ventas del mes
    dataframe_mes = dataframes_meses[mes]
    
    # Se obtiene el total de ventas por dia del mes
    total_ventas_dia_mes = dataframe_mes.groupby('Dia')['Cantidad Pedida'].count()
    
    # Se agrega el total de ventas por dia al anual
    total_ventas_anual_dia.append(total_ventas_dia_mes)
    
    # Se obtiene el total de ventas por dia de la semana del mes
    total_ventas_dia_semana_mes = dataframe_mes.groupby('Dia semanal')['Cantidad Pedida'].count()
    
    # Se agrega el total de ventas por dia de la semana al anual
    total_ventas_anual_dia_semana.append(total_ventas_dia_semana_mes)

total_ventas_anual_dia


[Dia
 1     308
 2     323
 3     296
 4     293
 5     308
 6     290
 7     308
 8     283
 9     317
 10    336
 11    340
 12    293
 13    319
 14    281
 15    328
 16    311
 17    291
 18    320
 19    320
 20    347
 21    305
 22    328
 23    277
 24    348
 25    297
 26    369
 27    311
 28    327
 29    320
 30    300
 31    277
 Name: Cantidad Pedida, dtype: int64,
 Dia
 1     424
 2     433
 3     403
 4     402
 5     387
 6     415
 7     426
 8     434
 9     448
 10    448
 11    423
 12    448
 13    468
 14    423
 15    402
 16    438
 17    452
 18    451
 19    403
 20    442
 21    405
 22    433
 23    391
 24    460
 25    412
 26    440
 27    452
 28    405
 Name: Cantidad Pedida, dtype: int64,
 Dia
 1     472
 2     525
 3     474
 4     471
 5     503
 6     471
 7     508
 8     481
 9     505
 10    491
 11    523
 12    476
 13    512
 14    478
 15    487
 16    477
 17    475
 18    479
 19    494
 20    480
 21    470
 22    503
 23    545
 24    

In [206]:
total_ventas_anual_dia_semana

[Dia semanal
 0    1221
 1    1561
 2    1528
 3    1548
 4    1256
 5    1290
 6    1267
 Name: Cantidad Pedida, dtype: int64,
 Dia semanal
 0    1688
 1    1678
 2    1777
 3    1659
 4    1693
 5    1710
 6    1763
 Name: Cantidad Pedida, dtype: int64,
 Dia semanal
 0    1964
 1    1931
 2    1966
 3    1945
 4    2416
 5    2535
 6    2372
 Name: Cantidad Pedida, dtype: int64,
 Dia semanal
 0    2920
 1    3031
 2    2538
 3    2501
 4    2374
 5    2462
 6    2441
 Name: Cantidad Pedida, dtype: int64,
 Dia semanal
 0    2112
 1    2191
 2    2652
 3    2734
 4    2587
 5    2103
 6    2161
 Name: Cantidad Pedida, dtype: int64,
 Dia semanal
 0    1774
 1    1788
 2    1860
 3    1819
 4    1832
 5    2245
 6    2219
 Name: Cantidad Pedida, dtype: int64,
 Dia semanal
 0    2347
 1    2267
 2    2251
 3    1885
 4    1831
 5    1850
 6    1842
 Name: Cantidad Pedida, dtype: int64,
 Dia semanal
 0    1522
 1    1553
 2    1553
 3    1927
 4    1910
 5    1944
 6    1530
 Name: Cantida

In [207]:
# Se pasa el arreglo de totales de ventas por dia a un dataframe
df_total_ventas_anual_dia= pd.concat(total_ventas_anual_dia, axis=1)
# Se asigna el nombre de las columnas
df_total_ventas_anual_dia.columns = meses

# Se pasa el arreglo de totales de ventas por dia de la semana a un dataframe
df_total_ventas_anual_dia_semana= pd.concat(total_ventas_anual_dia_semana, axis=1)
# Se asigna el nombre de las columnas
df_total_ventas_anual_dia_semana.columns = meses

df_total_ventas_anual_dia

Unnamed: 0_level_0,Enero,Febrero,Marzo,Abril,Mayo,Junio,Julio,Agosto,Septiembre,Octubre,Noviembre,Diciembre
Dia,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1,Unnamed: 12_level_1
1,308,424.0,472,615.0,501,459.0,474,363,392.0,642,607.0,785
2,323,433.0,525,588.0,532,450.0,465,389,400.0,672,612.0,798
3,296,403.0,474,599.0,500,422.0,467,361,379.0,624,538.0,752
4,293,402.0,471,626.0,544,465.0,459,383,386.0,626,608.0,795
5,308,387.0,503,611.0,528,465.0,451,363,357.0,678,562.0,802
6,290,415.0,471,613.0,507,487.0,474,402,385.0,664,556.0,817
7,308,426.0,508,570.0,543,415.0,451,386,375.0,670,610.0,763
8,283,434.0,481,610.0,545,445.0,477,381,380.0,639,610.0,780
9,317,448.0,505,616.0,565,438.0,466,383,397.0,608,587.0,770
10,336,448.0,491,629.0,548,447.0,463,426,392.0,684,571.0,806


In [214]:
# Se mira la informacion del dataframe de ventas anual por dia
df_total_ventas_anual_dia.info()


<class 'pandas.core.frame.DataFrame'>
Index: 31 entries, 1 to 31
Data columns (total 12 columns):
 #   Column      Non-Null Count  Dtype  
---  ------      --------------  -----  
 0   Enero       31 non-null     int64  
 1   Febrero     31 non-null     float64
 2   Marzo       31 non-null     int64  
 3   Abril       31 non-null     float64
 4   Mayo        31 non-null     int64  
 5   Junio       31 non-null     float64
 6   Julio       31 non-null     int64  
 7   Agosto      31 non-null     int64  
 8   Septiembre  31 non-null     float64
 9   Octubre     31 non-null     int64  
 10  Noviembre   31 non-null     float64
 11  Diciembre   31 non-null     int64  
dtypes: float64(5), int64(7)
memory usage: 3.0 KB


In [215]:
# Se reemplazan los valores NaN por 0
df_total_ventas_anual_dia.fillna(0, inplace=True)

# Se convierten los valores de las columnas a enteros
df_total_ventas_anual_dia = df_total_ventas_anual_dia.astype(int)

df_total_ventas_anual_dia.info()

<class 'pandas.core.frame.DataFrame'>
Index: 31 entries, 1 to 31
Data columns (total 12 columns):
 #   Column      Non-Null Count  Dtype
---  ------      --------------  -----
 0   Enero       31 non-null     int32
 1   Febrero     31 non-null     int32
 2   Marzo       31 non-null     int32
 3   Abril       31 non-null     int32
 4   Mayo        31 non-null     int32
 5   Junio       31 non-null     int32
 6   Julio       31 non-null     int32
 7   Agosto      31 non-null     int32
 8   Septiembre  31 non-null     int32
 9   Octubre     31 non-null     int32
 10  Noviembre   31 non-null     int32
 11  Diciembre   31 non-null     int32
dtypes: int32(12)
memory usage: 1.6 KB


In [216]:
# Se pide informacion de los tipos de datos del dataframe de ventas anual por dia de la semana
df_total_ventas_anual_dia_semana.info()

<class 'pandas.core.frame.DataFrame'>
Index: 7 entries, 0 to 6
Data columns (total 12 columns):
 #   Column      Non-Null Count  Dtype
---  ------      --------------  -----
 0   Enero       7 non-null      int64
 1   Febrero     7 non-null      int64
 2   Marzo       7 non-null      int64
 3   Abril       7 non-null      int64
 4   Mayo        7 non-null      int64
 5   Junio       7 non-null      int64
 6   Julio       7 non-null      int64
 7   Agosto      7 non-null      int64
 8   Septiembre  7 non-null      int64
 9   Octubre     7 non-null      int64
 10  Noviembre   7 non-null      int64
 11  Diciembre   7 non-null      int64
dtypes: int64(12)
memory usage: 700.0 bytes


In [217]:
df_total_ventas_anual_dia_semana

Unnamed: 0_level_0,Enero,Febrero,Marzo,Abril,Mayo,Junio,Julio,Agosto,Septiembre,Octubre,Noviembre,Diciembre
Dia semanal,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1,Unnamed: 12_level_1
0,1221,1688,1964,2920,2112,1774,2347,1522,1930,2611,2351,4068
1,1561,1678,1931,3031,2191,1788,2267,1553,1578,3233,2318,4008
2,1528,1777,1966,2538,2652,1860,2251,1553,1537,3197,2340,3239
3,1548,1659,1945,2501,2734,1819,1885,1927,1533,3279,2349,3239
4,1256,1693,2416,2374,2587,1832,1831,1910,1578,2586,2898,3253
5,1290,1710,2535,2462,2103,2245,1850,1944,1519,2698,2931,3166
6,1267,1763,2372,2441,2161,2219,1842,1530,1936,2647,2364,3976


In [234]:
# Se crea una lista de colores para representar los meses
colores_meses = px.colors.qualitative.Set3
colores_meses


['rgb(141,211,199)',
 'rgb(255,255,179)',
 'rgb(190,186,218)',
 'rgb(251,128,114)',
 'rgb(128,177,211)',
 'rgb(253,180,98)',
 'rgb(179,222,105)',
 'rgb(252,205,229)',
 'rgb(217,217,217)',
 'rgb(188,128,189)',
 'rgb(204,235,197)',
 'rgb(255,237,111)']

In [282]:
dias_meses[meses[4]] + 1

32

In [283]:
dias = list(range(1, dias_meses[meses[6]] + 1))
dias

[1,
 2,
 3,
 4,
 5,
 6,
 7,
 8,
 9,
 10,
 11,
 12,
 13,
 14,
 15,
 16,
 17,
 18,
 19,
 20,
 21,
 22,
 23,
 24,
 25,
 26,
 27,
 28,
 29,
 30,
 31]

In [222]:
# Se crea el objeto de grafico para representar el total de ventas anual por dia
fig = go.Figure()

# Se agrega a la figura un grafico de linea con los dias y el total de ventas por dia del mes de Enero

fig.add_trace(go.Scatter(
    x = dias,
    y = df_total_ventas_anual_dia['Enero'],
    name='Total de Ventas por Dia del Mes',
    line=dict(color= colores_meses[0],
              shape='spline',
              smoothing=1.3,
              width=3)
    )
)

# Se configura los ejes y los titulos
fig.update_layout(
    title='Total de Ventas Anual por Dia del Mes',
    xaxis=dict(title='Dia del Mes', tickvals=df_total_ventas_anual_dia.index),
    yaxis=dict(title='Total de Ventas', side='left')
)

fig.show()


In [281]:
# Se crea el objeto de grafico para representar el total de ventas anual por dia
fig = go.Figure()
# Se recorre los meses y se agrega a la figura un grafico de linea con los dias y sus ventas anuales
for i in range(len(meses)):
    fig.add_trace(go.Scatter(
        x = list(range(1,dias_meses[meses[i]]+1)),
        y = df_total_ventas_anual_dia[meses[i]],
        name=meses[i],
        line=dict(color= colores_meses[i],
                  shape='spline',
                  smoothing=0.8,
                  width=1)
        )
    )
    
# Se configura los ejes y los titulos
fig.update_layout(
    title='Total de Ventas Anual por Dia del Mes',
    xaxis=dict(title='Dia del Mes', tickvals=df_total_ventas_anual_dia.index),
    yaxis=dict(title='Total de Ventas', side='left'),
    template='plotly_dark',
    height=900

)
fig.show()


In [252]:
print('Se puede ver un patrón de ventas por dia del mes muy similar en todos los meses.')


Se puede ver un patrón de ventas por dia del mes muy similar en todos los meses.


### ● ¿Cómo varían las ventas a lo largo de los diferentes días de la semana?


In [284]:
print('A lo largo de los días, las venta varían dentro de su promedio mensual')

A lo largo de los días, las venta varían dentro de su promedio mensual


### ● ¿Se observa alguna diferencia significativa en las ventas entre los días laborables y los fines de semana?