In [None]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
import datetime as dt
import calendar

pd.set_option('display.max_rows', 10000)
pd.set_option('display.max_columns', 10000)

In [None]:
ventas= pd.read_excel(r'C:\Users\Pablo\OneDrive - Helacor S.A\Club Grido\Informes de analítica\Analisis de tartas\ventas_tartas.xlsx')
ventas.head()

#### Analizo indicadores básicos compras de tartas

In [None]:
print('minima fecha:', ventas['SaleDate'].min())
print('maxima fecha:', ventas['SaleDate'].max())

In [None]:
print('Kilos vendidos de tartas a través de Club Grido:', ventas[(ventas.ProductId ==406) | (ventas.ProductId ==407) | (ventas.ProductId ==408)].Kilos.sum())

In [None]:
print('unidades vendidas:', ventas[((ventas.ProductId ==406) | (ventas.ProductId ==407) | (ventas.ProductId ==408))].SaleId.count())

In [None]:
socios_tartas = ventas.CustomerId.nunique()
print('Socios que compraron tartas:', socios_tartas)

In [None]:
socios_recompraron= (ventas.groupby('CustomerId').SaleId.nunique()>1).sum()
print('clientes que recompraron tartas:',socios_recompraron)

In [None]:
print('porcentaje de socios que recompró:',round(socios_recompraron/socios_tartas*100,1),'%')

In [None]:
print('porcentaje de ventas por producto')
ventas[((ventas.ProductId ==406) | (ventas.ProductId ==407) | (ventas.ProductId ==408))].ProductName.value_counts(normalize=True)*100

##### Analizo las compras segun la hora

In [None]:
horas = pd.to_datetime(ventas['SaleDate']).dt.hour

In [None]:
fig, ax = plt.subplots(figsize=(10,7))
ax.tick_params(axis='x', labelrotation = 30)
plt.title('Compras de tarta Frizzio por hora del día')
fig = sns.countplot(y=horas, palette=["#0C3B65"], order= [num for num in range(0,24)])
ax.set_xlabel('Cantidad de compras de tartas Frizzio',loc='center')
ax.set_ylabel('Hora del día en que se compran tartas Frizzio',loc='center')

##### Analizo las compras segun días

In [None]:
import locale
locale.setlocale(locale.LC_ALL,'es_ES.UTF-8')
dia = pd.to_datetime(ventas['SaleDate']).dt.weekday.apply(lambda x: calendar.day_name[x])

In [None]:
fig, ax = plt.subplots(figsize=(10,7))
ax.tick_params(axis='x', labelrotation = 30)
plt.title('Compras de tarta Frizzio por día de la semana')
fig = sns.countplot(y=dia, order = list(calendar.day_name), color='grey')
ax.set_xlabel('Cantidad de compras de tartas Frizzio',loc='center')
ax.set_ylabel('',loc='center')

In [None]:
(dia.value_counts(normalize=True)*100).apply(lambda x: round(x,1))

#### Analizo comportamiento con productos

In [None]:
print('cantidad de ventas:',ventas.SaleId.nunique())

In [None]:
print('Cantidad de ventas con otro producto:',ventas[~((ventas.ProductId ==406) | (ventas.ProductId ==407) | (ventas.ProductId ==408))].SaleId.nunique())

In [None]:
print('porcentaje de ventas realizadas en conjunto con otro producto')
ventas[~((ventas.ProductId ==406) | (ventas.ProductId ==407) | (ventas.ProductId ==408))].SaleId.nunique() / ventas.SaleId.nunique()*100

In [None]:
productos = pd.read_excel(r'C:\Users\Pablo\Helacor S.A\Equipo CLUB GRIDO - General\Datos\productos_vigentes.xlsx')
productos['ProductId']= productos.ProductId.astype('float')
productos=productos[productos['Linea x Producto']!='No Definido']
productos.drop_duplicates(subset=['ProductId'],inplace=True)
productos.drop('ProductName',axis=1,inplace=True)
productos.head()

In [None]:
ventas= ventas.merge(productos,left_on='ProductId',right_on='ProductId',how='left')
ventas.shape

In [None]:
ventas.head()

In [None]:
print('Porcentaje de acompañamiento por producto')
pd.DataFrame(ventas[~((ventas.ProductId ==406) | (ventas.ProductId ==407) | (ventas.ProductId ==408))].ProductName.value_counts(normalize=True)*100).head(10)

In [None]:
print('Porcentaje de acompañamiento por Linea')
pd.DataFrame(ventas[~((ventas.ProductId ==406) | (ventas.ProductId ==407) | (ventas.ProductId ==408))]['Linea x Producto'].value_counts(normalize=True)*100).head(10)

In [None]:
print('Porcentaje de acompañamiento por Familia')
pd.DataFrame(ventas[~((ventas.ProductId ==406) | (ventas.ProductId ==407) | (ventas.ProductId ==408))]['familia'].value_counts(normalize=True)*100).head(20)

In [None]:
print('Porcentaje de acompañamiento por producto')
pd.DataFrame(ventas[~((ventas.ProductId ==406) | (ventas.ProductId ==407) | (ventas.ProductId ==408))].ProductName.value_counts(normalize=True)*100).head(20)

Análisis por franquicia

In [None]:
pd.DataFrame(ventas[~((ventas.ProductId ==406) | (ventas.ProductId ==407) | (ventas.ProductId ==408))].BranchOfficeId.value_counts(normalize=True)*100).head(20)

In [None]:
ventas.BranchOfficeId.nunique()