# Análisis de un negocio de retail

## El objetivo es analizar la evolución de las ventas de un negocio, así como la proporción que aporta cada vendedor al negocio

### 1.- Importar la base

In [None]:
# Importamos librerías
import pandas as pd
import matplotlib.pylab as plt
import numpy as np

In [None]:
#Cargamos la base de datos
path='C:\\Users\\Gabo\\Documents\\Gabriel Mendoza\\Business\\Crehana\\Análisis de datos con jupyther notebook\\Módulos\\05 Módulo 05 - Comercializadora\\Facturación.xlsx'
df=pd.read_excel(path)

In [None]:
df

In [None]:
df.dtypes

### 2.- Realizamos los primeros cálculos para nuestro análisis y limpiamos la base

In [None]:
# Agregamos el mes y el año de la fecha de emisión
#df['Año']=df['Fecha de Emision'].dt.year
#df['Mes']=df['Fecha de Emision'].dt.month

In [None]:
df.sample(10)

In [None]:
# Revisamos que no tengamos valores vacíos
df.isnull().sum()

In [None]:
# Reemplazamos los valores vacíos por 0's
df['Año'].replace(np.nan,0,inplace=True)
df['Mes'].replace(np.nan,0,inplace=True)
df['Importe Pagado'].replace(np.nan,0,inplace=True)
df['Cliente'].replace(np.nan,0,inplace=True)

In [None]:
# Creamos una columna que se llame status para identificar aquellas facturas que ya se pagaron y aquellas que se emitieron pero no se han pagado
#df.loc[df['Fecha de Pago'].isnull(),'Status']='Emitida'
#df.loc[df['Importe Pagado']!=0,'Status']='Pagada'

In [None]:
df

### 3.- Análisis

In [None]:
# Calculamos las estadísticas descriptivas de las variables
df.describe(include='all')

#### Dado que nos interesa analizar la facturación de las emitidas, vamos a analizar todas las facturas emitidas

In [None]:
# Filtramos de nuestra base las facturas emitidas
#df=df[df['Status']=='Emitida']
#df

In [None]:
# Agrupamos el importe de las facturas emitidas que es "Importe Factura"
#df_sum=df.groupby(['Año','Mes'],as_index=False)['Importe Factura'].sum()
#df_sum

In [None]:
# Agregamos una llave que nos ayudará a unir nuestras bases de datos en el futuro


In [None]:
# Aquí contamos las facturas. ¿Cuántas facturas se pagaron?


In [None]:
# Generamos la llave para unirla con la base anterior


In [None]:
# Unimos ambas bases


In [None]:
# Limpiamos nuestra base


In [None]:
# Cambiamos los nombres de las columnas para que sea una base limpia


In [None]:
# Eliminamos las columnas que no necesitamos


In [None]:
# Le pedimos que el index sea el mes
df2_plot=df2_plot.set_index('Mes')

In [None]:
#Graficamos
df2_plot.plot(kind='bar', figsize=(10, 6))

plt.xlabel('Mes') 
plt.ylabel('Nivel de Facturación') 
plt.title('Facturas emitidas del 2020') 

plt.show()

In [None]:
# realizamos los mismos cálculos para graficar el número de facturas
df2_plot2=df2[['Mes','Facturas']]

In [None]:
df2_plot2=df2_plot2.set_index('Mes')

In [None]:
# step 2: plot data
df2_plot2.plot(kind='bar', figsize=(10, 6))

plt.xlabel('Mes') # add to x-label to the plot
plt.ylabel(' # de Facturas Pagadas') # add y-label to the plot
plt.title('Facturas emitidas del 2020') # add title to the plot

plt.show()

### 4.- Análisis de vendedores

In [None]:
# Analizaremos las ventas que aportan los vendedores


In [None]:
# Generamos 3 bases, una para cada vendedor
df_juan=df[df['Vendedor']=='Juan']
df_claudia=df[df['Vendedor']=='Claudia']
df_bety=df[df['Vendedor']=='Bety']

In [None]:
# Realizamos los cálculos y agrupaciones para Juan


In [None]:
# Creamos la llave para unir las bases agrupadas de Juan


In [None]:
# Juntamos las bases


In [None]:
# limpiamos la base de Juan


In [None]:
# Base final de Juan


In [None]:
# Realizamos el mismo proceso para la base de Claudia


In [None]:
# Base final de Claudia


In [None]:
#Mismos cálculos para Bety



In [None]:
# Base final de Bety


In [None]:
# Creamos la llave para unir las bases de todos los vendedores


In [None]:
#Unimos las bases


In [None]:
#Comenzamos con la limpieza de la base final de los vendedores


In [None]:
df_vend

In [None]:
df_vend['Año']=df_vend['Año_x']
df_vend['Mes']=df_vend['Mes_x']
df_vend['Monto_Juan']=df_vend['Monto_x']
df_vend['Facturas_Juan']=df_vend['Facturas_x']

df_vend['Monto_Claudia']=df_vend['Monto_y']
df_vend['Facturas_Claudia']=df_vend['Facturas_y']

df_vend['Monto_Bety']=df_vend['Monto']
df_vend['Facturas_Bety']=df_vend['Facturas']


In [None]:
df_vend.drop('Año_x',axis=1,inplace=True)
df_vend.drop('Mes_x',axis=1,inplace=True)
df_vend.drop('Monto_x',axis=1,inplace=True)
df_vend.drop('Facturas_x',axis=1,inplace=True)

df_vend.drop('Monto_y',axis=1,inplace=True)
df_vend.drop('Facturas_y',axis=1,inplace=True)

df_vend.drop('Monto',axis=1,inplace=True)
df_vend.drop('Facturas',axis=1,inplace=True)


In [None]:
# Base final para los vendedores


In [None]:
# Dado que queremos graficar la venta de los vendedores creamos una subbase para crear nuestra visualización
df_vend_line=df_vend[['Mes','Monto_Juan', 'Monto_Claudia','Monto_Bety']]

In [None]:
df_vend_line=df_vend_line.set_index('Mes')

In [None]:
df_vend_line.plot(kind='line')

plt.title('Monto facturado por vendedor')
plt.ylabel('Monto')
plt.xlabel('Mes')

plt.show()

# Bety no ha tenido emisión de facturas, por esta razón, no sale en la gráfica