### Analisis de datos, Ejercicio 1: "Restaurante"

Importamos pandas para poder trabajar con analisis de datos:

In [1]:
import pandas as pd

Importamos el archivo "restaurante.xlsx", contiene la base de datos del restaurante:

In [None]:
restaurante= pd.read_excel("./restaurante.xlsx")

In [None]:
restaurante.head()

Agregar una columna llamada "FechaMes", que contenga el año y el mes de la columna fecha (Ej. 2010-03)

In [None]:
restaurante["FechaMes"]=restaurante.Fecha.dt.strftime("%Y-%m")
restaurante.head()

Investigaremos si el ingreso ha bajado, obteneniendo las ventas totales de cada mes:

In [None]:
ventas_mes = restaurante.groupby("FechaMes").agg({"Precio":"sum"})

In [None]:
#ventas_mes.head()

Harémos una inspección rápida de los datos con una gráfica de calor sobre las ventas de cada mes:

In [None]:
import seaborn as sns
import matplotlib.pyplot as plt
import matplotlib.ticker as ticker
sns.heatmap(ventas_mes,annot=True,fmt='g',cmap='Blues', vmin=100000, vmax=215000)
plt.show()

Hacemos una gráfica de barras con las ventas de cada mes:

In [None]:
ventas_mes.plot(y="Precio",kind="bar",color="red")
plt.xticks(x="FechaMes", rotation='vertical', size=8)
plt.ylim(140000,210000)
plt.show()

__Conclusión:__ los ingresos aumentaron al principio, pero volvieron a bajar a niveles record.

Ahora contaremos cuantos productos se sirvieron en cada mes:

In [None]:
productos_mes = restaurante.groupby("FechaMes").agg({"Producto":"count"})

In [None]:
#productos_mes.head()

Crearemos un gráfico de calor sobre la cantidad de platos vendidos en cada mes para hacer un análisis exploratorio sencillo:

In [None]:
sns.heatmap(productos_mes,annot=True,fmt='g',cmap='Purples', vmin=0)
plt.show()

Haremos una gráfica de linea con el total de productos servidos por mes:

In [None]:
import matplotlib.pyplot as plt

productos_mes.plot(y="Producto",kind="line",color="black")
plt.xticks(x="FechaMes", rotation='vertical', size=8)
plt.ylim(0,3000)
plt.show()

__Conclusión:__ los ingresos bajaron, pero la cantidad de productos vendidos se mantuvo en el tiempo

Ahora mostraremos los ingresos al mes según si es comida o bebida, para encontrar si hubo un cambio en los habitos de consumo de los clientes:

In [None]:
ingreso_tipo =pd.pivot_table(restaurante,
                      index=["FechaMes"],
                      columns="Tipo",
                      fill_value=0,
                      values="Precio",
                      aggfunc='sum')

In [None]:
#ingreso_tipo.head()

Haremos una gráfica de calor sobre las ventas mensuales de cada tipo de producto:

Graficaremos el ingreso mensual de cada tipo de alimento:

In [None]:
ingreso_tipo.plot(kind='line')
plt.show()

__Conclusión:__ los clientes piden cada vez menos bebidas, pero la comida se mantiene, por lo que tenemos fuertes indicios que el problema general se da en esa área.

Analizaremos el ingreso mensual de las bebidas teniendo una columna por categoría:

In [None]:
bebidas=restaurante[restaurante["Tipo"]=="Bebida"]
bebidas_mes =pd.pivot_table(bebidas,
                      index=["FechaMes"],
                      columns="Categoria",
                      fill_value=0,
                      values="Precio",
                      aggfunc='sum')

In [None]:
#bebidas_mes.head()

Haremos una gráfica de calor sobre los ingresos mensuales de cada tipo de bebida:

In [None]:
sns.heatmap(bebidas_mes,annot=True,fmt='g',cmap='Blues_r')
plt.show()

Graficaremos el ingreso mensual de cada tipo de bebida:

In [None]:
bebidas_mes.plot(kind='line')
plt.show()

__Conclusión:__ Los ingresos provenientes de los vinos bajaron mucho, debemos indagar en los posibles motivos, por ejemplo, analizando a los meseros que lo sirven.

Obtendremos el ingreso mensual de cada mesero:

In [None]:
meseros_mes =pd.pivot_table(restaurante,
                      index=["FechaMes"],
                      columns="Atendió",
                      fill_value=0,
                      values="Precio",
                      aggfunc='sum')

In [None]:
meseros_mes

Haremos una gráfica de calor sobre las ventas de cada mesero:

In [None]:
from matplotlib.pyplot import figure

figure(figsize=(12, 5), dpi=80)
sns.heatmap(meseros_mes,annot=True,fmt='g',cmap='Blues_r')
plt.show()

In [None]:
fig, axarr = plt.subplots(3,3, figsize=(16,24))
fig.suptitle('Venta de meseros',y=0.9)
contador=0
for i in range(3):
    for j in range(3):
        axarr[i,j].plot(meseros_mes.index,meseros_mes.iloc[:,contador], label=meseros_mes.iloc[:,contador].name)
        axarr[i,j].legend(loc="upper right")
        axarr[i,j].tick_params(axis="x",labelrotation=45)
        contador+=1

__Conclusión:__ las ventas de los meseros al igual que el vino están bajando, excepto por Mauricio que entró a trabajar en septiembre, un buen paso será graficar la relación de estas 2 variables, por ejemplo, calcular cuanto vino vende cada mesero

Averiguaremos cuanto vino vende cada mesero:

In [None]:
ventas_vino = restaurante[restaurante["Categoria"]=="Vinos"]
ventas_vino=ventas_vino.groupby("Atendió").agg({"Precio":"sum"})

In [None]:
#ventas_vino.head()

Hacemos un análisis exploratorio con una gráfica de calor:

In [None]:
sns.heatmap(ventas_vino,annot=True,fmt='g',cmap='Blues_r')
plt.show()

Graficamos la venta de vinos de cada mesero:

In [None]:
ventas_vino.plot(y="Precio",kind="bar",color="green")
plt.show()

__Conclusión:__ en la gráfica anterior notamos que no aparece Mauricio, por lo que el descenso en ingresos puede deberse a esto

Para poder conocer si los meseros atienden bien utilizaremos una cantidad derivada, la propina, si reciben buenas propinas es aceptable pensar que es por su buen servicio:

In [None]:
propinas= restaurante.groupby("Atendió").agg({"Propina":"mean"})

In [None]:
#propinas.head()

Haremos un analisis exploratorio de los datos con una gráfica de calor:

In [None]:
sns.heatmap(propinas,annot=True,fmt='g',cmap='Blues_r')
plt.show()

Graficamos la propina media de cada mesero:

In [None]:
propinas.plot(y="Propina",kind="bar",color="green")
plt.show()

__Conclusión:__ todos los meseros tienen propinas similares, a excepción de Mauricio, por lo que debemos analizar la cantidad de clientes que vuelven a comprar con nosotros, en especial después de septiembre.

Analizaremos la cantidad de clientes nuevos contra los que regresan:

In [None]:
ventas_tipo =pd.pivot_table(restaurante,
                      index=["FechaMes"],
                      columns="Tipo de Cliente",
                      fill_value=0,
                      values="Precio",
                      aggfunc='sum')

In [None]:
ventas_tipo

Haremos una gráfica de calor sobre las ventas al mes por tipo de cliente:

In [None]:
sns.heatmap(ventas_tipo,annot=True,fmt='g',cmap='Blues')
plt.show()

Graficaremos las ventas al mes por tipo de cliente:

In [None]:
from matplotlib.pyplot import figure

figure(figsize=(12, 5), dpi=80)

plt.subplot(1, 2, 1)
plt.plot(ventas_tipo.index,ventas_tipo["Cliente Nuevo"], label="Cliente Nuevo")
plt.legend(loc="upper right")
plt.xticks(ventas_tipo.index, rotation='vertical', size=8)
plt.subplot(1, 2, 2)
plt.plot(ventas_tipo.index,ventas_tipo["Cliente Repetido"], label="Cliente Repetido")
plt.legend(loc="upper right")
plt.xticks(ventas_tipo.index, rotation='vertical', size=8)
plt.show()

__Conclusión:__ los clientes deciden no volver a comer con nosotros, analizaremos el impacto de este hecho en la venta de vino.

Analizaremos la venta de vinos según el tipo de cliente:

In [None]:
ventas_vino = restaurante[restaurante["Categoria"]=="Vinos"]
ventas_vino =pd.pivot_table(ventas_vino,
                      index=["FechaMes"],
                      columns="Tipo de Cliente",
                      fill_value=0,
                      values="Precio",
                      aggfunc='sum')

In [None]:
ventas_vino.head()

Haremos una gráfica de calor las ventas de vino al mes por tipo de cliente:

In [None]:
sns.heatmap(ventas_vino,annot=True,fmt='g',cmap='Blues')
plt.show()

Graficaremos las ventas de vino al mes por tipo de cliente:

In [None]:
ventas_vino.plot(kind='line')
plt.show()

__Conclusión:__ la venta de vino en los clientes nuevos se mantuvo, pero en los repetidos ha descendido, en especial desde septiembre, debemos investigar la venta de cada mesero separado por tipo de cliente.

Analizar la venta de cada mesero en base al tipo de cliente:

In [None]:
ventas_mesero =pd.pivot_table(restaurante,
                      index=["Atendió"],
                      columns="Tipo de Cliente",
                      fill_value=0,
                      values="Precio",
                      aggfunc='sum')

In [None]:
#ventas_mesero.head()

Para analizar mejor el trato que le dan a los clientes por tipo, transformaremos sus ventas a porcentajes:

In [None]:
ventas_mesero["Total Venta"]=ventas_mesero["Cliente Nuevo"]+ventas_mesero["Cliente Repetido"]
ventas_mesero["% Nuevo"]=(ventas_mesero["Cliente Nuevo"] / ventas_mesero["Total Venta"] )*100
ventas_mesero["% Repetido"]=(ventas_mesero["Cliente Repetido"] / ventas_mesero["Total Venta"] )*100

In [None]:
#ventas_mesero.head()

Haremos un análisis exploratorio de los datos con un mapa de calor:

In [None]:
sns.heatmap(ventas_mesero[["% Nuevo","% Repetido"]],annot=True,fmt='g',cmap='Blues')
plt.show()

Y finalmente graficaremos las ventas al mes de cada mesero por tipo de cliente:

In [None]:
ax=ventas_mesero.plot(y=["% Nuevo","% Repetido"],kind="bar")
ticks = ax.get_yticks()
ax.yaxis.set_major_formatter(ticker.PercentFormatter())
plt.show()


__Conclusión:__ Mauricio no atiende clientes repetidos.

__Conlusión General:__ Los clientes repetidos son los que más vino consumían, al dejar de regresar nuestros ingresos disminuyeron, nuestro principal sospechoso es Mauricio por tener unas propinas anormalmente altas, pero pese a ello los clientes no quieren volver a ser atendidos por el.

Tras hacer una investigación presencial encontramos que la manera en la que Mauricio atendía era grosera y exigia a los comensales consumir más, por eso sus ventas eran altas, pero ahuyentaba a los clientes.