# Bibliotecas

In [97]:
import pandas as pd
import numpy as np
import plotly.express as px

# Dados

In [98]:
dados = pd.read_csv("clientes_restaurantes.csv")

In [99]:
dados.head(2)

Unnamed: 0,data,Chimi & Churri,Assa Frão
0,1/1/2016,65.0,139.0
1,1/2/2016,24.0,85.0


In [100]:
dados.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 478 entries, 0 to 477
Data columns (total 3 columns):
 #   Column          Non-Null Count  Dtype  
---  ------          --------------  -----  
 0   data            478 non-null    object 
 1   Chimi & Churri  476 non-null    float64
 2   Assa Frão       477 non-null    float64
dtypes: float64(2), object(1)
memory usage: 11.3+ KB


In [101]:
dados['data'] = pd.to_datetime(dados['data'])

dados.set_index('data', inplace=True)

In [102]:
dados

Unnamed: 0_level_0,Chimi & Churri,Assa Frão
data,Unnamed: 1_level_1,Unnamed: 2_level_1
2016-01-01,65.0,139.0
2016-01-02,24.0,85.0
2016-01-03,24.0,81.0
2016-01-04,23.0,32.0
2016-01-05,2.0,43.0
...,...,...
2017-04-18,30.0,18.0
2017-04-19,20.0,18.0
2017-04-20,22.0,46.0
2017-04-21,38.0,38.0


# Tratando os dados nulos

In [103]:
dados = dados.interpolate()

32 + 2 / 2 = 17

In [104]:
dados.loc['2016-04-04' : '2016-04-06']

Unnamed: 0_level_0,Chimi & Churri,Assa Frão
data,Unnamed: 1_level_1,Unnamed: 2_level_1
2016-04-04,32.0,12.0
2016-04-05,17.0,34.0
2016-04-06,2.0,40.0


Não existe 27.2 cliente então vamos deixar tudo arredondado com o INT

In [105]:
dados = dados.astype(int)
dados

Unnamed: 0_level_0,Chimi & Churri,Assa Frão
data,Unnamed: 1_level_1,Unnamed: 2_level_1
2016-01-01,65,139
2016-01-02,24,85
2016-01-03,24,81
2016-01-04,23,32
2016-01-05,2,43
...,...,...
2017-04-18,30,18
2017-04-19,20,18
2017-04-20,22,46
2017-04-21,38,38


# Explorando os dados

## Gráfico Histograma

In [106]:
px.histogram(dados['Chimi & Churri'], text_auto=True,
             labels={"value":"Cliente"})

In [107]:
px.histogram(dados['Assa Frão'], text_auto=True,
             labels={"value":"Cliente"})

In [108]:
dados.describe().round(2)

Unnamed: 0,Chimi & Churri,Assa Frão
count,478.0,478.0
mean,37.45,37.68
std,21.43,24.62
min,1.0,3.0
25%,22.25,19.0
50%,33.0,30.5
75%,49.0,50.0
max,128.0,139.0


# Gráfico BoxPlot

In [109]:
px.box(dados[['Chimi & Churri', 'Assa Frão']])

# Gerando inseghts

In [110]:
dados['Total'] = dados.sum(axis=1)

In [111]:
px.histogram(dados["Total"], text_auto=True)

# Gráfico de linha

In [112]:
px.line(dados["Total"], markers=True, width=5000)

# Encontrando a quantidade mensal de clientes

In [113]:
clientes_mensais = dados.resample(rule='ME')[['Chimi & Churri', 'Assa Frão']].sum()

clientes_mensais

Unnamed: 0_level_0,Chimi & Churri,Assa Frão
data,Unnamed: 1_level_1,Unnamed: 2_level_1
2016-01-31,920,1577
2016-02-29,1109,1396
2016-03-31,1177,1513
2016-04-30,1089,1229
2016-05-31,957,1338
2016-06-30,1262,914
2016-07-31,1299,986
2016-08-31,972,944
2016-09-30,1037,1084
2016-10-31,1135,1188


In [114]:
clientes_mensais.index.month_name(locale='pt_BR')

Index(['Janeiro', 'Fevereiro', 'Março', 'Abril', 'Maio', 'Junho', 'Julho',
       'Agosto', 'Setembro', 'Outubro', 'Novembro', 'Dezembro', 'Janeiro',
       'Fevereiro', 'Março', 'Abril'],
      dtype='object', name='data')

In [115]:
clientes_mensais['Mês'] = clientes_mensais.index.month_name(locale='pt_BR')

clientes_mensais

Unnamed: 0_level_0,Chimi & Churri,Assa Frão,Mês
data,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1
2016-01-31,920,1577,Janeiro
2016-02-29,1109,1396,Fevereiro
2016-03-31,1177,1513,Março
2016-04-30,1089,1229,Abril
2016-05-31,957,1338,Maio
2016-06-30,1262,914,Junho
2016-07-31,1299,986,Julho
2016-08-31,972,944,Agosto
2016-09-30,1037,1084,Setembro
2016-10-31,1135,1188,Outubro


# Gráfico de barra empilhado

In [130]:
clientes_mensais['Mês e Ano'] = clientes_mensais.index.month_name(locale='pt_BR.utf8') + ' ' + clientes_mensais.index.year.astype(str)

clientes_mensais

Unnamed: 0_level_0,Chimi & Churri,Assa Frão,Mês,Mês e Ano
data,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1
2016-01-31,920,1577,Janeiro,Janeiro 2016
2016-02-29,1109,1396,Fevereiro,Fevereiro 2016
2016-03-31,1177,1513,Março,Marã§o 2016
2016-04-30,1089,1229,Abril,Abril 2016
2016-05-31,957,1338,Maio,Maio 2016
2016-06-30,1262,914,Junho,Junho 2016
2016-07-31,1299,986,Julho,Julho 2016
2016-08-31,972,944,Agosto,Agosto 2016
2016-09-30,1037,1084,Setembro,Setembro 2016
2016-10-31,1135,1188,Outubro,Outubro 2016


In [127]:
import plotly.graph_objects as go
import pandas as pd

In [137]:
px.bar(clientes_mensais, 
       x="Mês e Ano", 
       y=["Chimi & Churri", "Assa Frão"],
       labels={"value":"Clientes"},
       title="Cliente Ao longo dos Meses",
       )