## Projeto Thai House
* Algumas informações

In [1]:
# principais bibliotecas
import pandas as pd
import numpy as np
from datetime import datetime
import matplotlib.pyplot as plt
%matplotlib inline
from pandas_profiling import ProfileReport


import plotly.express as px
import plotly.io as pio
import plotly.graph_objects as go


# Configuração pandas
# pandas.set_option(pat, value)
pd.set_option('display.precision', 2)

Pandas backend loaded 1.4.2
Numpy backend loaded 1.21.5
Pyspark backend NOT loaded
Python backend loaded


In [2]:
# Plotly themes
# seaborn, plotly_white, simple_white, plotly, plotly_dark, ggplot2, none

pio.templates.default = "plotly_white"

px.defaults.template = "plotly_white"
px.defaults.color_continuous_scale = px.colors.sequential.Blackbody
px.defaults.width = 800
px.defaults.height = 600


In [3]:
df = pd.read_excel('df_thai.xlsx')

In [4]:
df.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 100 entries, 0 to 99
Data columns (total 14 columns):
 #   Column          Non-Null Count  Dtype         
---  ------          --------------  -----         
 0   data_evento     100 non-null    datetime64[ns]
 1   data_contato    100 non-null    datetime64[ns]
 2   tipo            100 non-null    object        
 3   valor_total     100 non-null    float64       
 4   num_convidados  100 non-null    float64       
 5   observação      100 non-null    object        
 6   etapa           100 non-null    object        
 7   situação        100 non-null    object        
 8   cardápio        100 non-null    object        
 9   preço           100 non-null    float64       
 10  sinal           100 non-null    float64       
 11  saldo_restante  99 non-null     float64       
 12  valor_extra     100 non-null    float64       
 13  forma_pag       99 non-null     object        
dtypes: datetime64[ns](2), float64(6), object(6)
memory usage: 1

In [5]:
valor_total_mediano = df['valor_total'].median()
print(valor_total_mediano)

4213.0


In [6]:
df.filter(items=['etapa', 'valor_total'])

Unnamed: 0,etapa,valor_total
0,Não informado,21450.4
1,Não informado,4631.0
2,Não informado,12100.0
3,Não informado,7213.5
4,Não informado,14125.0
...,...,...
95,Não fechado,0.0
96,Não fechado,0.0
97,Não fechado,0.0
98,Em negociação,0.0


In [7]:
for i in range(len(df)):
    if df['etapa'].iloc[i] in 'Em negociação':
        df.loc[i, 'valor_total'] = valor_total_mediano

# df['valor_total']
# df.valor_total.replace(0, valor_total_mediano)

In [8]:
df[df['etapa'] == 'Em negociação']

Unnamed: 0,data_evento,data_contato,tipo,valor_total,num_convidados,observação,etapa,situação,cardápio,preço,sinal,saldo_restante,valor_extra,forma_pag
70,2022-04-17,2022-04-17,Jantar/palestra,4213.0,30.0,"Quantidade de pessoas:\n 30 pax não fecharam a data ainda, mas será em uma quinta ou terça as 19 até as 22 horas.\nformato aula com palestrante, precisam de mesa redonda em formato lua, e para apresentação com projeção.\niremos filmar a aula, por isso, precisamos de espaço para 2 câmeras e uma mesa com computador.\n\nprever no custo o equipamento de projeção e de captação de imagem, bem como as equipes técnicas necessárias. sugeri fazermos em outro formato em l o jantar, ou mesas de seis lugares e com a possibilidade da apresentação ser no segundo piso em formato auditório. o cliente vai analisar junto a equipe.",Em negociação,Em negociação a data esta sendo estudada,Não informado,230.0,0.0,6900.0,0.0,Não informado
79,2022-05-27,2022-04-25,Jantar,4213.0,23.0,"Jantar, necessita de audio , telão, microfone e caixa de som.",Em negociação,Orçamento enviado/ não retorna o contato.,A definir,0.0,0.0,0.0,0.0,Não informado
86,2022-06-24,2022-04-27,Coffee break/almoço,4213.0,30.0,"Coffee break e almoço para 30 pessoas, os convidados irão assistir uma transmissão ao vivo.",Em negociação,Encaminhado orçamento,A definir,0.0,0.0,0.0,0.0,Não informado
87,2022-06-30,2022-05-04,Jantar/ palestra,4213.0,20.0,"Jantar com uma palestra ao vivo, equipamentos de audio e som terceirizados. estacionamento incluso para 20 carros.",Em negociação,Encaminhado orçamento,Menu phuket,280.0,0.0,5600.0,0.0,Não informado
93,2022-07-26,2022-06-01,Não informado,4213.0,50.0,"Não me passou dados do evento ainda, mas já fez eventos conosco, e assim que possível me envia as necessidades do evento e fechamos contrato.",Em negociação,Não informado,A definir,0.0,0.0,0.0,0.0,Não informado
94,2022-07-05,2022-06-03,Não informado,4213.0,20.0,Não informado,Em negociação,Não informado,Não informado,0.0,0.0,0.0,0.0,Não informado
98,2022-08-18,2022-05-27,Jantar,4213.0,20.0,"Jantar com uma apresentação, cliente solicitou equipamento de aúdio e som.",Em negociação,Entrar em contato 25 dias para definição do evento.( pré reserva em agosto e outrubro),A definir,0.0,0.0,0.0,0.0,Não informado
99,2022-10-18,2022-05-27,Jantar com palestra,4213.0,20.0,"Jantar com palestra, cliente solicitou equipamentos de aúdio e som",Em negociação,Entrar em contato 25 dias para definição do evento.(pré reserva em agosto e outubro),A definir,0.0,0.0,0.0,0.0,Não informado


In [9]:
df['etapa'] = df.etapa.astype('category')

In [10]:
# Criando código para coluna categórica e incluindo coluna no dataframe
df.insert(9, 'cod_etapa', df['etapa'].cat.codes)

In [11]:
# # Conhecendo o dataframe
# profile = ProfileReport(df, title="Thai House Report", explorative=True)
# profile.to_file("thai_report.html")

## Análise gráfica

In [12]:
# Criando colunas: 
#        DataFrame.insert(loc, column, value, allow_duplicates=False) 
df.insert(1, 'ano_evento', df.data_evento.dt.year)
df.insert(2, 'mes_evento', df.data_evento.dt.month_name())
df.insert(3, 'dia_semana', df.data_evento.dt.day_name())

# df['ano_evento'] = df['data_evento'].dt.year
# df['mes_evento'] =  df['data_evento'].dt.month_name()

In [13]:
# df['mes_evento'].unique()
dictm = {'June': 'junho', 'July': 'julho', 'August': 'agosto', 'September': 'setembro', 'October': 'outubro'
         , 'November': 'novembro', 'December': 'dezembro', 'January': 'janeiro', 'February': 'fevereiro',
         'March': 'março', 'April': 'abril', 'May': 'maio'}

In [14]:
# df['dia_semana'].unique()
dictw = {'Monday': 'segunda-feira', 'Tuesday': 'terça-feira', 'Wednesday': 'quarta-feira',
         'Thursday': 'quinta-feira', 'Friday': 'sexta-feira', 'Saturday': 'sábado', 'Sunday': 'domingo'}

In [15]:
df.mes_evento.replace(dictm, inplace=True)

In [16]:
df.dia_semana.replace(dictw, inplace= True)

In [17]:
df.head()

Unnamed: 0,data_evento,ano_evento,mes_evento,dia_semana,data_contato,tipo,valor_total,num_convidados,observação,etapa,situação,cardápio,cod_etapa,preço,sinal,saldo_restante,valor_extra,forma_pag
0,2018-06-12,2018,junho,terça-feira,2018-06-12,1º evento,21450.4,78.0,1 mesa de 8 lugares+ 5 mesas de 4 lugares + 25 mesas de 2 lugares,Não informado,Não informado,Não informado,3,0.0,0.0,0.0,0.0,Não informado
1,2018-07-12,2018,julho,quinta-feira,2018-07-12,Empresarial,4631.0,25.0,"Cardapio krab kpp r$ 175,00 por pessoa c/ espumante (1 garrafa a cada 3 pessoas)",Não informado,Não informado,Não informado,3,0.0,0.0,0.0,0.0,Não informado
2,2018-07-19,2018,julho,quinta-feira,2018-07-19,Empresarial,12100.0,55.0,"Menu koh paghan finger r$ 185,00 e pct bebidas mali com drink tom yam siam. degustação 29/05.",Não informado,Não informado,Não informado,3,0.0,0.0,0.0,0.0,Não informado
3,2018-08-03,2018,agosto,sexta-feira,2018-08-03,Empresarial,7213.5,35.0,"Menu krab kpp r$ 195,00 por pessoa com refri c/ vinho (1 garrafa a cada 3 pessoas)",Não informado,Não informado,Não informado,3,0.0,0.0,0.0,0.0,Não informado
4,2018-08-21,2018,agosto,terça-feira,2018-08-21,Empresarial,14125.0,70.0,"Menu krab kpp r$ 195,00 por pessoa com refri c/ vinho (1 garrafa a cada 3 pessoas) + 5 vinhos extras no valor total de r$ 475,00",Não informado,Não informado,Não informado,3,0.0,0.0,0.0,0.0,Não informado


### Visão completa do DataFrame

In [18]:
df_qtde_eventos = df.groupby(df['ano_evento']).count()
df_qtde_eventos

Unnamed: 0_level_0,data_evento,mes_evento,dia_semana,data_contato,tipo,valor_total,num_convidados,observação,etapa,situação,cardápio,cod_etapa,preço,sinal,saldo_restante,valor_extra,forma_pag
ano_evento,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1,Unnamed: 12_level_1,Unnamed: 13_level_1,Unnamed: 14_level_1,Unnamed: 15_level_1,Unnamed: 16_level_1,Unnamed: 17_level_1
2018,49,49,49,49,49,49,49,49,49,49,49,49,49,49,49,49,49
2019,17,17,17,17,17,17,17,17,17,17,17,17,17,17,17,17,17
2022,34,34,34,34,34,34,34,34,34,34,34,34,34,34,33,34,33


In [49]:
fig = px.bar(df_qtde_eventos, x= 'num_convidados', title= 'Quantidade Total de Orçamentos por Ano (2018 - 2022)', 
       text_auto=True, labels= {'num_convidados': 'Quantidade Orçamentos', 'ano_evento': 'Ano Evento'})

fig.show()
fig.write_html("orç_2018-22.html")

In [20]:
valor_ano = df.groupby('ano_evento').sum()
valor_ano

Unnamed: 0_level_0,valor_total,num_convidados,cod_etapa,preço,sinal,saldo_restante,valor_extra
ano_evento,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1
2018,242927.85,1204.0,147.0,0.0,0.0,0.0,0.0
2019,52473.7,145.0,51.0,0.0,0.0,0.0,0.0
2022,151182.8,1369.0,61.0,4085.0,3615.0,120863.8,1253.8


In [50]:
# fig = px.bar(df, x="ano_evento", y="valor_total", color="smoker", barmode="group")
fig = px.histogram(df, x="ano_evento", y="valor_total",
                   text_auto= True,
                   title= 'Valor total orçado por ano',
                   labels={'valor_total': 'Orçamentos', 'ano_evento': 'Ano evento'},
                   color= 'ano_evento')
fig.update_yaxes(title=None, ticklabelstep=2, showticklabels=True)
fig.update_layout(bargap=0.2)
fig.show()
fig.write_html("valor_ano.html")

In [22]:
df.loc[:, ['valor_total', 'num_convidados']]

Unnamed: 0,valor_total,num_convidados
0,21450.4,78.0
1,4631.0,25.0
2,12100.0,55.0
3,7213.5,35.0
4,14125.0,70.0
...,...,...
95,0.0,40.0
96,0.0,40.0
97,0.0,30.0
98,4213.0,20.0


## Analise de dados após abril de 2022

In [23]:
# #Filtro

# df.query("data_evento >= '2022/04'")

# # outra opção
# df_2022 = df[df['data_evento'] >= '2022/04'].sort_values(by= 'data_evento')

In [24]:
df_2022 = df.query("data_contato >= '2022/04'")

In [51]:
fig = px.histogram(df.query("data_evento >= '2022/04'"), x= 'mes_evento', labels= {'mes_evento': 'Ano 2022', 'count': 'Quantidade de Eventos'}, 
       text_auto=True, color= 'etapa', barmode='group', title='Evolução de Orçamentos')

fig.update_yaxes(title=None, ticklabelstep=2, showticklabels=False)

fig.update_xaxes(title_font = {"size": 20}, title_standoff = 10)

fig.update_layout(title_font_size=24, bargap=0.2)
fig.show()
fig.write_html("orç_2022.html")

In [26]:
df_2022.columns

Index(['data_evento', 'ano_evento', 'mes_evento', 'dia_semana', 'data_contato',
       'tipo', 'valor_total', 'num_convidados', 'observação', 'etapa',
       'situação', 'cardápio', 'cod_etapa', 'preço', 'sinal', 'saldo_restante',
       'valor_extra', 'forma_pag'],
      dtype='object')

In [27]:
# df_filtro = df.query('data_evento >= "2022/04"')
df_2022.groupby(['etapa']).count()

Unnamed: 0_level_0,data_evento,ano_evento,mes_evento,dia_semana,data_contato,tipo,valor_total,num_convidados,observação,situação,cardápio,cod_etapa,preço,sinal,saldo_restante,valor_extra,forma_pag
etapa,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1,Unnamed: 12_level_1,Unnamed: 13_level_1,Unnamed: 14_level_1,Unnamed: 15_level_1,Unnamed: 16_level_1,Unnamed: 17_level_1
Em negociação,8,8,8,8,8,8,8,8,8,8,8,8,8,8,8,8,8
Fechado,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5
Não fechado,12,12,12,12,12,12,12,12,12,12,12,12,12,12,12,12,12
Não informado,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0
Realizado,5,5,5,5,5,5,5,5,5,5,5,5,5,5,4,5,4


In [52]:
# df.query("data_evento >= '2022/04' and etapa == 'Realizado'")

fig = px.bar(df.query("data_evento >= '2022/04'"), x='cod_etapa', y='valor_total', color='etapa',
      text_auto=True, title='Soma Eventos Realizados e Prospectados (início maio de 2022)')

fig.update_yaxes(title= None, ticklabelstep=2, showticklabels=True)
fig.update_xaxes(title= None, title_font = {"size": 20}, title_standoff = 10,
                ticktext=['Em negociação', 'Assinatura','Não fechado', 'Não informado', 'Realizado'],
                tickvals=['0','1','2','3','4', '5'])
fig.update_layout(title_font_size=24, bargap=0.2)

# fig.update_layout()
# fig.update_xaxes(
#                 ticktext=['Em negociação', 'Fechado', 'Não fechado', 'Não informada','Realizado'],
#                 tickvals=['0','1','2','3','4', '5'])
# fig.update_traces(name= 'etapa', visible=True, selector=dict(type='histogram'))
fig.show()
fig.write_html("eventos_maio_2022.html")

In [29]:
df.columns

Index(['data_evento', 'ano_evento', 'mes_evento', 'dia_semana', 'data_contato',
       'tipo', 'valor_total', 'num_convidados', 'observação', 'etapa',
       'situação', 'cardápio', 'cod_etapa', 'preço', 'sinal', 'saldo_restante',
       'valor_extra', 'forma_pag'],
      dtype='object')

In [53]:
etapa = df_2022.query('etapa == "Não fechado" or etapa == "Fechado" or etapa == "Realizado"')
fig = px.pie(etapa, 'etapa', title='Etapas Finais do Processo ')
fig.update_layout(title_font_size=24)
fig.update_traces(textposition='outside', textinfo='percent+label')
# fig.update_layout(title_font_size=24, bargap=0.2)
fig.show()
fig.write_html("etapas_processo_finalizadas.html")

In [31]:
df_2022.columns.values

array(['data_evento', 'ano_evento', 'mes_evento', 'dia_semana',
       'data_contato', 'tipo', 'valor_total', 'num_convidados',
       'observação', 'etapa', 'situação', 'cardápio', 'cod_etapa',
       'preço', 'sinal', 'saldo_restante', 'valor_extra', 'forma_pag'],
      dtype=object)

In [54]:
# etapa = df_2022.query('etapa == "Não fechado" or etapa == "Fechado" or etapa == "Realizado"')
fig = px.pie(df_2022, 'dia_semana', title='Procura por dia da semana')
fig.update_layout(title_font_size=24)
fig.update_traces(textposition='outside', textinfo='percent+label')
# fig.update_layout(title_font_size=24, bargap=0.2)
fig.show()
fig.write_html("dist_dia_semana.html")

In [33]:
df_2022.head()

Unnamed: 0,data_evento,ano_evento,mes_evento,dia_semana,data_contato,tipo,valor_total,num_convidados,observação,etapa,situação,cardápio,cod_etapa,preço,sinal,saldo_restante,valor_extra,forma_pag
69,2022-04-28,2022,abril,quinta-feira,2022-04-09,Não informado,6900.0,30.0,"Aula ao vivo, vai precisar de aparelhos de aúdio e som em espaço reservado.",Realizado,Realizado,Não informado,4,230.0,0.0,6900.0,0.0,Não informado
70,2022-04-17,2022,abril,domingo,2022-04-17,Jantar/palestra,4213.0,30.0,"Quantidade de pessoas:\n 30 pax não fecharam a data ainda, mas será em uma quinta ou terça as 19 até as 22 horas.\nformato aula com palestrante, precisam de mesa redonda em formato lua, e para apresentação com projeção.\niremos filmar a aula, por isso, precisamos de espaço para 2 câmeras e uma mesa com computador.\n\nprever no custo o equipamento de projeção e de captação de imagem, bem como as equipes técnicas necessárias. sugeri fazermos em outro formato em l o jantar, ou mesas de seis lugares e com a possibilidade da apresentação ser no segundo piso em formato auditório. o cliente vai analisar junto a equipe.",Em negociação,Em negociação a data esta sendo estudada,Não informado,0,230.0,0.0,6900.0,0.0,Não informado
71,2022-03-22,2022,março,terça-feira,2022-04-13,Finger /coquetel,0.0,50.0,"Welcome drink, com vinhos e espumante, um sommelier, uma recepcionsita na recepção com lista e banner . \njantar sala reservada. o cliente precisa que a montagem das mesas fosse em linha, 50 convidados.\nofereci em u e l que de qualquer forma seria possivél atender as necessidades do cliente.\nmas não aceitou, precisa que tenha este formato.",Não fechado,Não realizado,Não informado,2,0.0,0.0,0.0,0.0,Não informado
72,2022-03-17,2022,março,quinta-feira,2022-04-27,Jantar/aula novas especialidades,0.0,90.0,"Servir finger foods, nada de empratados. os convidados podem ficar em pé, mas também é importante alguns espaços para sentar e algumas mesas que sirvam de apoio durante o coquetel. resoveram ficar em gramado, e seu proximo evento será conosco.",Não fechado,Não realizado,Não informado,2,0.0,0.0,0.0,0.0,Não informado
73,2022-04-07,2022,abril,quinta-feira,2022-04-07,Jantar com palestra,0.0,90.0,"Mesas redondas, com toalhas,com disponibilidetotal.\nprecisa que todos os convidados fiquem na mesma sala, e a apresentação da mesma forma. \nespaço fisico para este formato, será uma apresentaçãocom aula médica com equipamentos de áudio visual .\nprato principal (considerar uma opção vegetariana)\nsobremesa,bebidas: pacote de bebidas não alcoolicas (água, suco e refrigerante) por 02 horas + vinho e cerveja ao consumo (enviar menu completo com rótulos e valores). minha sugestão ao cliente seria utilizarmos os dois anbientes da casa, assim seria possivél atendermos ao evento, com certeza. mas infelizmente o cliente não aceitou a proposta",Não fechado,Não realizado,Não informado,2,0.0,0.0,0.0,0.0,Não informado


In [34]:
df_2022.query('etapa == "Realizado"')

Unnamed: 0,data_evento,ano_evento,mes_evento,dia_semana,data_contato,tipo,valor_total,num_convidados,observação,etapa,situação,cardápio,cod_etapa,preço,sinal,saldo_restante,valor_extra,forma_pag
69,2022-04-28,2022,abril,quinta-feira,2022-04-09,Não informado,6900.0,30.0,"Aula ao vivo, vai precisar de aparelhos de aúdio e som em espaço reservado.",Realizado,Realizado,Não informado,4,230.0,0.0,6900.0,0.0,Não informado
75,2022-05-11,2022,maio,quarta-feira,2022-04-17,Almoço,9066.8,40.0,"Almoço inicio as 12:00 horas, mesas de seis e oito lugares,uma palestra em formato auditório com os convidados todos de frente. necessita de telão, projetor( passei contato da zaniratti). mas iremos disponibilizar os equipamentos. gostaria de estacionamento com manobrista. sem bebida alcoolica",Realizado,Realizado,Menu phuket,4,220.0,2415.0,6651.8,266.8,Entrada/ restante faturado 22/05
76,2022-05-19,2022,maio,quinta-feira,2022-05-14,Jantar/palestra,7650.0,30.0,"Jantar com palestra, o cliente solicitou equipamentos de projetor e telão.",Realizado,Realizado,Menu phuket,4,255.0,0.0,7650.0,0.0,Cartão de crédito final do evento
77,2022-05-26,2022,maio,quinta-feira,2022-05-26,Jantar,5500.0,25.0,"Jantar para 25 pessoas, três dias antes do evento será informado se haverá mais pessoas. equipamentos solicitados: projetor , telão.\n estacionamento para 25 convidados.\no cliente necessita de uma prato vegetariano.",Realizado,Realizado,Menu krab,4,220.0,0.0,,0.0,Cartão de creditofinal do evento
78,2022-05-28,2022,maio,sábado,2022-04-19,Welcome coffee/almoço,12750.0,51.0,"Welcome coffeee às 10:00horas, as 10:30horas sala privativa para aula,às 12:00horas o almoço deverá ser servido na mesma sala da apresentação aula.\nna apresentação aula, cliente solicitou que forneçamos água para os convidados. \nequipamentos fornecidos pela contratada: tela, projetor, sonorização, internet.\nnão dispomos de um profissional técnico.",Realizado,Fechado,Wellcome coffee\nmenu krab,4,250.0,0.0,12750.0,0.0,


In [55]:
fat = df_2022[df_2022['etapa'] == 'Realizado']
fig = px.histogram(fat, x= 'mes_evento', y= 'valor_total', text_auto=True, labels={'valor_total': '', 'mes_evento': ''},
            title='Eventos realizados (início Maio/2022)')
# df_2022.groupby('situação')
fig.show()
fig.write_html("eventos_realizados_2022.html")

In [56]:
fig = px.scatter(df_2022.query('valor_total > 0 and preço > 0'), 
                 x="num_convidados", y="preço", 
                 labels={'preço': 'Valor cardápio', 'num_convidados': 'Quantidade de convidados', 'dia_semana': 'Dia da semana'},
                 color='cardápio', size='valor_total')
fig.update_layout(title='Distribuição de Número de convidados por Valor do Cardápio', title_font_size=20)
fig.update_traces(marker_size=12)
fig.show()
fig.write_html("num_convidados_valor_cardápio.html")

In [37]:
df_2022.head(2)

Unnamed: 0,data_evento,ano_evento,mes_evento,dia_semana,data_contato,tipo,valor_total,num_convidados,observação,etapa,situação,cardápio,cod_etapa,preço,sinal,saldo_restante,valor_extra,forma_pag
69,2022-04-28,2022,abril,quinta-feira,2022-04-09,Não informado,6900.0,30.0,"Aula ao vivo, vai precisar de aparelhos de aúdio e som em espaço reservado.",Realizado,Realizado,Não informado,4,230.0,0.0,6900.0,0.0,Não informado
70,2022-04-17,2022,abril,domingo,2022-04-17,Jantar/palestra,4213.0,30.0,"Quantidade de pessoas:\n 30 pax não fecharam a data ainda, mas será em uma quinta ou terça as 19 até as 22 horas.\nformato aula com palestrante, precisam de mesa redonda em formato lua, e para apresentação com projeção.\niremos filmar a aula, por isso, precisamos de espaço para 2 câmeras e uma mesa com computador.\n\nprever no custo o equipamento de projeção e de captação de imagem, bem como as equipes técnicas necessárias. sugeri fazermos em outro formato em l o jantar, ou mesas de seis lugares e com a possibilidade da apresentação ser no segundo piso em formato auditório. o cliente vai analisar junto a equipe.",Em negociação,Em negociação a data esta sendo estudada,Não informado,0,230.0,0.0,6900.0,0.0,Não informado


In [38]:
df_2022.iloc[5:6]

Unnamed: 0,data_evento,ano_evento,mes_evento,dia_semana,data_contato,tipo,valor_total,num_convidados,observação,etapa,situação,cardápio,cod_etapa,preço,sinal,saldo_restante,valor_extra,forma_pag
74,2022-04-16,2022,abril,sábado,2022-04-28,Jantar,0.0,75.0,Precisam de uma sala que acomode todos os convidados e um auditorio para a apresentação do evento.\nsugeri dividirmos em duas salas e a apresentação fazermos no mesmo espaço.\nmas o cliente não quer neste formato.\n vou enviar fotos e materila da casa thai house para proximos eventos.,Não fechado,Não realizado,Não informado,2,0.0,0.0,0.0,0.0,Não informado


In [39]:
df_2022['valor_total'].mean()

3979.86

In [40]:
df_2022['num_convidados'].mean()

35.3

In [41]:
df_2022.describe()

Unnamed: 0,ano_evento,valor_total,num_convidados,cod_etapa,preço,sinal,saldo_restante,valor_extra
count,30.0,30.0,30.0,30.0,30.0,30.0,29.0,30.0
mean,2022.0,3979.86,35.3,1.63,121.5,80.5,3112.99,8.89
std,0.0,3190.42,19.85,1.35,124.29,440.92,3576.2,48.71
min,2022.0,0.0,15.0,0.0,0.0,0.0,0.0,0.0
25%,2022.0,0.0,20.75,0.25,0.0,0.0,0.0,0.0
50%,2022.0,4213.0,30.0,2.0,110.0,0.0,0.0,0.0
75%,2022.0,5593.75,40.0,2.0,245.0,0.0,6250.0,0.0
max,2022.0,12750.0,90.0,4.0,280.0,2415.0,12750.0,266.8


In [42]:
df_2022.query("valor_total > 0 and num_convidados > 30").groupby([df_2022.data_evento.dt.day, 'mes_evento', 'dia_semana'], sort=True).sum()

Unnamed: 0_level_0,Unnamed: 1_level_0,Unnamed: 2_level_0,ano_evento,valor_total,num_convidados,cod_etapa,preço,sinal,saldo_restante,valor_extra
data_evento,mes_evento,dia_semana,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1
11,maio,quarta-feira,2022,9066.8,40.0,4,220.0,2415.0,6651.8,266.8
26,julho,terça-feira,2022,4213.0,50.0,0,0.0,0.0,0.0,0.0
28,maio,sábado,2022,12750.0,51.0,4,250.0,0.0,12750.0,0.0


In [57]:
fig = px.bar(df_2022.query("valor_total > 0 and num_convidados > 0 and etapa != 'Em negociação'").groupby(['data_evento', 'dia_semana', 'mes_evento'], sort=True).sum(),
       x="num_convidados",y="valor_total", text_auto=False, 
       title='Valor por quantidade de convidados (início Maio/2022)', barmode='group',
       labels={'valor_total': 'Valor acumulado', 'num_convidados': 'Quantidade de convidados'})

fig.update_layout(bargap=0.1)
fig.show()
fig.write_html("valor_qtde_pessoas.html")

In [58]:
fig = px.scatter(df.query("num_convidados > 0 and valor_total > 0"),
                 x="num_convidados", y="valor_total", trendline="ols",
                labels={'num_convidados': 'Quantidade convidados', 'valor_total': 'Valor evento'},
                title='Regressão linear - Previsão valor de evento por número de convidados',
                color='num_convidados', size='num_convidados', size_max=15, 
                color_continuous_scale=px.colors.cyclical.IceFire, )
fig.show()
fig.write_html("regressão_linear.html")


# fig = px.scatter_mapbox(df, lat="centroid_lat", lon="centroid_lon", color="peak_hour", size="car_hours",
#                   color_continuous_scale=px.colors.cyclical.IceFire, size_max=15, zoom=10,
#                   mapbox_style="carto-positron")

In [45]:
df_2022.head()

Unnamed: 0,data_evento,ano_evento,mes_evento,dia_semana,data_contato,tipo,valor_total,num_convidados,observação,etapa,situação,cardápio,cod_etapa,preço,sinal,saldo_restante,valor_extra,forma_pag
69,2022-04-28,2022,abril,quinta-feira,2022-04-09,Não informado,6900.0,30.0,"Aula ao vivo, vai precisar de aparelhos de aúdio e som em espaço reservado.",Realizado,Realizado,Não informado,4,230.0,0.0,6900.0,0.0,Não informado
70,2022-04-17,2022,abril,domingo,2022-04-17,Jantar/palestra,4213.0,30.0,"Quantidade de pessoas:\n 30 pax não fecharam a data ainda, mas será em uma quinta ou terça as 19 até as 22 horas.\nformato aula com palestrante, precisam de mesa redonda em formato lua, e para apresentação com projeção.\niremos filmar a aula, por isso, precisamos de espaço para 2 câmeras e uma mesa com computador.\n\nprever no custo o equipamento de projeção e de captação de imagem, bem como as equipes técnicas necessárias. sugeri fazermos em outro formato em l o jantar, ou mesas de seis lugares e com a possibilidade da apresentação ser no segundo piso em formato auditório. o cliente vai analisar junto a equipe.",Em negociação,Em negociação a data esta sendo estudada,Não informado,0,230.0,0.0,6900.0,0.0,Não informado
71,2022-03-22,2022,março,terça-feira,2022-04-13,Finger /coquetel,0.0,50.0,"Welcome drink, com vinhos e espumante, um sommelier, uma recepcionsita na recepção com lista e banner . \njantar sala reservada. o cliente precisa que a montagem das mesas fosse em linha, 50 convidados.\nofereci em u e l que de qualquer forma seria possivél atender as necessidades do cliente.\nmas não aceitou, precisa que tenha este formato.",Não fechado,Não realizado,Não informado,2,0.0,0.0,0.0,0.0,Não informado
72,2022-03-17,2022,março,quinta-feira,2022-04-27,Jantar/aula novas especialidades,0.0,90.0,"Servir finger foods, nada de empratados. os convidados podem ficar em pé, mas também é importante alguns espaços para sentar e algumas mesas que sirvam de apoio durante o coquetel. resoveram ficar em gramado, e seu proximo evento será conosco.",Não fechado,Não realizado,Não informado,2,0.0,0.0,0.0,0.0,Não informado
73,2022-04-07,2022,abril,quinta-feira,2022-04-07,Jantar com palestra,0.0,90.0,"Mesas redondas, com toalhas,com disponibilidetotal.\nprecisa que todos os convidados fiquem na mesma sala, e a apresentação da mesma forma. \nespaço fisico para este formato, será uma apresentaçãocom aula médica com equipamentos de áudio visual .\nprato principal (considerar uma opção vegetariana)\nsobremesa,bebidas: pacote de bebidas não alcoolicas (água, suco e refrigerante) por 02 horas + vinho e cerveja ao consumo (enviar menu completo com rótulos e valores). minha sugestão ao cliente seria utilizarmos os dois anbientes da casa, assim seria possivél atendermos ao evento, com certeza. mas infelizmente o cliente não aceitou a proposta",Não fechado,Não realizado,Não informado,2,0.0,0.0,0.0,0.0,Não informado


In [46]:
# # função agg
# df_2022_agrupado_pelo_mes = df_2022.groupby('mes_evento', sort=False).agg({ 'etapa': np.count_nonzero }).reset_index()
# df_2022_agrupado_pelo_mes

In [47]:
# DataFrame.groupby(by=None, axis=0, level=None, as_index=True, sort=True, group_keys=True,
#                   squeeze=NoDefault.no_default, observed=False, dropna=True)
# df.groupby([df['data_evento'].dt.year, df['data_evento'].dt.month_name()]).sum()
tab = df.groupby([df['ano_evento'], df['mes_evento']]).sum().reset_index().sort_values(['mes_evento'], ascending=True)
display(tab)

Unnamed: 0,ano_evento,mes_evento,valor_total,num_convidados,cod_etapa,preço,sinal,saldo_restante,valor_extra
15,2022,abril,20900.0,265.0,12,680.0,1200.0,22387.0,987.0
9,2019,abril,7080.0,0.0,3,0.0,0.0,0.0,0.0
0,2018,agosto,44552.7,200.0,15,0.0,0.0,0.0,0.0
16,2022,agosto,4213.0,20.0,0,0.0,0.0,0.0,0.0
10,2019,dezembro,0.0,0.0,6,0.0,0.0,0.0,0.0
...,...,...,...,...,...,...,...,...,...
6,2018,novembro,68800.0,310.0,39,0.0,0.0,0.0,0.0
7,2018,outubro,31181.0,213.0,30,0.0,0.0,0.0,0.0
14,2019,outubro,0.0,0.0,3,0.0,0.0,0.0,0.0
21,2022,outubro,4213.0,20.0,0,0.0,0.0,0.0,0.0


In [48]:
tab.to_excel('tabela_2018_2022.xlsx', index=False)