# Leitura dos dados

In [1]:
import pandas as pd

In [2]:
pedido = pd.read_csv('pedido.csv')
pedido.head()

Unnamed: 0,idPedido,dtPedido,flKetchup,descUF,txtRecado
0,0,2023-05-11T10:59:33.000+0000,,Goiás,
1,1,2023-05-11T11:23:42.000+0000,,Paraná,Aquela pizza perfeita! :-D
2,2,2023-05-11T11:24:29.000+0000,,São Paulo,Muito obrigado!!
3,3,2023-05-11T11:29:39.000+0000,,São Paulo,
4,4,2023-05-11T11:31:30.000+0000,,Rio Grande do Sul,Capricha no peperoni


In [3]:
produto = pd.read_csv('produto.csv')
produto.head()

Unnamed: 0,descItem,vlPreco
0,abacate,5.25
1,abacaxi,2.5
2,abobrinha,2.0
3,alcaparra,3.0
4,alho,1.0


In [4]:
item_pedido = pd.read_csv('item_pedido.csv')
item_pedido.head()

Unnamed: 0,idPedido,descTipoItem,descItem
0,0,bebida,refrigerante
1,0,borda,borda tradicional
2,0,ingrediente 1,pepperoni
3,0,ingrediente 2,orégano
4,0,ingrediente 3,frango


# Limpeza

In [5]:
pedido['dtPedido'] = pd.to_datetime(pedido['dtPedido'])
pedido.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 1106 entries, 0 to 1105
Data columns (total 5 columns):
 #   Column     Non-Null Count  Dtype              
---  ------     --------------  -----              
 0   idPedido   1106 non-null   int64              
 1   dtPedido   1106 non-null   datetime64[ns, UTC]
 2   flKetchup  1097 non-null   object             
 3   descUF     1106 non-null   object             
 4   txtRecado  538 non-null    object             
dtypes: datetime64[ns, UTC](1), int64(1), object(3)
memory usage: 43.3+ KB


In [6]:
pedido['diaSemana'] = pedido['dtPedido'].dt.day_name()
pedido['horaCompleta'] = pedido['dtPedido'].dt.time
pedido['hora'] = pedido['dtPedido'].dt.hour

In [7]:
pedido.diaSemana.unique()

array(['Thursday', 'Friday', 'Saturday', 'Sunday', 'Monday', 'Tuesday',
       'Wednesday'], dtype=object)

In [8]:
dia_semana_pt = {'Sunday': 'Domingo','Monday':'Segunda-Feira',
                 'Tuesday':'Terça-Feira','Wednesday':'Quarta-Feira',
                 'Thursday':'Quinta-Feira','Friday':'Sexta-Feira',
                 'Saturday':'Sábado'}

In [9]:
pedido['diaSemana'] = pedido['diaSemana'].map(dia_semana_pt)
pedido.head()

Unnamed: 0,idPedido,dtPedido,flKetchup,descUF,txtRecado,diaSemana,horaCompleta,hora
0,0,2023-05-11 10:59:33+00:00,,Goiás,,Quinta-Feira,10:59:33,10
1,1,2023-05-11 11:23:42+00:00,,Paraná,Aquela pizza perfeita! :-D,Quinta-Feira,11:23:42,11
2,2,2023-05-11 11:24:29+00:00,,São Paulo,Muito obrigado!!,Quinta-Feira,11:24:29,11
3,3,2023-05-11 11:29:39+00:00,,São Paulo,,Quinta-Feira,11:29:39,11
4,4,2023-05-11 11:31:30+00:00,,Rio Grande do Sul,Capricha no peperoni,Quinta-Feira,11:31:30,11


# Merge

In [10]:
df = pd.merge(pedido, item_pedido, on='idPedido', how='inner')
df.head()

Unnamed: 0,idPedido,dtPedido,flKetchup,descUF,txtRecado,diaSemana,horaCompleta,hora,descTipoItem,descItem
0,0,2023-05-11 10:59:33+00:00,,Goiás,,Quinta-Feira,10:59:33,10,bebida,refrigerante
1,0,2023-05-11 10:59:33+00:00,,Goiás,,Quinta-Feira,10:59:33,10,borda,borda tradicional
2,0,2023-05-11 10:59:33+00:00,,Goiás,,Quinta-Feira,10:59:33,10,ingrediente 1,pepperoni
3,0,2023-05-11 10:59:33+00:00,,Goiás,,Quinta-Feira,10:59:33,10,ingrediente 2,orégano
4,0,2023-05-11 10:59:33+00:00,,Goiás,,Quinta-Feira,10:59:33,10,ingrediente 3,frango


In [11]:
df = pd.merge(df, produto, on='descItem', how='inner')
df.head()

Unnamed: 0,idPedido,dtPedido,flKetchup,descUF,txtRecado,diaSemana,horaCompleta,hora,descTipoItem,descItem,vlPreco
0,0,2023-05-11 10:59:33+00:00,,Goiás,,Quinta-Feira,10:59:33,10,bebida,refrigerante,7.25
1,1,2023-05-11 11:23:42+00:00,,Paraná,Aquela pizza perfeita! :-D,Quinta-Feira,11:23:42,11,bebida,refrigerante,7.25
2,3,2023-05-11 11:29:39+00:00,,São Paulo,,Quinta-Feira,11:29:39,11,bebida,refrigerante,7.25
3,8,2023-05-11 12:01:49+00:00,,Goiás,,Quinta-Feira,12:01:49,12,bebida,refrigerante,7.25
4,10,2023-05-11 12:19:47+00:00,True,Goiás,"Amo vocês, quero dividir a pizza com vocês ♥️",Quinta-Feira,12:19:47,12,bebida,refrigerante,7.25


In [12]:
df = df.sort_values('idPedido')

# Análise

O objetivo é conseguir um pequeno resumo das operações por Estado e plotar isso em um mapa

## Ticket médio por estado

In [13]:
ticketMedio = df.groupby(['descUF', 'idPedido'])['vlPreco'].sum().groupby('descUF').mean().reset_index()
ticketMedio.columns = ['descUF','ticketMedio']
ticketMedio['ticketMedio'] = ticketMedio['ticketMedio'].round(2)
ticketMedio

Unnamed: 0,descUF,ticketMedio
0,Acre,52.5
1,Alagoas,42.31
2,Amapá,50.2
3,Amazonas,46.79
4,Bahia,45.37
5,Ceará,46.95
6,Distrito Federal,43.16
7,Espírito Santo,45.83
8,Goiás,45.21
9,Maranhão,44.96


## Faturamento

In [14]:
faturamento = df.groupby('descUF')['vlPreco'].sum().reset_index()
faturamento.columns = ['descUF','faturamento']
faturamento

Unnamed: 0,descUF,faturamento
0,Acre,105.0
1,Alagoas,507.75
2,Amapá,50.2
3,Amazonas,187.15
4,Bahia,1951.0
5,Ceará,2065.6
6,Distrito Federal,1424.15
7,Espírito Santo,1466.6
8,Goiás,1582.35
9,Maranhão,359.7


## Total de Pedidos por Estado

In [15]:
totalPedidos = pedido.groupby('descUF')['idPedido'].count().reset_index()
totalPedidos.columns = ['descUF','totalPedidos']
totalPedidos

Unnamed: 0,descUF,totalPedidos
0,Acre,2
1,Alagoas,12
2,Amapá,1
3,Amazonas,4
4,Bahia,43
5,Ceará,44
6,Distrito Federal,33
7,Espírito Santo,32
8,Goiás,35
9,Maranhão,8


## Dia mais movimentado por estado

In [16]:
diaMovimentado = pedido.groupby(['descUF', 'diaSemana'])['idPedido'].count().groupby('descUF').idxmax().reset_index()
diaMovimentado.columns = ['descUF','diaMovimentado']
diaMovimentado['diaMovimentado'] = diaMovimentado['diaMovimentado'].apply(lambda x: x[1])
diaMovimentado

Unnamed: 0,descUF,diaMovimentado
0,Acre,Quarta-Feira
1,Alagoas,Quarta-Feira
2,Amapá,Quarta-Feira
3,Amazonas,Quarta-Feira
4,Bahia,Quarta-Feira
5,Ceará,Quarta-Feira
6,Distrito Federal,Quarta-Feira
7,Espírito Santo,Quarta-Feira
8,Goiás,Quarta-Feira
9,Maranhão,Quarta-Feira


## Item favorito por Estado

In [17]:
ingredienteFavorito = df[df.descTipoItem.str.startswith('ingrediente')]
ingredienteFavorito = ingredienteFavorito.groupby(['descUF', 'descItem'])['descItem'].count().groupby('descUF').idxmax().reset_index()
ingredienteFavorito.columns = ['descUF','itemFav']
ingredienteFavorito['itemFav'] = ingredienteFavorito['itemFav'].apply(lambda x: x[1])
ingredienteFavorito['itemFav'] = ingredienteFavorito['itemFav'].str.title()
ingredienteFavorito

Unnamed: 0,descUF,itemFav
0,Acre,Berinjela
1,Alagoas,Cebola
2,Amapá,Bacon
3,Amazonas,Azeitona
4,Bahia,Cebola
5,Ceará,Tomate
6,Distrito Federal,Pepperoni
7,Espírito Santo,Bacon
8,Goiás,Azeitona
9,Maranhão,Cebola


## Borda mais pedida por Estado

In [18]:
bordaFavorita = df[df.descTipoItem == 'borda']
bordaFavorita = bordaFavorita.groupby(['descUF', 'descItem'])['descItem'].count().groupby('descUF').idxmax().reset_index()
bordaFavorita.columns = ['descUF','bordaFav']
bordaFavorita['bordaFav'] = bordaFavorita['bordaFav'].apply(lambda x: x[1])
bordaFavorita['bordaFav'] = bordaFavorita['bordaFav'].str.replace('borda', '').str.replace('sabor', '').str.title().str.lstrip()

bordaFavorita

Unnamed: 0,descUF,bordaFav
0,Acre,Cream Cheese
1,Alagoas,Tradicional
2,Amapá,Catupiry
3,Amazonas,Catupiry
4,Bahia,Tradicional
5,Ceará,Catupiry
6,Distrito Federal,Tradicional
7,Espírito Santo,Catupiry
8,Goiás,Tradicional
9,Maranhão,Tradicional


# Merge Analise por Estado

In [19]:
df_por_estado = pd.merge(ticketMedio,totalPedidos,on='descUF')
df_por_estado.head()

Unnamed: 0,descUF,ticketMedio,totalPedidos
0,Acre,52.5,2
1,Alagoas,42.31,12
2,Amapá,50.2,1
3,Amazonas,46.79,4
4,Bahia,45.37,43


In [20]:
df_por_estado = pd.merge(df_por_estado,faturamento,on='descUF')
df_por_estado.head()

Unnamed: 0,descUF,ticketMedio,totalPedidos,faturamento
0,Acre,52.5,2,105.0
1,Alagoas,42.31,12,507.75
2,Amapá,50.2,1,50.2
3,Amazonas,46.79,4,187.15
4,Bahia,45.37,43,1951.0


In [21]:
df_por_estado = pd.merge(df_por_estado,diaMovimentado,on='descUF')
df_por_estado.head()

Unnamed: 0,descUF,ticketMedio,totalPedidos,faturamento,diaMovimentado
0,Acre,52.5,2,105.0,Quarta-Feira
1,Alagoas,42.31,12,507.75,Quarta-Feira
2,Amapá,50.2,1,50.2,Quarta-Feira
3,Amazonas,46.79,4,187.15,Quarta-Feira
4,Bahia,45.37,43,1951.0,Quarta-Feira


In [22]:
df_por_estado = pd.merge(df_por_estado,ingredienteFavorito,on='descUF')
df_por_estado.head()

Unnamed: 0,descUF,ticketMedio,totalPedidos,faturamento,diaMovimentado,itemFav
0,Acre,52.5,2,105.0,Quarta-Feira,Berinjela
1,Alagoas,42.31,12,507.75,Quarta-Feira,Cebola
2,Amapá,50.2,1,50.2,Quarta-Feira,Bacon
3,Amazonas,46.79,4,187.15,Quarta-Feira,Azeitona
4,Bahia,45.37,43,1951.0,Quarta-Feira,Cebola


In [23]:
df_por_estado = pd.merge(df_por_estado,bordaFavorita,on='descUF')
df_por_estado.head()

Unnamed: 0,descUF,ticketMedio,totalPedidos,faturamento,diaMovimentado,itemFav,bordaFav
0,Acre,52.5,2,105.0,Quarta-Feira,Berinjela,Cream Cheese
1,Alagoas,42.31,12,507.75,Quarta-Feira,Cebola,Tradicional
2,Amapá,50.2,1,50.2,Quarta-Feira,Bacon,Catupiry
3,Amazonas,46.79,4,187.15,Quarta-Feira,Azeitona,Catupiry
4,Bahia,45.37,43,1951.0,Quarta-Feira,Cebola,Tradicional


## Visualizacao

In [24]:
import folium

coord = {
    'descUF': ['Acre', 'Alagoas', 'Amapá', 'Amazonas', 'Bahia', 'Ceará', 'Distrito Federal',
               'Espírito Santo', 'Goiás', 'Maranhão', 'Mato Grosso', 'Mato Grosso do Sul',
               'Minas Gerais', 'Pará', 'Paraíba', 'Paraná', 'Pernambuco', 'Piauí',
               'Rio de Janeiro', 'Rio Grande do Norte', 'Rio Grande do Sul', 'Rondônia',
               'Roraima', 'Santa Catarina', 'São Paulo', 'Sergipe', 'Tocantins'],
    'lat': [-9.0238, -9.5713, 1.3545, -3.4653, -12.5797, -5.4984, -15.7998, -19.1834, -15.827, -5.42,
            -12.6819, -20.7722, -18.5265, -3.4653, -7.24, -24.89, -8.8137, -6.6, -22.9068, -5.4026,
            -30.0346, -11.5057, 2.7376, -27.2423, -23.5505, -10.5741, -10.1753],
    'lon': [-70.812, -36.7819, -51.916, -62.2159, -41.7007, -39.3206, -47.8645, -40.3089, -49.8362, -45.4444,
            -56.9211, -54.7852, -44.1588, -52.8696, -36.782, -51.55, -36.9541, -42.2792, -43.1729, -36.9541,
            -51.2177, -63.5806, -62.0751, -50.2189, -46.6333, -37.3857, -48.2982]
}

coordenadas = pd.DataFrame(coord)

In [25]:
df_por_estado = pd.merge(df_por_estado,coordenadas,on='descUF')
df_por_estado

Unnamed: 0,descUF,ticketMedio,totalPedidos,faturamento,diaMovimentado,itemFav,bordaFav,lat,lon
0,Acre,52.5,2,105.0,Quarta-Feira,Berinjela,Cream Cheese,-9.0238,-70.812
1,Alagoas,42.31,12,507.75,Quarta-Feira,Cebola,Tradicional,-9.5713,-36.7819
2,Amapá,50.2,1,50.2,Quarta-Feira,Bacon,Catupiry,1.3545,-51.916
3,Amazonas,46.79,4,187.15,Quarta-Feira,Azeitona,Catupiry,-3.4653,-62.2159
4,Bahia,45.37,43,1951.0,Quarta-Feira,Cebola,Tradicional,-12.5797,-41.7007
5,Ceará,46.95,44,2065.6,Quarta-Feira,Tomate,Catupiry,-5.4984,-39.3206
6,Distrito Federal,43.16,33,1424.15,Quarta-Feira,Pepperoni,Tradicional,-15.7998,-47.8645
7,Espírito Santo,45.83,32,1466.6,Quarta-Feira,Bacon,Catupiry,-19.1834,-40.3089
8,Goiás,45.21,35,1582.35,Quarta-Feira,Azeitona,Tradicional,-15.827,-49.8362
9,Maranhão,44.96,8,359.7,Quarta-Feira,Cebola,Tradicional,-5.42,-45.4444


In [34]:
# Criar um mapa utilizando o Folium
mapa = folium.Map(location=[-15.77972, -47.92972], zoom_start=3.5)

# Adicionar marcadores no mapa com base nos dados do DataFrame
for index, row in df_por_estado.iterrows():
    tooltip_text = f"""<strong>{row['descUF']}</strong><br>
                        Faturamento: R$ {row['faturamento']}<br>
                        Ticket Médio: R${row['ticketMedio']}<br>
                        Total Pedidos: {row['totalPedidos']}<br>
                        Dia Mais Movimentado: {row['diaMovimentado']}<br>
                        Ingrediente Favorito: {row['itemFav']}<br>
                        Borda Favorita: {row['bordaFav']}<br>"""
    folium.Marker(location=[row['lat'], row['lon']],
                  icon=folium.CustomIcon(icon_image='icon_pizza.png', icon_size=(22, 22)),
                  tooltip=folium.Tooltip(tooltip_text, sticky=True)).add_to(mapa)

# Exibir o mapa
mapa

In [35]:
mapa.save('pizzaria.html')