# Tabela vendas

#### Bibliotécas

- `pip install pandas` analise de dados
- `pip install openpyxl` para ler excel
- `pip install plotly` gráficos
- `pi install nbformat` formatar

#### Carregando os dados do Excel

In [2]:
import pandas as pd
# ler o arquivo
dados = pd.read_csv("Dados-BMPB-2024.csv")

In [3]:
# Mapeamento dos nomes das colunas antigos para os novos
novo_nome_colunas = {
    "occurrence": "Registro",
    "type": "Tipo",
    "subtype": "Subtipo",
    "dispatch_group": "Grupo de dispacho",
    "address": "Endereço",
    "dispatched": "Data do dispacho",
    "devices": "VTR",
    "communicated": "Hora comunicada",
    "received": "Recebida",
    "in_route": "Hora recebida",
    "arrival_on_site": "Hora de chagada",
    "in_transport": "Hora em transporte",
    "arrival_in_transport": "Hora da chagada",
    "closed": "Data encerramento"
}

# Renomear as colunas
dados.rename(columns=novo_nome_colunas, inplace=True)

#### Análises exploratórias

In [4]:
# visualizando as 10 primeiras linhas
dados.head(10)

Unnamed: 0,Registro,Tipo,Subtipo,Grupo de dispacho,Endereço,Data do dispacho,VTR,Hora comunicada,Recebida,Hora recebida,Hora de chagada,Hora em transporte,Hora da chagada,Data encerramento
0,CBM2024000019,[10208] Abalroamento,Sem vítima,CBM AISP 11-22 ( 7°BBM ),"Pedregal, Campina Grande - PB, Brasil",01/01/2024 04:15:05,,,,,,,,01/01/2024 04:17:23
1,CBM2024000074,[10208] Abalroamento,Sem vítima,CBM AISP 01 à 07 e 24 ( 1°BBM ),"R. Dr. Gilvan Marinho Muribeca - Cabo Branco, ...",01/01/2024 17:30:53,,,,,,,,01/01/2024 18:05:41
2,CBM2024000098,[10208] Abalroamento,Com vítima não fatal,CBM AISP 14 ( 7° CIBM ),"Monteiro, PB, Brasil",01/01/2024 21:03:54,,,,,,,,01/01/2024 21:07:57
3,CBM2024000155,[10208] Abalroamento,Com vítima não fatal,CBM AISP 01 à 07 e 24 ( 1°BBM ),"Manaíra, João Pessoa - PB, Brasil",02/01/2024 16:04:41,AR66,00:00:02,00:00:02,00:13:50,00:22:19,00:00:02,00:42:30,02/01/2024 18:01:36
4,CBM2024000173,[10208] Abalroamento,Com vítima não fatal,CBM AISP 01 à 07 e 24 ( 1°BBM ),"Avenida Presidente Café Filho - Bessa, João Pe...",02/01/2024 18:15:16,AR67,00:00:03,00:00:03,00:14:19,,,,02/01/2024 18:47:45
5,CBM2024000186,[10208] Abalroamento,Com vítima não fatal,CBM AISP 01 à 07 e 24 ( 1°BBM ),"Avenida Presidente Café Filho - Bessa, João Pe...",02/01/2024 19:29:57,ABTS02,00:00:02,00:00:01,00:24:25,00:00:14,,,02/01/2024 20:20:37
6,CBM2024000187,[10208] Abalroamento,Com vítima não fatal,CBM AISP 01 à 07 e 24 ( 1°BBM ),"Santa Rita, PB, Brasil",02/01/2024 19:37:25,AR66,00:00:20,00:00:03,00:22:50,00:22:43,00:18:28,00:57:01,02/01/2024 22:30:58
7,CBM2024000288,[10208] Abalroamento,Com vítima não fatal,CBM AISP 01 à 07 e 24 ( 1°BBM ),"Av. Sapé - Manaíra, João Pessoa - PB, Brasil",04/01/2024 09:01:10,,,,,,,,04/01/2024 09:15:31
8,CBM2024000306,[10208] Abalroamento,Sem vítima,CBM AISP 01 à 07 e 24 ( 1°BBM ),Avenida Hilton Souto Maior - José Americo de A...,04/01/2024 12:27:56,,,,,,,,04/01/2024 12:28:45
9,CBM2024000341,[10208] Abalroamento,Com vítima não fatal,CBM AISP 01 à 07 e 24 ( 1°BBM ),"Conde, PB, Brasil",04/01/2024 17:18:13,,,,,,,,04/01/2024 17:30:34


In [5]:
# Visualizando as últimas linhas
dados.tail()

Unnamed: 0,Registro,Tipo,Subtipo,Grupo de dispacho,Endereço,Data do dispacho,VTR,Hora comunicada,Recebida,Hora recebida,Hora de chagada,Hora em transporte,Hora da chagada,Data encerramento
14197,CBM2024012265,[20126] Vistoria Técnica (CBM),,CBM AISP 01 à 07 e 24 ( 1°BBM ),"Avenida Presidente Afonso Pena - Bessa, João P...",27/05/2024 10:36:59,LAP61,00:00:02,00:00:01,00:26:45,00:05:06,,,27/05/2024 11:32:13
14198,CBM2024012431,[20126] Vistoria Técnica (CBM),,CBM AISP 01 à 07 e 24 ( 1°BBM ),"Rua do Desenvolvimento, 51 - Bairro das Indúst...",29/05/2024 14:05:32,LAP61,00:00:01,00:00:02,00:00:01,00:06:25,,,31/05/2024 16:02:58
14199,CBM2024012812,[20126] Vistoria Técnica (CBM),,CBM AISP 01 à 07 e 24 ( 1°BBM ),"Av. João Câncio da Silva, 1742 - Manaíra, João...",01/06/2024 17:23:24,LAP61,00:00:02,00:00:02,06:08:29,00:00:33,,,02/06/2024 00:28:30
14200,CBM2024012921,[20126] Vistoria Técnica (CBM),,CBM AISP 01 à 07 e 24 ( 1°BBM ),"R. Manoel Paulino Gomes - Mutirão, Bayeux - PB...",02/06/2024 12:36:05,LAP61,00:00:02,00:00:02,00:00:01,00:01:04,,,02/06/2024 16:27:16
14201,CBM2024013713,[20126] Vistoria Técnica (CBM),,CBM AISP 01 à 07 e 24 ( 1°BBM ),"Avenida Carneiro da Cunha - Torre, João Pessoa...",08/06/2024 10:34:26,LAP61,00:00:02,00:00:01,00:01:12,00:01:26,,,08/06/2024 18:29:20


In [6]:
# formato da tabela de dados (linhas, colunas)
dados.shape

(14202, 14)

In [7]:
# Visualizando informações das colunas
dados.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 14202 entries, 0 to 14201
Data columns (total 14 columns):
 #   Column              Non-Null Count  Dtype 
---  ------              --------------  ----- 
 0   Registro            14202 non-null  object
 1   Tipo                14202 non-null  object
 2   Subtipo             13107 non-null  object
 3   Grupo de dispacho   14202 non-null  object
 4   Endereço            14202 non-null  object
 5   Data do dispacho    14202 non-null  object
 6   VTR                 9985 non-null   object
 7   Hora comunicada     9961 non-null   object
 8   Recebida            9918 non-null   object
 9   Hora recebida       9825 non-null   object
 10  Hora de chagada     9274 non-null   object
 11  Hora em transporte  1999 non-null   object
 12  Hora da chagada     1679 non-null   object
 13  Data encerramento   14202 non-null  object
dtypes: object(14)
memory usage: 1.5+ MB


In [8]:
# análise da coluna
dados["Tipo"]

0                  [10208] Abalroamento
1                  [10208] Abalroamento
2                  [10208] Abalroamento
3                  [10208] Abalroamento
4                  [10208] Abalroamento
                      ...              
14197    [20126] Vistoria Técnica (CBM)
14198    [20126] Vistoria Técnica (CBM)
14199    [20126] Vistoria Técnica (CBM)
14200    [20126] Vistoria Técnica (CBM)
14201    [20126] Vistoria Técnica (CBM)
Name: Tipo, Length: 14202, dtype: object

In [9]:
# analisando duas ou mais colunas
dados[["Tipo","Subtipo"]]

Unnamed: 0,Tipo,Subtipo
0,[10208] Abalroamento,Sem vítima
1,[10208] Abalroamento,Sem vítima
2,[10208] Abalroamento,Com vítima não fatal
3,[10208] Abalroamento,Com vítima não fatal
4,[10208] Abalroamento,Com vítima não fatal
...,...,...
14197,[20126] Vistoria Técnica (CBM),
14198,[20126] Vistoria Técnica (CBM),
14199,[20126] Vistoria Técnica (CBM),
14200,[20126] Vistoria Técnica (CBM),


In [10]:
# análise e cálculos com describe
dados.describe()

Unnamed: 0,Registro,Tipo,Subtipo,Grupo de dispacho,Endereço,Data do dispacho,VTR,Hora comunicada,Recebida,Hora recebida,Hora de chagada,Hora em transporte,Hora da chagada,Data encerramento
count,14202,14202,13107,14202,14202,14202,9985,9961,9918,9825,9274,1999,1679,14202
unique,14202,114,189,18,7606,13704,743,476,1070,3414,4338,928,1164,14192
top,CBM2024000019,[40101] Busca de Animais,Abelha/marimbondo/similar,CBM AISP 01 à 07 e 24 ( 1°BBM ),Parque do Povo - Rua Sebastião Donato - Centro...,02/06/2024 01:30:45,LABS13,00:00:02,00:00:02,00:00:02,00:00:02,00:00:02,00:00:14,02/06/2024 17:56:15
freq,1,3455,2415,6500,516,4,608,3168,3543,974,282,465,20,2


In [11]:
# análise definindo uma coluna
dados["Tipo"].describe()

count                        14202
unique                         114
top       [40101] Busca de Animais
freq                          3455
Name: Tipo, dtype: object

In [12]:
# contagem de vendas por loja
dados["Tipo"].value_counts()

Tipo
[40101] Busca de Animais                            3455
[30401] Emergência Clínica                          1444
[20101] Ação Preventiva BM                          1259
[31202] Acidentes diversos                           886
[30801] Queda de altura                              582
                                                    ... 
[1401] Homicídio culposo                               1
[30117] Acidente:  Caminhão/Ônibus x objeto fixo       1
[2514] Manifestação Pública                            1
[301191] Acidente:  Animal x Bicicleta                 1
[1502] Dirigir Sem Habilitação                         1
Name: count, Length: 114, dtype: int64

In [13]:
# vendas por cidade
dados_agrupados = dados["Subtipo"].value_counts()
dados_agrupados.to_excel("PorSubTipo.xlsx")

In [14]:
# forma de pagamento
dados_agrupados = dados["Grupo de dispacho"].value_counts()
dados_agrupados.to_excel("PorAisp.xlsx")

#### Agrupando dados

In [15]:
# Contagem de Grupo de dispacho
dados_agrupados = dados.groupby("Grupo de dispacho")["Registro"].count().to_frame()
dados_agrupados.to_excel("PorGrupoDeDispacho.xlsx")

In [16]:
dados_agrupados = dados.groupby("Tipo")["Registro"].count().to_frame()
dados_agrupados.to_excel("PorTipo.xlsx")

In [17]:
# imprime o nome das colunas
print(dados.columns)

Index(['Registro', 'Tipo', 'Subtipo', 'Grupo de dispacho', 'Endereço',
       'Data do dispacho', 'VTR', 'Hora comunicada', 'Recebida',
       'Hora recebida', 'Hora de chagada', 'Hora em transporte',
       'Hora da chagada', 'Data encerramento'],
      dtype='object')


In [18]:
# Remover espaços em branco dos nomes das colunas
dados.columns = dados.columns.str.strip()

# Verificar novamente os nomes das colunas
print(dados.columns)


Index(['Registro', 'Tipo', 'Subtipo', 'Grupo de dispacho', 'Endereço',
       'Data do dispacho', 'VTR', 'Hora comunicada', 'Recebida',
       'Hora recebida', 'Hora de chagada', 'Hora em transporte',
       'Hora da chagada', 'Data encerramento'],
      dtype='object')


#### Procurar por data do despacho

In [19]:
# faturamento com mais de um agrupamento
dados.groupby(["Grupo de dispacho","Tipo", "Subtipo"])["Registro"].count().to_frame()

Unnamed: 0_level_0,Unnamed: 1_level_0,Unnamed: 2_level_0,Registro
Grupo de dispacho,Tipo,Subtipo,Unnamed: 3_level_1
2 REISP- EVENTOS- BM,[20101] Ação Preventiva BM,Festas e eventos,3
2 REISP- EVENTOS- BM,[20101] Ação Preventiva BM,Outras/Ações preventivas diversas,2
2 REISP- EVENTOS- BM,[2544] Apoio a Pessoa,Apoio do Corpo de Bombeiros Militar a Pessoa.,1
2 REISP- EVENTOS- BM,[31202] Acidentes diversos,Outro/ Acidentes diversos,1
2 REISP- EVENTOS- BM,[40101] Busca de Animais,Abelha/marimbondo/similar,1
...,...,...,...
OP SEMANA SANTA BM-PB,[20101] Ação Preventiva BM,Outras/Ações preventivas diversas,17
OP SEMANA SANTA BM-PB,[30401] Emergência Clínica,Convulsão,1
OP SEMANA SANTA BM-PB,[30401] Emergência Clínica,Outro/emergência clínica,3
OP SEMANA SANTA BM-PB,[31202] Acidentes diversos,Outro/ Acidentes diversos,2


#### Visualização de dados

In [20]:
import plotly.express as px


In [21]:

px.histogram(dados, x='Grupo de dispacho')

In [22]:
print(dados.columns)

Index(['Registro', 'Tipo', 'Subtipo', 'Grupo de dispacho', 'Endereço',
       'Data do dispacho', 'VTR', 'Hora comunicada', 'Recebida',
       'Hora recebida', 'Hora de chagada', 'Hora em transporte',
       'Hora da chagada', 'Data encerramento'],
      dtype='object')


#### Busca por tipo

In [41]:
import pandas as pd
import plotly.express as px

# Supondo que 'dados' já é um DataFrame carregado com suas colunas

# Agrupar por 'Tipo' e contar os registros
dados_agrupados = dados.groupby("Tipo")["Registro"].count().reset_index()

# Renomear a coluna para refletir o número de registros
dados_agrupados.columns = ['Tipo', 'Contagem']

# Ordenar os dados pela coluna 'Contagem' em ordem decrescente
dados_agrupados = dados_agrupados.sort_values(by="Contagem", ascending=False)

# Selecionar os 10 tipos com maior número de registros
top_10 = dados_agrupados.head(10)

# Somar o número de registros dos tipos que não estão no top 10
outros = pd.DataFrame([{'Tipo': 'Outros', 'Contagem': dados_agrupados[10:]["Contagem"].sum()}])

# Concatenar o top 10 com o grupo "Outros"
top_10_unido = pd.concat([top_10, outros])

# Criar o histograma
fig = px.bar(top_10_unido, x="Tipo", y="Contagem",
             title="Top 10 Tipos com Maior Número de Registros (Unindo Outros)",
             labels={"Tipo": "Tipo", "Contagem": "Número de Registros"},
             text="Contagem",)

# Mostrar o histograma
fig.show()

# Salvar o DataFrame como Excel
top_10_unido.to_excel("top_10_unido.xlsx", index=False)

# Salvar o gráfico como imagem (por exemplo, PNG)

# Salvar o gráfico como arquivo HTML
fig.write_html("histograma_top_10_unido.html")


#### Busca por aisp

In [33]:
import pandas as pd
import plotly.express as px

# Supondo que 'dados' já é um DataFrame carregado com suas colunas

# Agrupar por 'Tipo' e contar os registros
dados_agrupados = dados.groupby(["Grupo de dispacho"]).size().reset_index(name="Contagem")

# Ordenar os dados pela coluna 'Contagem' em ordem decrescente
dados_agrupados = dados_agrupados.sort_values(by="Contagem", ascending=False)

# Criar o gráfico
grafico = px.histogram(dados_agrupados,
                       x="Grupo de dispacho",
                       y="Contagem",
                       text_auto=True,
                       title="Por tipo",
                       color="Grupo de dispacho")

# Mostrar o gráfico
grafico.show()

# Salvar o gráfico como arquivo HTML
grafico.write_html("Por Grupo de despacho.html")


#### Busca por subtipo

In [52]:
import pandas as pd
import plotly.express as px

# Supondo que 'dados' já é um DataFrame carregado com suas colunas

# Agrupar por 'Tipo' e contar os registros
dados_agrupados = dados.groupby("Subtipo")["Registro"].count().reset_index()

# Renomear a coluna para refletir o número de registros
dados_agrupados.columns = ['Subtipo', 'Contagem']

# Ordenar os dados pela coluna 'Contagem' em ordem decrescente
dados_agrupados = dados_agrupados.sort_values(by="Contagem", ascending=False)

# Selecionar os 10 tipos com maior número de registros
top_10 = dados_agrupados.head(10)

# Somar o número de registros dos tipos que não estão no top 10
outros = pd.DataFrame([{'Subtipo': 'Outros', 'Contagem': dados_agrupados[10:]["Contagem"].sum()}])

# Concatenar o top 10 com o grupo "Outros"
top_10_unido = pd.concat([top_10, outros])

# Criar o histograma
fig = px.bar(top_10_unido, x="Subtipo", y="Contagem",
             title="Top 10 Tipos com Maior Número de Registros (Unindo Outros)",
             labels={"Subtipo": "Subtipo", "Contagem": "Número de Registros"},
             text="Contagem",)

# Mostrar o histograma
fig.show()

# Salvar o DataFrame como Excel
top_10_unido.to_excel("top_10_subtipo_unido.xlsx", index=False)

# Salvar o gráfico como imagem (por exemplo, PNG)

# Salvar o gráfico como arquivo HTML
fig.write_html("histograma_top_10_subtipo_unido.html")


#### Contagem por dia da semana

In [None]:
import pandas as pd
import plotly.express as px

# Supondo que 'dados' já é um DataFrame carregado com suas colunas, incluindo a coluna 'Data do dispacho'

# Converter a coluna de data para o tipo datetime com tratamento de erros
dados['Data do dispacho'] = pd.to_datetime(dados['Data do dispacho'], errors='coerce')

# Remover linhas com valores de data inválidos (NaT)
dados = dados.dropna(subset=['Data do dispacho'])

# Extrair o dia da semana e contar os registros
dados_agrupados = dados.groupby(dados['Data do dispacho'].dt.dayofweek).size().reset_index(name="Contagem")

# Renomear os dias da semana para nomes mais legíveis
nomes_dias_semana = {0: 'Segunda', 1: 'Terça', 2: 'Quarta', 3: 'Quinta', 4: 'Sexta', 5: 'Sábado', 6: 'Domingo'}
dados_agrupados['Dia da Semana'] = dados_agrupados['Data do dispacho'].apply(lambda x: x.strftime('%A')).map(nomes_dias_semana)

# Ordenar os dados pela ordem dos dias da semana
dados_agrupados = dados_agrupados.sort_values(by="Data do dispacho")

# Criar o gráfico
grafico = px.bar(dados_agrupados,
                 x="Dia da Semana",
                 y="Contagem",
                 text="Contagem",
                 title="Contagem de Registros por Dia da Semana - Data do Dispacho")

# Mostrar o gráfico
grafico.show()

# Salvar o gráfico como arquivo HTML
grafico.write_html("contagem_por_dia_semana_data_dispacho.html")


In [40]:
import pandas as pd
import plotly.express as px

# Supondo que 'dados' já é um DataFrame carregado com suas colunas, incluindo a coluna 'Data do dispacho'

# Converter a coluna de data para o tipo datetime com tratamento de erros
dados['Data do dispacho'] = pd.to_datetime(dados['Data do dispacho'], errors='coerce')

# Remover linhas com valores de data inválidos (NaT)
dados = dados.dropna(subset=['Data do dispacho'])

# Extrair o mês e contar os registros
dados_agrupados = dados.groupby(dados['Data do dispacho'].dt.month).size().reset_index(name="Contagem")

# Renomear os meses para nomes mais legíveis
nomes_meses = {1: 'Janeiro', 2: 'Fevereiro', 3: 'Março', 4: 'Abril', 5: 'Maio', 6: 'Junho', 7: 'Julho', 8: 'Agosto', 9: 'Setembro', 10: 'Outubro', 11: 'Novembro', 12: 'Dezembro'}
dados_agrupados['Mês'] = dados_agrupados['Data do dispacho'].map(nomes_meses)

# Ordenar os dados pela ordem dos meses
dados_agrupados = dados_agrupados.sort_values(by="Data do dispacho")

# Criar o gráfico
grafico = px.bar(dados_agrupados,
                 x="Mês",
                 y="Contagem",
                 text="Contagem",
                 title="Contagem de Registros por Mês - Data do Dispacho")

# Mostrar o gráfico
grafico.show()

# Salvar o gráfico como arquivo HTML
grafico.write_html("contagem_por_mes_data_dispacho.html")


#### Listas e comando for

In [51]:
import pandas as pd
import plotly.express as px

# Supondo que 'dados' já é um DataFrame carregado com suas colunas, incluindo a coluna 'Data do dispacho'

# Converter a coluna de data para o tipo datetime com tratamento de erros
dados['Data do dispacho'] = pd.to_datetime(dados['Data do dispacho'], errors='coerce')

# Ordenar os dados pela ordem dos meses
dados = dados.sort_values(by="Data do dispacho")

# Criar o DataFrame com a contagem de registros por Tipo e Subtipo
dados_agrupados = dados.groupby(["Tipo", "Subtipo"]).size().reset_index(name="Contagem")

lista_colunas = ["Tipo", "Subtipo", "Hora recebida", "Hora comunicada"]

for coluna in lista_colunas:
    if coluna in dados_agrupados.columns:  # Verifica se a coluna está presente no DataFrame
        grafico = px.histogram(dados_agrupados,
                               x=coluna,
                               y="Contagem",
                               title=f"Contagem por {coluna}",
                               color="Tipo")
        grafico.show()
        grafico.write_html(f"contagem_por_{coluna.lower()}.html")
    else:
        print(f"A coluna {coluna} não está presente no DataFrame.")


A coluna Hora recebida não está presente no DataFrame.
A coluna Hora comunicada não está presente no DataFrame.


In [49]:
print(dados.columns)

Index(['Registro', 'Tipo', 'Subtipo', 'Grupo de dispacho', 'Endereço',
       'Data do dispacho', 'VTR', 'Hora comunicada', 'Recebida',
       'Hora recebida', 'Hora de chagada', 'Hora em transporte',
       'Hora da chagada', 'Data encerramento'],
      dtype='object')
