# Pipeline ETL: Agregando Datasets do SP196 em um Arquivo Consolidado

## Aviso: Comentários resumidos neste código; consulte a  [Documentação](https://github.com/DemikFR/Analise-Controle-Zoonoses-SP156/blob/main/README.md) para obter uma compreensão mais detalhada das razões por trás de cada trecho de código.

## Gerar o dataframe com os dados da Prefeitura

In [1]:
import requests
import re
from bs4 import BeautifulSoup as bs
import pandas as pd
from io import StringIO
import chardet

### Criar o dataframe que conterá os dados necessários para a análise

In [2]:
df = pd.DataFrame()
dfs = []

## Função para buscar os caminhos para o download de cada dataset

In [3]:
def get_soup(url, search):
    response = requests.get(url)
    
    # Verificar se a conexão foi bem sucedida
    if response.status_code == 200:
        soup = bs(response.content, 'html.parser')

        # Retornar as páginas onde terão as de download
        return soup.find_all('a', href=True, attrs={'title': re.compile(search)}) 
    else:
        return f'Página{link["title"]} está inacessível. Código: {response.status_code}'

## Código para inserir os dados em uma lista

In [4]:
# URL base do site da Prefeitura
url_base = 'http://dados.prefeitura.sp.gov.br'

# URL inicial onde estarão os links para os datasets
url_inicial = 'http://dados.prefeitura.sp.gov.br/dataset/dados-do-sp156'

# extensão do dataset para filtrar
file_type = '.csv'

for link in get_soup(url_inicial, r'^Dados do SP156 -.*'):
    
    # Pegar o link de download
    for page in get_soup(url_base+link['href'], r'^http://dados.prefeitura.sp.gov.br/dataset/.*'):
        link_download = page['href']
        
        # Verificar se é o arquivo a ser baixado é Excel
        if file_type in link_download:
            
            # Pegar o conteúdo do CSV
            response_csv = requests.get(page['href'])
            
            # Cada datset tem um encoding diferente, por isso foi necessário usar a biblioteca chardet para identificar 
            # automaticamente qual é.
            encoding = chardet.detect(response_csv.content)['encoding']
            
            # Colocar os dados na tabela auxiliar
            if int(link["title"][-4:]) >= 2021:
                df3 = pd.read_csv(StringIO(response_csv.content.decode(encoding)), sep=';', encoding=encoding, low_memory=False)
            else:
                df3 = pd.read_csv(StringIO(response_csv.content.decode(encoding)), sep=',', encoding=encoding, low_memory=False)
                
            dfs.append(df3)  # Adicionar o DataFrame intermediário à lista
            
            # Inserir os dados na planilha original
            print(f'Os dados do {link["title"]} foram inseridos com sucesso.')

Os dados do Dados do SP156 - 1º TRI 2023 foram inseridos com sucesso.
Os dados do Dados do SP156 - 4º TRI 2022 foram inseridos com sucesso.
Os dados do Dados do SP156 - 3º TRI 2022 foram inseridos com sucesso.
Os dados do Dados do SP156 - 2º TRI 2022 foram inseridos com sucesso.
Os dados do Dados do SP156 - 1º TRI 2022 foram inseridos com sucesso.
Os dados do Dados do SP156 - 4º TRI 2021 foram inseridos com sucesso.
Os dados do Dados do SP156 - 3º TRI 2021 foram inseridos com sucesso.
Os dados do Dados do SP156 - 2º TRI 2021 foram inseridos com sucesso.
Os dados do Dados do SP156 - 1º TRI 2021 foram inseridos com sucesso.
Os dados do Dados do SP156 - Dezembro - 2020 foram inseridos com sucesso.
Os dados do Dados do SP156 - Outubro e Novembro - 2020 foram inseridos com sucesso.
Os dados do Dados do SP156 - 3º TRI 2020 foram inseridos com sucesso.
Os dados do Dados do SP156 - 1º SEM 2020 foram inseridos com sucesso.
Os dados do Dados do SP156 - 2º SEM 2019 foram inseridos com sucesso.
Os

## Criar o dataframe com todos os datasets coletados

In [5]:
df = pd.concat(dfs, ignore_index=True)

In [6]:
df.shape

(13688540, 33)

## Verificar todas as colunas disponibilizadas

In [7]:
df.any()

Data de abertura                                                          True
Canal                                                                     True
Tema                                                                      True
Assunto                                                                   True
Serviço                                                                   True
Logradouro                                                                True
Número                                                                    True
CEP                                                                       True
Subprefeitura                                                             True
Distrito                                                                  True
Setor                                                                     True
Quadra                                                                    True
Latitude                                            

## Manter apenas os campos necessários

In [8]:
df = df[['Data de abertura', 'Tema', 'Assunto', 'Especificação do assunto', 'Serviço', 'Bairro', 'Distrito'
         , 'Status da solicitação', 'Data do parecer']]

## Apagar registros que por terem muitos valores nulo, não servirão para a análise

In [9]:
df = df.dropna(thresh=4)

In [10]:
df[df.Assunto.isnull()]

Unnamed: 0,Data de abertura,Tema,Assunto,Especificação do assunto,Serviço,Bairro,Distrito,Status da solicitação,Data do parecer


In [11]:
df.sample(10)

Unnamed: 0,Data de abertura,Tema,Assunto,Especificação do assunto,Serviço,Bairro,Distrito,Status da solicitação,Data do parecer
2069587,2022-01-24 13:44:35,Animais,Animais que transmitem doenças ou risco à saúde,,Abelhas e Vespas - Solicitar vistoria em ninhos,,CAMPO BELO,FINALIZADO,2022-04-13 17:57:47
937865,2022-12-10 09:16:54,Ouvidoria Geral do Município,Ouvidoria Geral do Município,,Reclamação,,,AGUARDANDO ATENDIMENTO,2023-01-06 08:23:15
5803840,2020-12-12 21:23:34.046,Cidadania e assistência social,Renda Básica Emergencial,,Renda Básica Emergencial - Consultar benefício...,,,FINALIZADA,2020-12-12 21:23:35.704
10136407,2017-06-08 19:37:47.271,Lixo e limpeza,"Ponto viciado, entulho e caçamba de entulho",,Entulho e grandes objetos em via pública - sol...,,ITAIM BIBI,FINALIZADA,2018-02-10 17:10:49.000
3308450,2021-08-30 20:57:54,Animais,Animais que podem causar doenças,,Ratos - Solicitar vistoria em local infestado,,SOCORRO,FINALIZADA,2021-09-08 14:08:02
12732288,2013-03-30,,Transporte publico / Linha e Itinerário,Intervalo excessivo da linha,,JARDIM PERI,,REALIZADA,2013-04-09 00:00:00.000
1767438,2022-05-24 15:03:27,Saúde,Medicamento de controle especial,,Farmácias de manipulação e drogarias - Entrega...,,,FINALIZADA,2022-05-25 10:45:16
8365396,2019-03-19 12:33:32.476,Trânsito e Transporte,Veículos abandonados,,Solicitar remoção de veículo/carcaça abandonad...,,SAO LUCAS,FINALIZADA,2019-10-16 23:59:38.278
5127873,2021-03-23 14:23:44,Cidadania e assistência social,Renda Básica Emergencial,,Renda Básica Emergencial - Consultar benefício...,,,FINALIZADA,2021-03-23 14:23:55
5789363,2020-12-12 15:50:13.612,Cidadania e assistência social,Renda Básica Emergencial,,Renda Básica Emergencial - Consultar benefício...,,,FINALIZADA,2020-12-12 15:50:17.962


## Filtrar apenas os dados necessários para a análise

In [12]:
df['Tema'].drop_duplicates()

0           Cidadania e assistência social
5                                  Animais
7               Obras, imóveis e habitação
10                            Rua e bairro
34                           Meio Ambiente
37                          Lixo e limpeza
41                                Urgência
54                                   Saúde
67                     Comércio e serviços
95                   Trânsito e Transporte
151                           Causa animal
188           Ouvidoria Geral do Município
227                         Pragas urbanas
431                               Finanças
439                         Acessibilidade
918                          Bilhete Único
1272                      Segurança urbana
2334                 Documentos e licenças
2885              Cultura, esporte e lazer
4389                              Educação
8048                              Trabalho
334059              Descomplica São Miguel
596920               Canais de Atendimento
597569     

### Entender o motivo de existirem nulos no 'Tema'

In [13]:
pd.set_option('display.max_rows', None)
df[df.Tema.isnull()]['Assunto'].drop_duplicates()

11388300                             Construcao de passarelas
11388301                                               Buraco
11388302                                      Poluição Sonora
11388304    Placas de Nomes de Ruas, Praças e demais Logra...
11388306                         Iluminacao - Lampada apagada
11388307             Transporte publico / Conduta de Trabalho
11388308                              Remoção veículo/carcaça
11388310                                               Elogio
11388314                            Vistoria / Infraestrutura
11388317                                                Obras
11388318                                           Edificacao
11388319                                        Animais / Cão
11388324                                         Pavimentacao
11388329                      Árvore(Calçada/Passeio Público)
11388332                          Transporte publico / Outros
11388334                                       Guias/sarjetas
11388336

### O campo 'Tema' só é usado em datasets mais recentes, por isso deve-se utilizar o campo 'Assunto' para filtrar

In [14]:
df1 = df[df['Assunto'].str.contains('Animais', regex=False) | df['Tema'].str.contains(r'^Anim.*|^Pragas.*', regex=True)].reset_index(drop=True)

In [15]:
df1.shape

(704360, 9)

In [16]:
df1.sample(20)

Unnamed: 0,Data de abertura,Tema,Assunto,Especificação do assunto,Serviço,Bairro,Distrito,Status da solicitação,Data do parecer
603879,2013-11-29,,Animais / Pombos,Reclamação de Pombos,,,,REALIZADA,2013-12-06 00:00:00.000
97819,2022-01-06 16:21:02,Animais,"Exames, vacinas e castração",,Castrar cães e gatos gratuitamente,,,FINALIZADO,2022-01-13 17:10:28
519524,2015-04-10 20:35:48.727,Animais,Animais que transmitem doenças ou risco à saúde,,Pernilongo/Mosquito - Solicitar vistoria em lo...,,CIDADE ADEMAR,FINALIZADA,2015-04-22 22:07:17.270
548917,2014-11-26,,Animais / Cão,Condições de criação / maus tratos,,VILA CONSTANCIA,,REALIZADA,2016-12-09 13:43:33.251
176233,2021-08-20 19:12:31,Animais,Animais que podem causar doenças,,Escorpião - Solicitar vistoria de local com es...,,JOSE BONIFACIO,FINALIZADA,2021-08-24 13:03:45
102626,2022-01-15 12:00:42,Animais,Registro de animais - RGA,,Registro Geral do Animal (RGA) - Solicitar ide...,,,FINALIZADO,2022-02-15 12:56:14
253309,2021-03-10 01:36:57,Animais,"Exames, vacinas e castração",,Castrar cães e gatos gratuitamente,,,INDEFERIDO,2021-03-19 15:39:37
439327,2017-01-30 15:34:50.676,Animais,Animais que transmitem doenças ou risco à saúde,,Abelhas e Vespas - Solicitar vistoria em ninhos,,ALTO DE PINHEIROS,FINALIZADA,2017-04-25 11:39:09.444
684693,2012-03-08 17:14:05.310,,Animais / Cão,Cão Agressor,,JARDIM MARIA RITA,23.0,CANCELADA,2012-04-24 00:00:00.000
669057,2012-12-29 12:06:42.080,,Animais / Pernilongo,Reclamação de Pernilongo,,JARDIM CELIA,,REALIZADA,2012-12-29 12:06:42.000


## Padronizar o campo 'Serviço' com o 'Especificação do assunto'

#### Os dois campos possuem o mesmo objetivo

In [17]:
df1.loc[df1['Serviço'].isnull(), 'Serviço'] = df1.loc[df1['Serviço'].isnull(), 'Especificação do assunto']

In [18]:
df1.sample(10)

Unnamed: 0,Data de abertura,Tema,Assunto,Especificação do assunto,Serviço,Bairro,Distrito,Status da solicitação,Data do parecer
510035,2015-02-18 16:20:57.040,Animais,Animais que transmitem doenças ou risco à saúde,,Ratos - Solicitar vistoria em local infestado,,CANGAIBA,FINALIZADA,2015-04-16 03:00:00.000
185873,2021-09-19 18:07:14,Animais,Animais que podem causar doenças,,Abelhas e Vespas - Solicitar vistoria em ninhos,,ITAQUERA,FINALIZADA,2021-09-27 17:49:24
288814,2020-11-24 22:38:29.227,Animais,"Exames, vacinas e castração",,Castrar cães e gatos gratuitamente,,,FINALIZADA,2020-12-08 13:59:38.311
291203,2020-07-01 20:41:52.828,Animais,Animal em via pública,,Solicitar remoção de animal morto em via pública,,ITAQUERA,FINALIZADA,2020-07-01 23:09:22.000
502653,2015-01-08 14:52:27.123,Animais,Animais que transmitem doenças ou risco à saúde,,Escorpião - Solicitar vistoria de local com es...,,CIDADE TIRADENTES,FINALIZADA,2015-06-03 14:05:29.137
681382,2012-02-25 15:48:32.860,,Animais,Remoção de animal morto em vias publicas,Remoção de animal morto em vias publicas,JARDIM ANHANGUERA,,REALIZADA,2012-03-01 14:39:12.753
598247,2013-10-15,,Animais / Cão,Cão Agressor,Cão Agressor,CASA VERDE ALTA,,REALIZADA,2013-11-13 00:00:00.000
342585,2019-07-30 14:02:31.520,Animais,Animal em via pública,,Solicitar remoção de animal morto em via pública,,ARTUR ALVIM,FINALIZADA,2019-07-30 19:44:28.000
403864,2018-02-01 11:32:20.290,Animais,Criação inadequada de animais,,Denunciar condições inadequadas de criação,,ITAQUERA,FINALIZADA,2018-02-21 13:36:11.778
357377,2019-12-10 15:25:11.634,Animais,Animais que transmitem doenças ou risco à saúde,,Abelhas e Vespas - Solicitar vistoria em ninhos,,CIDADE LIDER,FINALIZADA,2020-04-16 19:37:53.337


In [19]:
df1[df1['Serviço'].isnull()]

Unnamed: 0,Data de abertura,Tema,Assunto,Especificação do assunto,Serviço,Bairro,Distrito,Status da solicitação,Data do parecer


#### Deletar o campo que não terá mais utilidade

In [20]:
df1 = df1.drop('Especificação do assunto', axis=1)

## Tratamento dos campos de localização

#### Os campos 'Bairro' e 'Distrito' são ambíguos, por isso que os valores que estão nulos em 'Distrito' receberão o valor de 'Bairro', caso exista. Além disso, o campo 'Distrito' existe alguns que são número, indicando um distrito que está na metadado disponibilizado neste repositório.

### Preencher valores de 'Distrito' com o de 'Bairro'

In [21]:
df1.loc[df1['Distrito'].isnull() & df1['Bairro'].notnull(), 'Distrito'] = df1.loc[df1['Distrito'].isnull() & df1['Bairro'].notnull(), 'Bairro']

In [22]:
df1.sample(10)

Unnamed: 0,Data de abertura,Tema,Assunto,Serviço,Bairro,Distrito,Status da solicitação,Data do parecer
443863,2017-03-09 15:56:45.603,Animais,Criação inadequada de animais,Denunciar condições inadequadas de criação,,LAJEADO,FINALIZADA,2017-04-12 17:48:43.216
393948,2018-11-12 21:05:05.246,Animais,Animais que transmitem doenças ou risco à saúde,Ratos - Solicitar vistoria em local infestado,,VILA MEDEIROS,FINALIZADA,2019-01-09 13:40:08.255
652248,2012-09-17 16:32:15.570,,Animais / Cão,Atropelado ou Acidentado vivo e sem proprietário,JARDIM NAKAMURA,JARDIM NAKAMURA,CANCELADA,2012-09-17 00:00:00.000
687684,2012-03-23 09:25:45.060,,"Animais / Abelhas, Vespas, Marimbondos",Colméia/Vespeiro instalado,SANTO AMARO,72.0,CANCELADA,2012-08-10 00:00:00.000
283081,2020-11-10 14:51:33.174,Animais,"Exames, vacinas e castração",Castrar cães e gatos gratuitamente,,,FINALIZADA,2020-12-23 11:55:08.768
437346,2017-01-13 20:59:53.441,Animais,Animais que transmitem doenças ou risco à saúde,Abelhas e Vespas - Solicitar vistoria em ninhos,,TUCURUVI,FINALIZADA,2017-04-10 17:42:54.434
570665,2014-03-20,,Animais / Cão,Condições de criação / maus tratos,JARDIM ARICANDUVA,JARDIM ARICANDUVA,REALIZADA,2014-03-28 00:00:00.000
404547,2018-02-08 15:13:27.250,Animais,Animais que transmitem doenças ou risco à saúde,Pernilongo/Mosquito - Solicitar vistoria em lo...,,CIDADE DUTRA,FINALIZADA,2018-04-23 12:27:29.730
597614,2013-10-10,,Animais / Ratos,Reclamação de ratos,VILA FORMOSA,VILA FORMOSA,REALIZADA,2013-10-11 00:00:00.000
387104,2018-08-30 17:43:48.991,Animais,Animais que transmitem doenças ou risco à saúde,Pernilongo/Mosquito - Solicitar vistoria em lo...,,CAMPO GRANDE,FINALIZADA,2018-11-23 12:27:24.777


### Converter os valores que estão em código para o seu nome original

In [23]:
distrito = pd.read_csv('codigos_de_distritos.csv', sep=';')

In [24]:
distrito['Nr Distrito'] = distrito['Nr Distrito'].astype(float)

In [25]:
distrito

Unnamed: 0,Nr Distrito,Nome Distrito
0,1.0,Agua Rasa
1,2.0,Alto de Pinheiros
2,3.0,Anhanguera
3,4.0,Aricanduva
4,5.0,Artur Alvim
5,6.0,Barra Funda
6,7.0,Bela Vista
7,8.0,Belem
8,9.0,Bom Retiro
9,10.0,Bras


In [26]:
df1['Distrito'] = df1['Distrito'].replace(distrito.set_index('Nr Distrito')['Nome Distrito'])

In [27]:
df1 = df1.drop('Bairro', axis=1)

In [28]:
df1.sample(10)

Unnamed: 0,Data de abertura,Tema,Assunto,Serviço,Distrito,Status da solicitação,Data do parecer
23301,2022-10-21 14:52:57,Animais,Animais que transmitem doenças ou risco à saúde,Abelhas e Vespas - Solicitar vistoria em ninhos,ITAQUERA,FINALIZADA,2022-11-23 14:53:58
409417,2018-03-23 11:36:31.077,Animais,Criação inadequada de animais,Denunciar condições inadequadas de criação,PONTE RASA,FINALIZADA,2018-04-06 15:09:03.573
442654,2017-02-24 10:30:16.718,Animais,Animais que transmitem doenças ou risco à saúde,Ratos - Solicitar vistoria em local infestado,TUCURUVI,FINALIZADA,2017-05-05 13:31:12.919
629980,2013-04-11,,Animais / Pernilongo,Reclamação de Pernilongo,QUARTA PARADA,REALIZADA,2013-05-17 00:00:00.000
14386,2023-03-02 14:49:15,Pragas urbanas,Animais que transmitem doenças ou risco à saúde,Ratos - Solicitar vistoria em local infestado,JARDIM SAO LUIS,FINALIZADA,2023-03-06 04:52:20
191530,2021-04-05 21:52:39,Animais,"Exames, vacinas e castração",Castrar cães e gatos gratuitamente,,FINALIZADA,2021-04-07 11:21:39
64097,2022-09-19 18:02:52,Animais,"Exames, vacinas e castração",Castrar cães e gatos gratuitamente,,FINALIZADA,2022-09-22 17:37:14
245613,2021-02-17 14:28:04,Animais,Animais que transmitem doenças ou risco à saúde,Ratos - Solicitar vistoria em local infestado,,AGUARDANDO ATENDIMENTO,2021-02-18 10:37:04
528153,2015-06-19 12:33:52.723,Animais,Animal agressor e/ou invasor,Cães e gatos invasores de instituições pública...,CIDADE DUTRA,CANCELADA,2015-07-23 03:00:00.000
80385,2022-05-12 12:07:07,Animais,"Exames, vacinas e castração",Castrar cães e gatos gratuitamente,,FINALIZADA,2022-05-13 11:37:53


In [35]:
df1['Distrito'].isnull().sum()

232552

In [36]:
df1['Distrito'].notnull().sum()

471808

## Tratamento das descrições (Assunto, Serviço)

In [138]:
df2 = df1.rename({'Assunto': 'Tipo de Serviço'}, axis=1)

In [139]:
df2.sample()

Unnamed: 0,Data de abertura,Tema,Tipo de Serviço,Serviço,Distrito,Status da solicitação,Data do parecer
375426,2019-04-30 04:33:32.130,Animais,Criação inadequada de animais,Denunciar condições inadequadas de criação,ITAIM PAULISTA,FINALIZADA,2019-05-06 20:23:48.254


In [140]:
df2['Tipo de Serviço'].drop_duplicates()

0                                Registro de animais - RGA
1                              Exames, vacinas e castração
3                                        Adoção de animais
4                            Criação inadequada de animais
6                                       Animais silvestres
9                                    Animal em via pública
14         Animais que transmitem doenças ou risco à saúde
23                            Animal agressor e/ou invasor
66        Dengue/chikungunya/zika (mosquito aedes aegypti)
26265                                  Comércio de animais
128038                    Animais que podem causar doenças
361615                                      Animais/Aranha
386661                                  Animais/Carrapatos
392961                                      Animais/Pulgas
397007                                      Animais/barata
529214                                       Animais / Cão
529218                                      Animais / Ga

In [141]:
df2[['Tipo de Serviço', 'Serviço']].drop_duplicates()

Unnamed: 0,Tipo de Serviço,Serviço
0,Registro de animais - RGA,Avisar sobre animal encontrado com Registro G...
1,"Exames, vacinas e castração",Castrar cães e gatos gratuitamente
3,Adoção de animais,Adotar cães e gatos
4,Criação inadequada de animais,Denunciar condições inadequadas de criação
6,Animais silvestres,Animais silvestres feridos ? Solicitar atendim...
9,Animal em via pública,Solicitar remoção de animal morto em via pública
12,Animal em via pública,Avaliação de animal em sofrimento sem propriet...
14,Animais que transmitem doenças ou risco à saúde,Pernilongo/Mosquito - Solicitar vistoria em lo...
15,Animais que transmitem doenças ou risco à saúde,Morcegos - Reclamar sobre local com morcegos
19,Animais que transmitem doenças ou risco à saúde,Ratos - Solicitar vistoria em local infestado


### Padronizar o Tipo de Serviço

In [142]:
df2.loc[df2['Tipo de Serviço'].str.contains('Animais[ |/]') & df2['Tipo de Serviço']
        .str.match('^(?!.*(Cão|Gato|Cavalo|silvestres|RGA|agressor|via))'), 'Tipo de Serviço'
       ] = 'Animais que transmitem doenças ou risco à saúde'

In [143]:
df2[['Tipo de Serviço', 'Serviço']].drop_duplicates()

Unnamed: 0,Tipo de Serviço,Serviço
0,Registro de animais - RGA,Avisar sobre animal encontrado com Registro G...
1,"Exames, vacinas e castração",Castrar cães e gatos gratuitamente
3,Adoção de animais,Adotar cães e gatos
4,Criação inadequada de animais,Denunciar condições inadequadas de criação
6,Animais silvestres,Animais silvestres feridos ? Solicitar atendim...
9,Animal em via pública,Solicitar remoção de animal morto em via pública
12,Animal em via pública,Avaliação de animal em sofrimento sem propriet...
14,Animais que transmitem doenças ou risco à saúde,Pernilongo/Mosquito - Solicitar vistoria em lo...
15,Animais que transmitem doenças ou risco à saúde,Morcegos - Reclamar sobre local com morcegos
19,Animais que transmitem doenças ou risco à saúde,Ratos - Solicitar vistoria em local infestado


In [144]:
df2['Tipo de Serviço'] = df2['Tipo de Serviço'].str.replace('Animais / ', '')

In [145]:
df2['Tipo de Serviço'] = df2['Tipo de Serviço'].str.replace(' / Animais', '')

In [147]:
df2['Tipo de Serviço'] = df2['Tipo de Serviço'].str.replace('Dengue/chikungunya/zika (mosquito aedes aegypti)', 'Vistoria')

In [148]:
df2['Tipo de Serviço'].drop_duplicates()

0                               Registro de animais - RGA
1                             Exames, vacinas e castração
3                                       Adoção de animais
4                           Criação inadequada de animais
6                                      Animais silvestres
9                                   Animal em via pública
14        Animais que transmitem doenças ou risco à saúde
23                           Animal agressor e/ou invasor
66                                               Vistoria
26265                                 Comércio de animais
529214                                                Cão
529218                                               Gato
529226                                            Animais
529765                                             Cavalo
Name: Tipo de Serviço, dtype: object

### Padronizar o Serviço

### Apagar os registros de teste

In [42]:
df2 = df2.drop(df2.loc[df1['Serviço'].str.contains('TESTE', regex=True)].index)

## Gerar o arquivo com os dados necessários

In [10]:
df1.to_csv('sp156_all_time.csv', sep=';')