# Configuração de ambiente

Importação das bibliotecas:
- Pandas: para manipulação de dados através do alias "pd"
- Google Colab: para manipulação de arquivos no Google Drive

E execução do comando "%matplotlib inline" para que os gráficos sejam exibidos no notebook logo abaixo da célula de código que os gerou.

In [66]:
import pandas as pd
from google.colab import drive

%matplotlib inline

Carregamento do Drive para que o notebook possa acessar os arquivos do Google Drive e com o parâmetro "force_remount=True" para que o Drive seja montado a cada execução do notebook.

In [67]:
drive.mount('/content/drive', force_remount=True)

Mounted at /content/drive


# Leitura e visualização do dataset

Leitura do arquivo "dataset.csv" através da função "read_csv" do Pandas e armazenamento do resultado na variável "df". Uso do parâmetro "sep" para informar qual o separador de colunas do arquivo e do parâmetro "encoding" para informar qual o tipo de codificação do arquivo.

In [68]:
csv_url = "https://github.com/viniciusgugelmin/data-science/blob/main/projects/base_de_despesas/data/dataset.csv?raw=true"

df = pd.read_csv(csv_url, sep=';', encoding='iso-8859-1', low_memory=False)

Atribuição do limite na exibição do dataset para 50 colunas e 20 linhas, afim de conseguir visualizar melhor os dados.

In [69]:
pd.set_option('display.max_columns', 50)
pd.set_option('display.max_rows', 20)

Exibição das 5 primeiras linhas do DataFrame através da função "head" do Pandas para verificar se o arquivo foi carregado corretamente e ter uma ideia do que ele contém.

In [70]:
df.head()

Unnamed: 0,ANO_EMPENHO,DT_EMPENHO,CD_FONTE,DS_FONTE,CD_FUNCAO,DS_FUNCAO,CD_PROGRAMA,DS_PROGRAMA,CD_ACAO,DS_ACAO,CD_SUBELEMENTO,DS_SUBELEMENTO,CD_ORGAO,DS_ORGAO,CD_DESPESA,DS_DESPESA,CODIGO_DESPESA_GRUPO,DS_GRUPO,CODIGO_DESPESA_MODALIDADE,DS_MODALIDADE,CODIGO_DESPESA_ELEMENTO,DS_ELEMENTO,CPF_CNPJ,NR_EMPENHO,LICITACAO,VL_EMPENHADO,CD_ITEM,DS_ITEM,DS_UNIDADE,QUANTIDADE,VL_PRECO_UNITARIO,VL_TOTAL,PROTOCOLOSUP,DT_TRANSACAO,NR_PARCELA,TRANSACAO,VL_LIQUIDADO,VL_DEVOLVIDO,VL_ANULADO,VL_PAGO,VL_CONSIGNADO
0,-----------,----------,--------,--------,---------,---------,-----------,-----------,-------,-------,--------------,--------------,--------,--------,----------,----------,--------------------,--------,-------------------------,-------------,-----------------------,-----------,--------,----------,---------,------------,-------,-------,----------,----------,-----------------,--------,------------,------------,------------,------------,------------,------------,----------,-------,-------------
1,2022,2022-06-09,098,Recursos Próprios do Fundo Municipal de Apoio ...,08,ASSISTÊNCIA SOCIAL,0001,PROGRAMA VIVA CURITIBA QUE NÃO DORME,2011,DESENVOLVIMENTO E EXECUÇÃO DE AÇÕES DE ATENDIM...,14,LOCAÇÃO DE BENS MÓVEIS E OUTRAS NATUREZAS E IN...,37,FUNDO MUNICIPAL DE APOIO AO DEFICIENTE,339039,OUTROS SERVIÇOS DE TERCEIROS - PESSOA JURÍDICA,3,Outras Despesas Correntes,90,Aplicações Diretas,39,Outros Serviços de Terceiros - Pessoa Jurídica,33038864000151,5,PE 186/2021 SMAP/SMELJ,510300,3,"BRINQUEDO INFLÁVEL, LOCAÇÃO, PULA PULA, CASTE...",MO,30000,7050000,21150000,,,,,,,,,
2,2022,2022-06-09,098,Recursos Próprios do Fundo Municipal de Apoio ...,08,ASSISTÊNCIA SOCIAL,0001,PROGRAMA VIVA CURITIBA QUE NÃO DORME,2011,DESENVOLVIMENTO E EXECUÇÃO DE AÇÕES DE ATENDIM...,14,LOCAÇÃO DE BENS MÓVEIS E OUTRAS NATUREZAS E IN...,37,FUNDO MUNICIPAL DE APOIO AO DEFICIENTE,339039,OUTROS SERVIÇOS DE TERCEIROS - PESSOA JURÍDICA,3,Outras Despesas Correntes,90,Aplicações Diretas,39,Outros Serviços de Terceiros - Pessoa Jurídica,33038864000151,5,PE 186/2021 SMAP/SMELJ,510300,5,"BRINQUEDO, PISCINA DE BOLINHAS CONVENCIONAL,",MO,20000,4020000,8040000,,,,,,,,,
3,2022,2022-06-23,024,Recursos Próprios do Fundo Municipal de Habita...,16,HABITAÇÃO,0002,PROGRAMA VIVA CURITIBA CIDADÃ,2066,"MANUTENÇÃO E EXECUÇÃO DOS SERVIÇOS TÉCNICOS, A...",5,SERVIÇOS TÉCNICOS PROFISSIONAIS,49,FUNDO MUNICIPAL DE HABITAÇÃO DE INTERESSE SOCIAL,339039,OUTROS SERVIÇOS DE TERCEIROS - PESSOA JURÍDICA,3,Outras Despesas Correntes,90,Aplicações Diretas,39,Outros Serviços de Terceiros - Pessoa Jurídica,03864060000140,6,PE 4/2020 COHAB-CT/FMHIS,166588,,,,,,,01-122405/2022,2022-07-22 00:00:00.000,1,Anulado de Empenho,000,000,53244,000,000
4,2022,2022-06-23,024,Recursos Próprios do Fundo Municipal de Habita...,16,HABITAÇÃO,0002,PROGRAMA VIVA CURITIBA CIDADÃ,2066,"MANUTENÇÃO E EXECUÇÃO DOS SERVIÇOS TÉCNICOS, A...",5,SERVIÇOS TÉCNICOS PROFISSIONAIS,49,FUNDO MUNICIPAL DE HABITAÇÃO DE INTERESSE SOCIAL,339039,OUTROS SERVIÇOS DE TERCEIROS - PESSOA JURÍDICA,3,Outras Despesas Correntes,90,Aplicações Diretas,39,Outros Serviços de Terceiros - Pessoa Jurídica,03864060000140,6,PE 4/2020 COHAB-CT/FMHIS,166588,,,,,,,01-122405/2022,2022-07-14 00:00:00.000,1,Pagamento de Empenho,000,000,000,113344,000


# Processo inicial de limpeza

Exclusão da coluna de índice 0 do DataFrame através da função "drop" do Pandas, pois ela é composta apenas por traços e não possui nenhum valor relevante além de separar as linhas do cabeçalho visualmente.

In [71]:
df = df.drop(0)
df.head()

Unnamed: 0,ANO_EMPENHO,DT_EMPENHO,CD_FONTE,DS_FONTE,CD_FUNCAO,DS_FUNCAO,CD_PROGRAMA,DS_PROGRAMA,CD_ACAO,DS_ACAO,CD_SUBELEMENTO,DS_SUBELEMENTO,CD_ORGAO,DS_ORGAO,CD_DESPESA,DS_DESPESA,CODIGO_DESPESA_GRUPO,DS_GRUPO,CODIGO_DESPESA_MODALIDADE,DS_MODALIDADE,CODIGO_DESPESA_ELEMENTO,DS_ELEMENTO,CPF_CNPJ,NR_EMPENHO,LICITACAO,VL_EMPENHADO,CD_ITEM,DS_ITEM,DS_UNIDADE,QUANTIDADE,VL_PRECO_UNITARIO,VL_TOTAL,PROTOCOLOSUP,DT_TRANSACAO,NR_PARCELA,TRANSACAO,VL_LIQUIDADO,VL_DEVOLVIDO,VL_ANULADO,VL_PAGO,VL_CONSIGNADO
1,2022,2022-06-09,98,Recursos Próprios do Fundo Municipal de Apoio ...,8,ASSISTÊNCIA SOCIAL,1,PROGRAMA VIVA CURITIBA QUE NÃO DORME,2011,DESENVOLVIMENTO E EXECUÇÃO DE AÇÕES DE ATENDIM...,14,LOCAÇÃO DE BENS MÓVEIS E OUTRAS NATUREZAS E IN...,37,FUNDO MUNICIPAL DE APOIO AO DEFICIENTE,339039,OUTROS SERVIÇOS DE TERCEIROS - PESSOA JURÍDICA,3,Outras Despesas Correntes,90,Aplicações Diretas,39,Outros Serviços de Terceiros - Pessoa Jurídica,33038864000151,5,PE 186/2021 SMAP/SMELJ,510300,3.0,"BRINQUEDO INFLÁVEL, LOCAÇÃO, PULA PULA, CASTE...",MO,30000.0,7050000.0,21150000.0,,,,,,,,,
2,2022,2022-06-09,98,Recursos Próprios do Fundo Municipal de Apoio ...,8,ASSISTÊNCIA SOCIAL,1,PROGRAMA VIVA CURITIBA QUE NÃO DORME,2011,DESENVOLVIMENTO E EXECUÇÃO DE AÇÕES DE ATENDIM...,14,LOCAÇÃO DE BENS MÓVEIS E OUTRAS NATUREZAS E IN...,37,FUNDO MUNICIPAL DE APOIO AO DEFICIENTE,339039,OUTROS SERVIÇOS DE TERCEIROS - PESSOA JURÍDICA,3,Outras Despesas Correntes,90,Aplicações Diretas,39,Outros Serviços de Terceiros - Pessoa Jurídica,33038864000151,5,PE 186/2021 SMAP/SMELJ,510300,5.0,"BRINQUEDO, PISCINA DE BOLINHAS CONVENCIONAL,",MO,20000.0,4020000.0,8040000.0,,,,,,,,,
3,2022,2022-06-23,24,Recursos Próprios do Fundo Municipal de Habita...,16,HABITAÇÃO,2,PROGRAMA VIVA CURITIBA CIDADÃ,2066,"MANUTENÇÃO E EXECUÇÃO DOS SERVIÇOS TÉCNICOS, A...",5,SERVIÇOS TÉCNICOS PROFISSIONAIS,49,FUNDO MUNICIPAL DE HABITAÇÃO DE INTERESSE SOCIAL,339039,OUTROS SERVIÇOS DE TERCEIROS - PESSOA JURÍDICA,3,Outras Despesas Correntes,90,Aplicações Diretas,39,Outros Serviços de Terceiros - Pessoa Jurídica,3864060000140,6,PE 4/2020 COHAB-CT/FMHIS,166588,,,,,,,01-122405/2022,2022-07-22 00:00:00.000,1.0,Anulado de Empenho,0.0,0.0,53244.0,0.0,0.0
4,2022,2022-06-23,24,Recursos Próprios do Fundo Municipal de Habita...,16,HABITAÇÃO,2,PROGRAMA VIVA CURITIBA CIDADÃ,2066,"MANUTENÇÃO E EXECUÇÃO DOS SERVIÇOS TÉCNICOS, A...",5,SERVIÇOS TÉCNICOS PROFISSIONAIS,49,FUNDO MUNICIPAL DE HABITAÇÃO DE INTERESSE SOCIAL,339039,OUTROS SERVIÇOS DE TERCEIROS - PESSOA JURÍDICA,3,Outras Despesas Correntes,90,Aplicações Diretas,39,Outros Serviços de Terceiros - Pessoa Jurídica,3864060000140,6,PE 4/2020 COHAB-CT/FMHIS,166588,,,,,,,01-122405/2022,2022-07-14 00:00:00.000,1.0,Pagamento de Empenho,0.0,0.0,0.0,113344.0,0.0
5,2022,2022-06-23,24,Recursos Próprios do Fundo Municipal de Habita...,16,HABITAÇÃO,2,PROGRAMA VIVA CURITIBA CIDADÃ,2066,"MANUTENÇÃO E EXECUÇÃO DOS SERVIÇOS TÉCNICOS, A...",5,SERVIÇOS TÉCNICOS PROFISSIONAIS,49,FUNDO MUNICIPAL DE HABITAÇÃO DE INTERESSE SOCIAL,339039,OUTROS SERVIÇOS DE TERCEIROS - PESSOA JURÍDICA,3,Outras Despesas Correntes,90,Aplicações Diretas,39,Outros Serviços de Terceiros - Pessoa Jurídica,3864060000140,6,PE 4/2020 COHAB-CT/FMHIS,166588,,,,,,,01-122405/2022,2022-07-13 00:00:00.000,1.0,Liquidação de Empenho,113344.0,0.0,0.0,0.0,0.0


Reset do index do DataFrame através da função "reset_index" do Pandas para que o index seja redefinido a partir do 0 e utilização do parâmetro "drop=True" para que a coluna de índice antiga seja excluída.

In [72]:
df = df.reset_index(drop=True)
df.head()

Unnamed: 0,ANO_EMPENHO,DT_EMPENHO,CD_FONTE,DS_FONTE,CD_FUNCAO,DS_FUNCAO,CD_PROGRAMA,DS_PROGRAMA,CD_ACAO,DS_ACAO,CD_SUBELEMENTO,DS_SUBELEMENTO,CD_ORGAO,DS_ORGAO,CD_DESPESA,DS_DESPESA,CODIGO_DESPESA_GRUPO,DS_GRUPO,CODIGO_DESPESA_MODALIDADE,DS_MODALIDADE,CODIGO_DESPESA_ELEMENTO,DS_ELEMENTO,CPF_CNPJ,NR_EMPENHO,LICITACAO,VL_EMPENHADO,CD_ITEM,DS_ITEM,DS_UNIDADE,QUANTIDADE,VL_PRECO_UNITARIO,VL_TOTAL,PROTOCOLOSUP,DT_TRANSACAO,NR_PARCELA,TRANSACAO,VL_LIQUIDADO,VL_DEVOLVIDO,VL_ANULADO,VL_PAGO,VL_CONSIGNADO
0,2022,2022-06-09,98,Recursos Próprios do Fundo Municipal de Apoio ...,8,ASSISTÊNCIA SOCIAL,1,PROGRAMA VIVA CURITIBA QUE NÃO DORME,2011,DESENVOLVIMENTO E EXECUÇÃO DE AÇÕES DE ATENDIM...,14,LOCAÇÃO DE BENS MÓVEIS E OUTRAS NATUREZAS E IN...,37,FUNDO MUNICIPAL DE APOIO AO DEFICIENTE,339039,OUTROS SERVIÇOS DE TERCEIROS - PESSOA JURÍDICA,3,Outras Despesas Correntes,90,Aplicações Diretas,39,Outros Serviços de Terceiros - Pessoa Jurídica,33038864000151,5,PE 186/2021 SMAP/SMELJ,510300,3.0,"BRINQUEDO INFLÁVEL, LOCAÇÃO, PULA PULA, CASTE...",MO,30000.0,7050000.0,21150000.0,,,,,,,,,
1,2022,2022-06-09,98,Recursos Próprios do Fundo Municipal de Apoio ...,8,ASSISTÊNCIA SOCIAL,1,PROGRAMA VIVA CURITIBA QUE NÃO DORME,2011,DESENVOLVIMENTO E EXECUÇÃO DE AÇÕES DE ATENDIM...,14,LOCAÇÃO DE BENS MÓVEIS E OUTRAS NATUREZAS E IN...,37,FUNDO MUNICIPAL DE APOIO AO DEFICIENTE,339039,OUTROS SERVIÇOS DE TERCEIROS - PESSOA JURÍDICA,3,Outras Despesas Correntes,90,Aplicações Diretas,39,Outros Serviços de Terceiros - Pessoa Jurídica,33038864000151,5,PE 186/2021 SMAP/SMELJ,510300,5.0,"BRINQUEDO, PISCINA DE BOLINHAS CONVENCIONAL,",MO,20000.0,4020000.0,8040000.0,,,,,,,,,
2,2022,2022-06-23,24,Recursos Próprios do Fundo Municipal de Habita...,16,HABITAÇÃO,2,PROGRAMA VIVA CURITIBA CIDADÃ,2066,"MANUTENÇÃO E EXECUÇÃO DOS SERVIÇOS TÉCNICOS, A...",5,SERVIÇOS TÉCNICOS PROFISSIONAIS,49,FUNDO MUNICIPAL DE HABITAÇÃO DE INTERESSE SOCIAL,339039,OUTROS SERVIÇOS DE TERCEIROS - PESSOA JURÍDICA,3,Outras Despesas Correntes,90,Aplicações Diretas,39,Outros Serviços de Terceiros - Pessoa Jurídica,3864060000140,6,PE 4/2020 COHAB-CT/FMHIS,166588,,,,,,,01-122405/2022,2022-07-22 00:00:00.000,1.0,Anulado de Empenho,0.0,0.0,53244.0,0.0,0.0
3,2022,2022-06-23,24,Recursos Próprios do Fundo Municipal de Habita...,16,HABITAÇÃO,2,PROGRAMA VIVA CURITIBA CIDADÃ,2066,"MANUTENÇÃO E EXECUÇÃO DOS SERVIÇOS TÉCNICOS, A...",5,SERVIÇOS TÉCNICOS PROFISSIONAIS,49,FUNDO MUNICIPAL DE HABITAÇÃO DE INTERESSE SOCIAL,339039,OUTROS SERVIÇOS DE TERCEIROS - PESSOA JURÍDICA,3,Outras Despesas Correntes,90,Aplicações Diretas,39,Outros Serviços de Terceiros - Pessoa Jurídica,3864060000140,6,PE 4/2020 COHAB-CT/FMHIS,166588,,,,,,,01-122405/2022,2022-07-14 00:00:00.000,1.0,Pagamento de Empenho,0.0,0.0,0.0,113344.0,0.0
4,2022,2022-06-23,24,Recursos Próprios do Fundo Municipal de Habita...,16,HABITAÇÃO,2,PROGRAMA VIVA CURITIBA CIDADÃ,2066,"MANUTENÇÃO E EXECUÇÃO DOS SERVIÇOS TÉCNICOS, A...",5,SERVIÇOS TÉCNICOS PROFISSIONAIS,49,FUNDO MUNICIPAL DE HABITAÇÃO DE INTERESSE SOCIAL,339039,OUTROS SERVIÇOS DE TERCEIROS - PESSOA JURÍDICA,3,Outras Despesas Correntes,90,Aplicações Diretas,39,Outros Serviços de Terceiros - Pessoa Jurídica,3864060000140,6,PE 4/2020 COHAB-CT/FMHIS,166588,,,,,,,01-122405/2022,2022-07-13 00:00:00.000,1.0,Liquidação de Empenho,113344.0,0.0,0.0,0.0,0.0


Exibição dos nomes das colunas do DataFrame através da função "columns" do Pandas para visualizar melhor quais colunas são necessárias através do cabeçalho e dicionário de dados incluso na pasta "data" do projeto, e também para verificar se o nome das colunas está legível.

In [73]:
df.columns

Index(['ANO_EMPENHO', 'DT_EMPENHO', 'CD_FONTE', 'DS_FONTE', 'CD_FUNCAO',
       'DS_FUNCAO', 'CD_PROGRAMA', 'DS_PROGRAMA', 'CD_ACAO', 'DS_ACAO',
       'CD_SUBELEMENTO', 'DS_SUBELEMENTO', 'CD_ORGAO', 'DS_ORGAO',
       'CD_DESPESA', 'DS_DESPESA', 'CODIGO_DESPESA_GRUPO', 'DS_GRUPO',
       'CODIGO_DESPESA_MODALIDADE', 'DS_MODALIDADE', 'CODIGO_DESPESA_ELEMENTO',
       'DS_ELEMENTO', 'CPF_CNPJ', 'NR_EMPENHO', 'LICITACAO', 'VL_EMPENHADO',
       'CD_ITEM', 'DS_ITEM', 'DS_UNIDADE', 'QUANTIDADE', 'VL_PRECO_UNITARIO',
       'VL_TOTAL', 'PROTOCOLOSUP', 'DT_TRANSACAO', 'NR_PARCELA', 'TRANSACAO',
       'VL_LIQUIDADO', 'VL_DEVOLVIDO', 'VL_ANULADO', 'VL_PAGO',
       'VL_CONSIGNADO'],
      dtype='object')

Encontramos a possibilidade de remover a coluna "ANO_EMPENHO" pois todos os valores são iguais, e estão presentes na coluna "DT_EMPENHO".
Vamos remover também todas as colunas que são de código de identificação, pois não são relevantes para a análise.
Colunas de numeração estão pouco relevantes para a análise, então vamos removê-las também, junto das "DS_GRUPO" e "DS_MODALIDADE", pois já temos a "DS_DEPESA" que detalha mais o tipo da despesa.
E por fim, vamos remover as colunas que apresentam números de identificação de licitação e protocolo, pois não são relevantes para a análise.

Todas essas remoções serão feitas usando a função drop, e filter para selecionar as colunas que serão removidas através de regex.

In [74]:
df = df.drop(df.filter(regex='ANO_EMPENHO|CD_|CODIGO_|NR_|LICITACAO|PROTOCOLOSUP|DS_GRUPO|DS_MODALIDADE').columns, axis=1)
df.columns

Index(['DT_EMPENHO', 'DS_FONTE', 'DS_FUNCAO', 'DS_PROGRAMA', 'DS_ACAO',
       'DS_SUBELEMENTO', 'DS_ORGAO', 'DS_DESPESA', 'DS_ELEMENTO', 'CPF_CNPJ',
       'VL_EMPENHADO', 'DS_ITEM', 'DS_UNIDADE', 'QUANTIDADE',
       'VL_PRECO_UNITARIO', 'VL_TOTAL', 'DT_TRANSACAO', 'TRANSACAO',
       'VL_LIQUIDADO', 'VL_DEVOLVIDO', 'VL_ANULADO', 'VL_PAGO',
       'VL_CONSIGNADO'],
      dtype='object')

Deixaremos legíveis os nomes das colunas, para facilitar a manipulação dos dados.
Visualizamos previamente uma abreviação de "DS_" que não é relevante, "DT_" que é a data, e "VL_" que é o valor, fazendo então essas substituições para deixar o nome das colunas mais legíveis.
Encontramos algumas colunas que não expressam muito bem para qual elemento da despesa estão se referindo, então vamos renomeá-las para deixar mais claro.
Pensando também nisso, vamos renomear a coluna de "CPF_CNPJ" para "DOCUMENTO" para conseguir diferenciar melhor os tipos de documentos em outra coluna que será criada.

Todas essas alterações serão feitas usando a função rename, e columns.str.replace para substituir os nomes das colunas.

In [75]:
df.columns = df.columns.str.replace('DT_', 'DATA_').str.replace('DS_', '').str.replace('VL_', 'VALOR_')
df.columns = df.columns.str.replace('CPF_CNPJ', 'DOCUMENTO').str.replace('UNIDADE', 'UNIDADE_ITEM').str.replace('QUANTIDADE', 'QUANTIDADE_ITEM').str.replace('DESPESA', 'TIPO').str.replace('DATA_EMPENHO', 'DATA')
df = df.rename(columns={'TRANSACAO': 'STATUS_TRANSACAO'})
df.columns

Index(['DATA', 'FONTE', 'FUNCAO', 'PROGRAMA', 'ACAO', 'SUBELEMENTO', 'ORGAO',
       'TIPO', 'ELEMENTO', 'DOCUMENTO', 'VALOR_EMPENHADO', 'ITEM',
       'UNIDADE_ITEM', 'QUANTIDADE_ITEM', 'VALOR_PRECO_UNITARIO',
       'VALOR_TOTAL', 'DATA_TRANSACAO', 'STATUS_TRANSACAO', 'VALOR_LIQUIDADO',
       'VALOR_DEVOLVIDO', 'VALOR_ANULADO', 'VALOR_PAGO', 'VALOR_CONSIGNADO'],
      dtype='object')

In [76]:
df.head()

Unnamed: 0,DATA,FONTE,FUNCAO,PROGRAMA,ACAO,SUBELEMENTO,ORGAO,TIPO,ELEMENTO,DOCUMENTO,VALOR_EMPENHADO,ITEM,UNIDADE_ITEM,QUANTIDADE_ITEM,VALOR_PRECO_UNITARIO,VALOR_TOTAL,DATA_TRANSACAO,STATUS_TRANSACAO,VALOR_LIQUIDADO,VALOR_DEVOLVIDO,VALOR_ANULADO,VALOR_PAGO,VALOR_CONSIGNADO
0,2022-06-09,Recursos Próprios do Fundo Municipal de Apoio ...,ASSISTÊNCIA SOCIAL,PROGRAMA VIVA CURITIBA QUE NÃO DORME,DESENVOLVIMENTO E EXECUÇÃO DE AÇÕES DE ATENDIM...,LOCAÇÃO DE BENS MÓVEIS E OUTRAS NATUREZAS E IN...,FUNDO MUNICIPAL DE APOIO AO DEFICIENTE,OUTROS SERVIÇOS DE TERCEIROS - PESSOA JURÍDICA,Outros Serviços de Terceiros - Pessoa Jurídica,33038864000151,510300,"BRINQUEDO INFLÁVEL, LOCAÇÃO, PULA PULA, CASTE...",MO,30000.0,7050000.0,21150000.0,,,,,,,
1,2022-06-09,Recursos Próprios do Fundo Municipal de Apoio ...,ASSISTÊNCIA SOCIAL,PROGRAMA VIVA CURITIBA QUE NÃO DORME,DESENVOLVIMENTO E EXECUÇÃO DE AÇÕES DE ATENDIM...,LOCAÇÃO DE BENS MÓVEIS E OUTRAS NATUREZAS E IN...,FUNDO MUNICIPAL DE APOIO AO DEFICIENTE,OUTROS SERVIÇOS DE TERCEIROS - PESSOA JURÍDICA,Outros Serviços de Terceiros - Pessoa Jurídica,33038864000151,510300,"BRINQUEDO, PISCINA DE BOLINHAS CONVENCIONAL,",MO,20000.0,4020000.0,8040000.0,,,,,,,
2,2022-06-23,Recursos Próprios do Fundo Municipal de Habita...,HABITAÇÃO,PROGRAMA VIVA CURITIBA CIDADÃ,"MANUTENÇÃO E EXECUÇÃO DOS SERVIÇOS TÉCNICOS, A...",SERVIÇOS TÉCNICOS PROFISSIONAIS,FUNDO MUNICIPAL DE HABITAÇÃO DE INTERESSE SOCIAL,OUTROS SERVIÇOS DE TERCEIROS - PESSOA JURÍDICA,Outros Serviços de Terceiros - Pessoa Jurídica,3864060000140,166588,,,,,,2022-07-22 00:00:00.000,Anulado de Empenho,0.0,0.0,53244.0,0.0,0.0
3,2022-06-23,Recursos Próprios do Fundo Municipal de Habita...,HABITAÇÃO,PROGRAMA VIVA CURITIBA CIDADÃ,"MANUTENÇÃO E EXECUÇÃO DOS SERVIÇOS TÉCNICOS, A...",SERVIÇOS TÉCNICOS PROFISSIONAIS,FUNDO MUNICIPAL DE HABITAÇÃO DE INTERESSE SOCIAL,OUTROS SERVIÇOS DE TERCEIROS - PESSOA JURÍDICA,Outros Serviços de Terceiros - Pessoa Jurídica,3864060000140,166588,,,,,,2022-07-14 00:00:00.000,Pagamento de Empenho,0.0,0.0,0.0,113344.0,0.0
4,2022-06-23,Recursos Próprios do Fundo Municipal de Habita...,HABITAÇÃO,PROGRAMA VIVA CURITIBA CIDADÃ,"MANUTENÇÃO E EXECUÇÃO DOS SERVIÇOS TÉCNICOS, A...",SERVIÇOS TÉCNICOS PROFISSIONAIS,FUNDO MUNICIPAL DE HABITAÇÃO DE INTERESSE SOCIAL,OUTROS SERVIÇOS DE TERCEIROS - PESSOA JURÍDICA,Outros Serviços de Terceiros - Pessoa Jurídica,3864060000140,166588,,,,,,2022-07-13 00:00:00.000,Liquidação de Empenho,113344.0,0.0,0.0,0.0,0.0


Utilização do método **info** para tentar encontrar valores nulos que não deveriam ser nulos.

# Processo de limpeza de dados nulos e padronização de dados

In [77]:
df.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 36086 entries, 0 to 36085
Data columns (total 23 columns):
 #   Column                Non-Null Count  Dtype 
---  ------                --------------  ----- 
 0   DATA                  36086 non-null  object
 1   FONTE                 36086 non-null  object
 2   FUNCAO                36086 non-null  object
 3   PROGRAMA              36086 non-null  object
 4   ACAO                  36086 non-null  object
 5   SUBELEMENTO           36086 non-null  object
 6   ORGAO                 36086 non-null  object
 7   TIPO                  36086 non-null  object
 8   ELEMENTO              36086 non-null  object
 9   DOCUMENTO             36086 non-null  object
 10  VALOR_EMPENHADO       36086 non-null  object
 11  ITEM                  9374 non-null   object
 12  UNIDADE_ITEM          9374 non-null   object
 13  QUANTIDADE_ITEM       9374 non-null   object
 14  VALOR_PRECO_UNITARIO  9374 non-null   object
 15  VALOR_TOTAL           9374 non-null 

Converção de certas colunas para númerico e data, e preenchimento das mesmas que estão com valores nulos para 0 para não interferir em possíveis cálculos. Foi descoberto também durante a limpeza que os valores de documentos estavam com espaços antes ou/e após os números do mesmo, então se teve o trabalho de retirar estes espaços.

In [78]:
df_cleaned = df.copy()

df_cleaned['DATA'] = pd.to_datetime(df_cleaned['DATA'], errors="coerce")
df_cleaned['VALOR_EMPENHADO'] = pd.to_numeric(df_cleaned['VALOR_EMPENHADO'].str.replace(",","."), errors="coerce")
df_cleaned['DOCUMENTO'] = df_cleaned['DOCUMENTO'].str.replace(" ", "")

df_cleaned['QUANTIDADE_ITEM'] = pd.to_numeric(df_cleaned['QUANTIDADE_ITEM'].str.replace(",","."), errors="coerce")
df_cleaned['VALOR_PRECO_UNITARIO'] = pd.to_numeric(df_cleaned['VALOR_PRECO_UNITARIO'].str.replace(",","."), errors="coerce")
df_cleaned['VALOR_TOTAL'] = pd.to_numeric(df_cleaned['VALOR_TOTAL'].str.replace(",","."), errors="coerce")
df_cleaned['VALOR_LIQUIDADO'] = pd.to_numeric(df_cleaned['VALOR_LIQUIDADO'].str.replace(",","."), errors="coerce")
df_cleaned['VALOR_DEVOLVIDO'] = pd.to_numeric(df_cleaned['VALOR_DEVOLVIDO'].str.replace(",","."), errors="coerce")
df_cleaned['VALOR_ANULADO'] = pd.to_numeric(df_cleaned['VALOR_ANULADO'].str.replace(",","."), errors="coerce")
df_cleaned['VALOR_PAGO'] = pd.to_numeric(df_cleaned['VALOR_PAGO'].str.replace(",","."), errors="coerce")
df_cleaned['VALOR_CONSIGNADO'] = pd.to_numeric(df_cleaned['VALOR_CONSIGNADO'].str.replace(",","."), errors="coerce")

df_cleaned['QUANTIDADE_ITEM'] = df_cleaned['QUANTIDADE_ITEM'].fillna(0)
df_cleaned['VALOR_PRECO_UNITARIO'] = df_cleaned['VALOR_PRECO_UNITARIO'].fillna(0)
df_cleaned['VALOR_TOTAL'] = df_cleaned['VALOR_TOTAL'].fillna(0)
df_cleaned['VALOR_LIQUIDADO'] = df_cleaned['VALOR_LIQUIDADO'].fillna(0)
df_cleaned['VALOR_DEVOLVIDO'] = df_cleaned['VALOR_DEVOLVIDO'].fillna(0)
df_cleaned['VALOR_ANULADO'] = df_cleaned['VALOR_ANULADO'].fillna(0)
df_cleaned['VALOR_PAGO'] = df_cleaned['VALOR_PAGO'].fillna(0)
df_cleaned['VALOR_CONSIGNADO'] = df_cleaned['VALOR_CONSIGNADO'].fillna(0)

df_cleaned

Unnamed: 0,DATA,FONTE,FUNCAO,PROGRAMA,ACAO,SUBELEMENTO,ORGAO,TIPO,ELEMENTO,DOCUMENTO,VALOR_EMPENHADO,ITEM,UNIDADE_ITEM,QUANTIDADE_ITEM,VALOR_PRECO_UNITARIO,VALOR_TOTAL,DATA_TRANSACAO,STATUS_TRANSACAO,VALOR_LIQUIDADO,VALOR_DEVOLVIDO,VALOR_ANULADO,VALOR_PAGO,VALOR_CONSIGNADO
0,2022-06-09,Recursos Próprios do Fundo Municipal de Apoio ...,ASSISTÊNCIA SOCIAL,PROGRAMA VIVA CURITIBA QUE NÃO DORME,DESENVOLVIMENTO E EXECUÇÃO DE AÇÕES DE ATENDIM...,LOCAÇÃO DE BENS MÓVEIS E OUTRAS NATUREZAS E IN...,FUNDO MUNICIPAL DE APOIO AO DEFICIENTE,OUTROS SERVIÇOS DE TERCEIROS - PESSOA JURÍDICA,Outros Serviços de Terceiros - Pessoa Jurídica,33038864000151,5103.00,"BRINQUEDO INFLÁVEL, LOCAÇÃO, PULA PULA, CASTE...",MO,3.0,705.0,2115.0,,,0.00,0.0,0.00,0.00,0.0
1,2022-06-09,Recursos Próprios do Fundo Municipal de Apoio ...,ASSISTÊNCIA SOCIAL,PROGRAMA VIVA CURITIBA QUE NÃO DORME,DESENVOLVIMENTO E EXECUÇÃO DE AÇÕES DE ATENDIM...,LOCAÇÃO DE BENS MÓVEIS E OUTRAS NATUREZAS E IN...,FUNDO MUNICIPAL DE APOIO AO DEFICIENTE,OUTROS SERVIÇOS DE TERCEIROS - PESSOA JURÍDICA,Outros Serviços de Terceiros - Pessoa Jurídica,33038864000151,5103.00,"BRINQUEDO, PISCINA DE BOLINHAS CONVENCIONAL,",MO,2.0,402.0,804.0,,,0.00,0.0,0.00,0.00,0.0
2,2022-06-23,Recursos Próprios do Fundo Municipal de Habita...,HABITAÇÃO,PROGRAMA VIVA CURITIBA CIDADÃ,"MANUTENÇÃO E EXECUÇÃO DOS SERVIÇOS TÉCNICOS, A...",SERVIÇOS TÉCNICOS PROFISSIONAIS,FUNDO MUNICIPAL DE HABITAÇÃO DE INTERESSE SOCIAL,OUTROS SERVIÇOS DE TERCEIROS - PESSOA JURÍDICA,Outros Serviços de Terceiros - Pessoa Jurídica,03864060000140,1665.88,,,0.0,0.0,0.0,2022-07-22 00:00:00.000,Anulado de Empenho,0.00,0.0,532.44,0.00,0.0
3,2022-06-23,Recursos Próprios do Fundo Municipal de Habita...,HABITAÇÃO,PROGRAMA VIVA CURITIBA CIDADÃ,"MANUTENÇÃO E EXECUÇÃO DOS SERVIÇOS TÉCNICOS, A...",SERVIÇOS TÉCNICOS PROFISSIONAIS,FUNDO MUNICIPAL DE HABITAÇÃO DE INTERESSE SOCIAL,OUTROS SERVIÇOS DE TERCEIROS - PESSOA JURÍDICA,Outros Serviços de Terceiros - Pessoa Jurídica,03864060000140,1665.88,,,0.0,0.0,0.0,2022-07-14 00:00:00.000,Pagamento de Empenho,0.00,0.0,0.00,1133.44,0.0
4,2022-06-23,Recursos Próprios do Fundo Municipal de Habita...,HABITAÇÃO,PROGRAMA VIVA CURITIBA CIDADÃ,"MANUTENÇÃO E EXECUÇÃO DOS SERVIÇOS TÉCNICOS, A...",SERVIÇOS TÉCNICOS PROFISSIONAIS,FUNDO MUNICIPAL DE HABITAÇÃO DE INTERESSE SOCIAL,OUTROS SERVIÇOS DE TERCEIROS - PESSOA JURÍDICA,Outros Serviços de Terceiros - Pessoa Jurídica,03864060000140,1665.88,,,0.0,0.0,0.0,2022-07-13 00:00:00.000,Liquidação de Empenho,1133.44,0.0,0.00,0.00,0.0
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
36081,2022-08-31,Programa Dinheiro Direto na Escola - PDDE - Ed...,EDUCAÇÃO,PROGRAMA VIVA CURITIBA CIDADÃ,TRANSFERÊNCIA DE RECURSOS ÀS ENTIDADES PRIVADA...,DEMAIS ENTIDADES DO TERCEIRO SETOR P/ PROMOÇÃO...,SECRETARIA MUNICIPAL DA EDUCAÇÃO,CONTRIBUIÇÕES,Contribuições,05803469000182,3496.00,,,0.0,0.0,0.0,,,0.00,0.0,0.00,0.00,0.0
36082,2022-08-31,Programa Dinheiro Direto na Escola - PDDE - Ed...,EDUCAÇÃO,PROGRAMA VIVA CURITIBA CIDADÃ,TRANSFERÊNCIA DE RECURSOS ÀS ENTIDADES PRIVADA...,DEMAIS ENTIDADES DO TERCEIRO SETOR P/ PROMOÇÃO...,SECRETARIA MUNICIPAL DA EDUCAÇÃO,CONTRIBUIÇÕES,Contribuições,06901226000140,2136.00,,,0.0,0.0,0.0,,,0.00,0.0,0.00,0.00,0.0
36083,2022-08-31,Programa Dinheiro Direto na Escola - PDDE - Ed...,EDUCAÇÃO,PROGRAMA VIVA CURITIBA CIDADÃ,TRANSFERÊNCIA DE RECURSOS ÀS ENTIDADES PRIVADA...,DEMAIS ENTIDADES DO TERCEIRO SETOR P/ PROMOÇÃO...,SECRETARIA MUNICIPAL DA EDUCAÇÃO,CONTRIBUIÇÕES,Contribuições,05680653000182,2684.00,,,0.0,0.0,0.0,,,0.00,0.0,0.00,0.00,0.0
36084,2022-08-31,Recursos Ordinários (Livres),ADMINISTRAÇÃO,PROGRAMA VIVA CURITIBA TRANSPARENTE,"PROMOÇÃO DA ASSISTÊNCIA GERAL AO SERVIDOR, CON...",AUXÍLIO-FUNERAL,"SECRETARIA MUNICIPAL DE ADMINISTRAÇÃO, GESTÃO ...",OUTROS BENEFÍCIOS ASSISTENCIAIS DO SERVIDO...,Outros Benefícios Assistenciais,92049168934,2050.00,,,0.0,0.0,0.0,,,0.00,0.0,0.00,0.00,0.0


Análise de coluna **ITEM** e similares para tentar limpar e padronizar os dados da mesma, sendo que possuem pouca diferença a não ser no modo como foi escrito.

In [79]:
df_cleaned['ITEM'] = df_cleaned['ITEM'].fillna("SEM ITEM")
df_cleaned['UNIDADE_ITEM'] = df_cleaned['UNIDADE_ITEM'].fillna("SEM UNIDADE")
df_cleaned['STATUS_TRANSACAO'] = df_cleaned['STATUS_TRANSACAO'].fillna("SEM STATUS")
df_cleaned['DATA_TRANSACAO'] = df_cleaned['DATA_TRANSACAO'].fillna("SEM DATA")

df_cleaned['ITEM'].unique()

array(['BRINQUEDO INFLÁVEL, LOCAÇÃO,  PULA PULA, CASTELO INFLÁVEL, SERVIÇO DE LOCAÇÃO',
       'BRINQUEDO,  PISCINA DE BOLINHAS CONVENCIONAL,', 'SEM ITEM', ...,
       'BALANÇA,  DIGITAL DE BOLSO DE ALTA PRECISÃO, CARACTERÍSTICAS DO, MB/BALANÇA DE BOLSO',
       'MEMÓRIA,  EPROM, PARA ELEVADOR,',
       'ROLDANA,  EM NYLON, PARA ELEVADOR,'], dtype=object)

Limpeza de alguns itens.

In [80]:
df_cleaned['ITEM'] = df_cleaned['ITEM'].str.replace(r'^MEMÓRIA.*.PARA ELEVADOR', 'BALANÇA PARA ELEVADOR', regex=True)
df_cleaned['ITEM'] = df_cleaned['ITEM'].str.replace(r'^ROLDANA.*.PARA ELEVADOR', 'ROLDANA PARA ELEVADOR', regex=True)
df_cleaned['ITEM'] = df_cleaned['ITEM'].str.replace(r'^BRINQUEDO.*', 'BRINQUEDO', regex=True)
df_cleaned['ITEM'] = df_cleaned['ITEM'].str.replace(r'^AMBULÂNCIA.*', 'AMBULÂNCIA', regex=True)
df_cleaned['ITEM'] = df_cleaned['ITEM'].str.replace(r'^BALANÇA.*', 'BALANÇA', regex=True)
df_cleaned['ITEM'] = df_cleaned['ITEM'].str.replace(r'^CAMISA.*', 'CAMISA', regex=True)
df_cleaned['ITEM'] = df_cleaned['ITEM'].str.replace(r'^UNIFORME.*', 'UNIFORME', regex=True)
df_cleaned['ITEM'] = df_cleaned['ITEM'].str.replace(r'^CABINE.*.SANITÁRIA.*', 'CABINE SANITÁRIA', regex=True)
df_cleaned['ITEM'] = df_cleaned['ITEM'].str.replace(r'^FIO.*', 'BARBANTE', regex=True)
df_cleaned['ITEM'] = df_cleaned['ITEM'].str.replace(r'^LINHA.*', 'BARBANTE', regex=True)
df_cleaned['ITEM'] = df_cleaned['ITEM'].str.replace(r'^AGULHA.*', 'AGULHA', regex=True)
df_cleaned['ITEM'] = df_cleaned['ITEM'].str.replace(r'^TECIDO.*', 'TECIDO', regex=True)
df_cleaned['ITEM'] = df_cleaned['ITEM'].str.replace(r'^TELA.*.PARA PINTURA.*', 'TELA PARA PINTURA', regex=True)
df_cleaned['ITEM'] = df_cleaned['ITEM'].str.replace(r'^TINTA.*', 'TINTA', regex=True)
df_cleaned['ITEM'] = df_cleaned['ITEM'].str.replace(r'^PINCEL.*', 'PINCEL', regex=True)
df_cleaned['ITEM'] = df_cleaned['ITEM'].str.replace(r'^LOCAÇÃO.*', 'LOCAÇÃO', regex=True)
df_cleaned['ITEM'] = df_cleaned['ITEM'].str.replace(r'^ESTRUTURA METÁLICA.*', 'LOCAÇÃO', regex=True)
df_cleaned['ITEM'] = df_cleaned['ITEM'].str.replace(r'^RECARGA.*.EXTINTOR.*', 'RECARGA DE EXTINTOR', regex=True)
df_cleaned['ITEM'] = df_cleaned['ITEM'].str.replace(r'^PLACA.*.SINALIZAÇÃO.*', 'PLACA DE SINALIZAÇÃO', regex=True)
df_cleaned['ITEM'] = df_cleaned['ITEM'].str.replace(r'^SUPORTE.*.EXTINTOR.*', 'SUPORTE DE EXTINTOR', regex=True)
df_cleaned['ITEM'] = df_cleaned['ITEM'].str.replace(r'^CERTIFICADO.*', 'CERTIFICADO', regex=True)
df_cleaned['ITEM'] = df_cleaned['ITEM'].str.replace(r'^ETIQUETA.*', 'ETIQUETA', regex=True)
df_cleaned['ITEM'] = df_cleaned['ITEM'].str.replace(r'^CANETA.*', 'CANETA', regex=True)
df_cleaned['ITEM'] = df_cleaned['ITEM'].str.replace(r'^BORRACHA.*', 'BORRACHA', regex=True)
df_cleaned['ITEM'] = df_cleaned['ITEM'].str.replace(r'^PAPEL.*', 'PAPEL', regex=True)
df_cleaned['ITEM'] = df_cleaned['ITEM'].str.replace(r'^BLOCO.*.RECADO.*', 'BLOCO PARA RECADO', regex=True)
df_cleaned['ITEM'] = df_cleaned['ITEM'].str.replace(r'^BALÃO.*', 'BALÃO', regex=True)
df_cleaned['ITEM'] = df_cleaned['ITEM'].str.replace(r'^REFIL.*.COLA QUENTE.*', 'REFIL DE COLA QUENTE', regex=True)
df_cleaned['ITEM'] = df_cleaned['ITEM'].str.replace(r'^LÁPIS.*', 'LÁPIS', regex=True)
df_cleaned['ITEM'] = df_cleaned['ITEM'].str.replace(r'^SACO.*.PLÁSTICO.*', 'SACO PLÁSTICO', regex=True)
df_cleaned['ITEM'] = df_cleaned['ITEM'].str.replace(r'^APRESENTADOR.*', 'APRESENTADOR', regex=True)
df_cleaned['ITEM'] = df_cleaned['ITEM'].str.replace(r'^MULTIMÍDIA.*', 'MULTIMÍDIA', regex=True)
df_cleaned['ITEM'] = df_cleaned['ITEM'].str.replace(r'^CABO.*.HDMI.*', 'CABO HDMI', regex=True)
df_cleaned['ITEM'] = df_cleaned['ITEM'].str.replace(r'^CARTUCHO.*.TINTA.*', 'CARTUCHO TINTA', regex=True)
df_cleaned['ITEM'] = df_cleaned['ITEM'].str.replace(r'^CADEIRA.*', 'CADEIRA', regex=True)
df_cleaned['ITEM'] = df_cleaned['ITEM'].str.replace(r'^PORTA.*', 'PORTA', regex=True)
df_cleaned['ITEM'] = df_cleaned['ITEM'].str.replace(r'^VIDRO.*', 'VIDRO', regex=True)
df_cleaned['ITEM'] = df_cleaned['ITEM'].str.replace(r'^DO IPPUC.*', 'OUTROS', regex=True)
df_cleaned['ITEM'] = df_cleaned['ITEM'].str.replace(r'^FECAHDURA.*', 'FECAHDURA', regex=True)
df_cleaned['ITEM'] = df_cleaned['ITEM'].str.replace(r'^ÁGUA.*', 'ÁGUA', regex=True)
df_cleaned['ITEM'] = df_cleaned['ITEM'].str.replace(r'^SONDAGEM.*', 'SONDAGEM', regex=True)
df_cleaned['ITEM'] = df_cleaned['ITEM'].str.replace(r'^LEVANTAMENTO PLANIALTIMÉTRICO.*', 'LEVANTAMENTO PLANIALTIMÉTRICO', regex=True)
df_cleaned['ITEM'] = df_cleaned['ITEM'].str.replace(r'^CONDULETE.*', 'CONDULETE', regex=True)
df_cleaned['ITEM'] = df_cleaned['ITEM'].str.replace(r'^TAMPA.*.CONDULETE.*', 'TAMPA PARA CONDULETE', regex=True)
df_cleaned['ITEM'] = df_cleaned['ITEM'].str.replace(r'^ELETRODUTO.*', 'ELETRODUTO', regex=True)
df_cleaned['ITEM'] = df_cleaned['ITEM'].str.replace(r'^LUVA.*', 'LUVA', regex=True)
df_cleaned['ITEM'] = df_cleaned['ITEM'].str.replace(r'^CORREDOR.*', 'CORREDOR', regex=True)
df_cleaned['ITEM'] = df_cleaned['ITEM'].str.replace(r'^DA INEXIGIBILIDADE.*', 'OUTROS', regex=True)
df_cleaned['ITEM'] = df_cleaned['ITEM'].str.replace(r'^LENÇO.*', 'LENÇO', regex=True)
df_cleaned['ITEM'] = df_cleaned['ITEM'].str.replace(r'^ELÁSTICO.*', 'ELÁSTICO', regex=True)
df_cleaned['ITEM'] = df_cleaned['ITEM'].str.replace(r'^PERCEVEJO.*', 'PERCEVEJO', regex=True)
df_cleaned['ITEM'] = df_cleaned['ITEM'].str.replace(r'^GRAMPO.*', 'GRAMPO', regex=True)
df_cleaned['ITEM'] = df_cleaned['ITEM'].str.replace(r'^TESOURA.*', 'TESOURA', regex=True)
df_cleaned['ITEM'] = df_cleaned['ITEM'].str.replace(r'^CORRETIVO.*', 'CORRETIVO', regex=True)
df_cleaned['ITEM'] = df_cleaned['ITEM'].str.replace(r'^CLIPS.*', 'CLIPS', regex=True)
df_cleaned['ITEM'] = df_cleaned['ITEM'].str.replace(r'^ESTILETE.*', 'ESTILETE', regex=True)
df_cleaned['ITEM'] = df_cleaned['ITEM'].str.replace(r'^UMEDECEDOR.*', 'UMEDECEDOR', regex=True)
df_cleaned['ITEM'] = df_cleaned['ITEM'].str.replace(r'^VASSOURA.*', 'VASSOURA', regex=True)
df_cleaned['ITEM'] = df_cleaned['ITEM'].str.replace(r'^CHÁ.*', 'CHÁ', regex=True)

df_cleaned['ITEM'].unique()

array(['BRINQUEDO', 'SEM ITEM', 'AMBULÂNCIA', ..., 'CAMISA', 'BALANÇA',
       'ROLDANA PARA ELEVADOR,'], dtype=object)

Vamos criar uma coluna para diferenciar tipos de documento que está ligado à despesa.

In [81]:
df_cleaned['DOCUMENTO_TIPO'] = df_cleaned['DOCUMENTO'].apply(lambda x: 'CPF' if len(x) == 11 else 'CNPJ' if len(x) == 14 else 'DESCONHECIDO')
df_cleaned

Unnamed: 0,DATA,FONTE,FUNCAO,PROGRAMA,ACAO,SUBELEMENTO,ORGAO,TIPO,ELEMENTO,DOCUMENTO,VALOR_EMPENHADO,ITEM,UNIDADE_ITEM,QUANTIDADE_ITEM,VALOR_PRECO_UNITARIO,VALOR_TOTAL,DATA_TRANSACAO,STATUS_TRANSACAO,VALOR_LIQUIDADO,VALOR_DEVOLVIDO,VALOR_ANULADO,VALOR_PAGO,VALOR_CONSIGNADO,DOCUMENTO_TIPO
0,2022-06-09,Recursos Próprios do Fundo Municipal de Apoio ...,ASSISTÊNCIA SOCIAL,PROGRAMA VIVA CURITIBA QUE NÃO DORME,DESENVOLVIMENTO E EXECUÇÃO DE AÇÕES DE ATENDIM...,LOCAÇÃO DE BENS MÓVEIS E OUTRAS NATUREZAS E IN...,FUNDO MUNICIPAL DE APOIO AO DEFICIENTE,OUTROS SERVIÇOS DE TERCEIROS - PESSOA JURÍDICA,Outros Serviços de Terceiros - Pessoa Jurídica,33038864000151,5103.00,BRINQUEDO,MO,3.0,705.0,2115.0,SEM DATA,SEM STATUS,0.00,0.0,0.00,0.00,0.0,CNPJ
1,2022-06-09,Recursos Próprios do Fundo Municipal de Apoio ...,ASSISTÊNCIA SOCIAL,PROGRAMA VIVA CURITIBA QUE NÃO DORME,DESENVOLVIMENTO E EXECUÇÃO DE AÇÕES DE ATENDIM...,LOCAÇÃO DE BENS MÓVEIS E OUTRAS NATUREZAS E IN...,FUNDO MUNICIPAL DE APOIO AO DEFICIENTE,OUTROS SERVIÇOS DE TERCEIROS - PESSOA JURÍDICA,Outros Serviços de Terceiros - Pessoa Jurídica,33038864000151,5103.00,BRINQUEDO,MO,2.0,402.0,804.0,SEM DATA,SEM STATUS,0.00,0.0,0.00,0.00,0.0,CNPJ
2,2022-06-23,Recursos Próprios do Fundo Municipal de Habita...,HABITAÇÃO,PROGRAMA VIVA CURITIBA CIDADÃ,"MANUTENÇÃO E EXECUÇÃO DOS SERVIÇOS TÉCNICOS, A...",SERVIÇOS TÉCNICOS PROFISSIONAIS,FUNDO MUNICIPAL DE HABITAÇÃO DE INTERESSE SOCIAL,OUTROS SERVIÇOS DE TERCEIROS - PESSOA JURÍDICA,Outros Serviços de Terceiros - Pessoa Jurídica,03864060000140,1665.88,SEM ITEM,SEM UNIDADE,0.0,0.0,0.0,2022-07-22 00:00:00.000,Anulado de Empenho,0.00,0.0,532.44,0.00,0.0,CNPJ
3,2022-06-23,Recursos Próprios do Fundo Municipal de Habita...,HABITAÇÃO,PROGRAMA VIVA CURITIBA CIDADÃ,"MANUTENÇÃO E EXECUÇÃO DOS SERVIÇOS TÉCNICOS, A...",SERVIÇOS TÉCNICOS PROFISSIONAIS,FUNDO MUNICIPAL DE HABITAÇÃO DE INTERESSE SOCIAL,OUTROS SERVIÇOS DE TERCEIROS - PESSOA JURÍDICA,Outros Serviços de Terceiros - Pessoa Jurídica,03864060000140,1665.88,SEM ITEM,SEM UNIDADE,0.0,0.0,0.0,2022-07-14 00:00:00.000,Pagamento de Empenho,0.00,0.0,0.00,1133.44,0.0,CNPJ
4,2022-06-23,Recursos Próprios do Fundo Municipal de Habita...,HABITAÇÃO,PROGRAMA VIVA CURITIBA CIDADÃ,"MANUTENÇÃO E EXECUÇÃO DOS SERVIÇOS TÉCNICOS, A...",SERVIÇOS TÉCNICOS PROFISSIONAIS,FUNDO MUNICIPAL DE HABITAÇÃO DE INTERESSE SOCIAL,OUTROS SERVIÇOS DE TERCEIROS - PESSOA JURÍDICA,Outros Serviços de Terceiros - Pessoa Jurídica,03864060000140,1665.88,SEM ITEM,SEM UNIDADE,0.0,0.0,0.0,2022-07-13 00:00:00.000,Liquidação de Empenho,1133.44,0.0,0.00,0.00,0.0,CNPJ
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
36081,2022-08-31,Programa Dinheiro Direto na Escola - PDDE - Ed...,EDUCAÇÃO,PROGRAMA VIVA CURITIBA CIDADÃ,TRANSFERÊNCIA DE RECURSOS ÀS ENTIDADES PRIVADA...,DEMAIS ENTIDADES DO TERCEIRO SETOR P/ PROMOÇÃO...,SECRETARIA MUNICIPAL DA EDUCAÇÃO,CONTRIBUIÇÕES,Contribuições,05803469000182,3496.00,SEM ITEM,SEM UNIDADE,0.0,0.0,0.0,SEM DATA,SEM STATUS,0.00,0.0,0.00,0.00,0.0,CNPJ
36082,2022-08-31,Programa Dinheiro Direto na Escola - PDDE - Ed...,EDUCAÇÃO,PROGRAMA VIVA CURITIBA CIDADÃ,TRANSFERÊNCIA DE RECURSOS ÀS ENTIDADES PRIVADA...,DEMAIS ENTIDADES DO TERCEIRO SETOR P/ PROMOÇÃO...,SECRETARIA MUNICIPAL DA EDUCAÇÃO,CONTRIBUIÇÕES,Contribuições,06901226000140,2136.00,SEM ITEM,SEM UNIDADE,0.0,0.0,0.0,SEM DATA,SEM STATUS,0.00,0.0,0.00,0.00,0.0,CNPJ
36083,2022-08-31,Programa Dinheiro Direto na Escola - PDDE - Ed...,EDUCAÇÃO,PROGRAMA VIVA CURITIBA CIDADÃ,TRANSFERÊNCIA DE RECURSOS ÀS ENTIDADES PRIVADA...,DEMAIS ENTIDADES DO TERCEIRO SETOR P/ PROMOÇÃO...,SECRETARIA MUNICIPAL DA EDUCAÇÃO,CONTRIBUIÇÕES,Contribuições,05680653000182,2684.00,SEM ITEM,SEM UNIDADE,0.0,0.0,0.0,SEM DATA,SEM STATUS,0.00,0.0,0.00,0.00,0.0,CNPJ
36084,2022-08-31,Recursos Ordinários (Livres),ADMINISTRAÇÃO,PROGRAMA VIVA CURITIBA TRANSPARENTE,"PROMOÇÃO DA ASSISTÊNCIA GERAL AO SERVIDOR, CON...",AUXÍLIO-FUNERAL,"SECRETARIA MUNICIPAL DE ADMINISTRAÇÃO, GESTÃO ...",OUTROS BENEFÍCIOS ASSISTENCIAIS DO SERVIDO...,Outros Benefícios Assistenciais,92049168934,2050.00,SEM ITEM,SEM UNIDADE,0.0,0.0,0.0,SEM DATA,SEM STATUS,0.00,0.0,0.00,0.00,0.0,CPF


Precisamos verificar se há despesas com documento desconhecido e entender se podemos tirar.

In [82]:
df_cleaned = df_cleaned[df_cleaned['DOCUMENTO_TIPO'] != 'DESCONHECIDO']
df_cleaned

Unnamed: 0,DATA,FONTE,FUNCAO,PROGRAMA,ACAO,SUBELEMENTO,ORGAO,TIPO,ELEMENTO,DOCUMENTO,VALOR_EMPENHADO,ITEM,UNIDADE_ITEM,QUANTIDADE_ITEM,VALOR_PRECO_UNITARIO,VALOR_TOTAL,DATA_TRANSACAO,STATUS_TRANSACAO,VALOR_LIQUIDADO,VALOR_DEVOLVIDO,VALOR_ANULADO,VALOR_PAGO,VALOR_CONSIGNADO,DOCUMENTO_TIPO
0,2022-06-09,Recursos Próprios do Fundo Municipal de Apoio ...,ASSISTÊNCIA SOCIAL,PROGRAMA VIVA CURITIBA QUE NÃO DORME,DESENVOLVIMENTO E EXECUÇÃO DE AÇÕES DE ATENDIM...,LOCAÇÃO DE BENS MÓVEIS E OUTRAS NATUREZAS E IN...,FUNDO MUNICIPAL DE APOIO AO DEFICIENTE,OUTROS SERVIÇOS DE TERCEIROS - PESSOA JURÍDICA,Outros Serviços de Terceiros - Pessoa Jurídica,33038864000151,5103.00,BRINQUEDO,MO,3.0,705.0,2115.0,SEM DATA,SEM STATUS,0.00,0.0,0.00,0.00,0.0,CNPJ
1,2022-06-09,Recursos Próprios do Fundo Municipal de Apoio ...,ASSISTÊNCIA SOCIAL,PROGRAMA VIVA CURITIBA QUE NÃO DORME,DESENVOLVIMENTO E EXECUÇÃO DE AÇÕES DE ATENDIM...,LOCAÇÃO DE BENS MÓVEIS E OUTRAS NATUREZAS E IN...,FUNDO MUNICIPAL DE APOIO AO DEFICIENTE,OUTROS SERVIÇOS DE TERCEIROS - PESSOA JURÍDICA,Outros Serviços de Terceiros - Pessoa Jurídica,33038864000151,5103.00,BRINQUEDO,MO,2.0,402.0,804.0,SEM DATA,SEM STATUS,0.00,0.0,0.00,0.00,0.0,CNPJ
2,2022-06-23,Recursos Próprios do Fundo Municipal de Habita...,HABITAÇÃO,PROGRAMA VIVA CURITIBA CIDADÃ,"MANUTENÇÃO E EXECUÇÃO DOS SERVIÇOS TÉCNICOS, A...",SERVIÇOS TÉCNICOS PROFISSIONAIS,FUNDO MUNICIPAL DE HABITAÇÃO DE INTERESSE SOCIAL,OUTROS SERVIÇOS DE TERCEIROS - PESSOA JURÍDICA,Outros Serviços de Terceiros - Pessoa Jurídica,03864060000140,1665.88,SEM ITEM,SEM UNIDADE,0.0,0.0,0.0,2022-07-22 00:00:00.000,Anulado de Empenho,0.00,0.0,532.44,0.00,0.0,CNPJ
3,2022-06-23,Recursos Próprios do Fundo Municipal de Habita...,HABITAÇÃO,PROGRAMA VIVA CURITIBA CIDADÃ,"MANUTENÇÃO E EXECUÇÃO DOS SERVIÇOS TÉCNICOS, A...",SERVIÇOS TÉCNICOS PROFISSIONAIS,FUNDO MUNICIPAL DE HABITAÇÃO DE INTERESSE SOCIAL,OUTROS SERVIÇOS DE TERCEIROS - PESSOA JURÍDICA,Outros Serviços de Terceiros - Pessoa Jurídica,03864060000140,1665.88,SEM ITEM,SEM UNIDADE,0.0,0.0,0.0,2022-07-14 00:00:00.000,Pagamento de Empenho,0.00,0.0,0.00,1133.44,0.0,CNPJ
4,2022-06-23,Recursos Próprios do Fundo Municipal de Habita...,HABITAÇÃO,PROGRAMA VIVA CURITIBA CIDADÃ,"MANUTENÇÃO E EXECUÇÃO DOS SERVIÇOS TÉCNICOS, A...",SERVIÇOS TÉCNICOS PROFISSIONAIS,FUNDO MUNICIPAL DE HABITAÇÃO DE INTERESSE SOCIAL,OUTROS SERVIÇOS DE TERCEIROS - PESSOA JURÍDICA,Outros Serviços de Terceiros - Pessoa Jurídica,03864060000140,1665.88,SEM ITEM,SEM UNIDADE,0.0,0.0,0.0,2022-07-13 00:00:00.000,Liquidação de Empenho,1133.44,0.0,0.00,0.00,0.0,CNPJ
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
36081,2022-08-31,Programa Dinheiro Direto na Escola - PDDE - Ed...,EDUCAÇÃO,PROGRAMA VIVA CURITIBA CIDADÃ,TRANSFERÊNCIA DE RECURSOS ÀS ENTIDADES PRIVADA...,DEMAIS ENTIDADES DO TERCEIRO SETOR P/ PROMOÇÃO...,SECRETARIA MUNICIPAL DA EDUCAÇÃO,CONTRIBUIÇÕES,Contribuições,05803469000182,3496.00,SEM ITEM,SEM UNIDADE,0.0,0.0,0.0,SEM DATA,SEM STATUS,0.00,0.0,0.00,0.00,0.0,CNPJ
36082,2022-08-31,Programa Dinheiro Direto na Escola - PDDE - Ed...,EDUCAÇÃO,PROGRAMA VIVA CURITIBA CIDADÃ,TRANSFERÊNCIA DE RECURSOS ÀS ENTIDADES PRIVADA...,DEMAIS ENTIDADES DO TERCEIRO SETOR P/ PROMOÇÃO...,SECRETARIA MUNICIPAL DA EDUCAÇÃO,CONTRIBUIÇÕES,Contribuições,06901226000140,2136.00,SEM ITEM,SEM UNIDADE,0.0,0.0,0.0,SEM DATA,SEM STATUS,0.00,0.0,0.00,0.00,0.0,CNPJ
36083,2022-08-31,Programa Dinheiro Direto na Escola - PDDE - Ed...,EDUCAÇÃO,PROGRAMA VIVA CURITIBA CIDADÃ,TRANSFERÊNCIA DE RECURSOS ÀS ENTIDADES PRIVADA...,DEMAIS ENTIDADES DO TERCEIRO SETOR P/ PROMOÇÃO...,SECRETARIA MUNICIPAL DA EDUCAÇÃO,CONTRIBUIÇÕES,Contribuições,05680653000182,2684.00,SEM ITEM,SEM UNIDADE,0.0,0.0,0.0,SEM DATA,SEM STATUS,0.00,0.0,0.00,0.00,0.0,CNPJ
36084,2022-08-31,Recursos Ordinários (Livres),ADMINISTRAÇÃO,PROGRAMA VIVA CURITIBA TRANSPARENTE,"PROMOÇÃO DA ASSISTÊNCIA GERAL AO SERVIDOR, CON...",AUXÍLIO-FUNERAL,"SECRETARIA MUNICIPAL DE ADMINISTRAÇÃO, GESTÃO ...",OUTROS BENEFÍCIOS ASSISTENCIAIS DO SERVIDO...,Outros Benefícios Assistenciais,92049168934,2050.00,SEM ITEM,SEM UNIDADE,0.0,0.0,0.0,SEM DATA,SEM STATUS,0.00,0.0,0.00,0.00,0.0,CPF


Por fim, vamos ordenar as colunas manualmente de uma maneira que os dados relacionados fiquem mais próximos.

In [83]:
df_cleaned_columns = list(df_cleaned.columns)
df_cleaned_columns

['DATA',
 'FONTE',
 'FUNCAO',
 'PROGRAMA',
 'ACAO',
 'SUBELEMENTO',
 'ORGAO',
 'TIPO',
 'ELEMENTO',
 'DOCUMENTO',
 'VALOR_EMPENHADO',
 'ITEM',
 'UNIDADE_ITEM',
 'QUANTIDADE_ITEM',
 'VALOR_PRECO_UNITARIO',
 'VALOR_TOTAL',
 'DATA_TRANSACAO',
 'STATUS_TRANSACAO',
 'VALOR_LIQUIDADO',
 'VALOR_DEVOLVIDO',
 'VALOR_ANULADO',
 'VALOR_PAGO',
 'VALOR_CONSIGNADO',
 'DOCUMENTO_TIPO']

In [84]:
df_cleaned_columns = [
 'DATA',
 'FONTE',
 'FUNCAO',
 'TIPO',
 'ORGAO',
 'PROGRAMA',
 'ACAO',
 'ELEMENTO',
 'SUBELEMENTO',
 'DOCUMENTO',
 'DOCUMENTO_TIPO',
 'VALOR_EMPENHADO',
 'ITEM',
 'UNIDADE_ITEM',
 'QUANTIDADE_ITEM',
 'VALOR_PRECO_UNITARIO',
 'VALOR_TOTAL',
 'DATA_TRANSACAO',
 'STATUS_TRANSACAO',
 'VALOR_LIQUIDADO',
 'VALOR_DEVOLVIDO',
 'VALOR_ANULADO',
 'VALOR_PAGO',
 'VALOR_CONSIGNADO'
 ]
df_cleaned[df_cleaned_columns]

Unnamed: 0,DATA,FONTE,FUNCAO,TIPO,ORGAO,PROGRAMA,ACAO,ELEMENTO,SUBELEMENTO,DOCUMENTO,DOCUMENTO_TIPO,VALOR_EMPENHADO,ITEM,UNIDADE_ITEM,QUANTIDADE_ITEM,VALOR_PRECO_UNITARIO,VALOR_TOTAL,DATA_TRANSACAO,STATUS_TRANSACAO,VALOR_LIQUIDADO,VALOR_DEVOLVIDO,VALOR_ANULADO,VALOR_PAGO,VALOR_CONSIGNADO
0,2022-06-09,Recursos Próprios do Fundo Municipal de Apoio ...,ASSISTÊNCIA SOCIAL,OUTROS SERVIÇOS DE TERCEIROS - PESSOA JURÍDICA,FUNDO MUNICIPAL DE APOIO AO DEFICIENTE,PROGRAMA VIVA CURITIBA QUE NÃO DORME,DESENVOLVIMENTO E EXECUÇÃO DE AÇÕES DE ATENDIM...,Outros Serviços de Terceiros - Pessoa Jurídica,LOCAÇÃO DE BENS MÓVEIS E OUTRAS NATUREZAS E IN...,33038864000151,CNPJ,5103.00,BRINQUEDO,MO,3.0,705.0,2115.0,SEM DATA,SEM STATUS,0.00,0.0,0.00,0.00,0.0
1,2022-06-09,Recursos Próprios do Fundo Municipal de Apoio ...,ASSISTÊNCIA SOCIAL,OUTROS SERVIÇOS DE TERCEIROS - PESSOA JURÍDICA,FUNDO MUNICIPAL DE APOIO AO DEFICIENTE,PROGRAMA VIVA CURITIBA QUE NÃO DORME,DESENVOLVIMENTO E EXECUÇÃO DE AÇÕES DE ATENDIM...,Outros Serviços de Terceiros - Pessoa Jurídica,LOCAÇÃO DE BENS MÓVEIS E OUTRAS NATUREZAS E IN...,33038864000151,CNPJ,5103.00,BRINQUEDO,MO,2.0,402.0,804.0,SEM DATA,SEM STATUS,0.00,0.0,0.00,0.00,0.0
2,2022-06-23,Recursos Próprios do Fundo Municipal de Habita...,HABITAÇÃO,OUTROS SERVIÇOS DE TERCEIROS - PESSOA JURÍDICA,FUNDO MUNICIPAL DE HABITAÇÃO DE INTERESSE SOCIAL,PROGRAMA VIVA CURITIBA CIDADÃ,"MANUTENÇÃO E EXECUÇÃO DOS SERVIÇOS TÉCNICOS, A...",Outros Serviços de Terceiros - Pessoa Jurídica,SERVIÇOS TÉCNICOS PROFISSIONAIS,03864060000140,CNPJ,1665.88,SEM ITEM,SEM UNIDADE,0.0,0.0,0.0,2022-07-22 00:00:00.000,Anulado de Empenho,0.00,0.0,532.44,0.00,0.0
3,2022-06-23,Recursos Próprios do Fundo Municipal de Habita...,HABITAÇÃO,OUTROS SERVIÇOS DE TERCEIROS - PESSOA JURÍDICA,FUNDO MUNICIPAL DE HABITAÇÃO DE INTERESSE SOCIAL,PROGRAMA VIVA CURITIBA CIDADÃ,"MANUTENÇÃO E EXECUÇÃO DOS SERVIÇOS TÉCNICOS, A...",Outros Serviços de Terceiros - Pessoa Jurídica,SERVIÇOS TÉCNICOS PROFISSIONAIS,03864060000140,CNPJ,1665.88,SEM ITEM,SEM UNIDADE,0.0,0.0,0.0,2022-07-14 00:00:00.000,Pagamento de Empenho,0.00,0.0,0.00,1133.44,0.0
4,2022-06-23,Recursos Próprios do Fundo Municipal de Habita...,HABITAÇÃO,OUTROS SERVIÇOS DE TERCEIROS - PESSOA JURÍDICA,FUNDO MUNICIPAL DE HABITAÇÃO DE INTERESSE SOCIAL,PROGRAMA VIVA CURITIBA CIDADÃ,"MANUTENÇÃO E EXECUÇÃO DOS SERVIÇOS TÉCNICOS, A...",Outros Serviços de Terceiros - Pessoa Jurídica,SERVIÇOS TÉCNICOS PROFISSIONAIS,03864060000140,CNPJ,1665.88,SEM ITEM,SEM UNIDADE,0.0,0.0,0.0,2022-07-13 00:00:00.000,Liquidação de Empenho,1133.44,0.0,0.00,0.00,0.0
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
36081,2022-08-31,Programa Dinheiro Direto na Escola - PDDE - Ed...,EDUCAÇÃO,CONTRIBUIÇÕES,SECRETARIA MUNICIPAL DA EDUCAÇÃO,PROGRAMA VIVA CURITIBA CIDADÃ,TRANSFERÊNCIA DE RECURSOS ÀS ENTIDADES PRIVADA...,Contribuições,DEMAIS ENTIDADES DO TERCEIRO SETOR P/ PROMOÇÃO...,05803469000182,CNPJ,3496.00,SEM ITEM,SEM UNIDADE,0.0,0.0,0.0,SEM DATA,SEM STATUS,0.00,0.0,0.00,0.00,0.0
36082,2022-08-31,Programa Dinheiro Direto na Escola - PDDE - Ed...,EDUCAÇÃO,CONTRIBUIÇÕES,SECRETARIA MUNICIPAL DA EDUCAÇÃO,PROGRAMA VIVA CURITIBA CIDADÃ,TRANSFERÊNCIA DE RECURSOS ÀS ENTIDADES PRIVADA...,Contribuições,DEMAIS ENTIDADES DO TERCEIRO SETOR P/ PROMOÇÃO...,06901226000140,CNPJ,2136.00,SEM ITEM,SEM UNIDADE,0.0,0.0,0.0,SEM DATA,SEM STATUS,0.00,0.0,0.00,0.00,0.0
36083,2022-08-31,Programa Dinheiro Direto na Escola - PDDE - Ed...,EDUCAÇÃO,CONTRIBUIÇÕES,SECRETARIA MUNICIPAL DA EDUCAÇÃO,PROGRAMA VIVA CURITIBA CIDADÃ,TRANSFERÊNCIA DE RECURSOS ÀS ENTIDADES PRIVADA...,Contribuições,DEMAIS ENTIDADES DO TERCEIRO SETOR P/ PROMOÇÃO...,05680653000182,CNPJ,2684.00,SEM ITEM,SEM UNIDADE,0.0,0.0,0.0,SEM DATA,SEM STATUS,0.00,0.0,0.00,0.00,0.0
36084,2022-08-31,Recursos Ordinários (Livres),ADMINISTRAÇÃO,OUTROS BENEFÍCIOS ASSISTENCIAIS DO SERVIDO...,"SECRETARIA MUNICIPAL DE ADMINISTRAÇÃO, GESTÃO ...",PROGRAMA VIVA CURITIBA TRANSPARENTE,"PROMOÇÃO DA ASSISTÊNCIA GERAL AO SERVIDOR, CON...",Outros Benefícios Assistenciais,AUXÍLIO-FUNERAL,92049168934,CPF,2050.00,SEM ITEM,SEM UNIDADE,0.0,0.0,0.0,SEM DATA,SEM STATUS,0.00,0.0,0.00,0.00,0.0


# Salvando dados limpos

Para salvar os dados limpos em um arquivo, vamos usar o método to_csv

In [85]:
df_cleaned.to_csv('/content/drive/MyDrive/UP/Ciência de Dados/Notebooks/data/dataset_clean.csv', index=False, sep=';')