# Configuração de ambiente

Importação das bibliotecas:
- Pandas: para manipulação de dados através do alias "pd"
- Google Colab: para manipulação de arquivos no Google Drive

E execução do comando "%matplotlib inline" para que os gráficos sejam exibidos no notebook logo abaixo da célula de código que os gerou.

In [86]:
import pandas as pd
from google.colab import drive

%matplotlib inline

Carregamento do Drive para que o notebook possa acessar os arquivos do Google Drive e com o parâmetro "force_remount=True" para que o Drive seja montado a cada execução do notebook.

In [87]:
drive.mount('/content/drive', force_remount=True)

Mounted at /content/drive


# Leitura e visualização do dataset

Leitura do arquivo "dataset.csv" através da função "read_csv" do Pandas e armazenamento do resultado na variável "df". Uso do parâmetro "sep" para informar qual o separador de colunas do arquivo e do parâmetro "encoding" para informar qual o tipo de codificação do arquivo.

In [88]:
csv_url = "https://github.com/viniciusgugelmin/data-science/blob/main/projects/base_de_despesas/data/dataset.csv?raw=true"

df = pd.read_csv(csv_url, sep=';', encoding='iso-8859-1', low_memory=False)

Atribuição do limite de colunas na exibição do dataset para 50 colunas, afim de conseguir visualizar melhor os dados.

In [89]:
pd.set_option('display.max_columns', 50)

Exibição das 5 primeiras linhas do DataFrame através da função "head" do Pandas para verificar se o arquivo foi carregado corretamente e ter uma ideia do que ele contém.

In [90]:
df.head()

Unnamed: 0,ANO_EMPENHO,DT_EMPENHO,CD_FONTE,DS_FONTE,CD_FUNCAO,DS_FUNCAO,CD_PROGRAMA,DS_PROGRAMA,CD_ACAO,DS_ACAO,CD_SUBELEMENTO,DS_SUBELEMENTO,CD_ORGAO,DS_ORGAO,CD_DESPESA,DS_DESPESA,CODIGO_DESPESA_GRUPO,DS_GRUPO,CODIGO_DESPESA_MODALIDADE,DS_MODALIDADE,CODIGO_DESPESA_ELEMENTO,DS_ELEMENTO,CPF_CNPJ,NR_EMPENHO,LICITACAO,VL_EMPENHADO,CD_ITEM,DS_ITEM,DS_UNIDADE,QUANTIDADE,VL_PRECO_UNITARIO,VL_TOTAL,PROTOCOLOSUP,DT_TRANSACAO,NR_PARCELA,TRANSACAO,VL_LIQUIDADO,VL_DEVOLVIDO,VL_ANULADO,VL_PAGO,VL_CONSIGNADO
0,-----------,----------,--------,--------,---------,---------,-----------,-----------,-------,-------,--------------,--------------,--------,--------,----------,----------,--------------------,--------,-------------------------,-------------,-----------------------,-----------,--------,----------,---------,------------,-------,-------,----------,----------,-----------------,--------,------------,------------,------------,------------,------------,------------,----------,-------,-------------
1,2022,2022-06-09,098,Recursos Próprios do Fundo Municipal de Apoio ...,08,ASSISTÊNCIA SOCIAL,0001,PROGRAMA VIVA CURITIBA QUE NÃO DORME,2011,DESENVOLVIMENTO E EXECUÇÃO DE AÇÕES DE ATENDIM...,14,LOCAÇÃO DE BENS MÓVEIS E OUTRAS NATUREZAS E IN...,37,FUNDO MUNICIPAL DE APOIO AO DEFICIENTE,339039,OUTROS SERVIÇOS DE TERCEIROS - PESSOA JURÍDICA,3,Outras Despesas Correntes,90,Aplicações Diretas,39,Outros Serviços de Terceiros - Pessoa Jurídica,33038864000151,5,PE 186/2021 SMAP/SMELJ,510300,3,"BRINQUEDO INFLÁVEL, LOCAÇÃO, PULA PULA, CASTE...",MO,30000,7050000,21150000,,,,,,,,,
2,2022,2022-06-09,098,Recursos Próprios do Fundo Municipal de Apoio ...,08,ASSISTÊNCIA SOCIAL,0001,PROGRAMA VIVA CURITIBA QUE NÃO DORME,2011,DESENVOLVIMENTO E EXECUÇÃO DE AÇÕES DE ATENDIM...,14,LOCAÇÃO DE BENS MÓVEIS E OUTRAS NATUREZAS E IN...,37,FUNDO MUNICIPAL DE APOIO AO DEFICIENTE,339039,OUTROS SERVIÇOS DE TERCEIROS - PESSOA JURÍDICA,3,Outras Despesas Correntes,90,Aplicações Diretas,39,Outros Serviços de Terceiros - Pessoa Jurídica,33038864000151,5,PE 186/2021 SMAP/SMELJ,510300,5,"BRINQUEDO, PISCINA DE BOLINHAS CONVENCIONAL,",MO,20000,4020000,8040000,,,,,,,,,
3,2022,2022-06-23,024,Recursos Próprios do Fundo Municipal de Habita...,16,HABITAÇÃO,0002,PROGRAMA VIVA CURITIBA CIDADÃ,2066,"MANUTENÇÃO E EXECUÇÃO DOS SERVIÇOS TÉCNICOS, A...",5,SERVIÇOS TÉCNICOS PROFISSIONAIS,49,FUNDO MUNICIPAL DE HABITAÇÃO DE INTERESSE SOCIAL,339039,OUTROS SERVIÇOS DE TERCEIROS - PESSOA JURÍDICA,3,Outras Despesas Correntes,90,Aplicações Diretas,39,Outros Serviços de Terceiros - Pessoa Jurídica,03864060000140,6,PE 4/2020 COHAB-CT/FMHIS,166588,,,,,,,01-122405/2022,2022-07-22 00:00:00.000,1,Anulado de Empenho,000,000,53244,000,000
4,2022,2022-06-23,024,Recursos Próprios do Fundo Municipal de Habita...,16,HABITAÇÃO,0002,PROGRAMA VIVA CURITIBA CIDADÃ,2066,"MANUTENÇÃO E EXECUÇÃO DOS SERVIÇOS TÉCNICOS, A...",5,SERVIÇOS TÉCNICOS PROFISSIONAIS,49,FUNDO MUNICIPAL DE HABITAÇÃO DE INTERESSE SOCIAL,339039,OUTROS SERVIÇOS DE TERCEIROS - PESSOA JURÍDICA,3,Outras Despesas Correntes,90,Aplicações Diretas,39,Outros Serviços de Terceiros - Pessoa Jurídica,03864060000140,6,PE 4/2020 COHAB-CT/FMHIS,166588,,,,,,,01-122405/2022,2022-07-14 00:00:00.000,1,Pagamento de Empenho,000,000,000,113344,000


# Processo inicial de limpeza

Exclusão da coluna de índice 0 do DataFrame através da função "drop" do Pandas, pois ela é composta apenas por traços e não possui nenhum valor relevante além de separar as linhas do cabeçalho visualmente.

In [91]:
df = df.drop(0)
df

Unnamed: 0,ANO_EMPENHO,DT_EMPENHO,CD_FONTE,DS_FONTE,CD_FUNCAO,DS_FUNCAO,CD_PROGRAMA,DS_PROGRAMA,CD_ACAO,DS_ACAO,CD_SUBELEMENTO,DS_SUBELEMENTO,CD_ORGAO,DS_ORGAO,CD_DESPESA,DS_DESPESA,CODIGO_DESPESA_GRUPO,DS_GRUPO,CODIGO_DESPESA_MODALIDADE,DS_MODALIDADE,CODIGO_DESPESA_ELEMENTO,DS_ELEMENTO,CPF_CNPJ,NR_EMPENHO,LICITACAO,VL_EMPENHADO,CD_ITEM,DS_ITEM,DS_UNIDADE,QUANTIDADE,VL_PRECO_UNITARIO,VL_TOTAL,PROTOCOLOSUP,DT_TRANSACAO,NR_PARCELA,TRANSACAO,VL_LIQUIDADO,VL_DEVOLVIDO,VL_ANULADO,VL_PAGO,VL_CONSIGNADO
1,2022,2022-06-09,098,Recursos Próprios do Fundo Municipal de Apoio ...,08,ASSISTÊNCIA SOCIAL,0001,PROGRAMA VIVA CURITIBA QUE NÃO DORME,2011,DESENVOLVIMENTO E EXECUÇÃO DE AÇÕES DE ATENDIM...,14,LOCAÇÃO DE BENS MÓVEIS E OUTRAS NATUREZAS E IN...,37,FUNDO MUNICIPAL DE APOIO AO DEFICIENTE,339039,OUTROS SERVIÇOS DE TERCEIROS - PESSOA JURÍDICA,3,Outras Despesas Correntes,90,Aplicações Diretas,39,Outros Serviços de Terceiros - Pessoa Jurídica,33038864000151,5,PE 186/2021 SMAP/SMELJ,510300,3,"BRINQUEDO INFLÁVEL, LOCAÇÃO, PULA PULA, CASTE...",MO,30000,7050000,21150000,,,,,,,,,
2,2022,2022-06-09,098,Recursos Próprios do Fundo Municipal de Apoio ...,08,ASSISTÊNCIA SOCIAL,0001,PROGRAMA VIVA CURITIBA QUE NÃO DORME,2011,DESENVOLVIMENTO E EXECUÇÃO DE AÇÕES DE ATENDIM...,14,LOCAÇÃO DE BENS MÓVEIS E OUTRAS NATUREZAS E IN...,37,FUNDO MUNICIPAL DE APOIO AO DEFICIENTE,339039,OUTROS SERVIÇOS DE TERCEIROS - PESSOA JURÍDICA,3,Outras Despesas Correntes,90,Aplicações Diretas,39,Outros Serviços de Terceiros - Pessoa Jurídica,33038864000151,5,PE 186/2021 SMAP/SMELJ,510300,5,"BRINQUEDO, PISCINA DE BOLINHAS CONVENCIONAL,",MO,20000,4020000,8040000,,,,,,,,,
3,2022,2022-06-23,024,Recursos Próprios do Fundo Municipal de Habita...,16,HABITAÇÃO,0002,PROGRAMA VIVA CURITIBA CIDADÃ,2066,"MANUTENÇÃO E EXECUÇÃO DOS SERVIÇOS TÉCNICOS, A...",5,SERVIÇOS TÉCNICOS PROFISSIONAIS,49,FUNDO MUNICIPAL DE HABITAÇÃO DE INTERESSE SOCIAL,339039,OUTROS SERVIÇOS DE TERCEIROS - PESSOA JURÍDICA,3,Outras Despesas Correntes,90,Aplicações Diretas,39,Outros Serviços de Terceiros - Pessoa Jurídica,03864060000140,6,PE 4/2020 COHAB-CT/FMHIS,166588,,,,,,,01-122405/2022,2022-07-22 00:00:00.000,1,Anulado de Empenho,000,000,53244,000,000
4,2022,2022-06-23,024,Recursos Próprios do Fundo Municipal de Habita...,16,HABITAÇÃO,0002,PROGRAMA VIVA CURITIBA CIDADÃ,2066,"MANUTENÇÃO E EXECUÇÃO DOS SERVIÇOS TÉCNICOS, A...",5,SERVIÇOS TÉCNICOS PROFISSIONAIS,49,FUNDO MUNICIPAL DE HABITAÇÃO DE INTERESSE SOCIAL,339039,OUTROS SERVIÇOS DE TERCEIROS - PESSOA JURÍDICA,3,Outras Despesas Correntes,90,Aplicações Diretas,39,Outros Serviços de Terceiros - Pessoa Jurídica,03864060000140,6,PE 4/2020 COHAB-CT/FMHIS,166588,,,,,,,01-122405/2022,2022-07-14 00:00:00.000,1,Pagamento de Empenho,000,000,000,113344,000
5,2022,2022-06-23,024,Recursos Próprios do Fundo Municipal de Habita...,16,HABITAÇÃO,0002,PROGRAMA VIVA CURITIBA CIDADÃ,2066,"MANUTENÇÃO E EXECUÇÃO DOS SERVIÇOS TÉCNICOS, A...",5,SERVIÇOS TÉCNICOS PROFISSIONAIS,49,FUNDO MUNICIPAL DE HABITAÇÃO DE INTERESSE SOCIAL,339039,OUTROS SERVIÇOS DE TERCEIROS - PESSOA JURÍDICA,3,Outras Despesas Correntes,90,Aplicações Diretas,39,Outros Serviços de Terceiros - Pessoa Jurídica,03864060000140,6,PE 4/2020 COHAB-CT/FMHIS,166588,,,,,,,01-122405/2022,2022-07-13 00:00:00.000,1,Liquidação de Empenho,113344,000,000,000,000
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
36082,2022,2022-08-31,114,Programa Dinheiro Direto na Escola - PDDE - Ed...,12,EDUCAÇÃO,0002,PROGRAMA VIVA CURITIBA CIDADÃ,2038,TRANSFERÊNCIA DE RECURSOS ÀS ENTIDADES PRIVADA...,45,DEMAIS ENTIDADES DO TERCEIRO SETOR P/ PROMOÇÃO...,09,SECRETARIA MUNICIPAL DA EDUCAÇÃO,335041,CONTRIBUIÇÕES,3,Outras Despesas Correntes,50,Transferências a Instituições Privadas sem Fin...,41,Contribuições,05803469000182,23153,/,349600,,,,,,,,,,,,,,,
36083,2022,2022-08-31,114,Programa Dinheiro Direto na Escola - PDDE - Ed...,12,EDUCAÇÃO,0002,PROGRAMA VIVA CURITIBA CIDADÃ,2038,TRANSFERÊNCIA DE RECURSOS ÀS ENTIDADES PRIVADA...,45,DEMAIS ENTIDADES DO TERCEIRO SETOR P/ PROMOÇÃO...,09,SECRETARIA MUNICIPAL DA EDUCAÇÃO,335041,CONTRIBUIÇÕES,3,Outras Despesas Correntes,50,Transferências a Instituições Privadas sem Fin...,41,Contribuições,06901226000140,23154,/,213600,,,,,,,,,,,,,,,
36084,2022,2022-08-31,114,Programa Dinheiro Direto na Escola - PDDE - Ed...,12,EDUCAÇÃO,0002,PROGRAMA VIVA CURITIBA CIDADÃ,2038,TRANSFERÊNCIA DE RECURSOS ÀS ENTIDADES PRIVADA...,45,DEMAIS ENTIDADES DO TERCEIRO SETOR P/ PROMOÇÃO...,09,SECRETARIA MUNICIPAL DA EDUCAÇÃO,335041,CONTRIBUIÇÕES,3,Outras Despesas Correntes,50,Transferências a Instituições Privadas sem Fin...,41,Contribuições,05680653000182,23155,/,268400,,,,,,,,,,,,,,,
36085,2022,2022-08-31,000,Recursos Ordinários (Livres),04,ADMINISTRAÇÃO,0007,PROGRAMA VIVA CURITIBA TRANSPARENTE,2164,"PROMOÇÃO DA ASSISTÊNCIA GERAL AO SERVIDOR, CON...",1,AUXÍLIO-FUNERAL,23,"SECRETARIA MUNICIPAL DE ADMINISTRAÇÃO, GESTÃO ...",339008,OUTROS BENEFÍCIOS ASSISTENCIAIS DO SERVIDO...,3,Outras Despesas Correntes,90,Aplicações Diretas,08,Outros Benefícios Assistenciais,92049168934,23156,/,205000,,,,,,,,,,,,,,,


Reset do index do DataFrame através da função "reset_index" do Pandas para que o index seja redefinido a partir do 0 e utilização do parâmetro "drop=True" para que a coluna de índice antiga seja excluída.

In [92]:
df = df.reset_index(drop=True)
df

Unnamed: 0,ANO_EMPENHO,DT_EMPENHO,CD_FONTE,DS_FONTE,CD_FUNCAO,DS_FUNCAO,CD_PROGRAMA,DS_PROGRAMA,CD_ACAO,DS_ACAO,CD_SUBELEMENTO,DS_SUBELEMENTO,CD_ORGAO,DS_ORGAO,CD_DESPESA,DS_DESPESA,CODIGO_DESPESA_GRUPO,DS_GRUPO,CODIGO_DESPESA_MODALIDADE,DS_MODALIDADE,CODIGO_DESPESA_ELEMENTO,DS_ELEMENTO,CPF_CNPJ,NR_EMPENHO,LICITACAO,VL_EMPENHADO,CD_ITEM,DS_ITEM,DS_UNIDADE,QUANTIDADE,VL_PRECO_UNITARIO,VL_TOTAL,PROTOCOLOSUP,DT_TRANSACAO,NR_PARCELA,TRANSACAO,VL_LIQUIDADO,VL_DEVOLVIDO,VL_ANULADO,VL_PAGO,VL_CONSIGNADO
0,2022,2022-06-09,098,Recursos Próprios do Fundo Municipal de Apoio ...,08,ASSISTÊNCIA SOCIAL,0001,PROGRAMA VIVA CURITIBA QUE NÃO DORME,2011,DESENVOLVIMENTO E EXECUÇÃO DE AÇÕES DE ATENDIM...,14,LOCAÇÃO DE BENS MÓVEIS E OUTRAS NATUREZAS E IN...,37,FUNDO MUNICIPAL DE APOIO AO DEFICIENTE,339039,OUTROS SERVIÇOS DE TERCEIROS - PESSOA JURÍDICA,3,Outras Despesas Correntes,90,Aplicações Diretas,39,Outros Serviços de Terceiros - Pessoa Jurídica,33038864000151,5,PE 186/2021 SMAP/SMELJ,510300,3,"BRINQUEDO INFLÁVEL, LOCAÇÃO, PULA PULA, CASTE...",MO,30000,7050000,21150000,,,,,,,,,
1,2022,2022-06-09,098,Recursos Próprios do Fundo Municipal de Apoio ...,08,ASSISTÊNCIA SOCIAL,0001,PROGRAMA VIVA CURITIBA QUE NÃO DORME,2011,DESENVOLVIMENTO E EXECUÇÃO DE AÇÕES DE ATENDIM...,14,LOCAÇÃO DE BENS MÓVEIS E OUTRAS NATUREZAS E IN...,37,FUNDO MUNICIPAL DE APOIO AO DEFICIENTE,339039,OUTROS SERVIÇOS DE TERCEIROS - PESSOA JURÍDICA,3,Outras Despesas Correntes,90,Aplicações Diretas,39,Outros Serviços de Terceiros - Pessoa Jurídica,33038864000151,5,PE 186/2021 SMAP/SMELJ,510300,5,"BRINQUEDO, PISCINA DE BOLINHAS CONVENCIONAL,",MO,20000,4020000,8040000,,,,,,,,,
2,2022,2022-06-23,024,Recursos Próprios do Fundo Municipal de Habita...,16,HABITAÇÃO,0002,PROGRAMA VIVA CURITIBA CIDADÃ,2066,"MANUTENÇÃO E EXECUÇÃO DOS SERVIÇOS TÉCNICOS, A...",5,SERVIÇOS TÉCNICOS PROFISSIONAIS,49,FUNDO MUNICIPAL DE HABITAÇÃO DE INTERESSE SOCIAL,339039,OUTROS SERVIÇOS DE TERCEIROS - PESSOA JURÍDICA,3,Outras Despesas Correntes,90,Aplicações Diretas,39,Outros Serviços de Terceiros - Pessoa Jurídica,03864060000140,6,PE 4/2020 COHAB-CT/FMHIS,166588,,,,,,,01-122405/2022,2022-07-22 00:00:00.000,1,Anulado de Empenho,000,000,53244,000,000
3,2022,2022-06-23,024,Recursos Próprios do Fundo Municipal de Habita...,16,HABITAÇÃO,0002,PROGRAMA VIVA CURITIBA CIDADÃ,2066,"MANUTENÇÃO E EXECUÇÃO DOS SERVIÇOS TÉCNICOS, A...",5,SERVIÇOS TÉCNICOS PROFISSIONAIS,49,FUNDO MUNICIPAL DE HABITAÇÃO DE INTERESSE SOCIAL,339039,OUTROS SERVIÇOS DE TERCEIROS - PESSOA JURÍDICA,3,Outras Despesas Correntes,90,Aplicações Diretas,39,Outros Serviços de Terceiros - Pessoa Jurídica,03864060000140,6,PE 4/2020 COHAB-CT/FMHIS,166588,,,,,,,01-122405/2022,2022-07-14 00:00:00.000,1,Pagamento de Empenho,000,000,000,113344,000
4,2022,2022-06-23,024,Recursos Próprios do Fundo Municipal de Habita...,16,HABITAÇÃO,0002,PROGRAMA VIVA CURITIBA CIDADÃ,2066,"MANUTENÇÃO E EXECUÇÃO DOS SERVIÇOS TÉCNICOS, A...",5,SERVIÇOS TÉCNICOS PROFISSIONAIS,49,FUNDO MUNICIPAL DE HABITAÇÃO DE INTERESSE SOCIAL,339039,OUTROS SERVIÇOS DE TERCEIROS - PESSOA JURÍDICA,3,Outras Despesas Correntes,90,Aplicações Diretas,39,Outros Serviços de Terceiros - Pessoa Jurídica,03864060000140,6,PE 4/2020 COHAB-CT/FMHIS,166588,,,,,,,01-122405/2022,2022-07-13 00:00:00.000,1,Liquidação de Empenho,113344,000,000,000,000
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
36081,2022,2022-08-31,114,Programa Dinheiro Direto na Escola - PDDE - Ed...,12,EDUCAÇÃO,0002,PROGRAMA VIVA CURITIBA CIDADÃ,2038,TRANSFERÊNCIA DE RECURSOS ÀS ENTIDADES PRIVADA...,45,DEMAIS ENTIDADES DO TERCEIRO SETOR P/ PROMOÇÃO...,09,SECRETARIA MUNICIPAL DA EDUCAÇÃO,335041,CONTRIBUIÇÕES,3,Outras Despesas Correntes,50,Transferências a Instituições Privadas sem Fin...,41,Contribuições,05803469000182,23153,/,349600,,,,,,,,,,,,,,,
36082,2022,2022-08-31,114,Programa Dinheiro Direto na Escola - PDDE - Ed...,12,EDUCAÇÃO,0002,PROGRAMA VIVA CURITIBA CIDADÃ,2038,TRANSFERÊNCIA DE RECURSOS ÀS ENTIDADES PRIVADA...,45,DEMAIS ENTIDADES DO TERCEIRO SETOR P/ PROMOÇÃO...,09,SECRETARIA MUNICIPAL DA EDUCAÇÃO,335041,CONTRIBUIÇÕES,3,Outras Despesas Correntes,50,Transferências a Instituições Privadas sem Fin...,41,Contribuições,06901226000140,23154,/,213600,,,,,,,,,,,,,,,
36083,2022,2022-08-31,114,Programa Dinheiro Direto na Escola - PDDE - Ed...,12,EDUCAÇÃO,0002,PROGRAMA VIVA CURITIBA CIDADÃ,2038,TRANSFERÊNCIA DE RECURSOS ÀS ENTIDADES PRIVADA...,45,DEMAIS ENTIDADES DO TERCEIRO SETOR P/ PROMOÇÃO...,09,SECRETARIA MUNICIPAL DA EDUCAÇÃO,335041,CONTRIBUIÇÕES,3,Outras Despesas Correntes,50,Transferências a Instituições Privadas sem Fin...,41,Contribuições,05680653000182,23155,/,268400,,,,,,,,,,,,,,,
36084,2022,2022-08-31,000,Recursos Ordinários (Livres),04,ADMINISTRAÇÃO,0007,PROGRAMA VIVA CURITIBA TRANSPARENTE,2164,"PROMOÇÃO DA ASSISTÊNCIA GERAL AO SERVIDOR, CON...",1,AUXÍLIO-FUNERAL,23,"SECRETARIA MUNICIPAL DE ADMINISTRAÇÃO, GESTÃO ...",339008,OUTROS BENEFÍCIOS ASSISTENCIAIS DO SERVIDO...,3,Outras Despesas Correntes,90,Aplicações Diretas,08,Outros Benefícios Assistenciais,92049168934,23156,/,205000,,,,,,,,,,,,,,,


Exibição dos nomes das colunas do DataFrame através da função "columns" do Pandas para visualizar melhor quais colunas são necessárias através do cabeçalho e dicionário de dados incluso na pasta "data" do projeto, e também para verificar se o nome das colunas está legível.

In [93]:
df.columns

Index(['ANO_EMPENHO', 'DT_EMPENHO', 'CD_FONTE', 'DS_FONTE', 'CD_FUNCAO',
       'DS_FUNCAO', 'CD_PROGRAMA', 'DS_PROGRAMA', 'CD_ACAO', 'DS_ACAO',
       'CD_SUBELEMENTO', 'DS_SUBELEMENTO', 'CD_ORGAO', 'DS_ORGAO',
       'CD_DESPESA', 'DS_DESPESA', 'CODIGO_DESPESA_GRUPO', 'DS_GRUPO',
       'CODIGO_DESPESA_MODALIDADE', 'DS_MODALIDADE', 'CODIGO_DESPESA_ELEMENTO',
       'DS_ELEMENTO', 'CPF_CNPJ', 'NR_EMPENHO', 'LICITACAO', 'VL_EMPENHADO',
       'CD_ITEM', 'DS_ITEM', 'DS_UNIDADE', 'QUANTIDADE', 'VL_PRECO_UNITARIO',
       'VL_TOTAL', 'PROTOCOLOSUP', 'DT_TRANSACAO', 'NR_PARCELA', 'TRANSACAO',
       'VL_LIQUIDADO', 'VL_DEVOLVIDO', 'VL_ANULADO', 'VL_PAGO',
       'VL_CONSIGNADO'],
      dtype='object')

Encontramos a possibilidade de remover a coluna "ANO_EMPENHO" pois todos os valores são iguais, e estão presentes na coluna "DT_EMPENHO".
Vamos remover também todas as colunas que são de código de identificação, pois não são relevantes para a análise.
Colunas de numeração estão pouco relevantes para a análise, então vamos removê-las também, junto das "DS_GRUPO" e "DS_MODALIDADE", pois já temos a "DS_DEPESA" que detalha mais o tipo da despesa.
E por fim, vamos remover as colunas que apresentam números de identificação de licitação e protocolo, pois não são relevantes para a análise.

Todas essas remoções serão feitas usando a função drop, e filter para selecionar as colunas que serão removidas através de regex.

In [94]:
df = df.drop(df.filter(regex='ANO_EMPENHO|CD_|CODIGO_|NR_|LICITACAO|PROTOCOLOSUP|DS_GRUPO|DS_MODALIDADE').columns, axis=1)
df.columns

Index(['DT_EMPENHO', 'DS_FONTE', 'DS_FUNCAO', 'DS_PROGRAMA', 'DS_ACAO',
       'DS_SUBELEMENTO', 'DS_ORGAO', 'DS_DESPESA', 'DS_ELEMENTO', 'CPF_CNPJ',
       'VL_EMPENHADO', 'DS_ITEM', 'DS_UNIDADE', 'QUANTIDADE',
       'VL_PRECO_UNITARIO', 'VL_TOTAL', 'DT_TRANSACAO', 'TRANSACAO',
       'VL_LIQUIDADO', 'VL_DEVOLVIDO', 'VL_ANULADO', 'VL_PAGO',
       'VL_CONSIGNADO'],
      dtype='object')

Deixaremos legíveis os nomes das colunas, para facilitar a manipulação dos dados.
Visualizamos previamente uma abreviação de "DS_" que não é relevante, "DT_" que é a data, e "VL_" que é o valor, fazendo então essas substituições para deixar o nome das colunas mais legíveis.
Encontramos algumas colunas que não expressam muito bem para qual elemento da despesa estão se referindo, então vamos renomeá-las para deixar mais claro.
Pensando também nisso, vamos renomear a coluna de "CPF_CNPJ" para "DOCUMENTO" para conseguir diferenciar melhor os tipos de documentos em outra coluna que será criada.

Todas essas alterações serão feitas usando a função rename, e columns.str.replace para substituir os nomes das colunas.

In [95]:
df.columns = df.columns.str.replace('DT_', 'DATA_').str.replace('DS_', '').str.replace('VL_', 'VALOR_')
df.columns = df.columns.str.replace('CPF_CNPJ', 'DOCUMENTO').str.replace('UNIDADE', 'UNIDADE_ITEM').str.replace('QUANTIDADE', 'QUANTIDADE_ITEM').str.replace('DESPESA', 'TIPO').str.replace('DATA_EMPENHO', 'DATA')
df = df.rename(columns={'TRANSACAO': 'STATUS_TRANSACAO'})
df.columns

Index(['DATA', 'FONTE', 'FUNCAO', 'PROGRAMA', 'ACAO', 'SUBELEMENTO', 'ORGAO',
       'TIPO', 'ELEMENTO', 'DOCUMENTO', 'VALOR_EMPENHADO', 'ITEM',
       'UNIDADE_ITEM', 'QUANTIDADE_ITEM', 'VALOR_PRECO_UNITARIO',
       'VALOR_TOTAL', 'DATA_TRANSACAO', 'STATUS_TRANSACAO', 'VALOR_LIQUIDADO',
       'VALOR_DEVOLVIDO', 'VALOR_ANULADO', 'VALOR_PAGO', 'VALOR_CONSIGNADO'],
      dtype='object')

In [96]:
df.head()

Unnamed: 0,DATA,FONTE,FUNCAO,PROGRAMA,ACAO,SUBELEMENTO,ORGAO,TIPO,ELEMENTO,DOCUMENTO,VALOR_EMPENHADO,ITEM,UNIDADE_ITEM,QUANTIDADE_ITEM,VALOR_PRECO_UNITARIO,VALOR_TOTAL,DATA_TRANSACAO,STATUS_TRANSACAO,VALOR_LIQUIDADO,VALOR_DEVOLVIDO,VALOR_ANULADO,VALOR_PAGO,VALOR_CONSIGNADO
0,2022-06-09,Recursos Próprios do Fundo Municipal de Apoio ...,ASSISTÊNCIA SOCIAL,PROGRAMA VIVA CURITIBA QUE NÃO DORME,DESENVOLVIMENTO E EXECUÇÃO DE AÇÕES DE ATENDIM...,LOCAÇÃO DE BENS MÓVEIS E OUTRAS NATUREZAS E IN...,FUNDO MUNICIPAL DE APOIO AO DEFICIENTE,OUTROS SERVIÇOS DE TERCEIROS - PESSOA JURÍDICA,Outros Serviços de Terceiros - Pessoa Jurídica,33038864000151,510300,"BRINQUEDO INFLÁVEL, LOCAÇÃO, PULA PULA, CASTE...",MO,30000.0,7050000.0,21150000.0,,,,,,,
1,2022-06-09,Recursos Próprios do Fundo Municipal de Apoio ...,ASSISTÊNCIA SOCIAL,PROGRAMA VIVA CURITIBA QUE NÃO DORME,DESENVOLVIMENTO E EXECUÇÃO DE AÇÕES DE ATENDIM...,LOCAÇÃO DE BENS MÓVEIS E OUTRAS NATUREZAS E IN...,FUNDO MUNICIPAL DE APOIO AO DEFICIENTE,OUTROS SERVIÇOS DE TERCEIROS - PESSOA JURÍDICA,Outros Serviços de Terceiros - Pessoa Jurídica,33038864000151,510300,"BRINQUEDO, PISCINA DE BOLINHAS CONVENCIONAL,",MO,20000.0,4020000.0,8040000.0,,,,,,,
2,2022-06-23,Recursos Próprios do Fundo Municipal de Habita...,HABITAÇÃO,PROGRAMA VIVA CURITIBA CIDADÃ,"MANUTENÇÃO E EXECUÇÃO DOS SERVIÇOS TÉCNICOS, A...",SERVIÇOS TÉCNICOS PROFISSIONAIS,FUNDO MUNICIPAL DE HABITAÇÃO DE INTERESSE SOCIAL,OUTROS SERVIÇOS DE TERCEIROS - PESSOA JURÍDICA,Outros Serviços de Terceiros - Pessoa Jurídica,3864060000140,166588,,,,,,2022-07-22 00:00:00.000,Anulado de Empenho,0.0,0.0,53244.0,0.0,0.0
3,2022-06-23,Recursos Próprios do Fundo Municipal de Habita...,HABITAÇÃO,PROGRAMA VIVA CURITIBA CIDADÃ,"MANUTENÇÃO E EXECUÇÃO DOS SERVIÇOS TÉCNICOS, A...",SERVIÇOS TÉCNICOS PROFISSIONAIS,FUNDO MUNICIPAL DE HABITAÇÃO DE INTERESSE SOCIAL,OUTROS SERVIÇOS DE TERCEIROS - PESSOA JURÍDICA,Outros Serviços de Terceiros - Pessoa Jurídica,3864060000140,166588,,,,,,2022-07-14 00:00:00.000,Pagamento de Empenho,0.0,0.0,0.0,113344.0,0.0
4,2022-06-23,Recursos Próprios do Fundo Municipal de Habita...,HABITAÇÃO,PROGRAMA VIVA CURITIBA CIDADÃ,"MANUTENÇÃO E EXECUÇÃO DOS SERVIÇOS TÉCNICOS, A...",SERVIÇOS TÉCNICOS PROFISSIONAIS,FUNDO MUNICIPAL DE HABITAÇÃO DE INTERESSE SOCIAL,OUTROS SERVIÇOS DE TERCEIROS - PESSOA JURÍDICA,Outros Serviços de Terceiros - Pessoa Jurídica,3864060000140,166588,,,,,,2022-07-13 00:00:00.000,Liquidação de Empenho,113344.0,0.0,0.0,0.0,0.0


Utilização do método **info** para tentar encontrar valores nulos que não deveriam ser nulos.

In [102]:
df.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 36086 entries, 0 to 36085
Data columns (total 23 columns):
 #   Column                Non-Null Count  Dtype 
---  ------                --------------  ----- 
 0   DATA                  36086 non-null  object
 1   FONTE                 36086 non-null  object
 2   FUNCAO                36086 non-null  object
 3   PROGRAMA              36086 non-null  object
 4   ACAO                  36086 non-null  object
 5   SUBELEMENTO           36086 non-null  object
 6   ORGAO                 36086 non-null  object
 7   TIPO                  36086 non-null  object
 8   ELEMENTO              36086 non-null  object
 9   DOCUMENTO             36086 non-null  object
 10  VALOR_EMPENHADO       36086 non-null  object
 11  ITEM                  9374 non-null   object
 12  UNIDADE_ITEM          9374 non-null   object
 13  QUANTIDADE_ITEM       9374 non-null   object
 14  VALOR_PRECO_UNITARIO  9374 non-null   object
 15  VALOR_TOTAL           9374 non-null 

Preenchimento de todas colunas que são de valores numéricos para não interferir em possíveis cálculos.

In [103]:
df_cleaned = df.copy()
df_cleaned['QUANTIDADE_ITEM'] = df['QUANTIDADE_ITEM'].fillna(0)
df_cleaned['VALOR_PRECO_UNITARIO'] = df['VALOR_PRECO_UNITARIO'].fillna(0)
df_cleaned['VALOR_TOTAL'] = df['VALOR_TOTAL'].fillna(0)
df_cleaned['VALOR_LIQUIDADO'] = df['VALOR_LIQUIDADO'].fillna(0)
df_cleaned['VALOR_DEVOLVIDO'] = df['VALOR_DEVOLVIDO'].fillna(0)
df_cleaned['VALOR_ANULADO'] = df['VALOR_ANULADO'].fillna(0)
df_cleaned['VALOR_PAGO'] = df['VALOR_PAGO'].fillna(0)
df_cleaned['VALOR_CONSIGNADO'] = df['VALOR_CONSIGNADO'].fillna(0)

df_cleaned['QUANTIDADE_ITEM'] = pd.to_numeric(df_cleaned['QUANTIDADE_ITEM'], errors="coerce")
df_cleaned['VALOR_PRECO_UNITARIO'] = pd.to_numeric(df_cleaned['VALOR_PRECO_UNITARIO'], errors="coerce")
df_cleaned['VALOR_TOTAL'] = pd.to_numeric(df_cleaned['VALOR_TOTAL'], errors="coerce")
df_cleaned['VALOR_LIQUIDADO'] = pd.to_numeric(df_cleaned['VALOR_LIQUIDADO'], errors="coerce")
df_cleaned['VALOR_DEVOLVIDO'] = pd.to_numeric(df_cleaned['VALOR_DEVOLVIDO'], errors="coerce")
df_cleaned['VALOR_ANULADO'] = pd.to_numeric(df_cleaned['VALOR_ANULADO'], errors="coerce")
df_cleaned['VALOR_PAGO'] = pd.to_numeric(df_cleaned['VALOR_PAGO'], errors="coerce")
df_cleaned['VALOR_CONSIGNADO'] = pd.to_numeric(df_cleaned['VALOR_CONSIGNADO'], errors="coerce")

df_cleaned.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 36086 entries, 0 to 36085
Data columns (total 23 columns):
 #   Column                Non-Null Count  Dtype  
---  ------                --------------  -----  
 0   DATA                  36086 non-null  object 
 1   FONTE                 36086 non-null  object 
 2   FUNCAO                36086 non-null  object 
 3   PROGRAMA              36086 non-null  object 
 4   ACAO                  36086 non-null  object 
 5   SUBELEMENTO           36086 non-null  object 
 6   ORGAO                 36086 non-null  object 
 7   TIPO                  36086 non-null  object 
 8   ELEMENTO              36086 non-null  object 
 9   DOCUMENTO             36086 non-null  object 
 10  VALOR_EMPENHADO       36086 non-null  object 
 11  ITEM                  9374 non-null   object 
 12  UNIDADE_ITEM          9374 non-null   object 
 13  QUANTIDADE_ITEM       26712 non-null  float64
 14  VALOR_PRECO_UNITARIO  26712 non-null  float64
 15  VALOR_TOTAL        

In [99]:
df_cleaned

Unnamed: 0,DATA,FONTE,FUNCAO,PROGRAMA,ACAO,SUBELEMENTO,ORGAO,TIPO,ELEMENTO,DOCUMENTO,VALOR_EMPENHADO,ITEM,UNIDADE_ITEM,QUANTIDADE_ITEM,VALOR_PRECO_UNITARIO,VALOR_TOTAL,DATA_TRANSACAO,STATUS_TRANSACAO,VALOR_LIQUIDADO,VALOR_DEVOLVIDO,VALOR_ANULADO,VALOR_PAGO,VALOR_CONSIGNADO
0,2022-06-09,Recursos Próprios do Fundo Municipal de Apoio ...,ASSISTÊNCIA SOCIAL,PROGRAMA VIVA CURITIBA QUE NÃO DORME,DESENVOLVIMENTO E EXECUÇÃO DE AÇÕES DE ATENDIM...,LOCAÇÃO DE BENS MÓVEIS E OUTRAS NATUREZAS E IN...,FUNDO MUNICIPAL DE APOIO AO DEFICIENTE,OUTROS SERVIÇOS DE TERCEIROS - PESSOA JURÍDICA,Outros Serviços de Terceiros - Pessoa Jurídica,33038864000151,510300,"BRINQUEDO INFLÁVEL, LOCAÇÃO, PULA PULA, CASTE...",MO,,7050000,21150000,,,0,0,0,0,0
1,2022-06-09,Recursos Próprios do Fundo Municipal de Apoio ...,ASSISTÊNCIA SOCIAL,PROGRAMA VIVA CURITIBA QUE NÃO DORME,DESENVOLVIMENTO E EXECUÇÃO DE AÇÕES DE ATENDIM...,LOCAÇÃO DE BENS MÓVEIS E OUTRAS NATUREZAS E IN...,FUNDO MUNICIPAL DE APOIO AO DEFICIENTE,OUTROS SERVIÇOS DE TERCEIROS - PESSOA JURÍDICA,Outros Serviços de Terceiros - Pessoa Jurídica,33038864000151,510300,"BRINQUEDO, PISCINA DE BOLINHAS CONVENCIONAL,",MO,,4020000,8040000,,,0,0,0,0,0
2,2022-06-23,Recursos Próprios do Fundo Municipal de Habita...,HABITAÇÃO,PROGRAMA VIVA CURITIBA CIDADÃ,"MANUTENÇÃO E EXECUÇÃO DOS SERVIÇOS TÉCNICOS, A...",SERVIÇOS TÉCNICOS PROFISSIONAIS,FUNDO MUNICIPAL DE HABITAÇÃO DE INTERESSE SOCIAL,OUTROS SERVIÇOS DE TERCEIROS - PESSOA JURÍDICA,Outros Serviços de Terceiros - Pessoa Jurídica,03864060000140,166588,,,0.0,0,0,2022-07-22 00:00:00.000,Anulado de Empenho,000,000,53244,000,000
3,2022-06-23,Recursos Próprios do Fundo Municipal de Habita...,HABITAÇÃO,PROGRAMA VIVA CURITIBA CIDADÃ,"MANUTENÇÃO E EXECUÇÃO DOS SERVIÇOS TÉCNICOS, A...",SERVIÇOS TÉCNICOS PROFISSIONAIS,FUNDO MUNICIPAL DE HABITAÇÃO DE INTERESSE SOCIAL,OUTROS SERVIÇOS DE TERCEIROS - PESSOA JURÍDICA,Outros Serviços de Terceiros - Pessoa Jurídica,03864060000140,166588,,,0.0,0,0,2022-07-14 00:00:00.000,Pagamento de Empenho,000,000,000,113344,000
4,2022-06-23,Recursos Próprios do Fundo Municipal de Habita...,HABITAÇÃO,PROGRAMA VIVA CURITIBA CIDADÃ,"MANUTENÇÃO E EXECUÇÃO DOS SERVIÇOS TÉCNICOS, A...",SERVIÇOS TÉCNICOS PROFISSIONAIS,FUNDO MUNICIPAL DE HABITAÇÃO DE INTERESSE SOCIAL,OUTROS SERVIÇOS DE TERCEIROS - PESSOA JURÍDICA,Outros Serviços de Terceiros - Pessoa Jurídica,03864060000140,166588,,,0.0,0,0,2022-07-13 00:00:00.000,Liquidação de Empenho,113344,000,000,000,000
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
36081,2022-08-31,Programa Dinheiro Direto na Escola - PDDE - Ed...,EDUCAÇÃO,PROGRAMA VIVA CURITIBA CIDADÃ,TRANSFERÊNCIA DE RECURSOS ÀS ENTIDADES PRIVADA...,DEMAIS ENTIDADES DO TERCEIRO SETOR P/ PROMOÇÃO...,SECRETARIA MUNICIPAL DA EDUCAÇÃO,CONTRIBUIÇÕES,Contribuições,05803469000182,349600,,,0.0,0,0,,,0,0,0,0,0
36082,2022-08-31,Programa Dinheiro Direto na Escola - PDDE - Ed...,EDUCAÇÃO,PROGRAMA VIVA CURITIBA CIDADÃ,TRANSFERÊNCIA DE RECURSOS ÀS ENTIDADES PRIVADA...,DEMAIS ENTIDADES DO TERCEIRO SETOR P/ PROMOÇÃO...,SECRETARIA MUNICIPAL DA EDUCAÇÃO,CONTRIBUIÇÕES,Contribuições,06901226000140,213600,,,0.0,0,0,,,0,0,0,0,0
36083,2022-08-31,Programa Dinheiro Direto na Escola - PDDE - Ed...,EDUCAÇÃO,PROGRAMA VIVA CURITIBA CIDADÃ,TRANSFERÊNCIA DE RECURSOS ÀS ENTIDADES PRIVADA...,DEMAIS ENTIDADES DO TERCEIRO SETOR P/ PROMOÇÃO...,SECRETARIA MUNICIPAL DA EDUCAÇÃO,CONTRIBUIÇÕES,Contribuições,05680653000182,268400,,,0.0,0,0,,,0,0,0,0,0
36084,2022-08-31,Recursos Ordinários (Livres),ADMINISTRAÇÃO,PROGRAMA VIVA CURITIBA TRANSPARENTE,"PROMOÇÃO DA ASSISTÊNCIA GERAL AO SERVIDOR, CON...",AUXÍLIO-FUNERAL,"SECRETARIA MUNICIPAL DE ADMINISTRAÇÃO, GESTÃO ...",OUTROS BENEFÍCIOS ASSISTENCIAIS DO SERVIDO...,Outros Benefícios Assistenciais,92049168934,205000,,,0.0,0,0,,,0,0,0,0,0
