# Configuração de ambiente

Importação das bibliotecas:

- Numpy: para computação numérica
- Pandas: para manipulação de dados através do alias "pd"
- Google Colab: para manipulação de arquivos no Google Drive
- Matplotlib: para criação de gráficos e visualizações de dados
- Seaborn: para visualização de dados
- Warnings: para poder alterar a visualização de warnings do sistema

E execução do comando "%matplotlib inline" para que os gráficos sejam exibidos no notebook logo abaixo da célula de código que os gerou.

In [1]:
import numpy as np
import pandas as pd
from google.colab import drive
from matplotlib import pyplot as plt
import seaborn as sns
import warnings

warnings.filterwarnings("ignore", category=FutureWarning)

sns.set()

%matplotlib inline

Carregamento do Drive para que o notebook possa acessar os arquivos do Google Drive e com o parâmetro "force_remount=True" para que o Drive seja montado a cada execução do notebook.

In [2]:
drive.mount('/content/drive', force_remount=True)

Mounted at /content/drive


# Leitura e visualização do dataset

Leitura do arquivo "dataset_clean.csv" através da função "read_csv" do Pandas e armazenamento do resultado na variável "df". Uso do parâmetro "sep" para informar qual o separador de colunas do arquivo e do parâmetro "encoding" para informar qual o tipo de codificação do arquivo.

In [3]:
csv_url = "https://github.com/viniciusgugelmin/data-science/blob/main/projects/base_de_despesas/data/dataset_clean.csv?raw=true"

df = pd.read_csv(csv_url, sep=';', encoding='iso-8859-1', low_memory=False)

Exibição das 5 primeiras linhas do DataFrame através da função "head" do Pandas para verificar se o arquivo foi carregado corretamente e ter uma ideia do que ele contém.

In [8]:
df.head()

Unnamed: 0,DATA,FONTE,FUNCAO,PROGRAMA,ACAO,SUBELEMENTO,ORGAO,TIPO,ELEMENTO,DOCUMENTO,...,VALOR_PRECO_UNITARIO,VALOR_TOTAL,DATA_TRANSACAO,STATUS_TRANSACAO,VALOR_LIQUIDADO,VALOR_DEVOLVIDO,VALOR_ANULADO,VALOR_PAGO,VALOR_CONSIGNADO,DOCUMENTO_TIPO
0,2022-06-09,Recursos Próprios do Fundo Municipal de Apoio ...,ASSISTÊNCIA SOCIAL,PROGRAMA VIVA CURITIBA QUE NÃO DORME,DESENVOLVIMENTO E EXECUÇÃO DE AÇÕES DE ATENDIM...,LOCAÇÃO DE BENS MÓVEIS E OUTRAS NATUREZAS E IN...,FUNDO MUNICIPAL DE APOIO AO DEFICIENTE,OUTROS SERVIÇOS DE TERCEIROS - PESSOA JURÍDICA,Outros Serviços de Terceiros - Pessoa Jurídica,33038864000151,...,0.0,0.0,SEM DATA,SEM STATUS,0.0,0.0,0.0,0.0,0.0,DESCONHECIDO
1,2022-06-09,Recursos Próprios do Fundo Municipal de Apoio ...,ASSISTÊNCIA SOCIAL,PROGRAMA VIVA CURITIBA QUE NÃO DORME,DESENVOLVIMENTO E EXECUÇÃO DE AÇÕES DE ATENDIM...,LOCAÇÃO DE BENS MÓVEIS E OUTRAS NATUREZAS E IN...,FUNDO MUNICIPAL DE APOIO AO DEFICIENTE,OUTROS SERVIÇOS DE TERCEIROS - PESSOA JURÍDICA,Outros Serviços de Terceiros - Pessoa Jurídica,33038864000151,...,0.0,0.0,SEM DATA,SEM STATUS,0.0,0.0,0.0,0.0,0.0,DESCONHECIDO
2,2022-06-23,Recursos Próprios do Fundo Municipal de Habita...,HABITAÇÃO,PROGRAMA VIVA CURITIBA CIDADÃ,"MANUTENÇÃO E EXECUÇÃO DOS SERVIÇOS TÉCNICOS, A...",SERVIÇOS TÉCNICOS PROFISSIONAIS,FUNDO MUNICIPAL DE HABITAÇÃO DE INTERESSE SOCIAL,OUTROS SERVIÇOS DE TERCEIROS - PESSOA JURÍDICA,Outros Serviços de Terceiros - Pessoa Jurídica,3864060000140,...,0.0,0.0,2022-07-22 00:00:00.000,Anulado de Empenho,0.0,0.0,0.0,0.0,0.0,DESCONHECIDO
3,2022-06-23,Recursos Próprios do Fundo Municipal de Habita...,HABITAÇÃO,PROGRAMA VIVA CURITIBA CIDADÃ,"MANUTENÇÃO E EXECUÇÃO DOS SERVIÇOS TÉCNICOS, A...",SERVIÇOS TÉCNICOS PROFISSIONAIS,FUNDO MUNICIPAL DE HABITAÇÃO DE INTERESSE SOCIAL,OUTROS SERVIÇOS DE TERCEIROS - PESSOA JURÍDICA,Outros Serviços de Terceiros - Pessoa Jurídica,3864060000140,...,0.0,0.0,2022-07-14 00:00:00.000,Pagamento de Empenho,0.0,0.0,0.0,0.0,0.0,DESCONHECIDO
4,2022-06-23,Recursos Próprios do Fundo Municipal de Habita...,HABITAÇÃO,PROGRAMA VIVA CURITIBA CIDADÃ,"MANUTENÇÃO E EXECUÇÃO DOS SERVIÇOS TÉCNICOS, A...",SERVIÇOS TÉCNICOS PROFISSIONAIS,FUNDO MUNICIPAL DE HABITAÇÃO DE INTERESSE SOCIAL,OUTROS SERVIÇOS DE TERCEIROS - PESSOA JURÍDICA,Outros Serviços de Terceiros - Pessoa Jurídica,3864060000140,...,0.0,0.0,2022-07-13 00:00:00.000,Liquidação de Empenho,0.0,0.0,0.0,0.0,0.0,DESCONHECIDO


# Criação de funções utilitárias

In [5]:
def contLinhasDfFormatado(_df):
  aux = f'{len(_df):_.0f}'
  aux = aux.replace('.', ',')
  return aux.replace('_', '.')

# Perguntas iniciais

- Qual o total de despesas temos no dataset?

In [6]:
cont_df = contLinhasDfFormatado(df)

print("Total:", cont_df)

Total: 36.086


- Qual o período de data dessas despesas?