# Análise do Banco de Serviços do BNDES
O objetivo é explorar os contratos de consultoria apoiados pelo BNDES, entendendo sua distribuição por esfera de cliente (federal, estadual, municipal), valores contratados e evolução temporal.

----------------------------
Relembrando inspeção de base
----------------------------

# 1. Dimensões (linhas x colunas)
print("Dimensões:", df.shape)

# 2. Nome das colunas
print("\nColunas disponíveis:")
print(df.columns.tolist())

# 3. Tipos de dados de cada coluna
print("\nTipos de dados:")
print(df.dtypes)

# 4. Valores ausentes (nulos) por coluna
print("\nValores nulos por coluna:")
print(df.isnull().sum())

# 5. Visualizar primeiras linhas
print("\nPrimeiras linhas da base:")
display(df.head())

# 6. Visualizar últimas linhas
print("\nÚltimas linhas da base:")
display(df.tail())

# 7. Estatísticas descritivas
print("\nEstatísticas descritivas (colunas numéricas):")
display(df.describe())

print("\nEstatísticas descritivas (colunas de texto/categoria):")
display(df.describe(include="object"))

In [5]:
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns

# Conigurações de exibição
pd.set_option('display.max_columns', None)
pd.set_option('display.max_rows', None)
sns.set(style = 'whitegrid')

In [6]:
ARQ = '../base_dados/banco-servicos-banco-de-servicos.csv'

# parâmetros de leitura
df = pd.read_csv(
    ARQ,
    sep = ';',
    decimal = ',',
    encoding = 'latin1'
)

# primeiras linhas
df.head()

Unnamed: 0,nome_projeto,cliente,esfera_cliente,numero_srm,numero_ocs,data_de_assinatura,compartilhado,link_projeto,servico_contratado,objeto,valor_global_contrato_reais,fim_vigencia,consorcio,cnpj_consorcio,empresa,cnpj_empresa,lider_consorcio,pp_consorcio
0,ACRE - SANEAMENTO,ESTADO DO ACRE,Estadual,4400003000.0,0264/2017,2017-06-14,Não,https://www.bndes.gov.br/arquivos/contratos-ad...,Serviço Único,CONTRATAÇÃO DE SERVIÇOS TÉCNICOS ESPECIALIZADO...,4049846.93,2021-05-24,CONSORCIO SANEAMENTO BRASIL,27.820.864/0001-06,AVALIAR AVALIACOES E ASSESSORIA LTDA,65.156.739/0001-32,Não,0.128
1,ACRE - SANEAMENTO,ESTADO DO ACRE,Estadual,4400003000.0,0264/2017,2017-06-14,Não,https://www.bndes.gov.br/arquivos/contratos-ad...,Serviço Único,CONTRATAÇÃO DE SERVIÇOS TÉCNICOS ESPECIALIZADO...,4049846.93,2021-05-24,CONSORCIO SANEAMENTO BRASIL,27.820.864/0001-06,ESSE ENGENHARIA E CONSULTORIA LTDA,41.656.372/0001-58,Não,0.427
2,ACRE - SANEAMENTO,ESTADO DO ACRE,Estadual,4400003000.0,0264/2017,2017-06-14,Não,https://www.bndes.gov.br/arquivos/contratos-ad...,Serviço Único,CONTRATAÇÃO DE SERVIÇOS TÉCNICOS ESPECIALIZADO...,4049846.93,2021-05-24,CONSORCIO SANEAMENTO BRASIL,27.820.864/0001-06,"FIALHO, CANABRAVA, ANDRADE, SALLES ADVOGADOS",02.911.978/0001-30,Sim,0.445
3,ALAGOAS - SANEAMENTO - BLOCO A,ESTADO DE ALAGOAS,Estadual,4400003000.0,0228/2017,2017-05-30,Sim,https://www.bndes.gov.br/arquivos/contratos-ad...,Serviço Único,CONSULTORIA DESESTATIZAÇÃO CASAL,11069894.62,2022-02-26,"CONSORCIO EY, FELSBERG, MUZZI E EMA",27.720.709/0001-18,E.M.A. ENGENHARIA DE MEIO AMBIENTE LTDA,54.695.317/0001-19,Não,0.4605
4,ALAGOAS - SANEAMENTO - BLOCO A,ESTADO DE ALAGOAS,Estadual,4400003000.0,0228/2017,2017-05-30,Sim,https://www.bndes.gov.br/arquivos/contratos-ad...,Serviço Único,CONSULTORIA DESESTATIZAÇÃO CASAL,11069894.62,2022-02-26,"CONSORCIO EY, FELSBERG, MUZZI E EMA",27.720.709/0001-18,FELSBERG E PEDRETTI ADVOGADOS E CONSULTORES LE...,09.522.100/0001-52,Não,0.2064


In [None]:
print('Dimensões:', df.shape)

df.info()

Dimensões: (910, 18)
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 910 entries, 0 to 909
Data columns (total 18 columns):
 #   Column                       Non-Null Count  Dtype  
---  ------                       --------------  -----  
 0   nome_projeto                 910 non-null    object 
 1   cliente                      910 non-null    object 
 2   esfera_cliente               910 non-null    object 
 3   numero_srm                   910 non-null    float64
 4   numero_ocs                   910 non-null    object 
 5   data_de_assinatura           910 non-null    object 
 6   compartilhado                910 non-null    object 
 7   link_projeto                 910 non-null    object 
 8   servico_contratado           910 non-null    object 
 9   objeto                       910 non-null    object 
 10  valor_global_contrato_reais  910 non-null    float64
 11  fim_vigencia                 910 non-null    object 
 12  consorcio                    910 non-null    object 
 13 

In [8]:
print(df.isnull().sum())

nome_projeto                   0
cliente                        0
esfera_cliente                 0
numero_srm                     0
numero_ocs                     0
data_de_assinatura             0
compartilhado                  0
link_projeto                   0
servico_contratado             0
objeto                         0
valor_global_contrato_reais    0
fim_vigencia                   0
consorcio                      0
cnpj_consorcio                 0
empresa                        0
cnpj_empresa                   0
lider_consorcio                0
pp_consorcio                   0
dtype: int64


In [None]:
print(df.describe(include = 'all').T)

In [None]:
print('\nColunas disponíveis:')
print(df.columns.tolist())


Colunas disponíveis:
['nome_projeto', 'cliente', 'esfera_cliente', 'numero_srm', 'numero_ocs', 'data_de_assinatura', 'compartilhado', 'link_projeto', 'servico_contratado', 'objeto', 'valor_global_contrato_reais', 'fim_vigencia', 'consorcio', 'cnpj_consorcio', 'empresa', 'cnpj_empresa', 'lider_consorcio', 'pp_consorcio']


In [None]:
# Fazendo um tratamento preventivo nas colunas
df.columns = (df.columns
              .str.strip()
              .str.lower()
              .str.replace(' ', '_')
#              .str.replace(r"[^\w]", "", regex=True)
)

print('\nColunas disponíveis:')
print(df.columns.tolist())


Colunas disponíveis:
['nome_projeto', 'cliente', 'esfera_cliente', 'numero_srm', 'numero_ocs', 'data_de_assinatura', 'compartilhado', 'link_projeto', 'servico_contratado', 'objeto', 'valor_global_contrato_reais', 'fim_vigencia', 'consorcio', 'cnpj_consorcio', 'empresa', 'cnpj_empresa', 'lider_consorcio', 'pp_consorcio', 'valor_recebido_por_empresa']


In [None]:
# Tratando dados, fazendo conversão de tipos
# Valor Global Contratado de string para float64
# Data de Assinatura de date para datetime
# Fim Vigência de string para datetime

df['valor_global_contrato_reais'] = pd.to_numeric(df['valor_global_contrato_reais'])

df['data_de_assinatura'] = pd.to_datetime(df['data_de_assinatura'])

df['fim_vigencia'] = pd.to_datetime(df['fim_vigencia'])

In [None]:
# Verificando a conversão
valor = df.loc[75, 'valor_global_contrato_reais']
print(type(valor))

<class 'numpy.float64'>


In [7]:
# Descobrindo o valor que cada empresa recebeu por contrato

df['valor_recebido_por_empresa'] = df['valor_global_contrato_reais'] * df['pp_consorcio']
df.head(5)

Unnamed: 0,nome_projeto,cliente,esfera_cliente,numero_srm,numero_ocs,data_de_assinatura,compartilhado,link_projeto,servico_contratado,objeto,valor_global_contrato_reais,fim_vigencia,consorcio,cnpj_consorcio,empresa,cnpj_empresa,lider_consorcio,pp_consorcio,valor_recebido_por_empresa
0,ACRE - SANEAMENTO,ESTADO DO ACRE,Estadual,4400003000.0,0264/2017,2017-06-14,Não,https://www.bndes.gov.br/arquivos/contratos-ad...,Serviço Único,CONTRATAÇÃO DE SERVIÇOS TÉCNICOS ESPECIALIZADO...,4049846.93,2021-05-24,CONSORCIO SANEAMENTO BRASIL,27.820.864/0001-06,AVALIAR AVALIACOES E ASSESSORIA LTDA,65.156.739/0001-32,Não,0.128,518380.4
1,ACRE - SANEAMENTO,ESTADO DO ACRE,Estadual,4400003000.0,0264/2017,2017-06-14,Não,https://www.bndes.gov.br/arquivos/contratos-ad...,Serviço Único,CONTRATAÇÃO DE SERVIÇOS TÉCNICOS ESPECIALIZADO...,4049846.93,2021-05-24,CONSORCIO SANEAMENTO BRASIL,27.820.864/0001-06,ESSE ENGENHARIA E CONSULTORIA LTDA,41.656.372/0001-58,Não,0.427,1729285.0
2,ACRE - SANEAMENTO,ESTADO DO ACRE,Estadual,4400003000.0,0264/2017,2017-06-14,Não,https://www.bndes.gov.br/arquivos/contratos-ad...,Serviço Único,CONTRATAÇÃO DE SERVIÇOS TÉCNICOS ESPECIALIZADO...,4049846.93,2021-05-24,CONSORCIO SANEAMENTO BRASIL,27.820.864/0001-06,"FIALHO, CANABRAVA, ANDRADE, SALLES ADVOGADOS",02.911.978/0001-30,Sim,0.445,1802182.0
3,ALAGOAS - SANEAMENTO - BLOCO A,ESTADO DE ALAGOAS,Estadual,4400003000.0,0228/2017,2017-05-30,Sim,https://www.bndes.gov.br/arquivos/contratos-ad...,Serviço Único,CONSULTORIA DESESTATIZAÇÃO CASAL,11069894.62,2022-02-26,"CONSORCIO EY, FELSBERG, MUZZI E EMA",27.720.709/0001-18,E.M.A. ENGENHARIA DE MEIO AMBIENTE LTDA,54.695.317/0001-19,Não,0.4605,5097686.0
4,ALAGOAS - SANEAMENTO - BLOCO A,ESTADO DE ALAGOAS,Estadual,4400003000.0,0228/2017,2017-05-30,Sim,https://www.bndes.gov.br/arquivos/contratos-ad...,Serviço Único,CONSULTORIA DESESTATIZAÇÃO CASAL,11069894.62,2022-02-26,"CONSORCIO EY, FELSBERG, MUZZI E EMA",27.720.709/0001-18,FELSBERG E PEDRETTI ADVOGADOS E CONSULTORES LE...,09.522.100/0001-52,Não,0.2064,2284826.0


In [8]:
# Conserto da coluna pp_consorcio, que estava com o a porcentagem de participação no contrato arredondado
pd.set_option('display.float_format', lambda x: '%.4f' % x)

df['pp_consorcio'] = df['pp_consorcio'].round(4)
print(df['pp_consorcio'].tail(20))


890   0.3500
891   0.4000
892   0.2000
893   0.8000
894   0.4225
895   0.0423
896   0.1690
897   0.3662
898   0.0633
899   0.1964
900   0.2792
901   0.4611
902   0.0633
903   0.1964
904   0.2792
905   0.4611
906   0.2433
907   0.2433
908   0.2433
909   0.2701
Name: pp_consorcio, dtype: float64


In [None]:
# Escolhendo contratos pelo SRM para fazer um grafico mostrando quanto cada empresa ganhou com aquele contrato

df.tail(1)

# 4400004395.0000
# 4400005441.0000
# 4400003622.0000
# 4400005970.0000


Unnamed: 0,nome_projeto,cliente,esfera_cliente,numero_srm,numero_ocs,data_de_assinatura,compartilhado,link_projeto,servico_contratado,objeto,valor_global_contrato_reais,fim_vigencia,consorcio,cnpj_consorcio,empresa,cnpj_empresa,lider_consorcio,pp_consorcio,valor_recebido_por_empresa
909,ZOOLÓGICO DO CIGS,COMANDO DO EXERCITO,Federal,4400005970.0,0200/2024,2024-07-09,Sim,https://www.bndes.gov.br/arquivos/contratos-ad...,Serviço Único,"a execução dos SERVIÇOS TÉCNICOS, o que inclui...",14750250.0,2029-06-16,PLANTUC - CONSULTORIA SOCIOAMBIENTAL LTDA,10.417.179/0001-30,PLANTUC - CONSULTORIA SOCIOAMBIENTAL LTDA,10.417.179/0001-30,Sim,0.2701,3984042.525


In [None]:
num_srm_sel = [4400004395.0000, 4400005441.0000, 4400003622.0000, 4400005970.0000]

df_filtrado = df[df['numero_srm'].isin(num_srm_sel)]

               nome_projeto                 cliente esfera_cliente  \
44            CASA DA MOEDA   MINISTERIO DA FAZENDA        Federal   
45            CASA DA MOEDA   MINISTERIO DA FAZENDA        Federal   
46            CASA DA MOEDA   MINISTERIO DA FAZENDA        Federal   
517   PARQUES MG - BIRIBIRI  ESTADO DE MINAS GERAIS       Estadual   
518   PARQUES MG - BIRIBIRI  ESTADO DE MINAS GERAIS       Estadual   
519   PARQUES MG - BIRIBIRI  ESTADO DE MINAS GERAIS       Estadual   
520   PARQUES MG - BIRIBIRI  ESTADO DE MINAS GERAIS       Estadual   
533  PARQUES MG - RIO PRETO  ESTADO DE MINAS GERAIS       Estadual   
534  PARQUES MG - RIO PRETO  ESTADO DE MINAS GERAIS       Estadual   
535  PARQUES MG - RIO PRETO  ESTADO DE MINAS GERAIS       Estadual   

         numero_srm numero_ocs data_de_assinatura compartilhado  \
44  4400004395.0000  0030/2020         2020-01-24           Não   
45  4400004395.0000  0030/2020         2020-01-24           Não   
46  4400004395.0000  0030/20

In [None]:
caminho_arquivo = '../base_dados/dados_filtrados.csv'

df_filtrado.to_csv(caminho_arquivo, index=False)

In [12]:
df.shape

(910, 19)

In [None]:
caminho_arquivo = '../base_dados/bd_2.csv'

df.to_csv(caminho_arquivo,
          index=False,
          sep=';',
          decimal=',',
          encoding='latin1')