# Análise do Banco de Serviços do BNDES
O objetivo é explorar os contratos de consultoria apoiados pelo BNDES, entendendo sua distribuição por esfera de cliente (federal, estadual, municipal), valores contratados e evolução temporal.

----------------------------
Relembrando inspeção de base
----------------------------

# 1. Dimensões (linhas x colunas)
print("Dimensões:", df.shape)

# 2. Nome das colunas
print("\nColunas disponíveis:")
print(df.columns.tolist())

# 3. Tipos de dados de cada coluna
print("\nTipos de dados:")
print(df.dtypes)

# 4. Valores ausentes (nulos) por coluna
print("\nValores nulos por coluna:")
print(df.isnull().sum())

# 5. Visualizar primeiras linhas
print("\nPrimeiras linhas da base:")
display(df.head())

# 6. Visualizar últimas linhas
print("\nÚltimas linhas da base:")
display(df.tail())

# 7. Estatísticas descritivas
print("\nEstatísticas descritivas (colunas numéricas):")
display(df.describe())

print("\nEstatísticas descritivas (colunas de texto/categoria):")
display(df.describe(include="object"))

In [35]:
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns

#Conigurações de exibição
pd.set_option("display.max_columns", None)
pd.set_option("display.max_rows", 20)
sns.set(style="whitegrid")

In [36]:
ARQ = "../base_dados/banco-servicos-banco-de-servicos.csv"

#parâmetros de leitura
df = pd.read_csv(
    ARQ,
    sep=";",
    decimal=",",
    encoding="latin1"
)

# primeiras linhas
df.head()

Unnamed: 0,nome_projeto,cliente,esfera_cliente,numero_srm,numero_ocs,data_de_assinatura,compartilhado,link_projeto,servico_contratado,objeto,valor_global_contrato_reais,fim_vigencia,consorcio,cnpj_consorcio,empresa,cnpj_empresa,lider_consorcio,pp_consorcio
0,ACRE - SANEAMENTO,ESTADO DO ACRE,Estadual,4400003000.0,0264/2017,2017-06-14,Não,https://www.bndes.gov.br/arquivos/contratos-ad...,Serviço Único,CONTRATAÇÃO DE SERVIÇOS TÉCNICOS ESPECIALIZADO...,4049846.93,2021-05-24,CONSORCIO SANEAMENTO BRASIL,27.820.864/0001-06,AVALIAR AVALIACOES E ASSESSORIA LTDA,65.156.739/0001-32,Não,0.128
1,ACRE - SANEAMENTO,ESTADO DO ACRE,Estadual,4400003000.0,0264/2017,2017-06-14,Não,https://www.bndes.gov.br/arquivos/contratos-ad...,Serviço Único,CONTRATAÇÃO DE SERVIÇOS TÉCNICOS ESPECIALIZADO...,4049846.93,2021-05-24,CONSORCIO SANEAMENTO BRASIL,27.820.864/0001-06,ESSE ENGENHARIA E CONSULTORIA LTDA,41.656.372/0001-58,Não,0.427
2,ACRE - SANEAMENTO,ESTADO DO ACRE,Estadual,4400003000.0,0264/2017,2017-06-14,Não,https://www.bndes.gov.br/arquivos/contratos-ad...,Serviço Único,CONTRATAÇÃO DE SERVIÇOS TÉCNICOS ESPECIALIZADO...,4049846.93,2021-05-24,CONSORCIO SANEAMENTO BRASIL,27.820.864/0001-06,"FIALHO, CANABRAVA, ANDRADE, SALLES ADVOGADOS",02.911.978/0001-30,Sim,0.445
3,ALAGOAS - SANEAMENTO - BLOCO A,ESTADO DE ALAGOAS,Estadual,4400003000.0,0228/2017,2017-05-30,Sim,https://www.bndes.gov.br/arquivos/contratos-ad...,Serviço Único,CONSULTORIA DESESTATIZAÇÃO CASAL,11069894.62,2022-02-26,"CONSORCIO EY, FELSBERG, MUZZI E EMA",27.720.709/0001-18,E.M.A. ENGENHARIA DE MEIO AMBIENTE LTDA,54.695.317/0001-19,Não,0.4605
4,ALAGOAS - SANEAMENTO - BLOCO A,ESTADO DE ALAGOAS,Estadual,4400003000.0,0228/2017,2017-05-30,Sim,https://www.bndes.gov.br/arquivos/contratos-ad...,Serviço Único,CONSULTORIA DESESTATIZAÇÃO CASAL,11069894.62,2022-02-26,"CONSORCIO EY, FELSBERG, MUZZI E EMA",27.720.709/0001-18,FELSBERG E PEDRETTI ADVOGADOS E CONSULTORES LE...,09.522.100/0001-52,Não,0.2064


In [31]:
print("Dimensões:", df.shape)

df.info()

Dimensões: (910, 18)
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 910 entries, 0 to 909
Data columns (total 18 columns):
 #   Column                       Non-Null Count  Dtype  
---  ------                       --------------  -----  
 0   nome_projeto                 910 non-null    object 
 1   cliente                      910 non-null    object 
 2   esfera_cliente               910 non-null    object 
 3   numero_srm                   910 non-null    float64
 4   numero_ocs                   910 non-null    object 
 5   data_de_assinatura           910 non-null    object 
 6   compartilhado                910 non-null    object 
 7   link_projeto                 910 non-null    object 
 8   servico_contratado           910 non-null    object 
 9   objeto                       910 non-null    object 
 10  valor_global_contrato_reais  910 non-null    float64
 11  fim_vigencia                 910 non-null    object 
 12  consorcio                    910 non-null    object 
 13 

In [8]:
print(df.isnull().sum())

nome_projeto                   0
cliente                        0
esfera_cliente                 0
numero_srm                     0
numero_ocs                     0
data_de_assinatura             0
compartilhado                  0
link_projeto                   0
servico_contratado             0
objeto                         0
valor_global_contrato_reais    0
fim_vigencia                   0
consorcio                      0
cnpj_consorcio                 0
empresa                        0
cnpj_empresa                   0
lider_consorcio                0
pp_consorcio                   0
dtype: int64


In [None]:
print(df.describe(include="all").T)

In [37]:
print("\nColunas disponíveis:")
print(df.columns.tolist())


Colunas disponíveis:
['nome_projeto', 'cliente', 'esfera_cliente', 'numero_srm', 'numero_ocs', 'data_de_assinatura', 'compartilhado', 'link_projeto', 'servico_contratado', 'objeto', 'valor_global_contrato_reais', 'fim_vigencia', 'consorcio', 'cnpj_consorcio', 'empresa', 'cnpj_empresa', 'lider_consorcio', 'pp_consorcio']


In [None]:
#Fazendo um tratamento preventivo nas colunas
df.columns = (df.columns
              .str.strip()
              .str.lower()
              .str.replace(" ", "_")
#              .str.replace(r"[^\w]", "", regex=True)
)

print("\nColunas disponíveis:")
print(df.columns.tolist())


Colunas disponíveis:
['nome_projeto', 'cliente', 'esfera_cliente', 'numero_srm', 'numero_ocs', 'data_de_assinatura', 'compartilhado', 'link_projeto', 'servico_contratado', 'objeto', 'valor_global_contrato_reais', 'fim_vigencia', 'consorcio', 'cnpj_consorcio', 'empresa', 'cnpj_empresa', 'lider_consorcio', 'pp_consorcio']
