# Obras concluídas sem informação da empresa contratada

Importando o módulo urllib para tratamento de requisições http

In [1]:
import urllib.request

Importando o módulo Pandas para tratamento do banco de dados

In [2]:
import pandas as pd

Escolhendo o nome do arquivo do banco de dados

In [3]:
arquivo = 'simec_obras.csv'

Escolhendo a url do arquivo de dados a ser baixado

In [4]:
url = 'http://simec.mec.gov.br/painelObras/download.php'

Fazendo a requisição do arquivo do banco de dados

In [5]:
%%time
urllib.request.urlretrieve(url, arquivo)

Wall time: 14.7 s


('simec_obras.csv', <http.client.HTTPMessage at 0x1d364905278>)

Lendo o arquivo do banco de dados definindo o tipo de separador, o padrão de codificação, o separador de decimais e que o processamento pode utilizar alta memória, bem como mostrar o tempo de execução da leitura de tal arquivo.

In [6]:
%%time
obras = pd.read_csv(arquivo, sep=';', encoding='iso8859_1', decimal=",", low_memory=False)

Wall time: 510 ms


Apresentando as informações do banco de dados

In [7]:
obras.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 28837 entries, 0 to 28836
Data columns (total 57 columns):
ID                                                28837 non-null int64
Nome                                              28834 non-null object
Situação                                          28837 non-null object
Município                                         28834 non-null object
UF                                                28834 non-null object
CEP                                               27030 non-null object
Logradouro                                        25290 non-null object
Bairro                                            24640 non-null object
Termo/Convênio                                    27608 non-null object
Fim da Vigência Termo/Convênio                    20982 non-null object
Situação do Termo/Convênio                        28837 non-null object
Percentual de Execução                            28837 non-null object
Data Prevista de Conclusão d

Verificando a quantidade de tuplas cuja coluna 'Empresa Contratada' encontra-se sem informação

In [8]:
obras['Empresa Contratada'].value_counts(dropna = False)

NaN                                                                            7569
(02908931000118) CONSTRUTORA SBM LTDA                                            63
(05205071000144) ALCA ENGENHARIA LTDA EPP                                        56
(00401969000174) QUALITY EMPREENDIMENTOS LTDA                                    52
(18842730000103) CONSORCIO PRO-INFANCIA BRASIL - PIB                             51
(01379965000108) POLI ENGENHARIA E COMERCIO LTDA                                 45
(16543194000101) SPE INOVA BH S/A                                                44
(07408234000111) L. & R. SANTOS CONSTRUCOES LTDA                                 41
(03314057000153) ENGE PRAT ENGENHARIA E SERVICOS LTDA.                           38
(14554855000179) UNICA ENGENHARIA E EMPREENDIMENTOS IMOBILIARIOS LTDA - EPP      37
(08878019000147) JAG EMPREENDIMENTOS LTDA                                        35
(00521113000132) SALVER EMPREITEIRA DE MAO DE OBRA LTDA                     

Criando um novo banco de dados apenas com a coluna 'ID', selecionando apenas as tuplas cuja coluna 'Empresa Contratada' encontra-se sem informação e a coluna 'Situação' encontra-se como 'Concluída'

In [9]:
concluida_sem_empresa = obras.loc[(obras['Empresa Contratada'].isnull()) & (obras['Situação'] == 'Concluída'), 'ID']

Verificando a quantidade de tuplas que encontram-se no banco de dados 'concluida_sem_empresa'

In [10]:
total_concluida_sem_empresa = concluida_sem_empresa.size
total_concluida_sem_empresa

352

Gerando um arquivo csv com o novo banco de dados

In [11]:
concluida_sem_empresa.to_csv('concluida_sem_empresa.csv', sep=',', index=False)

**Conclusão:** No banco de dados gerado no dia 20 de julho de 2018 a partir dos dados constantes do Painel de Obras do SIMEC, existem atualmente {{total_concluida_sem_empresa}} obras concluídas cujas empresas contratadas não estão devidamente informadas.

In [12]:
for _, id in concluida_sem_empresa.iteritems():
    print('http://simec.mec.gov.br/painelObras/contratacao.php?obra={}'.format(id))

http://simec.mec.gov.br/painelObras/contratacao.php?obra=1428
http://simec.mec.gov.br/painelObras/contratacao.php?obra=1506
http://simec.mec.gov.br/painelObras/contratacao.php?obra=1571
http://simec.mec.gov.br/painelObras/contratacao.php?obra=1686
http://simec.mec.gov.br/painelObras/contratacao.php?obra=1797
http://simec.mec.gov.br/painelObras/contratacao.php?obra=1801
http://simec.mec.gov.br/painelObras/contratacao.php?obra=1939
http://simec.mec.gov.br/painelObras/contratacao.php?obra=1965
http://simec.mec.gov.br/painelObras/contratacao.php?obra=1989
http://simec.mec.gov.br/painelObras/contratacao.php?obra=2037
http://simec.mec.gov.br/painelObras/contratacao.php?obra=2115
http://simec.mec.gov.br/painelObras/contratacao.php?obra=2140
http://simec.mec.gov.br/painelObras/contratacao.php?obra=2196
http://simec.mec.gov.br/painelObras/contratacao.php?obra=2320
http://simec.mec.gov.br/painelObras/contratacao.php?obra=3585
http://simec.mec.gov.br/painelObras/contratacao.php?obra=3768
http://s