## Filtragem arquivos transparência - Saúde

#### Carregando bibliotecas

In [1]:
import os
import glob
import openpyxl
import pandas as pd

#### Funções auxiliares

In [2]:
def listar_arquivos(diretorio='Favorecidos', extensao='xlsx'):
    search = "input/{}/*.{}".format(diretorio, extensao)
    files = glob.glob(search)
    files.sort()
    return files

In [3]:
arquivos = listar_arquivos('Contratos')

In [4]:
arquivos

['input/Contratos/Open_Data_Contratos_2008.xlsx',
 'input/Contratos/Open_Data_Contratos_2009.xlsx',
 'input/Contratos/Open_Data_Contratos_2010.xlsx',
 'input/Contratos/Open_Data_Contratos_2011.xlsx',
 'input/Contratos/Open_Data_Contratos_2012.xlsx',
 'input/Contratos/Open_Data_Contratos_2013.xlsx',
 'input/Contratos/Open_Data_Contratos_2014.xlsx',
 'input/Contratos/Open_Data_Contratos_2015.xlsx',
 'input/Contratos/Open_Data_Contratos_2016.xlsx',
 'input/Contratos/Open_Data_Contratos_2017.xlsx',
 'input/Contratos/Open_Data_Contratos_2018.xlsx',
 'input/Contratos/Open_Data_Contratos_2019.xlsx']

#### Filtrando os dados referentes à saúde (Secretaria Municipal de Saúde e Fundo de Assistência à Saúde)

In [5]:
dff = pd.DataFrame()
for arquivo in arquivos:
    df = pd.read_excel(arquivo, sheet_name='Plan1')
    # SECRETARIA MUNICIPAL DE SAÚDE = 1800 e FUNDO DE ASSISTÊNCIA À SAÚDE = 1333
    df = df[(df['Órgão executor'] == 1800) | (df['Órgão executor'] == 1333)]
    dff = dff.append(df)

In [6]:
len(dff)

2674

In [7]:
len(dff['Código favorecido'].unique())

809

#### Análise dos Favorecidos por ano

In [8]:
aggregations = {
    'Favorecido': 'first',
    'Valor Instrumento': 'sum',
    'Valor do acréscimo ou redução': 'sum',
    'Saldo do instrumento': 'sum',
    'Saldo executado': 'sum',
    'Valor empenhado': 'sum',
    'Valor liquidado': 'sum',
    'Valor pago': 'sum'
}
dff1 = dff.groupby(['Ano instrumento', 'Código favorecido']).agg(aggregations)

In [9]:
dff1

Unnamed: 0_level_0,Unnamed: 1_level_0,Favorecido,Valor Instrumento,Valor do acréscimo ou redução,Saldo do instrumento,Saldo executado,Valor empenhado,Valor liquidado,Valor pago
Ano instrumento,Código favorecido,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1
2008,26476720,JOSE PEREIRA HERDEIRO,35421.12,0.00,35421.12,0.00,35421.12,35421.12,35421.12
2008,2753111715,ROBERTO ALEXANDER VEIGA DE MORAES GREY,8513.98,0.00,8513.98,0.00,8513.98,8513.98,8513.98
2008,8354000182,BIOSENSOR INDUSTRIA E COMERCIO LTDA EPP,6800.00,0.00,6800.00,0.00,6800.00,6800.00,6800.00
2008,11620935791,AMAURI CARDOSO DA SILVA MOURA,83986.36,0.00,83986.36,0.00,83986.36,83986.36,83986.36
2008,29687063734,EVANDRO LUIZ ALVES DE MORAES TAVARES,155580.23,0.00,155580.23,0.00,155580.23,155580.23,155580.23
2008,59062000179,CRYSSIL FORNECEDORA DE MATERIAIS E SERVICOS ES...,1242908.50,82970.00,1325878.50,0.00,1325878.50,1325878.50,1325878.50
2008,66529743715,FERNANDO ZEFERINO ALVES,132531.23,0.00,132531.23,0.00,132531.23,132531.23,132531.23
2008,72089563753,JOSE CARLOS ALVES PEREIRA,3309.95,0.00,3309.95,0.00,3309.95,3309.95,3309.95
2008,85822000112,ESPECIFARMA COMERCIO DE MEDICAMENTOS E PRODUTO...,117000.00,0.00,117000.00,117000.00,0.00,0.00,0.00
2008,86616000127,UTN UNIDADE DE TRATAMENTO NEFROLOGICO E SERVIC...,700690.00,0.00,700690.00,0.00,700690.00,700690.00,700690.00


#### Análise de valores e quantidades de Contratos efetuados anualmente

In [10]:
aggregations = {
    'Valor pago': 'sum',
    'Código favorecido': 'count'
}
dff2 = dff.groupby('Ano instrumento').agg(aggregations)

In [11]:
dff2

Unnamed: 0_level_0,Valor pago,Código favorecido
Ano instrumento,Unnamed: 1_level_1,Unnamed: 2_level_1
2008,350057300.0,988
2009,434051900.0,385
2010,678775900.0,205
2011,1181017000.0,186
2012,521384400.0,150
2013,254673300.0,101
2014,623601800.0,136
2015,449774100.0,113
2016,612643500.0,164
2017,91958140.0,90


#### Exportando resultados gerais

In [12]:
with pd.ExcelWriter('output/gastos_totais_saude.xlsx') as writer:
    dff1.to_excel(writer, sheet_name='detalhado')
    dff2.to_excel(writer, sheet_name='anual')

#### CNPJs específicos das OSS - obtidas através do site da Prefeitura do Rio

In [13]:
codigos = [
    2385669000174,
    9652823000176,
    61699567000192,
    24232886000167,
    343941000128,
    8882456000134,
    33981408000140,
    27774561000102,
    31104896000182,
    33005638000174,
    6942340000118,
    5153789000134,
    2833927377000140,
    42375097000167,
    48211585000115,
    5696218000146,
    2158304200084,
    7345851000115,
    33722224000166,
    7813739000161,
    10635117000103,
    66518267000183
]

In [14]:
dff = dff[dff['Código favorecido'].isin(codigos)]

In [15]:
len(dff)

73

#### Análise das OSS por ano

In [16]:
aggregations = {
    'Favorecido': 'first',
    'Valor Instrumento': 'sum',
    'Valor do acréscimo ou redução': 'sum',
    'Saldo do instrumento': 'sum',
    'Saldo executado': 'sum',
    'Valor empenhado': 'sum',
    'Valor liquidado': 'sum',
    'Valor pago': 'sum'
}
dff3 = dff.groupby(['Ano instrumento', 'Código favorecido']).agg(aggregations)

In [17]:
dff3

Unnamed: 0_level_0,Unnamed: 1_level_0,Favorecido,Valor Instrumento,Valor do acréscimo ou redução,Saldo do instrumento,Saldo executado,Valor empenhado,Valor liquidado,Valor pago
Ano instrumento,Código favorecido,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1
2009,2385669000174,FUNDACAO PARA O DESENVOLVIMENTO CIENTIFICO E T...,66730790.0,35708400.0,31022390.0,27797092.13,38933700.0,38933700.0,38933700.0
2009,9652823000176,INSTITUTO DE ATENCAO BASICA E AVANCADA A SAUDE,70297200.0,22926000.0,47371200.0,1219313.81,69077880.0,69077880.0,69077880.0
2009,31104896000182,CENTRO DE ESTUDOS PESQUISA E DESENVOLVIMENTO T...,85000.0,0.0,85000.0,0.0,85000.0,85000.0,85000.0
2010,2385669000174,FUNDACAO PARA O DESENVOLVIMENTO CIENTIFICO E T...,149389600.0,0.0,149389600.0,51964057.47,97425550.0,97425550.0,97425550.0
2010,9652823000176,INSTITUTO DE ATENCAO BASICA E AVANCADA A SAUDE,57713420.0,133896300.0,191609700.0,5435934.17,186173700.0,186173700.0,186173700.0
2010,31104896000182,CENTRO DE ESTUDOS PESQUISA E DESENVOLVIMENTO T...,700000.0,1400000.0,2100000.0,333333.36,1766667.0,1766667.0,1766667.0
2010,61699567000192,ASSOCIACAO PAULISTA PARA DESENVOLVIMENTO DA ME...,47083880.0,45428460.0,92512350.0,4719356.85,87792990.0,87792990.0,87792990.0
2011,2385669000174,FUNDACAO PARA O DESENVOLVIMENTO CIENTIFICO E T...,226580500.0,14026450.0,240607000.0,88935309.65,151671700.0,151671700.0,151671700.0
2011,5696218000146,INSTITUTO DE DESENVOLVIMENTO INSTITUCIONAL E A...,1752181.0,0.0,1752181.0,1563814.11,188367.0,188367.0,188367.0
2011,9652823000176,INSTITUTO DE ATENCAO BASICA E AVANCADA A SAUDE,36713560.0,58824360.0,95537920.0,3044665.76,92493250.0,92493250.0,92493250.0


#### Análise de valores e quantidades de Contratos efetuados anualmente com OSS

In [18]:
aggregations = {
    'Valor pago': 'sum',
    'Código favorecido': 'count'
}
dff4 = dff.groupby('Ano instrumento').agg(aggregations)

In [19]:
dff4

Unnamed: 0_level_0,Valor pago,Código favorecido
Ano instrumento,Unnamed: 1_level_1,Unnamed: 2_level_1
2009,108096600.0,4
2010,373158900.0,16
2011,356667600.0,13
2012,119434100.0,8
2013,22932540.0,7
2014,211788300.0,9
2015,66356700.0,4
2016,56457850.0,10
2017,29450850.0,1
2018,19706840.0,1


#### Exportando resultados específicos de OSS

In [20]:
with pd.ExcelWriter('output/gastos_os_saude.xlsx') as writer:
    dff3.to_excel(writer, sheet_name='detalhado')
    dff4.to_excel(writer, sheet_name='anual')