In [3]:
import numpy as np
import pandas as pd
from tqdm import tqdm
from os import listdir
from datatable import dt, f, by
from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.common.keys import Keys
from utils import get_path, data_load

# Descrição

Entre os desafios mais urgentes do Sistema Único de Saúde (SUS) estão a ampliação do acesso e a adequação dos serviços ofertados. No Brasil, as relações existentes entre regiões e redes de atenção à saúde indicam que o avanço do processo de regionalização do SUS pode interferir positivamente na oferta de ações de serviços de saúde, tornando-a mais eficiente e abrangente.

[Saiba mais](https://www.resbr.net.br/apresentacao/)

[Plataforma de acesso aos dados](https://indicadores.resbr.net.br/view/)

# Scrap

In [2]:
def scrap_indicator(driver, url, n_files=10):
  driver.maximize_window()
  anchors = None
  columns = None
  checkboxes = None
  for i in tqdm(range(n_files)):
    driver.get(url + 'clrSession=true')
    driver.find_element(By.XPATH, "//input[@type='radio' and @value='4']").click()
    columns = driver.find_elements(
      By.XPATH, "//input[@type='checkbox' and @onclick='SelAll(this)']")
    for column in columns: column.click()
    driver.find_element(By.XPATH, "//input[@id='btnEnviar']").click()
    if anchors == None:
      anchors = driver.find_elements(By.CSS_SELECTOR, "a[href*=listaLocs]")
      anchors = set([a.get_attribute('href') for a in anchors])
      anchors = sorted(list(anchors))
    for a in anchors: driver.execute_script(a[:-1])
    checkboxes = driver.find_elements(
      By.XPATH, "//input[@type='checkbox' and @onclick='SelAll(this)']")
    n_cks = len(checkboxes)
    pos_list = np.arange(0, n_cks, n_cks/10, dtype=int)
    bgn = pos_list[i]
    try: end = pos_list[i+1]
    except: end = len(checkboxes)
    selected_boxes = checkboxes[bgn:end]
    for checkbox in selected_boxes:
      if not checkbox.is_selected() and checkbox.is_displayed():
        checkbox.click()
    driver.find_element(By.XPATH, "//input[@id='btnEnviar2']").click()
    driver.find_element(By.XPATH, "//input[@id='btnTabela']").click()
    driver.get(url.replace('indicadores.php', 'output.php') + 'export=2')
    print(f'{i+1:02}/{n_files}: checkboxes={n_cks}, selected={len(selected_boxes)}')
    driver.switch_to.window(driver.window_handles[0])

In [3]:
url = 'https://indicadores.resbr.net.br/view/indicadores.php?'
chromedriver = '/Users/lucas/Desktop/chromedriver'
driver = webdriver.Chrome(chromedriver)
scrap_indicator(driver, url)


executable_path has been deprecated, please pass in a Service object

 10%|█         | 1/10 [00:22<03:23, 22.56s/it]

01/10: checkboxes=465, selected=46


 20%|██        | 2/10 [00:30<01:49, 13.73s/it]

02/10: checkboxes=465, selected=46


 30%|███       | 3/10 [00:40<01:26, 12.38s/it]

03/10: checkboxes=465, selected=46


 40%|████      | 4/10 [00:51<01:10, 11.70s/it]

04/10: checkboxes=465, selected=46


 50%|█████     | 5/10 [00:59<00:51, 10.21s/it]

05/10: checkboxes=465, selected=46


 60%|██████    | 6/10 [01:11<00:43, 10.97s/it]

06/10: checkboxes=465, selected=46


 70%|███████   | 7/10 [01:22<00:33, 11.06s/it]

07/10: checkboxes=465, selected=46


 80%|████████  | 8/10 [01:34<00:22, 11.19s/it]

08/10: checkboxes=465, selected=46


 90%|█████████ | 9/10 [01:45<00:11, 11.25s/it]

09/10: checkboxes=465, selected=46


100%|██████████| 10/10 [01:56<00:00, 11.68s/it]

10/10: checkboxes=465, selected=51





In [None]:
# driver.close()

# Tabela resultante

In [8]:
path_dir = get_path('INDICADORES', '')
files = [path_dir+pth for pth in listdir(path_dir) if pth[-3:] == 'csv']
dfs = [pd.read_csv(fl, encoding='latin1', sep=';') for fl in files]
for df in dfs: print(df.shape)

(524, 184)
(595, 184)
(673, 184)
(511, 184)
(645, 184)
(516, 184)
(528, 184)
(695, 184)
(734, 184)
(587, 184)


In [9]:
df_indc = pd.concat(dfs)
df_indc

Unnamed: 0,CÓDIGO,Tipo Localidade,UF,CIR,Município,Número de municípios na Região de Saúde,Município de capital,Municípios que fazem parte da zona de fronteira - IBGE,Municípios que fazem parte da faixa de fronteira - IBGE,Municípios que fazem parte da fronteira estadual,...,Porcentual de Despesas com Investimentos pelo Total de Despesas em Saúde (2014),Porcentual de Tranferências SUS pelo Total de Despesas em Saúde (2014),Porcentual de Recursos Próprios em Saúde - EC29 (2014),Recursos de Transferências SUS por habitante (2014),Despesas com Recursos Próprios em Saúde por habitante (2014),Cobertura populacional estimada pelas equipes de Atenção Básica (2014),% de população beneficiária de planos de saúde (Setembro/2015),Porcentual de famílias beneficiárias do Programa Bolsa Família (2014),Porcentual de população beneficiária do Programa Bolsa Família (2014),Unnamed: 183
0,15.001,REGSAU,-,Araguaia,-,15,0,0,0,7,...,853,5461,1883,21311,16166,6390,515,3443,3159,
1,15.002,REGSAU,-,Baixo Amazonas,-,14,0,3,5,5,...,1061,5082,2077,20422,15930,4220,618,4915,5245,
2,15.003,REGSAU,-,Carajás,-,17,0,0,0,9,...,944,2616,2379,17749,45516,5223,2206,3418,3501,
3,15.004,REGSAU,-,Lago de Tucuruí,-,6,0,0,0,0,...,808,5390,2008,20823,16648,4999,307,4530,3986,
4,15.013,REGSAU,-,Marajó I,-,9,0,0,0,0,...,2006,5115,1721,15885,11180,2419,102,6093,6159,
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
582,171.780,MUNIC,Tocantins,Sudeste,Ponte Alta do Bom Jesus,15,Não,Não,Não,Sim,...,843,3479,2854,19983,36945,100,202,5197,4693,
583,171.800,MUNIC,Tocantins,Sudeste,Porto Alegre do Tocantins,15,Não,Não,Não,Não,...,1052,3589,1905,22042,38641,100,115,5265,4882,
584,171.865,MUNIC,Tocantins,Sudeste,Rio da Conceição,15,Não,Não,Não,Sim,...,1386,2014,1552,16211,53836,100,081,4784,4819,
585,172.090,MUNIC,Tocantins,Sudeste,Taguatinga,15,Não,Não,Não,Sim,...,025,4417,3313,18731,29260,7825,2620,3730,4123,


# Exportando tabela

In [5]:
path_indc = path_dir + 'indicadores.csv.gzip'
df_indc.to_csv(path_indc, index=False)

In [7]:
pd.read_csv(path_indc, low_memory=False)

Unnamed: 0,CÓDIGO,Tipo Localidade,UF,CIR,Município,Número de municípios na Região de Saúde,Município de capital,Municípios que fazem parte da zona de fronteira - IBGE,Municípios que fazem parte da faixa de fronteira - IBGE,Municípios que fazem parte da fronteira estadual,...,Porcentual de Despesas com Investimentos pelo Total de Despesas em Saúde (2014),Porcentual de Tranferências SUS pelo Total de Despesas em Saúde (2014),Porcentual de Recursos Próprios em Saúde - EC29 (2014),Recursos de Transferências SUS por habitante (2014),Despesas com Recursos Próprios em Saúde por habitante (2014),Cobertura populacional estimada pelas equipes de Atenção Básica (2014),% de população beneficiária de planos de saúde (Setembro/2015),Porcentual de famílias beneficiárias do Programa Bolsa Família (2014),Porcentual de população beneficiária do Programa Bolsa Família (2014),Unnamed: 183
0,15.001,REGSAU,-,Araguaia,-,15,0,0,0,7,...,853,5461,1883,21311,16166,6390,515,3443,3159,
1,15.002,REGSAU,-,Baixo Amazonas,-,14,0,3,5,5,...,1061,5082,2077,20422,15930,4220,618,4915,5245,
2,15.003,REGSAU,-,Carajás,-,17,0,0,0,9,...,944,2616,2379,17749,45516,5223,2206,3418,3501,
3,15.004,REGSAU,-,Lago de Tucuruí,-,6,0,0,0,0,...,808,5390,2008,20823,16648,4999,307,4530,3986,
4,15.013,REGSAU,-,Marajó I,-,9,0,0,0,0,...,2006,5115,1721,15885,11180,2419,102,6093,6159,
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
6003,171.780,MUNIC,Tocantins,Sudeste,Ponte Alta do Bom Jesus,15,Não,Não,Não,Sim,...,843,3479,2854,19983,36945,100,202,5197,4693,
6004,171.800,MUNIC,Tocantins,Sudeste,Porto Alegre do Tocantins,15,Não,Não,Não,Não,...,1052,3589,1905,22042,38641,100,115,5265,4882,
6005,171.865,MUNIC,Tocantins,Sudeste,Rio da Conceição,15,Não,Não,Não,Sim,...,1386,2014,1552,16211,53836,100,081,4784,4819,
6006,172.090,MUNIC,Tocantins,Sudeste,Taguatinga,15,Não,Não,Não,Sim,...,025,4417,3313,18731,29260,7825,2620,3730,4123,
