# Download automatizado de edificações

## Introdução

Os arquivos de edificações estão divididos por sub-prefeituras. Isso acontece em outros casos e é possível adaptar esse script para solucionar dificuldades similares.
É comum precisarmos desse arquivo para fazer alguma análise e sempre acaba ficando a dificuldade de se obeter o conjunto total de feições.

Portanto um robo automatizado que faça o download dos arquivos de maneira consistente pode ser uma ferramenta útil de trabalho para vc que precisa trabalhar com dados de toda a cidade.

## Metodologia

Para fazermos o download de forma automatizada vamos usar a linguagem de programação Python com o WebDriver Selenium

### Abrindo so site do Geosampa

O primeiro passo é abrir o site do GeoSampa em um WebDriver e simular um usuário fazendo o download de todos os arquivos de lote

In [1]:
from selenium import webdriver

options = webdriver.ChromeOptions()

# Descomente a linha abaixo caso não precise visualizar o browser
# options.add_argument('headless') 

options.add_argument('window-size=900x1080')

# Inicializando o driver, que é uma instância de um browser
driver = webdriver.Chrome(chrome_options=options)
driver.get("http://geosampa.prefeitura.sp.gov.br/PaginasPublicas/_SBC.aspx")

  # This is added back by InteractiveShellApp.init_path()


### Clicando no botão de downloads

In [2]:
#popup = driver.find_element_by_xpath('//*[@id="toPopup"]/div[1]')
#driver.execute_script("arguments[0].click();", popup)

#driver.execute_script('document.getElementById("backgroundPopup").remove()')
driver.implicitly_wait(1)

botao_downloads = driver.find_element_by_xpath('//*[contains(@id, "OpenLayers_Control_Panel")]/div[7]')
botao_downloads.click()

### Escolhendo a camada

Agora precisamos escolher no menu DropDown a opção 'Cadastro' e então a opção 'Lotes'. Quando uma nova janela passa a ser apresentada para podermos escolher 'Shapefiles'

In [3]:
driver.implicitly_wait(1)

from selenium.webdriver.support.select import Select
combo_download = Select(driver.find_element_by_id('cboCamadas'))
combo_download.select_by_visible_text('Habitação e Edificação')

driver.implicitly_wait(1)

sub_combo_download = Select(driver.find_element_by_id('cboSubCamadas'))
sub_combo_download.select_by_visible_text('Edificação')

driver.implicitly_wait(1)

link_ok = driver.find_element_by_xpath('//*[@id="popup_ok"]')
link_ok.click()

driver.implicitly_wait(1)

link_shps = driver.find_element_by_xpath('//*[@id="1"]/td[2]/a[2]')
link_shps.click()

### Iterando sobre os arquivos disponíveis para download

Nessa tela temos links para os downloads de todos os arquivos. Precisamos portanto iterar sobre eles e guardar esses links em um arquivo para postetiormente fazer o download de cada um deles.

In [4]:
%%time


# abrindo  o arquivo em modo append
f = open("download_edificacoes_geosampa.txt", "w+")

# iterando sobre os links
while True:
    links_arquivos = driver.find_elements_by_class_name("down")
    for link in links_arquivos:
        if 'SHP_edificacao' in link.get_attribute("href"):
            f.write(link.get_attribute("href")+'\n')
            #link.click()
    if driver.find_element_by_xpath('//*[contains(@id, "next__P_")]').get_attribute('class').find('disabled') < 0:
        driver.find_element_by_xpath('//*[contains(@id, "next__P_")]/span').click()
    else:
        break

# fechando o arquivo        
f.close()

Wall time: 1.31 s


### Fazendo o download dos arquivos

Agora que temos os links, podemos fazer o download dos arquivos individualmente

In [13]:
import os
cwd = os.getcwd()

from selenium.webdriver.chrome.options import Options

options = Options()
options.add_experimental_option("prefs", {
  "download.default_directory": cwd+"\downloads\\",
  "download.prompt_for_download": False,
  "download.directory_upgrade": True,
  "safebrowsing.enabled": True
})

driver = webdriver.Chrome(chrome_options=options)

with open("download_edificacoes_geosampa.txt","r") as f:
    line = f.readline()
    while line:
        driver.get(line)
        line = f.readline()


  


### Descomprimindo os arquivos baixados

Agora que os arquivos estão baixados podemos descompacta-los

In [18]:
import zlib
import zipfile
import os

In [17]:
directory = cwd+"/downloads/"
for entry in os.scandir(directory):
    shp_zip = zipfile.ZipFile(entry)
    shp_zip.extractall(cwd+"/shp_files/")
    shp_zip.close()

### Concatenando todos os ShapeFiles em uma única camada

Agora que temos 96 camadas, uma para cada distrito, seria interessante concatenarmos todas elas para trabalhar apenas com uma geral para toda a cidade.

In [2]:
import pandas as pd
import geopandas as gpd
import datetime
date_string = datetime.datetime.now().strftime("%Y-%m-%d")

gdfs = []

rootdir = cwd+"\shp_files\"

for subdir, dirs, files in os.walk(rootdir):
    for file in files:
        if file.endswith('.shp') and file.startswith('SHP_edificacao'):
            gdfs.append(gpd.read_file(os.path.join(subdir, file)))
            
df = pd.concat(gdfs)
gdf = gpd.GeoDataFrame(df, crs={'init' :'epsg:31983'}, geometry=df['geometry'])
gdf.to_file(cwd+'\edificacoes-geosampa.shp')
