# Download automatizado de lotes

## Introdução

Os arquivos de lotes estão divididos por sub-prefeituras. Isso acontece em outros casos e é possível adaptar esse script para solucionar dificuldades similares.
É comum precisarmos desse arquivo para fazer alguma análise e sempre acaba ficando a dificuldade de se obeter o conjunto total de feições.

Portanto um robo automatizado que faça o download dos arquivos de maneira consistente pode ser uma ferramenta útil de trabalho para vc que precisa trabalhar com dados de toda a cidade.

## Metodologia

Para fazermos o download de forma automatizada vamos usar a linguagem de programação Python com o WebDriver Selenium

### Abrindo so site do Geosampa

O primeiro passo é abrir o site do GeoSampa em um WebDriver e simular um usuário fazendo o download de todos os arquivos de lote

In [1]:
from selenium import webdriver

options = webdriver.ChromeOptions()

# Descomente a linha abaixo caso não precise visualizar o browser
# options.add_argument('headless') 

options.add_argument('window-size=900x1080')

# Inicializando o driver, que é uma instância de um browser
driver = webdriver.Chrome(chrome_options=options)
driver.get("http://geosampa.prefeitura.sp.gov.br/PaginasPublicas/_SBC.aspx")

  # This is added back by InteractiveShellApp.init_path()


### Clicando no botão de downloads

In [2]:
#popup = driver.find_element_by_xpath('//*[@id="toPopup"]/div[1]')
#driver.execute_script("arguments[0].click();", popup)

#driver.execute_script('document.getElementById("backgroundPopup").remove()')
driver.implicitly_wait(1)

botao_downloads = driver.find_element_by_xpath('//*[contains(@id, "OpenLayers_Control_Panel")]/div[7]')
botao_downloads.click()

In [3]:
#######

driver.implicitly_wait(1)

from selenium.webdriver.support.select import Select
combo_download = Select(driver.find_element_by_id('cboCamadas'))

In [4]:
list(map(lambda x: x.text, combo_download.options))

['',
 'Cidade Solidária',
 'Limites Administrativos',
 'População',
 'Equipamentos',
 'Transporte',
 'Sistema Viário',
 'Habitação e Edificação',
 'Proteção e Defesa Civil',
 'Infraestrutura Urbana',
 'Verde e Recursos Naturais',
 'Meio Físico',
 'Rural',
 'Cadastro',
 'Legislação Urbana',
 'Patrimônio Cultural',
 'Acessibilidade',
 'Atlas Ambiental',
 'Economia',
 'Imagens Satelites',
 'Mosaico de Ortofotos',
 'Plantas e Mapas Históricos',
 'Articulacao de Imagens',
 'Atendimento ao Cidadão']

### Escolhendo a camada

Agora precisamos escolher no menu DropDown a opção 'Cadastro' e então a opção 'Lotes'. Quando uma nova janela passa a ser apresentada para podermos escolher 'Shapefiles'

In [5]:
driver.implicitly_wait(1)

from selenium.webdriver.support.select import Select
combo_download = Select(driver.find_element_by_id('cboCamadas'))
combo_download.select_by_visible_text('Cadastro')

driver.implicitly_wait(1)

sub_combo_download = Select(driver.find_element_by_id('cboSubCamadas'))
sub_combo_download.select_by_visible_text('Lotes')

driver.implicitly_wait(1)

link_ok = driver.find_element_by_xpath('//*[@id="1"]/td[2]/a[3]')
link_ok.click()

driver.implicitly_wait(1)

# link_shps = driver.find_element_by_xpath('//*[@id="1"]/td[2]/a[2]')
# link_shps.click()

### Iterando sobre os arquivos disponíveis para download

Nessa tela temos links para os downloads de todos os arquivos. Precisamos portanto iterar sobre eles e guardar esses links em um arquivo para postetiormente fazer o download de cada um deles.

In [None]:
%%time


# abrindo  o arquivo em modo append
f = open("download_lotes_geosampa.txt", "w+")

# iterando sobre os links
while True:
    links_arquivos = driver.find_elements_by_class_name("down")

    for link in links_arquivos:
        print(link)
        if 'SHP_LOTES' in link.get_attribute("href"):
            l = link
#             print(l)
            driver.execute_script("arguments[0].click();", l)
            driver.implicitly_wait(1)
            b = driver.find_element_by_xpath("//*[contains(text(), 'De acordo')]")
            driver.execute_script("arguments[0].click();", b)
            driver.implicitly_wait(1)
#             f.write(link.get_attribute("href")+'\n')
            #link.click()
    if driver.find_element_by_xpath('//*[contains(@id, "next__P_")]').get_attribute('class').find('disabled') < 0:
        n = driver.find_element_by_xpath('//*[contains(@id, "next__P_")]/span')
        driver.execute_script("arguments[0].click();", n)
    else:
        break

# fechando o arquivo        
f.close()

<selenium.webdriver.remote.webelement.WebElement (session="db2d8c6ec48801d6a6fbac01ad7c07c8", element="c02216f9-18d9-4a6a-93ae-42d0f1361d56")>
<selenium.webdriver.remote.webelement.WebElement (session="db2d8c6ec48801d6a6fbac01ad7c07c8", element="d4c2c221-a5b3-4d44-bc7d-235559c3f4b8")>
<selenium.webdriver.remote.webelement.WebElement (session="db2d8c6ec48801d6a6fbac01ad7c07c8", element="03ceca93-d01a-4d59-b102-80d7609597e7")>
<selenium.webdriver.remote.webelement.WebElement (session="db2d8c6ec48801d6a6fbac01ad7c07c8", element="d10d50d5-deee-483c-8013-3b123971933d")>
<selenium.webdriver.remote.webelement.WebElement (session="db2d8c6ec48801d6a6fbac01ad7c07c8", element="79532d78-8e94-4525-a76e-cbf63e945e54")>
<selenium.webdriver.remote.webelement.WebElement (session="db2d8c6ec48801d6a6fbac01ad7c07c8", element="7acb9c61-4ba3-4401-901d-def24dfdfbb4")>
<selenium.webdriver.remote.webelement.WebElement (session="db2d8c6ec48801d6a6fbac01ad7c07c8", element="ab2afb4e-ebe2-4f11-b77e-88984234ca78")>