# Download automatizado de lotes

## Introdução

Os arquivos de lotes estão divididos por sub-prefeituras. Isso acontece em outros casos e é possível adaptar esse script para solucionar dificuldades similares.
É comum precisarmos desse arquivo para fazer alguma análise e sempre acaba ficando a dificuldade de se obeter o conjunto total de feições.

Portanto um robo automatizado que faça o download dos arquivos de maneira consistente pode ser uma ferramenta útil de trabalho para vc que precisa trabalhar com dados de toda a cidade.

## Metodologia

Para fazermos o download de forma automatizada vamos usar a linguagem de programação Python com o WebDriver Selenium

## Resultados

Os resultados do último download realizado em 07/03/2023 está disponível para download no link: https://www.kaggle.com/datasets/andasampa/geosampa-no-kaggle


### Abrindo so site do Geosampa

O primeiro passo é abrir o site do GeoSampa em um WebDriver e simular um usuário fazendo o download de todos os arquivos de lote

In [17]:
from webdriver_manager.chrome import ChromeDriverManager 
from selenium import webdriver 
from selenium.webdriver.chrome.service import Service as ChromeService
from selenium.webdriver.common.by import By


browser = webdriver.Chrome(service=ChromeService(ChromeDriverManager().install())) 
browser.implicitly_wait(5)


In [18]:
browser.get("http://geosampa.prefeitura.sp.gov.br/PaginasPublicas/_SBC.aspx")

### Clicando no botão de downloads

In [19]:
#popup = driver.find_element_by_xpath('//*[@id="toPopup"]/div[1]')
#driver.execute_script("arguments[0].click();", popup)

#driver.execute_script('document.getElementById("backgroundPopup").remove()')
driver.implicitly_wait(1)

botao_downloads = browser.find_element(By.XPATH, '//*[contains(@id, "OpenLayers_Control_Panel")]/div[7]')
botao_downloads.click()


In [22]:
#######

driver.implicitly_wait(1)

from selenium.webdriver.support.select import Select
combo_download = Select(browser.find_element(By.ID, 'cboCamadas'))

In [23]:
list(map(lambda x: x.text, combo_download.options))

['',
 'Cidade Solidária',
 'Limites Administrativos',
 'População',
 'Equipamentos',
 'Transporte',
 'Sistema Viário',
 'Habitação e Edificação',
 'Proteção e Defesa Civil',
 'Infraestrutura Urbana',
 'Verde e Recursos Naturais',
 'Meio Físico',
 'Rural',
 'Cadastro',
 'Legislação Urbana',
 'Patrimônio Cultural',
 'Acessibilidade',
 'Atlas Ambiental',
 'Economia',
 'Imagens Satelites',
 'Mosaico de Ortofotos',
 'Plantas e Mapas Históricos',
 'Articulacao de Imagens',
 'Atendimento ao Cidadão',
 'Proteção aos Aeródromos',
 'Licenciamento Ambiental',
 'Limpeza Urbana']

### Escolhendo a camada

Agora precisamos escolher no menu DropDown a opção 'Cadastro' e então a opção 'Lotes'. Quando uma nova janela passa a ser apresentada para podermos escolher 'Shapefiles'

In [27]:
driver.implicitly_wait(1)

from selenium.webdriver.support.select import Select
combo_download = Select(browser.find_element(By.ID, 'cboCamadas'))
combo_download.select_by_visible_text('Cadastro')

browser.implicitly_wait(1)

sub_combo_download = Select(browser.find_element(By.ID, 'cboSubCamadas'))
sub_combo_download.select_by_visible_text('Lotes')

browser.implicitly_wait(1)

link_ok = browser.find_element(By.XPATH, '//*[@id="1"]/td[2]/a[3]')
link_ok.click()

browser.implicitly_wait(1)

# link_shps = driver.find_element_by_xpath('//*[@id="1"]/td[2]/a[2]')
# link_shps.click()

### Iterando sobre os arquivos disponíveis para download

Nessa tela temos links para os downloads de todos os arquivos. Precisamos portanto iterar sobre eles e guardar esses links em um arquivo para postetiormente fazer o download de cada um deles.

In [29]:
%%time


# abrindo  o arquivo em modo append
f = open("download_lotes_geosampa.txt", "w+")

# iterando sobre os links
while True:
    links_arquivos = browser.find_elements(By.CLASS_NAME, "down")

    for link in links_arquivos:
        print(link)
        if 'SHP_LOTES' in link.get_attribute("href"):
            l = link
#             print(l)
            browser.execute_script("arguments[0].click();", l)
            browser.implicitly_wait(1)
            b = browser.find_element(By.XPATH, "//*[contains(text(), 'De acordo')]")
            browser.execute_script("arguments[0].click();", b)
            browser.implicitly_wait(1)
#             f.write(link.get_attribute("href")+'\n')
            #link.click()
    if browser.find_element(By.XPATH, '//*[contains(@id, "next__P_")]').get_attribute('class').find('disabled') < 0:
        n = browser.find_element(By.XPATH, '//*[contains(@id, "next__P_")]/span')
        browser.execute_script("arguments[0].click();", n)
    else:
        break

# fechando o arquivo        
f.close()

<selenium.webdriver.remote.webelement.WebElement (session="e8d06f0082cf06e8142c33b8b1e26648", element="d5bebf8d-5a7c-4e35-b9d7-33092c2cd45e")>
<selenium.webdriver.remote.webelement.WebElement (session="e8d06f0082cf06e8142c33b8b1e26648", element="4a4819b4-913e-4ddb-bc15-cb69abc4d386")>
<selenium.webdriver.remote.webelement.WebElement (session="e8d06f0082cf06e8142c33b8b1e26648", element="b2be31d8-10e9-4b05-be6a-73dde5ffa246")>
<selenium.webdriver.remote.webelement.WebElement (session="e8d06f0082cf06e8142c33b8b1e26648", element="efe97901-6fd2-43a8-bcc3-d68e99616c2b")>
<selenium.webdriver.remote.webelement.WebElement (session="e8d06f0082cf06e8142c33b8b1e26648", element="a5184a0b-0d17-4dc6-8694-2de92830d5a5")>
<selenium.webdriver.remote.webelement.WebElement (session="e8d06f0082cf06e8142c33b8b1e26648", element="758f8eaa-037a-4ad0-b87c-54a7c4fa5d8b")>
<selenium.webdriver.remote.webelement.WebElement (session="e8d06f0082cf06e8142c33b8b1e26648", element="458b7583-1462-46f6-84d8-e8562e32ef6c")>