In [None]:
# Importação das bibliotecas necessárias
from selenium import webdriver  # Importando o módulo de automação de navegador
from webdriver_manager.chrome import ChromeDriverManager  # Gerenciador de driver para o Chrome
from selenium.webdriver.chrome.service import Service  # Importando o serviço do driver do Chrome
from selenium.webdriver.chrome.options import Options  # Importando opções para configurações adicionais do driver
from time import sleep  # Importando função sleep para pausar o código temporariamente
import requests  # Importando a biblioteca para realizar solicitações HTTP
from bs4 import BeautifulSoup  # Importar o Beautiful Soup para analisar HTML

# Criar um serviço para o driver do Chrome usando o gerenciador de driver do Chrome
servico = Service(ChromeDriverManager().install())

# Configurar opções para o driver do Chrome
options = Options()
# options.add_argument('--headless')  # Executar o navegador em modo headless (sem interface gráfica)
# options.add_argument('window-size=400,800')  # Definir o tamanho da janela do navegador

URL_OPEN_STREET_MAP_TRACES = 'https://www.openstreetmap.org/traces' #--> Página do OpenstreetMap onde estão localizadas as rotas para download.
PREFIX_URL_DOWNLOAD = 'https://www.openstreetmap.org' #--> Página do principal do OpenstreetMap. Esta variável será utilizada para montar a URL das páginas de download.

# Nota: A documentação fornecida abaixo é uma explicação de cada linha do código acima.

# Linha 2: Importar a classe 'webdriver' do módulo 'selenium' para controlar o navegador.
# Linha 3: Importar a classe 'ChromeDriverManager' do módulo 'webdriver_manager.chrome' para gerenciar o driver do Chrome.
# Linha 4: Importar a classe 'Service' do módulo 'selenium.webdriver.chrome.service' para o serviço do driver do Chrome.
# Linha 5: Importar a classe 'Options' do módulo 'selenium.webdriver.chrome.options' para configurar opções do driver.
# Linha 6: Importar a função 'sleep' do módulo 'time' para pausar a execução do código por um período de tempo.
# Linha 7: Importar a biblioteca 'requests' para fazer solicitações HTTP.
# Linha 8: Importar a classe 'BeautifulSoup' do módulo 'bs4' para analisar documentos HTML.

# Linha 11: Criar um objeto 'servico' do tipo 'Service' usando o gerenciador de driver do Chrome.
# Linha 12: Configurar as opções do navegador Chrome.
# Linha 13: Adicionar o argumento '--headless' às opções, o que faz com que o navegador seja executado em modo headless. Trecho comentado
# Linha 14: Adicionar o argumento 'window-size=400,800' às opções, definindo o tamanho da janela do navegador. Trecho comentado

In [None]:
navegador = webdriver.Chrome(service=servico)
navegador.get(URL_OPEN_STREET_MAP_TRACES)

page_content = navegador.page_source
site = BeautifulSoup(page_content, 'html.parser')
routes = site.findAll('tr')

list_pending_routes = []
list_finished_routes = []

for route in routes:
    if route.find('span', attrs={'class': 'text-danger'}):
        pending_routes = route.find('span', attrs={'class': 'text-danger'})    
        pending_link_routes = route.find('a')        
        list_pending_routes.append([PREFIX_URL_DOWNLOAD+pending_link_routes['href']])
        print (f"{pending_routes.text}: {PREFIX_URL_DOWNLOAD+pending_link_routes['href']}")

    else:         
        finished_link_routes = route.find('a')        
        list_finished_routes.append([PREFIX_URL_DOWNLOAD+finished_link_routes['href']])
        print(f"FINISHED: {PREFIX_URL_DOWNLOAD+finished_link_routes['href']}")
navegador.close()



# Linha 1: Criação de um objeto 'navegador' do tipo 'webdriver.Chrome' com o serviço configurado.
#          Isso permite que você use o driver Chrome para automatizar a navegação.
#          No entanto, as opções 'headless' e 'window-size' não são aplicadas nessa linha.

# Linha 2: Abre uma página web no navegador usando o método 'get'. O URL_OPEN_STREET_MAP_TRACES deve ser definido anteriormente. Vale ressaltar que quando é utilizado [.get], estamos utilizando o Selenium.

# Linha 4: Obtém o conteúdo HTML da página carregada no navegador usando o atributo 'page_source'. Note que aqui ainda estamos usando o Selenium.

# Linha 5: Cria um objeto 'site' do tipo 'BeautifulSoup' para analisar o conteúdo HTML da página. Aqui já estamos fazendo uma mescla das bibliotecas Selenium e BeautifulSoup.

# Linha 6: Encontra todos os elementos 'tr' (linhas) na página usando o método 'findAll' do objeto 'site'.

# Linha 8-9: Inicializa duas listas vazias, 'list_pending_routes' e 'list_finished_routes', para armazenar informações de rotas pendentes e finalizadas.

# Linha 11-21: Um loop 'for' é usado para percorrer cada linha ('tr') na lista 'routes'.

# Linha 12-16: Verifica se a rota está pendente (não finalizada). Se sim, encontra o elemento 'span' com a classe 'text-danger'
#              que indica uma rota pendente e também encontra o link ('a') associado à rota pendente.
#              As informações da rota pendente são então adicionadas à lista 'list_pending_routes'.
#              A função 'print' é usada para exibir informações sobre a rota pendente.

#              Obs.: Usando a constante [PREFIX_URL_DOWNLOAD] = [https://www.openstreetmap.org] 
#              e concatenando com o link obtido ao capturar o elemento 'href' do elemento 'a', tanto nas rotas pendentes e nas finalizadas, 
#              consegui montar a url das páginas que possuem os links para download.
#              No caso deste código podemos optar em baixar as rotas pendentes, finalizadas ou ambas. Eu optei em baixar somente as rotas finalizadas.

# Linha 18-21: Caso a rota não esteja pendente (ou seja, concluída), encontra o link ('a') associado à rota finalizada.
#              As informações da rota finalizada são então adicionadas à lista 'list_finished_routes'.
#              A função 'print' é usada para exibir informações sobre a rota finalizada.

# Linha 22: Fecha o navegador após o loop ter percorrido todas as rotas.

In [None]:
## Lembrete: Usa-se [requests.get] estamos usando o BeautifulSoup - e quando usamos só o [.get] estamos usando o Selenium
navegador = webdriver.Chrome(service=servico)
for list_finished_route in list_finished_routes:
    sleep(5)
    url = list_finished_route[0]
    navegador.get(url)  #--> Exemplo onse usamos o Selenium somente com o [.get]
    navegador.find_element('xpath','//*[@id="content"]/div[2]/div/table/tbody/tr[1]/td/a').click()
navegador.close()


# Linha 2: Criação de um objeto 'navegador' do tipo 'webdriver.Chrome' com o serviço configurado.

# Linha 3-7: Um loop 'for' é usado para percorrer cada rota finalizada na lista 'list_finished_routes'.

# Linha 4: Pausa a execução do código por 5 segundos (Considerei este tempo para que houvesse tempo da tela renderizar por completo).

# Linha 5: Obtém a URL da página da rota finalizada da lista 'list_finished_routes'.

# Linha 6: Abre a URL no navegador usando o método 'get' do objeto 'navegador'.
#          Aqui, estou usando o Selenium para navegar até a URL.

# Linha 7: Encontra o elemento na página usando XPath e o método 'find_element'.
#          Em seguida realizo um clique no link para download da rota finalizada.
#          Isso é feito usando o Selenium para interagir com a página.
#          Esta é uma forma de exemplificar o uso do Selenium para realizar cliques e interagir com elementos específicos na página.

# Linha 8: Fecha o navegador após o loop ter percorrido todas as rotas finalizadas.