In [3]:
# Importación de librerías
import time
import csv
import os
import requests
import unidecode
import random
from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC

# Crear directorio para guardar imágenes si no existe
if not os.path.exists('tmp/images'):
    os.makedirs('tmp/images')

# Iniciar el driver de Selenium para Firefox
driver = webdriver.Firefox()  # Asegúrate de que el path al driver sea el correcto

# Leer archivo CSV para obtener provincias y cantones
with open('cantones.csv', 'r') as infile:
    reader = csv.reader(infile)
    next(reader)  # Saltar la primera fila (cabeceras)
    for row in reader:
        provincia, canton = row

        # Crear término de búsqueda para DuckDuckGo
        search_term = f'Foto turística Cantón {canton} Provincia de {provincia} -mapa -ubicación'
        print(f'Buscando imágenes para: {search_term}...')

        # Abrir URL en el navegador gestionado por Selenium
        url = f'https://duckduckgo.com/?q={search_term}&t=ffab&iar=images&iax=images&ia=images'
        driver.get(url)

        try:
            # Esperar hasta que se cargue la imagen en la página
            element_present = EC.presence_of_element_located((By.XPATH, '/html/body/div[2]/div[3]/div/div/div[2]/div[2]/div[1]/div[1]/span/img'))
            WebDriverWait(driver, 10).until(element_present)

            # Extraer URL de la imagen
            img = driver.find_element_by_xpath('/html/body/div[2]/div[3]/div/div/div[2]/div[2]/div[1]/div[1]/span/img')
            img_url = img.get_attribute('src')

            # Slugify los nombres de la provincia y el cantón para el archivo
            provincia = unidecode.unidecode(provincia.lower().replace(' ', '-'))
            canton = unidecode.unidecode(canton.lower().replace(' ', '-'))

            # Descargar y guardar la imagen
            print(f'Descargando imagen desde: {img_url}...')
            img_data = requests.get(img_url).content
            with open(f'tmp/images/{provincia}-{canton}.jpg', 'wb') as handler:
                handler.write(img_data)

        except TimeoutException:
            print('Tiempo agotado esperando a que se cargue la página.')

        except Exception as e:
            print(f'Error: {e}')

        # Pausar ejecución un tiempo aleatorio entre 1 y 10 segundos para evitar sobrecargar el servidor
        time.sleep(random.randint(1, 10))

# Cerrar el driver de Selenium
driver.quit()


Buscando imágenes para: Foto turística Cantón CUENCA Provincia de Azuay -mapa -ubicación...


  img = driver.find_element_by_xpath('/html/body/div[2]/div[3]/div/div/div[2]/div[2]/div[1]/div[1]/span/img')


Descargando imagen desde: https://external-content.duckduckgo.com/iu/?u=https%3A%2F%2Ftse3.mm.bing.net%2Fth%3Fid%3DOIP.v4SA2p_fEYsK62rqltoS-QHaE8%26pid%3DApi&f=1&ipt=0b43f33cd07895002e6619373811d3295af3c106f2b31d3fba7cf7a3b90f5d4d&ipo=images...
Buscando imágenes para: Foto turística Cantón GIRÓN Provincia de Azuay -mapa -ubicación...
Descargando imagen desde: https://external-content.duckduckgo.com/iu/?u=https%3A%2F%2Ftse4.mm.bing.net%2Fth%3Fid%3DOIP.Z3RROPVdgoz_mxE_hfb6EQHaD4%26pid%3DApi&f=1&ipt=f94ffe4e910b03833e3c51f2ef635e4eaa7505be08edd1d658df9bcadd74cc7a&ipo=images...
Buscando imágenes para: Foto turística Cantón GUALACEO Provincia de Azuay -mapa -ubicación...
Descargando imagen desde: https://external-content.duckduckgo.com/iu/?u=https%3A%2F%2Ftse1.mm.bing.net%2Fth%3Fid%3DOIP.MlP6QIbui9q43Zpundj4OAHaEy%26pid%3DApi&f=1&ipt=4b8edd4347220db258f6df2b4fb6fecfffd87ad31b851f1767564c9fecc6d110&ipo=images...
Buscando imágenes para: Foto turística Cantón NABÓN Provincia de Azuay -mapa -ub