In [None]:
# Importamos las librerías necesarias
import requests # Para hacer solicitudes HTTP a la API de Wikipedia
import pandas as pd # Para manejar y guardar los datos en DataFrames

# Diccionario con títulos exactos de Wikipedia para cada departamento
departamentos_wiki = {
    "Amazonas": "Departamento de Amazonas (Perú)",
    "Áncash": "Departamento de Áncash",
    "Apurímac": "Departamento de Apurímac",
    "Arequipa": "Departamento de Arequipa",
    "Ayacucho": "Departamento de Ayacucho",
    "Cajamarca": "Departamento de Cajamarca",
    "Callao": "Provincia Constitucional del Callao",
    "Cusco": "Departamento del Cuzco",
    "Huancavelica": "Departamento de Huancavelica",
    "Huánuco": "Departamento de Huánuco",
    "Ica": "Departamento de Ica",
    "Junín": "Departamento de Junín",
    "La Libertad": "Departamento de La Libertad (Perú)",
    "Lambayeque": "Departamento de Lambayeque",
    "Lima": "Departamento de Lima",
    "Loreto": "Departamento de Loreto",
    "Madre de Dios": "Departamento de Madre de Dios",
    "Moquegua": "Departamento de Moquegua",
    "Pasco": "Departamento de Pasco",
    "Piura": "Departamento de Piura",
    "Puno": "Departamento de Puno",
    "San Martín": "Departamento de San Martín",
    "Tacna": "Departamento de Tacna",
    "Tumbes": "Departamento de Tumbes"
}

# Función para obtener la imagen principal desde Wikipedia
def get_wiki_image_url(title):
    params = {                  # Definimos los parámetros de la API de Wikipedia
        "action": "query",      # Acción de consulta
        "titles": title,        # Nombre de la página de Wikipedia
        "prop": "pageimages",   # Propiedad para obtener imágenes
        "piprop": "original",  # Obtener imagen en tamaño original (mayor resolución) 
        "format": "json"        # Formato de respuesta
    }
    url = "https://es.wikipedia.org/w/api.php"
    resp = requests.get(url, params=params).json()   # Hacemos la solicitud GET a la API
    pages = resp.get("query", {}).get("pages", {})   # Procesamos la respuesta para extraer la imagen
    for page in pages.values():
        if "original" in page:
            return page["original"]["source"]       # Retornamos la URL de la imagen
    return None

# Obtener las URLs de imagen
registros = []  # Lista vacía para almacenar los resultados
 #Recorremos cada departamento y su título de Wikipedia
for nombre, titulo_wiki in departamentos_wiki.items():
    imagen_url = get_wiki_image_url(titulo_wiki)
    registros.append({"Departamento": nombre, "Imagen_URL": imagen_url})
# Guardamos el nombre del departamento y su imagen

# Crear DataFrame
df_imagenes = pd.DataFrame(registros)

# Guardar en formato Excel
df_imagenes.to_excel("imagenes_departamentos24.xlsx", index=False)

# Mostrar resultado
print(df_imagenes)


     Departamento                                         Imagen_URL
0        Amazonas  https://upload.wikimedia.org/wikipedia/commons...
1          Áncash  https://upload.wikimedia.org/wikipedia/commons...
2        Apurímac  https://upload.wikimedia.org/wikipedia/commons...
3        Arequipa  https://upload.wikimedia.org/wikipedia/commons...
4        Ayacucho  https://upload.wikimedia.org/wikipedia/commons...
5       Cajamarca  https://upload.wikimedia.org/wikipedia/commons...
6          Callao                                               None
7           Cusco  https://upload.wikimedia.org/wikipedia/commons...
8    Huancavelica  https://upload.wikimedia.org/wikipedia/commons...
9         Huánuco  https://upload.wikimedia.org/wikipedia/commons...
10            Ica  https://upload.wikimedia.org/wikipedia/commons...
11          Junín  https://upload.wikimedia.org/wikipedia/commons...
12    La Libertad  https://upload.wikimedia.org/wikipedia/commons...
13     Lambayeque  https://upload.