#### EVALUACIÓN INTERMEDIA MÓDULO 2

##### Parte 1: Web Scraping con BeautifulSoup

Utilizando la biblioteca BeautifulSoup en Python, extrae información de la siguiente web. Debes extraer la tabla de senderos de España con la siguiente información:

1. Identificador.

2. Denominación.

3. Itinerario.

In [76]:
from bs4 import BeautifulSoup
import requests
import pandas as pd
import re

In [77]:
def extraer_senderos_españa(url):
    
    res_senderos = requests.get(url)
    soup = BeautifulSoup(res_senderos.text, 'html.parser')
    tabla = soup.find('table', {'class': 'wikitable'})
    filas = tabla.find_all('tr')[1:]
    
    identificador = []
    denominacion = []
    itinerario = []
    
    for fila in filas:
        columnas = fila.find_all('td')
        identificador.append(columnas[0].text.strip())
        denominacion.append(columnas[1].text.strip())
        itinerario.append(columnas[2].text.strip())  
        
    return identificador, denominacion, itinerario    

url_senderos = "https://es.wikipedia.org/wiki/Sendero_de_Gran_Recorrido"

senderos_españa = extraer_senderos_españa(url_senderos)

identificador = senderos_españa[0]
denominacion = senderos_españa[1]
itinerario = senderos_españa[2]

for i in range(len(identificador)):
    "Identificador:", identificador[i]
    "Denominación:", denominacion[i]
    "Itinerario:", itinerario[i]

In [78]:
identificador, denominacion, itinerario = extraer_senderos_españa(url_senderos)

df_senderos = pd.DataFrame({
    "Identificador": identificador,
    "Denominación": denominacion,
    "Itinerario": itinerario
})

df_senderos

Unnamed: 0,Identificador,Denominación,Itinerario
0,GR-1,Sendero Histórico,Ampurdán - Bañolas - Ripoll - Berga - Graus - ...
1,GR-2,Sendero La Junquera-San Adrián del Besós,La Junquera - Rupit - San Adrián del Besós
2,GR-3,Sendero Central de Cataluña,Lérida -*- Balaguer -*- Tremp -*- Puebla de Se...
3,GR-4,Sendero Puigcerdá-Mequinenza,Puigcerdá - Montserrat -*- Mequinenza
4,GR-5,Sendero de los Miradores o de los parques natu...,Sitges - Montserrat - Canet de Mar
...,...,...,...
175,GR-292,Canales romanos de las Médulas (El Bierzo),Área recreativa Campo de Braña (Las Médulas) -...
176,GR-300,Círculo al Embalse de El Atazar,El Berrueco - Patones de Arriba - El Atazar - ...
177,GR-303,Sierra del Rincón,
178,GR-330,Sendero Costa Blanca Interior,Parque natural del Macizo del Montgó - Parque ...


##### Parte 2: Obtención de Datos Climatológicos con la API de AEMET

Utiliza la API de AEMET para obtener información climatológica de la Sierra de Gredos. En concreto deberás usar el endpoint de "predicciones-especificas" la predicción de montaña para la sierra de gredos. Debe realizar las siguientes tareas:

1. Incluir la temperatura máxima en la Sierra de Gredos.

2. Incluir la temperatura mínima en la Sierra de Gredos.

3. Incluir la fecha en la que se recopilaron los datos.

4. Incluir la sierra de donde vienen los datos.

In [79]:
import requests
import json
from datetime import datetime
import pandas as pd

from bs4 import BeautifulSoup

pd.set_option('display.max_columns', None)

In [80]:
api_key = "eyJhbGciOiJIUzI1NiJ9.eyJzdWIiOiJkaWFuYS5nYXJjaWEubTkyQGdtYWlsLmNvbSIsImp0aSI6IjYyNzNiZDJkLTIyNGItNDhjMy1hMTI0LTA1OWRiMDc3NTEzMSIsImlzcyI6IkFFTUVUIiwiaWF0IjoxNzE0NDYyOTQzLCJ1c2VySWQiOiI2MjczYmQyZC0yMjRiLTQ4YzMtYTEyNC0wNTlkYjA3NzUxMzEiLCJyb2xlIjoiIn0.CxBiOEm-gy9l8auRhJR0ly5T6ERW6_TcDulj1CF_tvs"

url = f"https://opendata.aemet.es/opendata/api/prediccion/especifica/montaña/pasada/area/gre1?api_key={api_key}"

In [81]:
def llamar_api(url):
    
    llamada = requests.get(url)
    print(f"La llamada a la API nos ha dado una respuesta de tipo: {llamada.status_code}")
    return llamada.json()

json_gredos = llamar_api(url)  

print(json_gredos)

La llamada a la API nos ha dado una respuesta de tipo: 200
{'descripcion': 'exito', 'estado': 200, 'datos': 'https://opendata.aemet.es/opendata/sh/8b92f8f3', 'metadatos': 'https://opendata.aemet.es/opendata/sh/19be9dac'}


In [82]:
if 'datos' in json_gredos:
    datos_url = json_gredos['datos']
    datos_gredos = llamar_api(datos_url)
    print("Datos obtenidos:")
    print(datos_gredos)
else:
    print("No se encontró la URL de los datos en la respuesta de la API.")

La llamada a la API nos ha dado una respuesta de tipo: 200
Datos obtenidos:
[{'origen': {'productor': 'Agencia Estatal de Meteorología - AEMET - Gobierno de España', 'web': 'http://www.aemet.es', 'tipo': 'Predicción de montaña', 'language': 'es', 'copyright': '© AEMET. Autorizado el uso de la información y su reproducción citando a AEMET como autora de la misma.', 'notaLegal': 'http://www.aemet.es/es/nota_legal'}, 'seccion': [{'apartado': [], 'lugar': [], 'parrafo': [{'texto': '(En las 24 horas previas a las 10:00 hora oficial del 30 de abril de 2024)', 'numero': '1'}, {'texto': '', 'numero': '2'}, {'texto': 'PRECIPITACIÓN:', 'numero': '3'}, {'texto': 'Chubascos por la tarde: 4 l/m2 en el puerto de El Pico, 3 l/m2 en Tornavacas.', 'numero': '4'}, {'texto': 'TEMPERATURAS MÍNIMAS:', 'numero': '5'}, {'texto': '-2ºC en el puerto de El Pico, 1ºC en El Barco de Ávila, 3ºC en Muñotello, 5ºC en El Piornal y Hervás, 6ºC en Tornavacas, 8ºC en Garganta La Olla.', 'numero': '6'}, {'texto': 'TEMPER

In [83]:
datos_gredos[0]

{'origen': {'productor': 'Agencia Estatal de Meteorología - AEMET - Gobierno de España',
  'web': 'http://www.aemet.es',
  'tipo': 'Predicción de montaña',
  'language': 'es',
  'copyright': '© AEMET. Autorizado el uso de la información y su reproducción citando a AEMET como autora de la misma.',
  'notaLegal': 'http://www.aemet.es/es/nota_legal'},
 'seccion': [{'apartado': [],
   'lugar': [],
   'parrafo': [{'texto': '(En las 24 horas previas a las 10:00 hora oficial del 30 de abril de 2024)',
     'numero': '1'},
    {'texto': '', 'numero': '2'},
    {'texto': 'PRECIPITACIÓN:', 'numero': '3'},
    {'texto': 'Chubascos por la tarde: 4 l/m2 en el puerto de El Pico, 3 l/m2 en Tornavacas.',
     'numero': '4'},
    {'texto': 'TEMPERATURAS MÍNIMAS:', 'numero': '5'},
    {'texto': '-2ºC en el puerto de El Pico, 1ºC en El Barco de Ávila, 3ºC en Muñotello, 5ºC en El Piornal y Hervás, 6ºC en Tornavacas, 8ºC en Garganta La Olla.',
     'numero': '6'},
    {'texto': 'TEMPERATURAS MÁXIMAS:', 'nu

In [84]:
datos_gredos[0]

{'origen': {'productor': 'Agencia Estatal de Meteorología - AEMET - Gobierno de España',
  'web': 'http://www.aemet.es',
  'tipo': 'Predicción de montaña',
  'language': 'es',
  'copyright': '© AEMET. Autorizado el uso de la información y su reproducción citando a AEMET como autora de la misma.',
  'notaLegal': 'http://www.aemet.es/es/nota_legal'},
 'seccion': [{'apartado': [],
   'lugar': [],
   'parrafo': [{'texto': '(En las 24 horas previas a las 10:00 hora oficial del 30 de abril de 2024)',
     'numero': '1'},
    {'texto': '', 'numero': '2'},
    {'texto': 'PRECIPITACIÓN:', 'numero': '3'},
    {'texto': 'Chubascos por la tarde: 4 l/m2 en el puerto de El Pico, 3 l/m2 en Tornavacas.',
     'numero': '4'},
    {'texto': 'TEMPERATURAS MÍNIMAS:', 'numero': '5'},
    {'texto': '-2ºC en el puerto de El Pico, 1ºC en El Barco de Ávila, 3ºC en Muñotello, 5ºC en El Piornal y Hervás, 6ºC en Tornavacas, 8ºC en Garganta La Olla.',
     'numero': '6'},
    {'texto': 'TEMPERATURAS MÁXIMAS:', 'nu

In [85]:
datos_gredos[0]['seccion']

[{'apartado': [],
  'lugar': [],
  'parrafo': [{'texto': '(En las 24 horas previas a las 10:00 hora oficial del 30 de abril de 2024)',
    'numero': '1'},
   {'texto': '', 'numero': '2'},
   {'texto': 'PRECIPITACIÓN:', 'numero': '3'},
   {'texto': 'Chubascos por la tarde: 4 l/m2 en el puerto de El Pico, 3 l/m2 en Tornavacas.',
    'numero': '4'},
   {'texto': 'TEMPERATURAS MÍNIMAS:', 'numero': '5'},
   {'texto': '-2ºC en el puerto de El Pico, 1ºC en El Barco de Ávila, 3ºC en Muñotello, 5ºC en El Piornal y Hervás, 6ºC en Tornavacas, 8ºC en Garganta La Olla.',
    'numero': '6'},
   {'texto': 'TEMPERATURAS MÁXIMAS:', 'numero': '7'},
   {'texto': '19ºC en Garganta La Olla, 17ºC en Hervás, 16ºC en El Barco de Ávila, 15ºC en Tornavacas y El Piornal, 13ºC en Muñotello y el puerto de El Pico.',
    'numero': '8'},
   {'texto': 'VIENTO: flojo con algunos intervalos de intensidad moderada.',
    'numero': '9'}],
  'nombre': 'tiempo_pasado'}]

In [86]:
datos_gredos[0]['seccion'][0]['parrafo']

[{'texto': '(En las 24 horas previas a las 10:00 hora oficial del 30 de abril de 2024)',
  'numero': '1'},
 {'texto': '', 'numero': '2'},
 {'texto': 'PRECIPITACIÓN:', 'numero': '3'},
 {'texto': 'Chubascos por la tarde: 4 l/m2 en el puerto de El Pico, 3 l/m2 en Tornavacas.',
  'numero': '4'},
 {'texto': 'TEMPERATURAS MÍNIMAS:', 'numero': '5'},
 {'texto': '-2ºC en el puerto de El Pico, 1ºC en El Barco de Ávila, 3ºC en Muñotello, 5ºC en El Piornal y Hervás, 6ºC en Tornavacas, 8ºC en Garganta La Olla.',
  'numero': '6'},
 {'texto': 'TEMPERATURAS MÁXIMAS:', 'numero': '7'},
 {'texto': '19ºC en Garganta La Olla, 17ºC en Hervás, 16ºC en El Barco de Ávila, 15ºC en Tornavacas y El Piornal, 13ºC en Muñotello y el puerto de El Pico.',
  'numero': '8'},
 {'texto': 'VIENTO: flojo con algunos intervalos de intensidad moderada.',
  'numero': '9'}]

In [87]:
prediccion = datos_gredos[0]['seccion'][0]['parrafo']
dicc = prediccion[4]

In [88]:
dicc

{'texto': 'TEMPERATURAS MÍNIMAS:', 'numero': '5'}

In [89]:
temp_minima = dicc['numero']
temp_minima

'5'

In [90]:
dicc = prediccion[6]
temp_maxima = dicc['numero']

temp_maxima

'7'

In [91]:
fecha = datos_gredos[0]['seccion'][0]['parrafo'][0]['texto']
fecha

'(En las 24 horas previas a las 10:00 hora oficial del 30 de abril de 2024)'

In [92]:
dicc = {"temp_max":[],
        "temp_min": [],
        "fecha":[],
        "sierra":[]
        }

In [93]:
año = re.findall('\d{4}',fecha)
año

['2024']

In [94]:
mes = re.findall('de (\w+) de',fecha)
mes

['abril']

In [95]:
dia = re.findall('del (\d{1,})',fecha)
dia

['30']

In [96]:
fecha_completa = año + mes + dia
fecha_completa

['2024', 'abril', '30']

In [97]:
texto_fecha = '-'.join(fecha_completa)
texto_fecha

'2024-abril-30'

In [98]:
dicc['temp_max'].append(temp_maxima)
dicc['temp_min'].append(temp_minima)
dicc['sierra'].append('sierra de gredos')
dicc['fecha'].append(texto_fecha)

In [99]:
dicc

{'temp_max': ['7'],
 'temp_min': ['5'],
 'fecha': ['2024-abril-30'],
 'sierra': ['sierra de gredos']}

In [100]:
pd_dicc = pd.DataFrame(dicc)

pd_dicc

Unnamed: 0,temp_max,temp_min,fecha,sierra
0,7,5,2024-abril-30,sierra de gredos
