#### Parte 1: Web Scraping con BeautifulSoup
Utilizando la biblioteca BeautifulSoup en Python, extrae información de la siguiente web. Debes
extraer la tabla de senderos de España con la siguiente información:
1. Identificador.
2. Denominación.
3. Itinerario.

In [3]:
import pandas as pd
import requests
import re
from bs4 import BeautifulSoup
pd.set_option('display.max_columns', None)

In [4]:
#0. Defino la url
url_senderos='https://es.wikipedia.org/wiki/Sendero_de_Gran_Recorrido'

In [5]:
#0. Hago la llamada
llamada=requests.get(url_senderos)
print(f'El estado de la llamada fue: {llamada.status_code}')

El estado de la llamada fue: 200


In [11]:
#0. Creo la sopa y busco la tabla que me interesa
sopa=BeautifulSoup(llamada.content, 'html.parser')
tablas_sopa=sopa.find_all('table')
mi_tabla=tablas_sopa[0] #la tabla que me interesa es la primera
mi_tabla

<table class="wikitable">
<tbody><tr>
<th>Identificador</th>
<th>Denominación</th>
<th>Itinerario</th>
<th>Variantes
</th></tr>
<tr>
<td><b><a href="/wiki/GR-1" title="GR-1">GR-1</a></b></td>
<td><a href="/wiki/GR-1" title="GR-1">Sendero Histórico</a></td>
<td><a href="/wiki/Ampurd%C3%A1n" title="Ampurdán">Ampurdán</a> - <a href="/wiki/Ba%C3%B1olas" title="Bañolas">Bañolas</a> - <a href="/wiki/Ripoll" title="Ripoll">Ripoll</a> - <a href="/wiki/Berga" title="Berga">Berga</a> - <a href="/wiki/Graus" title="Graus">Graus</a> - <a href="/wiki/Tierrantona" title="Tierrantona">Tierrantona</a> - <a href="/wiki/Riglos" title="Riglos">Riglos</a> - <a href="/wiki/Biel_(Zaragoza)" title="Biel (Zaragoza)">Biel</a> - <a href="/wiki/Sos_del_Rey_Cat%C3%B3lico" title="Sos del Rey Católico">Sos del Rey Católico</a> - <a href="/wiki/Olite" title="Olite">Olite</a> - <a href="/wiki/Allo_(Navarra)" title="Allo (Navarra)">Allo</a> - <a href="/wiki/Santa_Cruz_de_Campezo" title="Santa Cruz de Campezo">Santa Cr

In [16]:
#1. Busco los encabezados
todos_encabezados=mi_tabla.find_all('th')

#1. Saco el texto
texto_encabezados=[i.text for i in todos_encabezados]
texto_encabezados

#1. Me quedo sólo con las columnas que me interesan
mis_encabezdos=texto_encabezados[0:3]
mis_encabezdos

['Identificador', 'Denominación', 'Itinerario']

In [30]:
#2. Saco las filas y me quedo sólo con las que me interesan (las mismas que los encabezados)
todas_filas=mi_tabla.find_all('tr')

#2. Saco el texto
todas_filas[1].text

#2. Saco los \n
mis_filas=[]
for i in todas_filas[1:]: #desde la fila 1 porque la fila 0 son los encabezados
    limpieza=i.text.split('\n')
    mis_filas.append(limpieza[1:4])
mis_filas

[['GR-1',
  'Sendero Histórico',
  'Ampurdán - Bañolas - Ripoll - Berga - Graus - Tierrantona - Riglos - Biel - Sos del Rey Católico - Olite - Allo - Santa Cruz de Campezo - Bernedo - Peñacerrada - San Pantaleón de Losa - Reinosa - Cervera de Pisuerga - Maraña -*- Fonteo -*- Sarria -*- Finisterre'],
 ['GR-2',
  'Sendero La Junquera-San Adrián del Besós',
  'La Junquera - Rupit - San Adrián del Besós'],
 ['GR-3',
  'Sendero Central de Cataluña',
  'Lérida -*- Balaguer -*- Tremp -*- Puebla de Segur -*- El Pont de Suert -*- Seo de Urgel -*- San Juan de las Abadesas - Manresa - Solsona - Tárrega - Vallbona de las Monjas -*- Borjas Blancas -*- Lérida'],
 ['GR-4',
  'Sendero Puigcerdá-Mequinenza',
  'Puigcerdá - Montserrat -*- Mequinenza'],
 ['GR-5',
  'Sendero de los Miradores o de los parques naturales',
  'Sitges - Montserrat - Canet de Mar'],
 ['GR-6', 'Sendero Barcelona-Montserrat', 'Barcelona - Montserrat'],
 ['GR-7',
  'Sendero Andorra-Estrecho de Gibraltar',
  'Seo de Urgel - Solsona

In [27]:
def extraccion_datos(url):
    #0. Hago la llamada, creo la sopa y elijo mi tabla
    llamada=requests.get(url_senderos)
    print(f'El estado de la llamada fue: {llamada.status_code}')

    sopa=BeautifulSoup(llamada.content, 'html.parser')
    tablas_sopa=sopa.find_all('table')
    mi_tabla=tablas_sopa[0]

    #1. Busco los encabezados y guardo los que me interesan en una lista
    #1. Busco los encabezados
    todos_encabezados=mi_tabla.find_all('th')
    #1. Saco el texto
    texto_encabezados=[i.text for i in todos_encabezados]
    #1. Me quedo sólo con las columnas que me interesan
    mis_encabezdos=texto_encabezados[0:3]

    #2. Saco las filas
    todas_filas=mi_tabla.find_all('tr')
    #2. Saco el texto
    todas_filas[1].text
    #2. Saco los \n y me quedo sólo con las que me interesan (las mismas que los encabezados)
    mis_filas=[]
    for i in todas_filas[1:]: #desde la fila 1 porque la fila 0 son los encabezados
        limpieza=i.text.split('\n')
        mis_filas.append(limpieza[1:4])
    
    return mis_encabezdos, mis_filas

In [28]:
#3. Llamo a la función
mis_encabezdos, mis_filas=extraccion_datos(url_senderos)

El estado de la llamada fue: 200


In [29]:
#4. Hago el DataFrame
df_senderos=pd.DataFrame(mis_filas)
df_senderos.columns=mis_encabezdos
df_senderos

Unnamed: 0,Identificador,Denominación,Itinerario
0,GR-1,Sendero Histórico,Ampurdán - Bañolas - Ripoll - Berga - Graus - ...
1,GR-2,Sendero La Junquera-San Adrián del Besós,La Junquera - Rupit - San Adrián del Besós
2,GR-3,Sendero Central de Cataluña,Lérida -*- Balaguer -*- Tremp -*- Puebla de Se...
3,GR-4,Sendero Puigcerdá-Mequinenza,Puigcerdá - Montserrat -*- Mequinenza
4,GR-5,Sendero de los Miradores o de los parques natu...,Sitges - Montserrat - Canet de Mar
...,...,...,...
175,GR-292,Canales romanos de las Médulas (El Bierzo),Área recreativa Campo de Braña (Las Médulas) -...
176,GR-300,Círculo al Embalse de El Atazar,El Berrueco - Patones de Arriba - El Atazar - ...
177,GR-303,Sierra del Rincón,
178,GR-330,Sendero Costa Blanca Interior,Parque natural del Macizo del Montgó - Parque ...


---
#### Parte 2: Obtención de Datos Climatológicos con la API de AEMET
Utiliza la API de AEMET para obtener información climatológica de la Sierra de Gredos. En
concreto deberás usar el endpoint de "predicciones-especificas" la predicción de montaña para
la sierra de gredos. Debe realizar las siguientes tareas:
1. Incluir la temperatura máxima en la Sierra de Gredos.
2. Incluir la temperatura mínima en la Sierra de Gredos.
3. Incluir la fecha en la que se recopilaron los datos.
4. Incluir la sierra de donde vienen los datos.
Tendrás que obtener un DataFrame similar al que observas a continuación
![image.png](attachment:image.png)

APIs

In [77]:
#1. Defino función de llamada a la API
def llamar_api(url):
    llamada = requests.get(url) 
    print(f"La llamada a la API nos ha dado una respuesta de tipo: {llamada.status_code}")

    if llamada.status_code != 200: 
        print(f"El motivo por el que la llamada falló es {llamada.reason}") 
    else:
        return llamada.json()


In [150]:
#0. Endpoint AEMET y API KEY
api_key='eyJhbGciOiJIUzI1NiJ9.eyJzdWIiOiJtYXJ0aW5lenRvcnJlZ29pc2FiZWxAZ21haWwuY29tIiwianRpIjoiMGYzZjYxOTEtODhjYi00MWNjLWI4OGItMzQ4OWZhY2RhMTIwIiwiaXNzIjoiQUVNRVQiLCJpYXQiOjE3MTM0NTc5ODMsInVzZXJJZCI6IjBmM2Y2MTkxLTg4Y2ItNDFjYy1iODhiLTM0ODlmYWNkYTEyMCIsInJvbGUiOiIifQ.x-Hvcmb8DW-NFQpQh77ZKUPq6NfxCZxxpf8cGj8UKeQ'
url_aemet= f'https://opendata.aemet.es/opendata/api/prediccion/especifica/montaña/pasada/area/gre1?api_key={api_key}'


In [151]:
#1. Llamo a la API
json_aemet=llamar_api(url_aemet)
json_aemet

La llamada a la API nos ha dado una respuesta de tipo: 200


{'descripcion': 'exito',
 'estado': 200,
 'datos': 'https://opendata.aemet.es/opendata/sh/2d25f876',
 'metadatos': 'https://opendata.aemet.es/opendata/sh/19be9dac'}

In [152]:
json_aemet['datos']

'https://opendata.aemet.es/opendata/sh/2d25f876'

In [153]:
llamada=requests.get(json_aemet['datos'])
llamada.json()

[{'origen': {'productor': 'Agencia Estatal de Meteorología - AEMET - Gobierno de España',
   'web': 'http://www.aemet.es',
   'tipo': 'Predicción de montaña',
   'language': 'es',
   'copyright': '© AEMET. Autorizado el uso de la información y su reproducción citando a AEMET como autora de la misma.',
   'notaLegal': 'http://www.aemet.es/es/nota_legal'},
  'seccion': [{'apartado': [],
    'lugar': [],
    'parrafo': [{'texto': '(En las 24 horas previas a las 10:00 hora oficial del 29 de abril de 2024)',
      'numero': '1'},
     {'texto': '', 'numero': '2'},
     {'texto': 'PRECIPITACIÓN:', 'numero': '3'},
     {'texto': 'Chubascos que registran 4 l/m2 en Hervás.', 'numero': '4'},
     {'texto': 'TEMPERATURAS MÍNIMAS:', 'numero': '5'},
     {'texto': '-4ºC en el puerto de El Pico, -2ºC en La Covatilla, -1ºC en El Barco de Ávila, 1ºC en Muñotello, 2ºC en El Piornal, 3ºC en Hervás, 4ºC en Tornavacas, 6ºC en Garganta La Olla.',
      'numero': '6'},
     {'texto': 'TEMPERATURAS MÁXIMAS:'

In [118]:
llamada_sopa=requests.get(json_aemet['datos'])
sopa=BeautifulSoup(llamada_sopa.content, 'html.parser')
sopa

[ {
  "origen" : {
    "productor" : "Agencia Estatal de Meteorología - AEMET - Gobierno de España",
    "web" : "http://www.aemet.es",
    "tipo" : "Predicción de montaña",
    "language" : "es",
    "copyright" : "© AEMET. Autorizado el uso de la información y su reproducción citando a AEMET como autora de la misma.",
    "notaLegal" : "http://www.aemet.es/es/nota_legal"
  },
  "seccion" : [ {
    "apartado" : [ ],
    "lugar" : [ ],
    "parrafo" : [ {
      "texto" : "(En las 24 horas previas a las 10:00 hora oficial del 29 de abril de 2024)",
      "numero" : "1"
    }, {
      "texto" : "",
      "numero" : "2"
    }, {
      "texto" : "PRECIPITACIÓN:",
      "numero" : "3"
    }, {
      "texto" : "Chubascos que registran 4 l/m2 en Hervás.",
      "numero" : "4"
    }, {
      "texto" : "TEMPERATURAS MÍNIMAS:",
      "numero" : "5"
    }, {
      "texto" : "-4ºC en el puerto de El Pico, -2ºC en La Covatilla, -1ºC en El Barco de Ávila, 1ºC en Muñotello, 2ºC en El Piornal, 3ºC en 

In [138]:
datos=list(sopa)
datos

['[ {\n  "origen" : {\n    "productor" : "Agencia Estatal de Meteorología - AEMET - Gobierno de España",\n    "web" : "http://www.aemet.es",\n    "tipo" : "Predicción de montaña",\n    "language" : "es",\n    "copyright" : "© AEMET. Autorizado el uso de la información y su reproducción citando a AEMET como autora de la misma.",\n    "notaLegal" : "http://www.aemet.es/es/nota_legal"\n  },\n  "seccion" : [ {\n    "apartado" : [ ],\n    "lugar" : [ ],\n    "parrafo" : [ {\n      "texto" : "(En las 24 horas previas a las 10:00 hora oficial del 29 de abril de 2024)",\n      "numero" : "1"\n    }, {\n      "texto" : "",\n      "numero" : "2"\n    }, {\n      "texto" : "PRECIPITACIÓN:",\n      "numero" : "3"\n    }, {\n      "texto" : "Chubascos que registran 4 l/m2 en Hervás.",\n      "numero" : "4"\n    }, {\n      "texto" : "TEMPERATURAS MÍNIMAS:",\n      "numero" : "5"\n    }, {\n      "texto" : "-4ºC en el puerto de El Pico, -2ºC en La Covatilla, -1ºC en El Barco de Ávila, 1ºC en Muñotel

In [122]:
print(type(datos))

<class 'list'>


In [132]:
datos_string=str(datos)
datos_string

'[\'[ {\\n  "origen" : {\\n    "productor" : "Agencia Estatal de Meteorología - AEMET - Gobierno de España",\\n    "web" : "http://www.aemet.es",\\n    "tipo" : "Predicción de montaña",\\n    "language" : "es",\\n    "copyright" : "© AEMET. Autorizado el uso de la información y su reproducción citando a AEMET como autora de la misma.",\\n    "notaLegal" : "http://www.aemet.es/es/nota_legal"\\n  },\\n  "seccion" : [ {\\n    "apartado" : [ ],\\n    "lugar" : [ ],\\n    "parrafo" : [ {\\n      "texto" : "(En las 24 horas previas a las 10:00 hora oficial del 29 de abril de 2024)",\\n      "numero" : "1"\\n    }, {\\n      "texto" : "",\\n      "numero" : "2"\\n    }, {\\n      "texto" : "PRECIPITACIÓN:",\\n      "numero" : "3"\\n    }, {\\n      "texto" : "Chubascos que registran 4 l/m2 en Hervás.",\\n      "numero" : "4"\\n    }, {\\n      "texto" : "TEMPERATURAS MÍNIMAS:",\\n      "numero" : "5"\\n    }, {\\n      "texto" : "-4ºC en el puerto de El Pico, -2ºC en La Covatilla, -1ºC en El 

In [147]:
diccionario=datos[0]
diccionario

'[ {\n  "origen" : {\n    "productor" : "Agencia Estatal de Meteorología - AEMET - Gobierno de España",\n    "web" : "http://www.aemet.es",\n    "tipo" : "Predicción de montaña",\n    "language" : "es",\n    "copyright" : "© AEMET. Autorizado el uso de la información y su reproducción citando a AEMET como autora de la misma.",\n    "notaLegal" : "http://www.aemet.es/es/nota_legal"\n  },\n  "seccion" : [ {\n    "apartado" : [ ],\n    "lugar" : [ ],\n    "parrafo" : [ {\n      "texto" : "(En las 24 horas previas a las 10:00 hora oficial del 29 de abril de 2024)",\n      "numero" : "1"\n    }, {\n      "texto" : "",\n      "numero" : "2"\n    }, {\n      "texto" : "PRECIPITACIÓN:",\n      "numero" : "3"\n    }, {\n      "texto" : "Chubascos que registran 4 l/m2 en Hervás.",\n      "numero" : "4"\n    }, {\n      "texto" : "TEMPERATURAS MÍNIMAS:",\n      "numero" : "5"\n    }, {\n      "texto" : "-4ºC en el puerto de El Pico, -2ºC en La Covatilla, -1ºC en El Barco de Ávila, 1ºC en Muñotell

In [148]:
print(type(diccionario))

<class 'bs4.element.NavigableString'>


In [None]:
#2. Llamo a la API e imprimo el json para ver sus características y saber por donde tendré que iterar después


In [None]:
#3. Limpio los datos conforme a lo que necesito (no tiene que ser con una función)
#3.1 preparo la estructura del diccionario
#3. 2itero por el rdo de llamar a la API y appendeo el diccionario

In [None]:
#4. Creo el DataFrame

In [109]:
api_key='eyJhbGciOiJIUzI1NiJ9.eyJzdWIiOiJtYXJ0aW5lenRvcnJlZ29pc2FiZWxAZ21haWwuY29tIiwianRpIjoiMGYzZjYxOTEtODhjYi00MWNjLWI4OGItMzQ4OWZhY2RhMTIwIiwiaXNzIjoiQUVNRVQiLCJpYXQiOjE3MTM0NTc5ODMsInVzZXJJZCI6IjBmM2Y2MTkxLTg4Y2ItNDFjYy1iODhiLTM0ODlmYWNkYTEyMCIsInJvbGUiOiIifQ.x-Hvcmb8DW-NFQpQh77ZKUPq6NfxCZxxpf8cGj8UKeQ'
url_aemet= f"https://opendata.aemet.es/opendata/api/prediccion/especifica/montaña/pasada/area/gre1/dia/0?api_key={api_key}"


In [110]:
#1. Llamo a la API
json_aemet=llamar_api(url_aemet)
json_aemet

La llamada a la API nos ha dado una respuesta de tipo: 200


{'descripcion': 'exito',
 'estado': 200,
 'datos': 'https://opendata.aemet.es/opendata/sh/210eecba',
 'metadatos': 'https://opendata.aemet.es/opendata/sh/57a35d70'}

In [111]:
json_aemet['datos']

'https://opendata.aemet.es/opendata/sh/210eecba'