In [10]:
import requests
import pandas as pd

# Importar librerías para web scraping y manipulación de datos
# -----------------------------------------------------------------------
from bs4 import BeautifulSoup
import requests

import re
from datetime import datetime

from tqdm import tqdm

### Parte 1: Web Scraping

In [11]:
url = "https://es.wikipedia.org/wiki/Sendero_de_Gran_Recorrido"
res = requests.get(url)
res.status_code

200

In [12]:
soup = BeautifulSoup(res.content, 'html.parser')
tablas = soup.find_all("table")

print("El número de tablas que tenemos en la página web es:", len(tablas))

El número de tablas que tenemos en la página web es: 2


In [14]:
print("En la tabla 1 tenemos: \n ", tablas[0])

En la tabla 1 tenemos: 
  <table class="wikitable">
<tbody><tr>
<th>Identificador</th>
<th>Denominación</th>
<th>Itinerario</th>
<th>Variantes
</th></tr>
<tr>
<td><b><a href="/wiki/GR-1" title="GR-1">GR-1</a></b></td>
<td><a href="/wiki/GR-1" title="GR-1">Sendero Histórico</a></td>
<td><a href="/wiki/Ampurd%C3%A1n" title="Ampurdán">Ampurdán</a> - <a href="/wiki/Ba%C3%B1olas" title="Bañolas">Bañolas</a> - <a href="/wiki/Ripoll" title="Ripoll">Ripoll</a> - <a href="/wiki/Berga" title="Berga">Berga</a> - <a href="/wiki/Graus" title="Graus">Graus</a> - <a href="/wiki/Tierrantona" title="Tierrantona">Tierrantona</a> - <a href="/wiki/Riglos" title="Riglos">Riglos</a> - <a href="/wiki/Biel_(Zaragoza)" title="Biel (Zaragoza)">Biel</a> - <a href="/wiki/Sos_del_Rey_Cat%C3%B3lico" title="Sos del Rey Católico">Sos del Rey Católico</a> - <a href="/wiki/Olite" title="Olite">Olite</a> - <a href="/wiki/Allo_(Navarra)" title="Allo (Navarra)">Allo</a> - <a href="/wiki/Santa_Cruz_de_Campezo" title="Santa

En HTML, los elementos . Aquí hay algunos elementos relacionados con `<tr>` que se utilizan comúnmente:

1. `<table>`: Este elemento se utiliza para crear una tabla en HTML y envuelve todas las filas y columnas de la tabla.

2. `<tr>`: Se utilizan para definir filas dentro de una tabla. Estos elementos hacen referencia a las filas de la tabla y deben estar ubicados dentro del elemento `<table>`

3. `<td>`: Representa una celda de datos en una tabla. Los elementos `<td>` deben estar ubicados dentro de un elemento `<tr>` para crear una celda en una fila.

4. `<th>`: Representa una celda de encabezado en una tabla. Al igual que `<td>`, los elementos `<th>` también deben estar ubicados dentro de un elemento `<tr>`, pero se utilizan para resaltar los encabezados de columna o fila.


In [None]:
rutas = tablas[0]

[<th>Identificador</th>,
 <th>Denominación</th>,
 <th>Itinerario</th>,
 <th>Variantes
 </th>]

In [13]:


diccionario = {"Identificador": [], 
            "Denominación": [], 
            "Itinerario": []}
 

filas = rutas.findAll("tr")[1:]
for fila in filas:
    celdas = fila.findAll("td")
    diccionario["Identificador"].append(celdas[0].text)
    diccionario["Denominación"].append(celdas[1].text)
    diccionario["Itinerario"].append(celdas[2].text)


pd.DataFrame(diccionario)

Unnamed: 0,Identificador,Denominación,Itinerario
0,GR-1,Sendero Histórico,Ampurdán - Bañolas - Ripoll - Berga - Graus - ...
1,GR-2,Sendero La Junquera-San Adrián del Besós,La Junquera - Rupit - San Adrián del Besós
2,GR-3,Sendero Central de Cataluña,Lérida -*- Balaguer -*- Tremp -*- Puebla de Se...
3,GR-4,Sendero Puigcerdá-Mequinenza,Puigcerdá - Montserrat -*- Mequinenza
4,GR-5,Sendero de los Miradores o de los parques natu...,Sitges - Montserrat - Canet de Mar
...,...,...,...
175,GR-292,Canales romanos de las Médulas (El Bierzo),Área recreativa Campo de Braña (Las Médulas) -...
176,GR-300,Círculo al Embalse de El Atazar,El Berrueco - Patones de Arriba - El Atazar - ...
177,GR-303,Sierra del Rincón,
178,GR-330,Sendero Costa Blanca Interior,Parque natural del Macizo del Montgó - Parque ...


In [None]:

lista_ecabezados = rutas.find_all("th")
lista_ecabezados

### Parte 2: Obtención Datos Climatológicos con API AEMET

In [2]:
api_key_aemet = "eyJhbGciOiJIUzI1NiJ9.eyJzdWIiOiJhLmdhcmNpYWdhcjVAZ21haWwuY29tIiwianRpIjoiM2YyY2ExZjQtODVkMS00NGFiLTg3MTYtNGJjMjFmOTVjYWQ4IiwiaXNzIjoiQUVNRVQiLCJpYXQiOjE2OTY0NDAzMTEsInVzZXJJZCI6IjNmMmNhMWY0LTg1ZDEtNDRhYi04NzE2LTRiYzIxZjk1Y2FkOCIsInJvbGUiOiIifQ.BE2zOBDnqoc6X7Hd0SN-D-vV70lX9r1QjhzK7jIZ9Ds"


url_gredos = f"https://opendata.aemet.es/opendata/api/prediccion/especifica/montaña/pasada/area/gre1?api_key={api_key_aemet}"
response_aemet = requests.get(url_gredos)
aemet_json = response_aemet.json()
aemet_json.keys()

dict_keys(['descripcion', 'estado', 'datos', 'metadatos'])

In [3]:
datos_gredos = requests.get(aemet_json["datos"]).json()
datos_gredos

[{'origen': {'productor': 'Agencia Estatal de Meteorología - AEMET - Gobierno de España',
   'web': 'http://www.aemet.es',
   'tipo': 'Predicción de montaña',
   'language': 'es',
   'copyright': '© AEMET. Autorizado el uso de la información y su reproducción citando a AEMET como autora de la misma.',
   'notaLegal': 'http://www.aemet.es/es/nota_legal'},
  'seccion': [{'apartado': [],
    'lugar': [],
    'parrafo': [{'texto': '(En las 24 horas previas a las 10:00 hora oficial del 27 de abril de 2024)',
      'numero': '1'},
     {'texto': '', 'numero': '2'},
     {'texto': 'PRECIPITACIÓN:', 'numero': '3'},
     {'texto': 'Lluvias por la tarde que registran: 25 l/m2 en el puerto de El Pico, 8 l/m2 en El Piornal y Garganta La Olla, 7 l/m2 en Tornavacas, 6 l/m2 en Hervás, 4 l/m2 en El Barco de Ávila, 2 l/m2 en Muñotello, 1 l/m2 en La Covatilla.',
      'numero': '4'},
     {'texto': 'TEMPERATURAS MÍNIMAS:', 'numero': '5'},
     {'texto': '-3ºC en La Covatilla, 2ºC en El Piornal y el puer

In [16]:
len(datos_gredos)

1

In [17]:
datos_gredos[0]["seccion"]

[{'apartado': [],
  'lugar': [],
  'parrafo': [{'texto': '(En las 24 horas previas a las 10:00 hora oficial del 27 de abril de 2024)',
    'numero': '1'},
   {'texto': '', 'numero': '2'},
   {'texto': 'PRECIPITACIÓN:', 'numero': '3'},
   {'texto': 'Lluvias por la tarde que registran: 25 l/m2 en el puerto de El Pico, 8 l/m2 en El Piornal y Garganta La Olla, 7 l/m2 en Tornavacas, 6 l/m2 en Hervás, 4 l/m2 en El Barco de Ávila, 2 l/m2 en Muñotello, 1 l/m2 en La Covatilla.',
    'numero': '4'},
   {'texto': 'TEMPERATURAS MÍNIMAS:', 'numero': '5'},
   {'texto': '-3ºC en La Covatilla, 2ºC en El Piornal y el puerto de El Pico, 4ºC en El Barco de Ávila, Muñotello y Tornavacas, 5ºC en Hervás, 6ºC en Garganta La Olla.',
    'numero': '6'},
   {'texto': 'TEMPERATURAS MÁXIMAS:', 'numero': '7'},
   {'texto': '15ºC en Garganta La Olla, 14ºC en Hervás, 13ºC en El Barco de Ávila y Muñotello, 12ºC en Tornavacas, 10ºC en El Piornal y el puerto de El Pico, 5ºC en La Covatilla.',
    'numero': '8'},
   {'t

In [4]:
datos_gredos[0]["seccion"][0].keys()

dict_keys(['apartado', 'lugar', 'parrafo', 'nombre'])

In [5]:
datos_gredos[0]["seccion"][0]["parrafo"]

[{'texto': '(En las 24 horas previas a las 10:00 hora oficial del 27 de abril de 2024)',
  'numero': '1'},
 {'texto': '', 'numero': '2'},
 {'texto': 'PRECIPITACIÓN:', 'numero': '3'},
 {'texto': 'Lluvias por la tarde que registran: 25 l/m2 en el puerto de El Pico, 8 l/m2 en El Piornal y Garganta La Olla, 7 l/m2 en Tornavacas, 6 l/m2 en Hervás, 4 l/m2 en El Barco de Ávila, 2 l/m2 en Muñotello, 1 l/m2 en La Covatilla.',
  'numero': '4'},
 {'texto': 'TEMPERATURAS MÍNIMAS:', 'numero': '5'},
 {'texto': '-3ºC en La Covatilla, 2ºC en El Piornal y el puerto de El Pico, 4ºC en El Barco de Ávila, Muñotello y Tornavacas, 5ºC en Hervás, 6ºC en Garganta La Olla.',
  'numero': '6'},
 {'texto': 'TEMPERATURAS MÁXIMAS:', 'numero': '7'},
 {'texto': '15ºC en Garganta La Olla, 14ºC en Hervás, 13ºC en El Barco de Ávila y Muñotello, 12ºC en Tornavacas, 10ºC en El Piornal y el puerto de El Pico, 5ºC en La Covatilla.',
  'numero': '8'},
 {'texto': 'VIENTO: flojo con intervalos de intensidad moderada, llegando 

In [18]:
len(datos_gredos[0]["seccion"][0]["parrafo"])

9

In [6]:
datos_clima = {"temp_maxima": [], "temp_minima": [], "sierra": [], "fecha": []}

for elemento in datos_gredos[0]["seccion"][0]["parrafo"]:
    if "mínimas" in elemento["texto"].lower():
        datos_clima["temp_minima"].append(elemento["numero"])
    if "máximas" in elemento["texto"].lower():
        datos_clima["temp_maxima"].append(elemento["numero"])
ubicacion = input("de donde estas sacando informacion")
datos_clima["sierra"].append(ubicacion)
datos_clima["fecha"].append(datetime.strftime(datetime.now(), "%Y-%b-%d"))

In [7]:
df_clima = pd.DataFrame(datos_clima)
df_clima

Unnamed: 0,temp_maxima,temp_minima,sierra,fecha
0,7,5,Gredos,2024-Apr-27


### CREACIÓN TABLAS SQL

In [None]:
CREATE TABLE Rutas (
    ruta VARCHAR(50),
    lugar VARCHAR(50),
    tipo VARCHAR(50),
    duracion VARCHAR(50),
    distancia VARCHAR(50),
    dificultad VARCHAR(50),
    esfuerzo VARCHAR(50),
    descripcion VARCHAR(150)
);


In [None]:
CREATE TABLE Clima (
    temp_maxima FLOAT,
    temp_min FLOAT,
    sierra VARCHAR(50),
    fecha DATE
);
