# Evaluación Intermedia

## Instrucciones:  

Esta evaluación consta de una serie de ejecicios para poner en práctica herramientas de extracción  
de datos con Python y en la creación de BBDD con SQL.  
Tiempo asignado: 2 horas y 40 minutos.  
Puedes usar recursos externos, incluyendo internet y materiales de referencia o tus propias notas.  
Completa los ejercicios en un jupyter notebook y el MySQL Workbench.  
Entrega: Tienes que crearte un repositorio en la organización de Adalab que tenga el siguiente nombre promo-X-DA-modulo2-evaluacion-intermedia-vuestronombre.  

## Ejercicios

### Parte 1: Web Scraping con BeautifulSoup

Utilizando la biblioteca BeautifulSoup en Python, extrae información de:
https://turismoactiva.com/rutas-de-montana-sierra-de-gredos/  
Debes extraer la siguiente información:

1. El nombre de las rutas que aparecen en la página web.
2. Donde esta ubicada la ruta.
3. El tipo de ruta. Si esta información añadir "Desconocido".
4. Duración de la ruta.
5. Los kilometros de la ruta.
6. La dificultad de la ruta.
7. El esfuerzo de la ruta.
8. La descripción de la ruta.

Tendrás que obtener un DataFrame similar al que observas a continuación
DataFrame_BS

In [146]:
# antes de empezar importamos las librerías que vamos a usar. 
# Importar librerías para web scraping y manipulación de datos
# -----------------------------------------------------------------------
from bs4 import BeautifulSoup
import requests

# Importar librerías para manipulación y análisis de datos
# -----------------------------------------------------------------------
import pandas as pd

# Importar librerías para procesamiento de texto
# -----------------------------------------------------------------------
import re


In [147]:
# definimos la url de la página de la vamos a sacar datos
url_gredos = "https://turismoactiva.com/rutas-de-montana-sierra-de-gredos/"

# hacemos la request a la página de la que queremos sacar la info
respuesta = requests.get(url_gredos)

# vemos si todo ha ido bien
print("La respuesta de la petición es:", respuesta.status_code)

La respuesta de la petición es: 200


In [148]:
# creamos el objeto BeautifulSoup para poder acceder al contenido solicitado
sopa_gredos = BeautifulSoup(respuesta.content, 'html.parser')

In [149]:
dict_rutas = {'nombre' : [], 
    'ubicacion' : [], 
    'tipo' : [], 
    'duracion' : [], 
    'km' : [], 
    'dificultad' : [], 
    'esfuerzo' : [], 
    'descripcion' : []}

In [150]:
# nombres de las rutas
nombres = sopa_gredos.find_all("h4", {"class": "elementor-heading-title elementor-size-default"})

for nombre in nombres[:-4]:
    dict_rutas['nombre'].append(nombre.text)
dict_rutas

{'nombre': ['Pico Morenzon',
  'Pico de la Mira',
  'Pico Almanzor',
  'Laguna Grande',
  'Cinco Lagunas',
  'Circo de  Hoya Moros',
  'Canchal Negro',
  'El Calvitero',
  'Canchal de la Ceja, Torreon, Calvitero',
  'Laguna de Barco',
  'Tres Lagunas, La Nava, Barco y Caballeros',
  'Laguna de los Caballeros',
  'Laguna de la Nava'],
 'ubicacion': [],
 'tipo': [],
 'duracion': [],
 'km': [],
 'dificultad': [],
 'esfuerzo': [],
 'descripcion': []}

In [151]:
# detalles de las rutas
detalles = sopa_gredos.find_all("li")
detalles

[<li style="font-size: 16.875px;">Botas de montaña de caña alta con  membrana Gore-Tex o similar (dependiendo la actividad o fecha del año se exigirá bota semirrígida)</li>,
 <li style="font-size: 16.875px;">Gafas de sol (aconsejable factor 4 y gafas de ventisca en condiciones invernales)</li>,
 <li style="font-size: 16.875px;">Ropa de abrigo, (Tres Capas) en invierno.</li>,
 <li style="font-size: 16.875px;">Cantimplora o similar, mínimo litro y medio por persona.</li>,
 <li style="font-size: 16.875px;">Guantes gruesos y finos con membrana impermeable.</li>,
 <li style="font-size: 16.875px;">Camiseta, calcetines de recambio.</li>,
 <li style="font-size: 16.875px;">Crema solar</li>,
 <li style="font-size: 16.875px;">Mochila de montaña, mínimo 20L.</li>,
 <li style="font-size: 16.875px;">Bocadillo, fruta, barritas.</li>,
 <li style="font-size: 16.875px;"><strong>Donde se realizan: </strong>Sierra de Gredos, salida desde la Plataforma de Gredos. Sector Central</li>,
 <li style="font-size:

In [152]:
detalles[9:]

[<li style="font-size: 16.875px;"><strong>Donde se realizan: </strong>Sierra de Gredos, salida desde la Plataforma de Gredos. Sector Central</li>,
 <li style="font-size: 16.875px;"><strong>Tipo de ruta: </strong>circular.</li>,
 <li style="font-size: 16.875px;"><strong>Duración:</strong> 4 horas.</li>,
 <li style="font-size: 16.875px;"><strong>Km</strong>: 10</li>,
 <li style="font-size: 16.875px;"><strong>Dificultad Técnica:</strong> baja. (Dependerá de la estación del año).</li>,
 <li style="font-size: 16.875px;"><strong>Esfuerzo:</strong> bajo – medio</li>,
 <li style="font-size: 16.875px;"><strong>Personas mínimas: </strong>4 personas.</li>,
 <li style="font-size: 16.875px;"><strong>Puntos de interés:</strong> Circo de Gredos, valle del Tietar, Refugio del Rey,  paisajes impresionante, avistamiento de animales, Circo de montaña.</li>,
 <li style="font-size: 16.875px;"><strong>Época: </strong>Anua</li>,
 <li style="font-size: 16.875px;"><strong>Precio:</strong> 30€/ persona activida

In [153]:
for detalle in detalles[9:]:
   
    lista_detalles = detalle.text.split(':')
    if lista_detalles[0] == 'Donde se realizan' or lista_detalles[0] == 'Localización':
        dict_rutas['ubicacion'].append(lista_detalles[1])
    if lista_detalles[0] == 'Tipo de ruta':
        dict_rutas['tipo'].append(lista_detalles[1])
    if lista_detalles[0] == 'Duración' or lista_detalles[0] == 'Tiempo':
        dict_rutas['duracion'].append(lista_detalles[1])
    if lista_detalles[0] == 'Km' or lista_detalles[0] == 'km':
        dict_rutas['km'].append(lista_detalles[1])
    if lista_detalles[0] == 'Dificultad técnica' or lista_detalles[0] == 'Dificultad Técnica':
        dict_rutas['dificultad'].append(lista_detalles[1])
    if lista_detalles[0] == 'Esfuerzo':
        dict_rutas['esfuerzo'].append(lista_detalles[1])

print(dict_rutas['tipo'])
for indice, nombre in enumerate(dict_rutas['nombre']):
    if nombre == 'Canchal Negro' or nombre == 'El Calvitero':
        dict_rutas['tipo'].insert(indice, 'Desconocido')

print(len(dict_rutas['nombre']))
print(len(dict_rutas['ubicacion']))
print(len(dict_rutas['tipo']))
print(len(dict_rutas['duracion']))
print(len(dict_rutas['km']))
print(len(dict_rutas['dificultad']))
print(len(dict_rutas['esfuerzo']))
print(len(dict_rutas['descripcion']))

['\xa0circular.', ' Ida y vuelta.', ' Ida y vuelta.', ' Ida y vuelta.', ' Ida y vuelta.', ' Ida y vuelta. (Posibilidad de circular por la Dehesa)', ' circular.', ' Ida y vuelta.', ' Circular', ' Ida y vuelta.', ' Ida y vuelta.']
13
13
13
13
13
13
13
0


In [154]:
# descripcion de las rutas
descripciones = sopa_gredos.find_all("p")

lista_descripciones = []
for descripcion in descripciones:
    if descripcion.text != '' and descripcion.text != '\n' :
        lista_descripciones.append(descripcion.text)
lista_descripciones = lista_descripciones[6:]
 
dict_rutas['descripcion'].extend([lista_descripciones[0], lista_descripciones[1:], lista_descripciones[6:8], lista_descripciones[8], lista_descripciones[9:11], lista_descripciones[11], lista_descripciones[12], lista_descripciones[13], lista_descripciones[14:16], lista_descripciones[16:18], lista_descripciones[18], lista_descripciones[19], lista_descripciones[-1]])
#dict_rutas['descripcion'].append(lista_descripciones[0], lista_descripciones[1:3], lista_descripciones[6:8], lista_descripciones[8], lista_descripciones[9,11], lista_descripciones[11], lista_descripciones[12], lista_descripciones[13], lista_descripciones[14:16], lista_descripciones[16:18], lista_descripciones[18], lista_descripciones[19], lista_descripciones[-1])
dict_rutas

{'nombre': ['Pico Morenzon',
  'Pico de la Mira',
  'Pico Almanzor',
  'Laguna Grande',
  'Cinco Lagunas',
  'Circo de  Hoya Moros',
  'Canchal Negro',
  'El Calvitero',
  'Canchal de la Ceja, Torreon, Calvitero',
  'Laguna de Barco',
  'Tres Lagunas, La Nava, Barco y Caballeros',
  'Laguna de los Caballeros',
  'Laguna de la Nava'],
 'ubicacion': ['\xa0Sierra de Gredos, salida desde la Plataforma de Gredos. Sector Central',
  '\xa0Sierra de Gredos, salida desde la Plataforma de Gredos. Sector Central',
  '\xa0Sierra de Gredos, salida desde la Plataforma de Gredos. Sector Central',
  '\xa0Sierra de Gredos, Plataforma de Gredos, sector central.',
  '\xa0Sierra de Gredos, salida desde Navalperal del Tormes. Sector central.',
  '\xa0Sierra de Bejar, salida desde la Plataforma del Travieso, sector occidental',
  ' Sierra de Bejar, Gredos Oeste\xa0(Salamanca)',
  ' Sierra de Bejar, Gredos Oeste\xa0(Salamanca)',
  '\xa0Sierra de Béjar, salida desde la plataforma del travieso. Sector occident

In [155]:
print(len(dict_rutas['nombre']))
print(len(dict_rutas['ubicacion']))
print(len(dict_rutas['tipo']))
print(len(dict_rutas['duracion']))
print(len(dict_rutas['km']))
print(len(dict_rutas['dificultad']))
print(len(dict_rutas['esfuerzo']))
print(len(dict_rutas['descripcion']))

13
13
13
13
13
13
13
13


In [160]:
df = pd.DataFrame(dict_rutas)
df.to_csv('rutas_gredos.csv')
df

Unnamed: 0,nombre,ubicacion,tipo,duracion,km,dificultad,esfuerzo,descripcion
0,Pico Morenzon,"Sierra de Gredos, salida desde la Plataforma ...",circular.,4 horas.,10,baja. (Dependerá de la estación del año).,bajo – medio,Una ruta perfecta para iniciarse en el mundo d...
1,Pico de la Mira,"Sierra de Gredos, salida desde la Plataforma ...",Ida y vuelta.,7 horas.,16,Media. (Dependerá de la estación del año).,Medio,"[Una ruta perfecta para iniciarse en Gredos, s..."
2,Pico Almanzor,"Sierra de Gredos, salida desde la Plataforma ...",Ida y vuelta.,14 horas.,22,Alta. (Dependerá de la estación del año).,Alto,[Subir al pico Almanzor es una actividad impre...
3,Laguna Grande,"Sierra de Gredos, Plataforma de Gredos, secto...",Ida y vuelta.,5 horas.,12,baja. (Dependerá de la estación del año).,Bajo – medio.,"Ruta conocida por todos, La Laguna Grande de G..."
4,Cinco Lagunas,"Sierra de Gredos, salida desde Navalperal del...",Ida y vuelta.,9 horas.,25,media. (Dependerá de la estación del año).,alto,"[Saliendo desde Navalperal del Tormes, nos dir..."
5,Circo de Hoya Moros,"Sierra de Bejar, salida desde la Plataforma d...",Ida y vuelta. (Posibilidad de circular por la...,7 horas.,12,Media. (Dependerá de la estación del año).,medio.,Una de las rutas más características de la Sie...
6,Canchal Negro,"Sierra de Bejar, Gredos Oeste (Salamanca)",Desconocido,"3,5 horas",8 km.,baja,bajo,"Se trata de una ruta facil, bonita y apta para..."
7,El Calvitero,"Sierra de Bejar, Gredos Oeste (Salamanca)",Desconocido,"4,5 horas",14 km.,baja – media,Medio,"Un clásico de la Sierra de Béjar, subir al Cal..."
8,"Canchal de la Ceja, Torreon, Calvitero","Sierra de Béjar, salida desde la plataforma d...",circular.,8 horas.,16,medio. (Dependerá de la estación del año).,Alto,"[El Calvitero, Canchal de La Ceja y Torreón, l..."
9,Laguna de Barco,"Sierra de Gredos, aparcamiento carretera Nava...",Ida y vuelta.,7 horas.,21,baja. (Dependerá de la estación del año).,medio.,"[No es una ruta muy transitada, al contrario q..."


### Parte 2: Obtención de Datos Climatológicos con la API de AEMET

Utiliza la API de AEMET para obtener información climatológica de la Sierra de Gredos. En concreto
deberás usar el endpoint de "predicciones-especificas" la predicción de montaña para la sierra de gredos.

Debe realizar las siguientes tareas:

1. Incluir la temperatura máxima en la Sierra de Gredos.
2. Incluir la temperatura mínima en la Sierra de Gredos.
3. Incluir la fecha en la que se recopilaron los datos.
4. Incluir la sierra de donde vienen los datos.

Tendrás que obtener un DataFrame similar al que observas a continuación
DataFrame_API

In [167]:
import os

In [172]:
# definir una variable con el token
#api_key_aemet = os.getenv('api')
api_key_aemet = "eyJhbGciOiJIUzI1NiJ9.eyJzdWIiOiJhLmdhcmNpYWdhcjVAZ21haWwuY29tIiwianRpIjoiM2YyY2ExZjQtODVkMS00NGFiLTg3MTYtNGJjMjFmOTVjYWQ4IiwiaXNzIjoiQUVNRVQiLCJpYXQiOjE2OTY0NDAzMTEsInVzZXJJZCI6IjNmMmNhMWY0LTg1ZDEtNDRhYi04NzE2LTRiYzIxZjk1Y2FkOCIsInJvbGUiOiIifQ.BE2zOBDnqoc6X7Hd0SN-D-vV70lX9r1QjhzK7jIZ9Ds"
# definir la url o endpoint a la que vamos a hacer la llamada
url_aemet_gredos = f"https://opendata.aemet.es/opendata/api/prediccion/especifica/montaña/pasada/area/gre1?api_key={api_key_aemet}"

llamada = requests.get(url_aemet_gredos)
print(F"RESPUESTA:  {llamada.status_code}")

json = llamada.json()
json


RESPUESTA:  200


{'descripcion': 'exito',
 'estado': 200,
 'datos': 'https://opendata.aemet.es/opendata/sh/2edea1f2',
 'metadatos': 'https://opendata.aemet.es/opendata/sh/19be9dac'}

In [174]:
datos = [ {
  "origen" : {
    "productor" : "Agencia Estatal de Meteorología - AEMET - Gobierno de España",
    "web" : "http://www.aemet.es",
    "tipo" : "Predicción de montaña",
    "language" : "es",
    "copyright" : "© AEMET. Autorizado el uso de la información y su reproducción citando a AEMET como autora de la misma.",
    "notaLegal" : "http://www.aemet.es/es/nota_legal"
  },
  "seccion" : [ {
    "apartado" : [ ],
    "lugar" : [ ],
    "parrafo" : [ {
      "texto" : "(En las 24 horas previas a las 09:00 hora oficial del 6 de noviembre de 2023)",
      "numero" : "1"
    }, {
      "texto" : "",
      "numero" : "2"
    }, {
      "texto" : "Predominan los cielos durante el día, con nubosidad más abundante en la vertiente norte. Por la noche se abren grandes claros pero aumenta de nuevo la nubosidad de madrugada. Precipitaciones débiles, con la cota de nieve rondando los 1700 metros. Se registran 5 l/m2 en La Covatilla, 2 l/m2 en El Barco de Ávila, Tornavacas y Hervás.",
      "numero" : "3"
    }, {
      "texto" : "TEMPERATURAS MÍNIMAS: ",
      "numero" : "4"
    }, {
      "texto" : "-3ºC en La Covatilla, 0ºC en Puerto El Pico, 1ºC en Piornal, 3ºC en El Barco de Ávila, 4ºC en Hervás y Tornavacas, 6ºC en Garganta La Olla.",
      "numero" : "5"
    }, {
      "texto" : "TEMPERATURAS MÁXIMAS: ",
      "numero" : "6"
    }, {
      "texto" : "13ºC en Hervás y Garganta La Olla, 12ºC en El Barco de Ávila, 11ºC en Tornavacas, 8ºC en Puerto El Pico y Piornal, 1ºC en La Covatilla.\t",
      "numero" : "7"
    }, {
      "texto" : "VIENTO: moderado de componente oeste, con rachas fuertes en cotas altas (64 km/h en La Covatilla). Por la noche pierde intensidad.",
      "numero" : "8"
    } ],
    "nombre" : "tiempo_pasado"
  } ],
  "id" : "gre1",
  "nombre" : "Tiempo pasado"
} ]

In [214]:
tmin = datos[0]['seccion'][0]['parrafo'][3]['numero']
tmax = datos[0]['seccion'][0]['parrafo'][5]['numero']
fecha = datos[0]['seccion'][0]['parrafo'][0]['texto'].split()
sierra = 'Sierra de Gredos'

In [215]:
fecha = " ".join(fecha[-5:]).split(')')
fecha = fecha[0]
fecha

'6 de noviembre de 2023'

In [216]:
gredos = (('tmax', 'tmin', 'fecha', 'sierra'), (tmax, tmin, fecha, sierra))
df_gredos = pd.DataFrame(gredos)
df_gredos

Unnamed: 0,0,1,2,3
0,tmax,tmin,fecha,sierra
1,6,4,6 de noviembre de 2023,Sierra de Gredos


### Parte 3: Diseño de una Base de Datos en SQL

Tu objetivo es diseñar una base de datos para almacenar la información de las rutas de montaña y los
datos climatológicos de la Sierra de Gredos, pero debes de tener en cuenta que en un futuro podremos
incluir más información de otras sierras de la Península Ibérica. Debes diseñar al menos dos tablas y
definir las relaciones entre ellas.
BONUS: Escribir el código de la creación y relación entre las tablas.