In [2]:
# Importar BeautifulSoup de la biblioteca bs4 para analizar documentos HTML
from bs4 import BeautifulSoup

# Importar funciones o clases del módulo 'soporte' ubicado en el paquete 'src' simulacion de lo que haría el request
from src import soporte as sp

# Importar la biblioteca requests para hacer solicitudes HTTP
import requests

# Importar la biblioteca re para trabajar con expresiones regulares
import re 

# Importar pandas para análisis y manipulación de datos
import pandas as pd

Beautiful Soup es ideal cuando necesitas extraer datos de un HTML que no es bien estructurado o que puede tener elementos desordenados. Es muy útil para tareas de web scraping, donde los datos se encuentran dentro de documentos HTML en la web.

In [3]:
# Simulamos la extracción del HTML utilizando una función del soporte, como si hubiéramos hecho requests.get(url)
# Aquí, 'content' es el equivalente al contenido HTML que recibiríamos si hubiésemos realizado una solicitud real a una página web.
content = sp.content

print(content)
# Visualizamos el contenido para asegurarnos de que se haya cargado correctamente.
# Este paso nos va a servir para verificar que el HTML que vamos a analizar esté bien formado y contenga los datos que necesitamos.

<!DOCTYPE html>
<html lang="es">
<head>
<meta charset="UTF-8">
<meta name="viewport" content="width=device-width, initial-scale=1">
	 <link rel="profile" href="https://gmpg.org/xfn/11"> 
	 <meta name='robots' content='index, follow, max-image-preview:large, max-snippet:-1, max-video-preview:-1' />

	<!-- This site is optimized with the Yoast SEO plugin v22.9 - https://yoast.com/wordpress/plugins/seo/ -->
	<title>RUTAS DE MONTAÑA SIERRA DE GREDOS - www.turismoactiva.com</title>
	<meta name="description" content="Las mejores rutas de montaña por la Sierra de Gredos, descubre los picos y lasgunas mas interesantes de la mano de un guia de montaña" />
	<link rel="canonical" href="https://turismoactiva.com/rutas-de-montana-sierra-de-gredos/" />
	<meta property="og:locale" content="es_ES" />
	<meta property="og:type" content="article" />
	<meta property="og:title" content="RUTAS DE MONTAÑA SIERRA DE GREDOS - www.turismoactiva.com" />
	<meta property="og:description" content="Las mejores rutas

In [4]:
# Creamos la "sopa" con el contenido de la variable content. Esto nos permitirá buscar elementos específicos dentro de él.
# Al pasar el contenido HTML y especificar "html.parser", estamos indicando a BeautifulSoup que queremos analizar este texto como HTML.
sopa = BeautifulSoup(content, "html.parser")


# Después de la exploración visual de la página y de haber visto que hemos encontrado un elemento común en el que encontramos todos los datos
# Vamos a querer sacar  los elementos dentro de los divs que tienen la clase "elementor-widget-container".

# Estos divs "("div", {"class": "elementor-widget-container"})"contienen la información que necesitamos, y al utilizar 'findAll', obtenemos una lista con todos ellos.
# 'findAll' recorre todo el HTML buscando cada coincidencia con la estructura o las condiciones que le hemos especificado.

nombre_ruta = sopa.findAll("div", {"class": "elementor-widget-container"}) 
# nos devuelve una lista

# limitamos el output mostrado usando [:2] por ejemplo, para que no salga algo interminable cuando lo subamos a github
nombre_ruta #[:2]

[<div class="elementor-widget-container">
 <style>/*! elementor - v3.22.0 - 17-06-2024 */
 .elementor-widget-image{text-align:center}.elementor-widget-image a{display:inline-block}.elementor-widget-image a img[src$=".svg"]{width:48px}.elementor-widget-image img{vertical-align:middle;display:inline-block}</style> <a href="https://turismoactiva.com/">
 <img alt="Turismo Activa" data-od-removed-loading="lazy" data-od-xpath="/*[1][self::HTML]/*[2][self::BODY]/*[3][self::DIV]/*[1][self::DIV]/*[1][self::DIV]/*[1][self::SECTION]/*[1][self::DIV]/*[1][self::DIV]/*[1][self::DIV]/*[1][self::DIV]/*[1][self::DIV]/*[2][self::A]/*[1][self::IMG]" src="https://turismoactiva.com/wp-content/uploads/2023/04/Turismo-Activa-logo-blanco-fondo-verde.png" title="Turismo-Activa-logo-blanco-fondo-verde"/> </a>
 </div>,
 <div class="elementor-widget-container">
 <div class="rkit-navmenu-container">
 <div class="rkit-hamburger-tablet" data-dropdown="rkit-dropdown-2036565826" id="rkit-hamburger-2036565826">
 <butto

In [5]:
# Podemos hacer un len para visualizar cuántos elementos encontramos.
# Esto es un chequeo rápido para asegurarnos de que hemos encontrado lo que buscábamos y para tener una idea de la cantidad de datos que vamos a manejar.
len(nombre_ruta)

82

In [6]:
# entonces vamos a crera una lista vacía que nos ayude a ir almacenando mi información mientras veo elemento a elemento
# A medida que extraemos y limpiamos el texto de cada elemento, lo almacenaremos aquí.
lista_info_rutas = []

# Lo siguiente que tendremo que hacer será iterar sobre cada elemento encontrado en 'nombre_ruta', extrayendo y limpiando el texto.
# Recordad que la función .text nos va a permirir extraer solo el texto contenido dentro de las etiquetas HTML, ignorando las etiquetas en sí.
# Y la función .strip() eliminará los espacios en blanco iniciales y finales del texto, que a veces pueden ser añadidos por error o por el formato del HTML.

for todos_los_elementos in nombre_ruta:
    lista_info_rutas.append(todos_los_elementos.text.strip())
    # Imprimimos cada elemento para verificar que estamos extrayendo los datos correctamente.

    # print(todos_los_elementos.text)  #probad ambos prints y mirad la diferencia entre ellos (vais a tener que hacer scroll)
    print(todos_los_elementos.text.strip())  #  # quitamos espacios iniciales y finales


Viajes y Aventuras                            

 



Viaje Marruecos, Toubkal, Marrakech y Desierto 9 días


Viaje aventura León Espeleobarranquismo Valporquero y Ferrata de Sabero




                                                Excursiones un día

 



Excursión Sierra de Béjar, Candelario con nieve


Excursión un día Sierra de Béjar, Candelario, El Castañar


Excursión un día Arribes del Duero, miradores y cascadas


Excursión Sierra de Francia y Batuecas








                                Actividades                            

 



Escalada


Vías ferratas


Puenting en Salamanca


Kayaks y piraguas


Paddle surf river


Rafting


Barranquismo




                                                Senderismo y trekking

 



Rutas de montaña Sierra de Gredos


Senderismo y montaña Sierra de Béjar


Senderismo Sierra de Francia, Batuecas


Senderismo Arribes del Duero Salamanca




Raquetas de nieve


Rocódromo y tirolina portátil


Parque de cuerdas




                    

In [7]:
# A continuación exploramos el contenido obtenido (recordáis nuestra nueva herramienta text editor? probémosla!)
lista_info_rutas

['',
 'Viajes y Aventuras                            \n\n \n\n\n\nViaje Marruecos, Toubkal, Marrakech y Desierto 9 días\n\n\nViaje aventura León Espeleobarranquismo Valporquero y Ferrata de Sabero\n\n\n\n\n                                                Excursiones un día\n\n \n\n\n\nExcursión Sierra de Béjar, Candelario con nieve\n\n\nExcursión un día Sierra de Béjar, Candelario, El Castañar\n\n\nExcursión un día Arribes del Duero, miradores y cascadas\n\n\nExcursión Sierra de Francia y Batuecas\n\n\n\n\n\n\n\n\n                                Actividades                            \n\n \n\n\n\nEscalada\n\n\nVías ferratas\n\n\nPuenting en Salamanca\n\n\nKayaks y piraguas\n\n\nPaddle surf river\n\n\nRafting\n\n\nBarranquismo\n\n\n\n\n                                                Senderismo y trekking\n\n \n\n\n\nRutas de montaña Sierra de Gredos\n\n\nSenderismo y montaña Sierra de Béjar\n\n\nSenderismo Sierra de Francia, Batuecas\n\n\nSenderismo Arribes del Duero Salamanca\n\n\n\n\nR

In [8]:
# Buscamos la posición del primer elemento relevante que necesitamos para limpiar la lista.
# Sabemos que la información que nos interesa empieza a partir de un cierto punto, que en este caso es "Pico Morenzon, Circo de Gredos".
# con el .index(), vamos a encontrar la posición exacta en la que comienza la información relevante, y desde ese punto exacto vamos a crear una nueva lista rutas

lista_info_rutas.index("Pico Morenzon, Circo de Gredos")
# print(lista_info_rutas[14]) #Descomentamos y probamos este print!

14

In [9]:
# Hora de buscar patrones chicas, una vez ubicamos la informacion exacta que necesitamos vamos a inspeccionar bien qué tenemos entre manos
# Con este fragmento de código estamos utilizando el concepto de slicing (segmentación) en Python para extraer una sublista de lista_info_rutas.
# En este caso sabemos cuál queremos que sea nuestro punto de partida pero vamos a ver con qué nos encontramos del 14 en adelante

lista_info_rutas[14:]

['Pico Morenzon, Circo de Gredos',
 '“Embárcate en la fascinante Ruta del Morezón, un sendero que revela la grandeza de Gredos. Naturaleza, desafío y vistas asombrosas te esperan.”',
 'Datos Tecnicos\n\n\nDonde se realizan:\xa0Sierra de Gredos, salida desde la Plataforma de Gredos. Sector Central\nTipo de ruta:\xa0circular.\nDuración:\xa04 horas.\nKm: 10\nDificultad Técnica:\xa0baja. (Dependerá de la estación del año).\nEsfuerzo:\xa0bajo – medio\nPersonas mínimas:\xa04 personas.\nPuntos de interés:\xa0Circo de Gredos, valle del Tietar, Refugio del Rey,\xa0 paisajes impresionante, avistamiento de animales, Circo de montaña.\nÉpoca:\xa0Anual\n\n\n\n\n\n\n\n\nPrecio\n\n\n30€ persona, para grupo superiores a 10 consultar.\nGrupo mínimo de 4\n\n\n\n\n\n\n\n\nDescripción\n\n“Descubre la montaña con nuestra ruta ideal para principiantes. Partiendo de la plataforma de Gredos, ascendemos por Prado Pozas hasta el refugio de Reguero Llano. Iniciamos la subida al Balcón de Gredos (Pico Morezón) pa

In [10]:
# Hacemos lo mismo para buscar la posión final de nuestra lista, sumamos dos para quedarnos con los elemntos de la descripción de la última ruta

lista_info_rutas.index("Tres Lagunas\nLa Nava, Barco y Caballeros\nSierra de Gredos sector occidental")+2  #porque des[ues de ese título tiene aún dos líneas más

52

In [11]:
# Creamos la nueva lista con los elementos necesarios para nuestra extracción que sabesmo agracias a nuestra exploración que irán del 14 al 53

rutas = lista_info_rutas[14:53]

In [12]:
rutas

['Pico Morenzon, Circo de Gredos',
 '“Embárcate en la fascinante Ruta del Morezón, un sendero que revela la grandeza de Gredos. Naturaleza, desafío y vistas asombrosas te esperan.”',
 'Datos Tecnicos\n\n\nDonde se realizan:\xa0Sierra de Gredos, salida desde la Plataforma de Gredos. Sector Central\nTipo de ruta:\xa0circular.\nDuración:\xa04 horas.\nKm: 10\nDificultad Técnica:\xa0baja. (Dependerá de la estación del año).\nEsfuerzo:\xa0bajo – medio\nPersonas mínimas:\xa04 personas.\nPuntos de interés:\xa0Circo de Gredos, valle del Tietar, Refugio del Rey,\xa0 paisajes impresionante, avistamiento de animales, Circo de montaña.\nÉpoca:\xa0Anual\n\n\n\n\n\n\n\n\nPrecio\n\n\n30€ persona, para grupo superiores a 10 consultar.\nGrupo mínimo de 4\n\n\n\n\n\n\n\n\nDescripción\n\n“Descubre la montaña con nuestra ruta ideal para principiantes. Partiendo de la plataforma de Gredos, ascendemos por Prado Pozas hasta el refugio de Reguero Llano. Iniciamos la subida al Balcón de Gredos (Pico Morezón) pa

Al explorar la lista final, podemos encontrar ciertos patrones en los que se encuentran los elementos que buscamos. 
Por una parte tenemos los nombres de las rutas y por otra un string con el resto de datos que estamos buscando.

In [13]:
# Perfecto, ahora ya sabemos que los nombres de las rutas, que se encuentran en la lista 'rutas' con un patrón claro: cada 4 posiciones
# El uso de [::4] significa que estamos tomando un elemento, luego saltamos tres y tomamos el siguiente. (acordaos start, stop, step)

nombres_rutas = rutas[::4]

# Imprimimos los nombres de las rutas para asegurarnos de que hemos extraído correctamente la información.
print(nombres_rutas)

['Pico Morenzon, Circo de Gredos', 'Pico de la Mira, desde la Plataforma de Gredos', 'Pico Almanzor, Circo de Gredos', 'Laguna Grande de Gredos, Circo de Gredos', 'Cinco Lagunas, Sierra de Gredos', 'Circo de Hoya Moros, Sierra de Béjar', 'Laguna de BarcoSierra de Gredos sector occidental', 'Laguna de los Caballeros\nSierra de Gredos sector occidental', 'Laguna de la Nava,\nSierra de Gredos sector occidental', 'Tres Lagunas\nLa Nava, Barco y Caballeros\nSierra de Gredos sector occidental']


In [14]:
nombres_rutas

['Pico Morenzon, Circo de Gredos',
 'Pico de la Mira, desde la Plataforma de Gredos',
 'Pico Almanzor, Circo de Gredos',
 'Laguna Grande de Gredos, Circo de Gredos',
 'Cinco Lagunas, Sierra de Gredos',
 'Circo de Hoya Moros, Sierra de Béjar',
 'Laguna de BarcoSierra de Gredos sector occidental',
 'Laguna de los Caballeros\nSierra de Gredos sector occidental',
 'Laguna de la Nava,\nSierra de Gredos sector occidental',
 'Tres Lagunas\nLa Nava, Barco y Caballeros\nSierra de Gredos sector occidental']

In [15]:
# Exploramos, tenemos los patrones y ahora sabesmo que los datos técnicos que necesitamos
# se encuentran desde la posición 2 y de nuevo con un patrón cada 4 posiciones!

datos_tecnicos = rutas[2::4]

In [16]:
# Exploramos el primer elemnto de la lista de descripciones para poder hacer una exploracion realizar la limpieza del primer elemento 
# despues exploraremos cómo usarlo en bucle

datos_tecnicos[0]



'Datos Tecnicos\n\n\nDonde se realizan:\xa0Sierra de Gredos, salida desde la Plataforma de Gredos. Sector Central\nTipo de ruta:\xa0circular.\nDuración:\xa04 horas.\nKm: 10\nDificultad Técnica:\xa0baja. (Dependerá de la estación del año).\nEsfuerzo:\xa0bajo – medio\nPersonas mínimas:\xa04 personas.\nPuntos de interés:\xa0Circo de Gredos, valle del Tietar, Refugio del Rey,\xa0 paisajes impresionante, avistamiento de animales, Circo de montaña.\nÉpoca:\xa0Anual\n\n\n\n\n\n\n\n\nPrecio\n\n\n30€ persona, para grupo superiores a 10 consultar.\nGrupo mínimo de 4\n\n\n\n\n\n\n\n\nDescripción\n\n“Descubre la montaña con nuestra ruta ideal para principiantes. Partiendo de la plataforma de Gredos, ascendemos por Prado Pozas hasta el refugio de Reguero Llano. Iniciamos la subida al Balcón de Gredos (Pico Morezón) para disfrutar de las mejores vistas del Circo de Gredos y el valle del Tietar. Desde allí, divisamos picos lejanos como los Montes de Toledo y La Mira, con el majestuoso Pico Almanzor a

In [17]:
type(datos_tecnicos[0])

str

In [18]:
# dividiendo un string por salto de linea y slipt me devuelve una lista con todos los elementos que tenemos aqui
# veo que `datos_tecnicos[0]` es un string con varias líneas.
# Así que uso `.split("\n")` para dividir el string en una lista donde cada elemento es una línea separada por un salto de línea.
# Esto nos va a facilitar trabajar con cada línea de forma individual.
datos_tecnicos [0].split("\n")

['Datos Tecnicos',
 '',
 '',
 'Donde se realizan:\xa0Sierra de Gredos, salida desde la Plataforma de Gredos. Sector Central',
 'Tipo de ruta:\xa0circular.',
 'Duración:\xa04 horas.',
 'Km: 10',
 'Dificultad Técnica:\xa0baja. (Dependerá de la estación del año).',
 'Esfuerzo:\xa0bajo – medio',
 'Personas mínimas:\xa04 personas.',
 'Puntos de interés:\xa0Circo de Gredos, valle del Tietar, Refugio del Rey,\xa0 paisajes impresionante, avistamiento de animales, Circo de montaña.',
 'Época:\xa0Anual',
 '',
 '',
 '',
 '',
 '',
 '',
 '',
 '',
 'Precio',
 '',
 '',
 '30€ persona, para grupo superiores a 10 consultar.',
 'Grupo mínimo de 4',
 '',
 '',
 '',
 '',
 '',
 '',
 '',
 '',
 'Descripción',
 '',
 '“Descubre la montaña con nuestra ruta ideal para principiantes. Partiendo de la plataforma de Gredos, ascendemos por Prado Pozas hasta el refugio de Reguero Llano. Iniciamos la subida al Balcón de Gredos (Pico Morezón) para disfrutar de las mejores vistas del Circo de Gredos y el valle del Tietar. 

In [19]:
# Si hacemos split, obtenemos una lista de la que podemos empezar a extraer los datos necesarios
# Este bucle `for` recorre cada uno de los elementos de la lista que fue creada a partir de la división anterior.
# Es decir, `elemento` representa cada una de las subcadenas obtenidas al dividir `datos_tecnicos[0]`.

for elemento in datos_tecnicos[0].split("\n"):
    # if "Tipo" in elemento:  # DESCOMENTAR Y PROBAR aqui con if vemos como podemos poner condiciones más específicas ej: busca si está la palabra "Tipo" en alguno de los elementos.

    # Aquí, en cada iteración del bucle, simplemente estamos imprimiendo el contenido del `elemento` actual.
    # Esto permite visualizar cada parte del texto que estaba separada por saltos de línea.
    print(elemento)

    # Después de imprimir el contenido de `elemento`, también se imprime una línea de guiones ("----------------------").
    # Esto es útil para distinguir visualmente entre cada elemento de la lista cuando los resultados se muestran en la consola.
    # Ayuda a separar y entender mejor cada sección de la información técnica que estamos procesando.
    print("----------------------")

Datos Tecnicos
----------------------

----------------------

----------------------
Donde se realizan: Sierra de Gredos, salida desde la Plataforma de Gredos. Sector Central
----------------------
Tipo de ruta: circular.
----------------------
Duración: 4 horas.
----------------------
Km: 10
----------------------
Dificultad Técnica: baja. (Dependerá de la estación del año).
----------------------
Esfuerzo: bajo – medio
----------------------
Personas mínimas: 4 personas.
----------------------
Puntos de interés: Circo de Gredos, valle del Tietar, Refugio del Rey,  paisajes impresionante, avistamiento de animales, Circo de montaña.
----------------------
Época: Anual
----------------------

----------------------

----------------------

----------------------

----------------------

----------------------

----------------------

----------------------

----------------------
Precio
----------------------

----------------------

----------------------
30€ persona, para grupo super

In [20]:
# Creamos un diccionario para almacenar por orden cada uno de los datos de las rutas, organizados en diferentes categorías (nombre, donde, tipo, duración, etc.).
# Este diccionario servirá como base para la creación de un DataFrame, donde cada columna representará una categoría de información.


ruta_info = {
    "nombre": nombres_rutas,
    "donde": [],
    "tipo": [],
    "duracion": [],
    "km": [],
    "dificultad": [],
    "esfuerzo": [],
    "descripcion": []
}

# Iteramos por la lista de descripciones técnicas para extraer la información relevante.
# En cada iteración, dividimos el texto en líneas individuales para analizar cada una por separado.
for descripcion in datos_tecnicos:
    # Separamos el elemento descripción en líneas, lo que nos permite tratar cada línea como un dato independiente.
    lista_split = descripcion.split("\n")

    #  La última línea de la lista siempre contiene la descripción de la ruta.
    # Así que la extraemos directamente y la añadimos al diccionario bajo la clave 'descripcion' -------> [clave descripcion].append
    descripcion_final = lista_split[-1]
    ruta_info["descripcion"].append(descripcion_final.strip())

    # Bien casi estamos, ahora por último,
    # vamos a iterar a través de cada línea de lista_split para encontrar y extraer la información específica de los detalles que necesitamos.

    for detalle in lista_split:
        # Buscamos la línea que contiene el tipo de ruta y la añadimos al diccionario bajo la clave 'tipo' -------> ["tipo"]
        if "Tipo" in detalle:

            ruta_info["tipo"].append(detalle.split(":")[1]) # aqui estamos dividiendo por el elemento 0 y el 1 tipo de ruta: sería el cero y circular el elemento 1
       
        # Buscamos la línea que contiene la duración o el tiempo y la añadimos al diccionario bajo la clave 'duracion'.
        elif "Duración" in detalle or "Tiempo" in detalle:

            ruta_info["duracion"].append(detalle.split(":")[1])        
        # Buscamos la línea que contiene la localización y la añadimos al diccionario bajo la clave 'donde'.
        elif "Localización" in detalle or "Donde se realizan" in detalle:
            print(detalle)
            ruta_info["donde"].append(detalle.split(":")[1])
            # print(detalle)

        # Desde este punto voy a probar a usar expresiones regulares
        # para encontrar la línea que contiene los kilómetros recorridos (km) y la añadimos al diccionario bajo la clave 'km'.
        elif re.match("Km", detalle, re.IGNORECASE):

            ruta_info["km"].append(detalle)

        # re.match(patron, string)` busca al inicio de la cadena string para ver si coincide con el patron  de lo contrario, devuelve None.
        # re.IGNORECASE` es la forma en la que le indicamos a la función `re.match` para que ignore las diferencias entre mayúsculas y minúsculas.
    
        elif re.match("Difi", detalle, re.IGNORECASE):

            ruta_info["dificultad"].append(detalle.split(":")[1].strip())

        elif re.match("Esfu", detalle, re.IGNORECASE):

            ruta_info["esfuerzo"].append(detalle.split(":")[1].strip())

Donde se realizan: Sierra de Gredos, salida desde la Plataforma de Gredos. Sector Central
Donde se realizan: Sierra de Gredos, salida desde la Plataforma de Gredos. Sector Central
Donde se realizan: Sierra de Gredos, salida desde la Plataforma de Gredos. Sector Central
Donde se realizan: Sierra de Gredos, Plataforma de Gredos, sector central.
Donde se realizan: Sierra de Gredos, salida desde Navalperal del Tormes. Sector central.
Donde se realizan: Sierra de Bejar, salida desde la Plataforma del Travieso, sector occidental
Donde se realizan: Sierra de Gredos, aparcamiento carretera Nava de Barco. Sector Central.
Donde se realizan: Sierra de Gredos, salida desde Navalguijo Sector Central
Donde se realizan: Sierra de Gredos, salida desde la carretera de Nava de Barco. Sector Central
Donde se realizan:  Sierra de Gredos, aparcamiento carretera Nava de Barco. Sector Central.


In [21]:
# Finalmente, creamos un DataFrame de pandas utilizando el diccionario 'ruta_info'.
# Cada clave del diccionario se convertirá en una columna del DataFrame, y cada lista se convertirá en una serie de datos dentro de esa columna.
df = pd.DataFrame(ruta_info)
df # Visualizamos el DataFrame para asegurarnos de que toda la información se ha almacenado correctamente.

Unnamed: 0,nombre,donde,tipo,duracion,km,dificultad,esfuerzo,descripcion
0,"Pico Morenzon, Circo de Gredos","Sierra de Gredos, salida desde la Plataforma ...",circular.,4 horas.,Km: 10,baja. (Dependerá de la estación del año).,bajo – medio,“Descubre la montaña con nuestra ruta ideal pa...
1,"Pico de la Mira, desde la Plataforma de Gredos","Sierra de Gredos, salida desde la Plataforma ...",Ida y vuelta.,7 horas.,km: 16,Media. (Dependerá de la estación del año).,Medio,Descubre la ruta perfecta para iniciarte en Gr...
2,"Pico Almanzor, Circo de Gredos","Sierra de Gredos, salida desde la Plataforma ...",Ida y vuelta.,14 horas.,km: 22,Alta. (Dependerá de la estación del año).,Alto,"Este pico, el más alto del Sistema Central, of..."
3,"Laguna Grande de Gredos, Circo de Gredos","Sierra de Gredos, Plataforma de Gredos, secto...",Ida y vuelta.,5 horas.,Km: 12,baja. (Dependerá de la estación del año).,Bajo – medio.,La ruta icónica de la Laguna Grande de Gredos ...
4,"Cinco Lagunas, Sierra de Gredos","Sierra de Gredos, salida desde Navalperal del...",Ida y vuelta.,9 horas.,Km: 25,media. (Dependerá de la estación del año).,alto,Cinco Lagunas sigue siendo un rincón de Gredos...
5,"Circo de Hoya Moros, Sierra de Béjar","Sierra de Bejar, salida desde la Plataforma d...",Ida y vuelta. (Posibilidad de circular por la...,7 horas.,km: 12,Media. (Dependerá de la estación del año).,medio.,Explora una de las rutas más destacadas de la ...
6,Laguna de BarcoSierra de Gredos sector occidental,"Sierra de Gredos, aparcamiento carretera Nava...",Ida y vuelta.,7 horas.,Km: 21,baja. (Dependerá de la estación del año).,medio.,"La tranquila Laguna de Galín Gómez, alias Lagu..."
7,Laguna de los Caballeros\nSierra de Gredos sec...,"Sierra de Gredos, salida desde Navalguijo Sec...",Ida y vuelta.,8 horas.,km: 25,baja. (Dependerá de la estación del año).,Alto,"Una ruta impresionante y muy desconocidas, con..."
8,"Laguna de la Nava,\nSierra de Gredos sector oc...","Sierra de Gredos, salida desde la carretera d...",Ida y vuelta.,8 horas.,km: 19,medio. (Dependerá de la estación del año).,Alto,"Saliendo de Nava de barco, nos vamos metiendo ..."
9,"Tres Lagunas\nLa Nava, Barco y Caballeros\nSie...","Sierra de Gredos, aparcamiento carretera Nav...",Circular,"2 días, una noche.",km: 26,alta. (Dependerá de la estación del año).,Muy alto,Realizaremos una ruta de dos días y una noche ...


In [22]:
print(df) # Cuando intentamos imprimir un DataFrame de pandas usando print(df), 
# es posible que a veces la salida no se vea tan bien formateada cabría esperar ya un dataframe en pandas no se printea de esa manera
# cuando eso pase lo primero que hay que comprobar es esto:

#descomentar

#pd.set_option('display.max_rows', 100)  # Cambia el número máximo de filas mostradas
#pd.set_option('display.max_columns', 10)  # Cambia el número máximo de columnas mostradas
#pd.set_option('display.width', 1000)  # Cambia el ancho máximo de la pantalla


                                              nombre  \
0                     Pico Morenzon, Circo de Gredos   
1     Pico de la Mira, desde la Plataforma de Gredos   
2                     Pico Almanzor, Circo de Gredos   
3           Laguna Grande de Gredos, Circo de Gredos   
4                    Cinco Lagunas, Sierra de Gredos   
5               Circo de Hoya Moros, Sierra de Béjar   
6  Laguna de BarcoSierra de Gredos sector occidental   
7  Laguna de los Caballeros\nSierra de Gredos sec...   
8  Laguna de la Nava,\nSierra de Gredos sector oc...   
9  Tres Lagunas\nLa Nava, Barco y Caballeros\nSie...   

                                               donde  \
0   Sierra de Gredos, salida desde la Plataforma ...   
1   Sierra de Gredos, salida desde la Plataforma ...   
2   Sierra de Gredos, salida desde la Plataforma ...   
3   Sierra de Gredos, Plataforma de Gredos, secto...   
4   Sierra de Gredos, salida desde Navalperal del...   
5   Sierra de Bejar, salida desde la Plataforma

In [23]:
#  si queremos hacer un print específico para un dataframe, deberíamos de usr esta función, la función Display
display(df)

Unnamed: 0,nombre,donde,tipo,duracion,km,dificultad,esfuerzo,descripcion
0,"Pico Morenzon, Circo de Gredos","Sierra de Gredos, salida desde la Plataforma ...",circular.,4 horas.,Km: 10,baja. (Dependerá de la estación del año).,bajo – medio,“Descubre la montaña con nuestra ruta ideal pa...
1,"Pico de la Mira, desde la Plataforma de Gredos","Sierra de Gredos, salida desde la Plataforma ...",Ida y vuelta.,7 horas.,km: 16,Media. (Dependerá de la estación del año).,Medio,Descubre la ruta perfecta para iniciarte en Gr...
2,"Pico Almanzor, Circo de Gredos","Sierra de Gredos, salida desde la Plataforma ...",Ida y vuelta.,14 horas.,km: 22,Alta. (Dependerá de la estación del año).,Alto,"Este pico, el más alto del Sistema Central, of..."
3,"Laguna Grande de Gredos, Circo de Gredos","Sierra de Gredos, Plataforma de Gredos, secto...",Ida y vuelta.,5 horas.,Km: 12,baja. (Dependerá de la estación del año).,Bajo – medio.,La ruta icónica de la Laguna Grande de Gredos ...
4,"Cinco Lagunas, Sierra de Gredos","Sierra de Gredos, salida desde Navalperal del...",Ida y vuelta.,9 horas.,Km: 25,media. (Dependerá de la estación del año).,alto,Cinco Lagunas sigue siendo un rincón de Gredos...
5,"Circo de Hoya Moros, Sierra de Béjar","Sierra de Bejar, salida desde la Plataforma d...",Ida y vuelta. (Posibilidad de circular por la...,7 horas.,km: 12,Media. (Dependerá de la estación del año).,medio.,Explora una de las rutas más destacadas de la ...
6,Laguna de BarcoSierra de Gredos sector occidental,"Sierra de Gredos, aparcamiento carretera Nava...",Ida y vuelta.,7 horas.,Km: 21,baja. (Dependerá de la estación del año).,medio.,"La tranquila Laguna de Galín Gómez, alias Lagu..."
7,Laguna de los Caballeros\nSierra de Gredos sec...,"Sierra de Gredos, salida desde Navalguijo Sec...",Ida y vuelta.,8 horas.,km: 25,baja. (Dependerá de la estación del año).,Alto,"Una ruta impresionante y muy desconocidas, con..."
8,"Laguna de la Nava,\nSierra de Gredos sector oc...","Sierra de Gredos, salida desde la carretera d...",Ida y vuelta.,8 horas.,km: 19,medio. (Dependerá de la estación del año).,Alto,"Saliendo de Nava de barco, nos vamos metiendo ..."
9,"Tres Lagunas\nLa Nava, Barco y Caballeros\nSie...","Sierra de Gredos, aparcamiento carretera Nav...",Circular,"2 días, una noche.",km: 26,alta. (Dependerá de la estación del año).,Muy alto,Realizaremos una ruta de dos días y una noche ...


In [24]:
def exploracion(data):
    display(data.head())
    # print(data.head()) #descomentamos esto y probamos a ver qué pasa


exploracion(df)

Unnamed: 0,nombre,donde,tipo,duracion,km,dificultad,esfuerzo,descripcion
0,"Pico Morenzon, Circo de Gredos","Sierra de Gredos, salida desde la Plataforma ...",circular.,4 horas.,Km: 10,baja. (Dependerá de la estación del año).,bajo – medio,“Descubre la montaña con nuestra ruta ideal pa...
1,"Pico de la Mira, desde la Plataforma de Gredos","Sierra de Gredos, salida desde la Plataforma ...",Ida y vuelta.,7 horas.,km: 16,Media. (Dependerá de la estación del año).,Medio,Descubre la ruta perfecta para iniciarte en Gr...
2,"Pico Almanzor, Circo de Gredos","Sierra de Gredos, salida desde la Plataforma ...",Ida y vuelta.,14 horas.,km: 22,Alta. (Dependerá de la estación del año).,Alto,"Este pico, el más alto del Sistema Central, of..."
3,"Laguna Grande de Gredos, Circo de Gredos","Sierra de Gredos, Plataforma de Gredos, secto...",Ida y vuelta.,5 horas.,Km: 12,baja. (Dependerá de la estación del año).,Bajo – medio.,La ruta icónica de la Laguna Grande de Gredos ...
4,"Cinco Lagunas, Sierra de Gredos","Sierra de Gredos, salida desde Navalperal del...",Ida y vuelta.,9 horas.,Km: 25,media. (Dependerá de la estación del año).,alto,Cinco Lagunas sigue siendo un rincón de Gredos...


In [25]:
print(df.to_string())

                                                                          nombre                                                                          donde                                                    tipo             duracion      km                                  dificultad       esfuerzo                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                    descripcion
0                                                 Pico Morenzon, Circo de Gredos         Sierra de Gredos, salida desde la Plataforma de Gredos. Sector Central          