# Reseña del juego "Pradera" en el sitio MisutMeeple.com




## 1.Instalar y Configurar BeautifulSoup

In [1]:
!pip install beautifulsoup4 requests



## 2.Extraer el HTML de una página con requests

In [2]:
import requests
from bs4 import BeautifulSoup

# URL de la página a scrapear
url = "https://misutmeeple.com/2021/05/resena-pradera/"

# Enviar una solicitud GET
response = requests.get(url)

# Verificar si la solicitud fue exitosa
if response.status_code == 200:
    html_content = response.text
    print("Página obtenida con éxito")
else:
    print(f"Error {response.status_code}")


Página obtenida con éxito


## 3.Parsear el HTML con BeautifulSoup

In [3]:
# Crear el objeto BeautifulSoup
soup = BeautifulSoup(html_content, "html.parser")

# Imprimir el HTML formateado
print(soup.prettify()[:1000])  # Solo mostramos una parte para no saturar el output

<!DOCTYPE html>
<html class="no-js" dir="ltr" itemscope="" itemtype="https://schema.org/Blog" lang="es" prefix="og: https://ogp.me/ns#">
 <head>
  <meta charset="utf-8"/>
  <meta content="width=device-width, initial-scale=1, minimum-scale=1" name="viewport"/>
  <title>
   Reseña: Pradera | Misut Meeple
  </title>
  <style>
   img:is([sizes="auto" i], [sizes^="auto," i]){contain-intrinsic-size:3000px 1500px}
  </style>
  <meta content="Reseña de Pradera, diseñado por Klemens Kalicki, ilustrado por Karolina Kijak" name="description"/>
  <meta content="max-image-preview:large" name="robots"/>
  <meta content="iMisut" name="author"/>
  <meta content="iJfWzcPgmmN6dvYJQ8mK43UT2fGrqwfgHRHBzpHTkzc" name="google-site-verification"/>
  <meta content="3adf79b746734dc795e741979ac11b7c" name="msvalidate.01"/>
  <meta content="7a8e0d54755436f4" name="yandex-verification"/>
  <meta content="colecciones,draft,gestión de la mano,juegos de cartas,juegos de tablero,karolina kijak,klemens kalicki,reseñas"

## 4.Encontrar elementos HTML

### Método 1: `find()` (Encuentra el primer elemento)

In [4]:
titulo = soup.find("title").text
print(f"Título de la página: {titulo}")

Título de la página: Reseña: Pradera | Misut Meeple


### Método 2: `find_all()` (Encuentra múltiples elementos)

In [5]:
# Extraer todos los títulos de las secciones
seccion = [h2.get_text() for h2 in soup.find("div", class_= "entry-content").find_all("h2")]
print(seccion)

['Introducción', 'Contenido', 'Mecánica', 'Opinión Personal']


In [6]:
import os
from google.colab import drive

# Montar Google Drive
drive.mount('/content/drive', force_remount=True)

# Acceso a la carpeta compartida en MyDrive
directorio_guardado = f'/content/drive/My Drive/PRADERA/datos/informacion'
os.makedirs(directorio_guardado, exist_ok=True)

# Nombre del archivo para guardar los enlaces
nombre_archivo = 'introduccion.txt'

# Construir la ruta completa del archivo
ruta_completa = os.path.join(directorio_guardado, nombre_archivo)

# Extraer todos los parrafos de la seccion
seccion = [(f"{p.get_text()}") for p in soup.find("div", class_= "entry-content").find_all("p", limit= 3)]

# Abrir el archivo en modo escritura
with open(ruta_completa, 'w') as archivo:
    print("\n".join(seccion))
    archivo.write("\n".join(seccion))

Mounted at /content/drive
Conviértete en un explorador que compite con otros por ver quién es el observador de la naturaleza más hábil en un viaje para el que no se necesita más que el deseo por descubrir los misterios de la naturaleza y una mirada llena de curiosidad por cada pequeño detalle que nos encontremos en el camino.
Así se nos presenta Pradera, diseñado por Klemens Kalicki, responsable de Dream Home. El juego fue publicado en 2021 por Rebel Studio en una versión en polaco. De las ilustraciones se encarga Karolina Kijak, siendo esta su primera incursión en el mundo de los juegos de mesa.
Se encuentra publicado en español por Asmodee Ibérica (aunque el juego es completamente independiente del idioma). Permite partidas de 1 a 4 jugadores, con una edad mínima sugerida de 10 años y una duración aproximada de entre 60 y 90 minutos. El precio de venta al público es de 44,99€. Para esta reseña se ha utilizado una copia de la versión en español de Asmodee Ibérica, que la propia editor

* Los tags "h2" contienen los distintos titulos (secciones) de los parrafos:
  ['Introducción', 'Contenido', 'Mecánica', 'Opinión Personal'], son interiores respecto de los niveles de los tags "p" que contienen
  el texto de interes.

* Por eso, si no colocamos el parametro "limit", el metodo "find_all" nos
  devuelve todos los tags "p" que encuentra y en nuestro caso el siguiente codigo nos brinda el texto completo de la reseña de la pagina.

* La idea es guardar en un archivo .txt el texto correspondiente a cada
  seccion de la reseña y no todo junto. Para lo cual hay que elegir que parrafos integran esa seccion e indexarlos como sigue:

In [7]:
import os
from google.colab import drive

# Montar Google Drive
drive.mount('/content/drive', force_remount=True)

# Acceso a la carpeta compartida en MyDrive
directorio_guardado = f'/content/drive/My Drive/PRADERA/datos/informacion'
os.makedirs(directorio_guardado, exist_ok=True)

# Nombre del archivo para guardar los enlaces
nombre_archivo = 'Mecanica_del_juego.txt'

# Construir la ruta completa del archivo
ruta_completa = os.path.join(directorio_guardado, nombre_archivo)

# Extraer todos los parrafos de la seccion
seccion = [(f"{p.get_text()}") for p in soup.find("div", class_= "entry-content").find_all("p", limit= 60 )]
print("\n".join(seccion[6:24]))

# Abrir el archivo en modo escritura
with open(ruta_completa, 'w') as archivo:
    print("\n".join(seccion))
    archivo.write("\n".join(seccion))

Mounted at /content/drive
Pradera es un juego con mecánicas principales de draft y colecciones en el que los jugadores tendrán que ir obteniendo cartas de cuatro tipos (terreno, observación, paisaje y descubrimiento) e ir jugándolas en su zona de juego. Para obtener las cartas se dispondrá de un suministro matricial (cuatro filas y cuatro columnas) de las que los jugadores obtendrán cartas colocando unas fichas que muestran un valor, de forma que, al colocarlas en una fila o columna, permitirá tomar la carta que corresponda con la posición indicada desde el marcador y contando tantos pasos como el valor, pudiendo jugar una carta de la mano. Alternativamente, el jugador podrá colocar una de estas fichas en un tablero central para disfrutar de un efecto impreso en ellas y, opcionalmente, reclamar un objetivo si en su zona de juego hay visible una pareja de iconos conectados en un círculo central. La partida finaliza al término de un determinado número de rondas, tras las cuales cada juga

## 5.Extraer datos específicos usando `select()` (CSS Selectors)

### Descargar informacion del juego y guardarla

### Descargar comentarios y guardarlos

In [8]:
import os

from google.colab import drive
drive.mount('/content/drive/')

# Nombre del archivo para guardar los enlaces
nombre_archivo = 'comentarios.txt'

# Acceso a la carpeta compartida en MyDrive
directorio_guardado = f'/content/drive/My Drive/PRADERA/datos/informacion'
os.makedirs(directorio_guardado, exist_ok=True)

# Construir la ruta completa del archivo
ruta_completa = os.path.join(directorio_guardado, nombre_archivo)

# Extraer todos los comentarios
comentarios = soup.select(".comment-body")

# Abrir el archivo en modo escritura
with open(ruta_completa, 'w') as archivo:
    for i, comentario in enumerate(comentarios, 1):
        print(f"{i} {comentario.find(class_='comment-content').text}")
        archivo.write(f"{i} {comentario.find(class_='comment-content').text}\n")


Drive already mounted at /content/drive/; to attempt to forcibly remount, call drive.mount("/content/drive/", force_remount=True).
1 Espectacular. Desde que se anunció ya me llamó la atención con su precioso arte. Pero con lo que acabas de decir se va a la wishlist de cabeza.Gracias como siempre compañero.
2 A mi me tiene encandilado. No deja de ser un juego de draft y colecciones, pero el sistema matricial del quadropolis eleva el nivel de exigencia y la competición por las bonificaciones el nivel de interacción. Siempre acabo las partidas con la sensacion de que me falta una ronda y por qué se acaba tan pronto… xD
3 Gran reseña, como siempre. Está gustando mucho en casa, sobre todo el contraste entre lo agradable y bucólico de las cartas, con la tensión que tienes para intentar optimizar y no descolgarte en la carrera por los objetivos… Se puede jugar a varios niveles: disfrutando del «paseito» y bajando lo que puedas o pilles, o estrujándote un poco más. En el segundo caso, es muy i

## 6.Scraping de Imágenes

### Extraer URLs de imágenes

In [9]:
import os

from google.colab import drive
drive.mount('/content/drive/')

# Extraer todas las imágenes de la página
imagenes = soup.find(class_="entry-content-wrap").find_all("img")

# Nombre del archivo para guardar los enlaces
nombre_archivo = 'enlaces_imagenes.txt'

# Acceso a la carpeta compartida en MyDrive
directorio_guardado = f'/content/drive/My Drive/PRADERA/datos/informacion'

# Construir la ruta completa del archivo
ruta_completa = os.path.join(directorio_guardado, nombre_archivo)

# Abrir el archivo en modo escritura
with open(ruta_completa, 'w') as archivo:
    for i, img in enumerate(imagenes, 1):
        img_url = img.get('src')
        if img_url:
            print(f"Imagen {i}: {img_url}")
            archivo.write(f"{img_url}\n")
        else:
            print(f"Imagen {i}: URL no válida.")

Drive already mounted at /content/drive/; to attempt to forcibly remount, call drive.mount("/content/drive/", force_remount=True).
Imagen 1: https://i0.wp.com/misutmeeple.com/wp-content/uploads/2021/05/pradera_portada.jpg?resize=1200%2C801&ssl=1
Imagen 2: https://i0.wp.com/misutmeeple.com/wp-content/uploads/2021/05/pradera_contraportada.jpg?resize=1200%2C801&ssl=1
Imagen 3: https://i0.wp.com/misutmeeple.com/wp-content/uploads/2021/05/pradera_contenido.jpg?resize=1200%2C330&ssl=1
Imagen 4: https://i0.wp.com/misutmeeple.com/wp-content/uploads/2021/05/pradera_cartas.jpg?resize=1200%2C803&ssl=1
Imagen 5: https://i0.wp.com/misutmeeple.com/wp-content/uploads/2021/05/pradera_tablero_suministro.jpg?resize=1200%2C770&ssl=1
Imagen 6: https://i0.wp.com/misutmeeple.com/wp-content/uploads/2021/05/pradera_fichas_camino.jpg?resize=1200%2C497&ssl=1
Imagen 7: https://i0.wp.com/misutmeeple.com/wp-content/uploads/2021/05/pradera_tablero_campamento.jpg?resize=1200%2C868&ssl=1
Imagen 8: https://i0.wp.com/m

### Descargar imágenes y guardarlas

In [10]:
import os

from google.colab import drive
drive.mount('/content/drive/')

# Extraer todas las imágenes de la página
imagenes = soup.find(class_="entry-content-wrap").find_all("img")

# Acceso a la carpeta compartida en MyDrive
directorio_guardado = f'/content/drive/My Drive/PRADERA/datos/informacion/Imagenes'
os.makedirs(directorio_guardado, exist_ok=True)

# Descargar las imágenes
for i, img in enumerate(imagenes, 1):
    img_url = img.get("src")

    # Algunas URLs son relativas, convertirlas en absolutas
    if img_url.startswith("/"):
        img_url = url + img_url   # La direccion "url" es la del sitio y fue definida en el punto 2

    # Descargar imagen
    img_data = requests.get(img_url).content

    nombre_archivo= (f"imagen_{i}.jpg")

    # Construir la ruta completa del archivo de la imagen
    ruta_completa = os.path.join(directorio_guardado, nombre_archivo)

    # Guardar la imagen
    with open(ruta_completa, "wb") as f:
        f.write(img_data)

    print(f"✅ Imagen {i} descargada")

Drive already mounted at /content/drive/; to attempt to forcibly remount, call drive.mount("/content/drive/", force_remount=True).
✅ Imagen 1 descargada
✅ Imagen 2 descargada
✅ Imagen 3 descargada
✅ Imagen 4 descargada
✅ Imagen 5 descargada
✅ Imagen 6 descargada
✅ Imagen 7 descargada
✅ Imagen 8 descargada
✅ Imagen 9 descargada
✅ Imagen 10 descargada
✅ Imagen 11 descargada
✅ Imagen 12 descargada
✅ Imagen 13 descargada
✅ Imagen 14 descargada
✅ Imagen 15 descargada
✅ Imagen 16 descargada
✅ Imagen 17 descargada
✅ Imagen 18 descargada


## 7.Scraping de Hipervínculos

In [11]:
import os

from google.colab import drive
drive.mount('/content/drive/')

# Nombre del archivo para guardar los enlaces
nombre_archivo = 'enlaces_pagina.txt'

# Acceso a la carpeta compartida en MyDrive
directorio_guardado = f'/content/drive/My Drive/PRADERA/datos/informacion'

# Construir la ruta completa del archivo
ruta_completa = os.path.join(directorio_guardado, nombre_archivo)

# Extración de tags
related_posts = soup.find(class_="tags-links").find_all('a')

# Abrir el archivo en modo escritura
with open(ruta_completa, 'w') as archivo:
    for post in related_posts:
        print(post.text)
        print(post.attrs['href'])
        archivo.write(f"{post.text}\n")
        archivo.write(f"{post.attrs['href']}\n")


Drive already mounted at /content/drive/; to attempt to forcibly remount, call drive.mount("/content/drive/", force_remount=True).
#Colecciones
https://misutmeeple.com/tag/colecciones/
#Draft
https://misutmeeple.com/tag/draft/
#Gestión de la Mano
https://misutmeeple.com/tag/gestion-de-la-mano/
#Juegos de Cartas
https://misutmeeple.com/tag/juegos-de-cartas/
#Juegos de Tablero
https://misutmeeple.com/tag/juegos-de-tablero/
#Karolina Kijak
https://misutmeeple.com/tag/karolina-kijak/
#Klemens Kalicki
https://misutmeeple.com/tag/klemens-kalicki/
#Reseñas
https://misutmeeple.com/tag/resenas/
