<a href="https://colab.research.google.com/github/alvumu/TGINE/blob/main/Practica1/3_2_scrapyJSON_LD_Elmundo.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Sesión 3 - Scrapy - Ejemplo Crawling JSON-LD (ElMundo)

## Apartado 1.1 Crawler de El Mundo extrayendo JSON-LD
En el ejemplo siguiente definimos un crawler en Scrapy para extraer noticias de los metadatos de las páginas web.
El Mundo y otros periódicos publican metadatos en formato JSON-LD (https://json-ld.org/) que permite obtener información estructurada de las webs. En este caso, tendremos que obtener esos objetos JSON-LD y extraer su información en el formato de noticia (https://schema.org/NewsArticle) publicado en Schema.org

** Existen librerías de Python para trabajar directamente con JSON-LD

In [None]:
!pip3 install -U scrapy



In [None]:
import scrapy
import sys
import json
import locale
import time
import random
from bs4 import BeautifulSoup

class ElMundoSpider (scrapy.Spider):

    #Es obligatorio poner un nombre
    name = 'elmundo'

    #Ponemos que el dominio que está permitido es el de la página y no vamos a irnos fuera de la misma
    allowed_domains = ['www.elmundo.es']

    start_urls = ['https://www.elmundo.es/']

    # para evitar que el sitio te bloquee por usar scrapy es interesante cambiar el USER_AGENT
    # El user agent por defecto de Scrapy cuando hace una petición es
    # Scrapy/VERSION (+https://scrapy.org)
    custom_settings = {
        'USER_AGENT': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/109.0.0.0 Safari/537.36',
    }

    def parse (self, response):
      """
      @inherit

      @param self
      @param response
      """

      # Obtenemos la URL de la web que estamos procesando
      url = str(response.request.url).strip()

      # Obtenemos usando CSS la parte donde está definido el JSON-LD en la web
      for item in response.css('script[type=\"application/ld+json\"]'):
        data = json.loads(item.css('::text').get())
        # Procesamos aquí los datos
        # RELLENAR
        if("headline" in data):
          title = data["headline"]
          content = data["description"]
          date = data["datePublished"]

          print ("-------------------------")
          print (url)
          print (title)
          print (content)
          print (date)
          print ("-------------------------")

          data = {
                'url' : url,
                'title': title,
                'content': content,
                'date': date
            }

            #Creamos para cada item un fichero json y para ello obtenemos un número aleatorio.
          filename = str(random.random()).replace(".","") + ".json"

            # Guardamos el documento si tiene contenido y título
          if content and title:
              with open ('elmundo/' + filename, 'w') as f:
                  json.dump (data, f, indent = 4)

      # Por último, miramos distintos enlaces que existan en la web (en este caso todos los de la etiqueta <a>)
      url_in_current_document = response.css ('a')
      for next_page in url_in_current_document:
          # Por cada enlace ejecutamos el mismo parse
          #Intentamos filtrar que solamente coja deportes
          url_str = str(next_page.css("::attr(href)").get())
          if(url_str.find("elmundo.es/deportes") != -1) :
            yield response.follow (next_page, self.parse)


## Apartado 1.2
Para poder lanzar el Spider necesitamos que ejecutar el siguiente código donde se configuará y lanzará el proceso.
Hay que hacer notar que solamente se puede lanzar un proceso por cada sesión en Jupyter notebook es por eso por lo que se recomienda exportar el código en un script de Python .py para poder ejecutarlo desde la línea de comandos.

In [None]:
import os
import scrapy
from scrapy.crawler import CrawlerProcess

# Creamos un proceso de Crawler podemos poner distintas settings que están definidas en la documentación.
# Entre ellas podemos ocular los logs del proceso de Crawling.
process = CrawlerProcess(settings={
    "LOG_ENABLED": False,
    # Used for pipeline 1
})

# Como se ha definido anteriormente en el RSSCrawler, los ficheros se van a almacenar en la carpeta "rss"
# Comprobamos que existe la carpeta y si no existe la creamos
if (not os.path.exists('elmundo')):
    os.mkdir('elmundo')

# Creamos el proceso con el RSSSpider
process.crawl(ElMundoSpider)
# Ejecutamos el Crawler
process.start()

INFO:scrapy.utils.log:Scrapy 2.11.0 started (bot: scrapybot)
INFO:scrapy.utils.log:Versions: lxml 4.9.3.0, libxml2 2.10.3, cssselect 1.2.0, parsel 1.8.1, w3lib 2.1.2, Twisted 22.10.0, Python 3.10.12 (main, Jun 11 2023, 05:26:28) [GCC 11.4.0], pyOpenSSL 23.2.0 (OpenSSL 3.1.4 24 Oct 2023), cryptography 41.0.5, Platform Linux-5.15.120+-x86_64-with-glibc2.35
INFO:scrapy.addons:Enabled addons:
[]


See the documentation of the 'REQUEST_FINGERPRINTER_IMPLEMENTATION' setting for information on how to handle this deprecation.
  return cls(crawler)
DEBUG:scrapy.utils.log:Using reactor: twisted.internet.epollreactor.EPollReactor
INFO:scrapy.extensions.telnet:Telnet Password: af2a23e331bd8571
INFO:scrapy.middleware:Enabled extensions:
['scrapy.extensions.corestats.CoreStats',
 'scrapy.extensions.telnet.TelnetConsole',
 'scrapy.extensions.memusage.MemoryUsage',
 'scrapy.extensions.logstats.LogStats']
INFO:scrapy.crawler:Overridden settings:
{'LOG_ENABLED': False,
 'USER_AGENT': 'Mozilla/5.0 (Windo

-------------------------
https://www.elmundo.es/deportes/mas-deporte/2023/10/25/6539588afdddfff51e8b45db.html
Tigist Assefa: &quot;Voy a darlo todo por acercarme lo máximo a los tiempos de los hombres&quot;
Hace exactamente un mes y dos días, Tigist Assefa (Adis Abeba, Etiopía, 1996) destrozó en Berlín el récord del mundo de maratón. Ninguna mujer había bajado jamás de las dos...
2023-10-25T21:57:45Z
-------------------------
-------------------------
https://www.elmundo.es/deportes/futbol/primera-division/2023/10/26/653a4071e9cf4a7b358b45c7.html
Florentino no tiene intención de ir al palco del Barcelona
&quot;A estas horas, no va&quot;. El mensaje que sale del Real Madrid habla de la intención de su presidente, Florentino Pérez, de no acudir el próximo sábado al palco del...
2023-10-26T10:36:19Z
-------------------------
-------------------------
https://www.elmundo.es/deportes/futbol/2023/10/26/653a467a21efa043148b4590.html
El jefe de Marketing de la RFEF pide el archivo y revela nu

DEBUG:scrapy.core.engine:Crawled (200) <GET https://www.elmundo.es/deportes/baloncesto/nba/pag2> (referer: https://www.elmundo.es/deportes/baloncesto/nba.html)
DEBUG:scrapy.core.engine:Crawled (200) <GET https://www.elmundo.es/deportes/baloncesto/mundial/pag2> (referer: https://www.elmundo.es/deportes/baloncesto/mundial.html)
DEBUG:scrapy.core.engine:Crawled (200) <GET https://www.elmundo.es/deportes/baloncesto/eurobasket/2022/09/11/631e134dfdddff94528b4596.html> (referer: https://www.elmundo.es/deportes/baloncesto/eurobasket.html)
DEBUG:scrapy.core.engine:Crawled (200) <GET https://www.elmundo.es/deportes/baloncesto/eurobasket/2022/09/10/631cc1b621efa0d45d8b457f.html> (referer: https://www.elmundo.es/deportes/baloncesto/eurobasket.html)
DEBUG:scrapy.core.engine:Crawled (200) <GET https://www.elmundo.es/deportes/tenis/2023/10/19/65319de0e4d4d8a11f8b45b8.html> (referer: https://www.elmundo.es/deportes.html)


-------------------------
https://www.elmundo.es/deportes/baloncesto/eurobasket/2022/09/11/631e134dfdddff94528b4596.html
Finlandia, rival en cuartos de España, la manada de lobos que lidera Markkanen: &quot;Es algo fuera de lo
La fiesta nacional suomi se desató el domingo en el Mercedes Benz Arena. Por primera vez en 55 años (en 1967 acabaron sextos), Finlandia se coló entre los ocho mejores de un...
2022-09-11T17:10:44Z
-------------------------
-------------------------
https://www.elmundo.es/deportes/baloncesto/eurobasket/2022/09/10/631cc1b621efa0d45d8b457f.html
Lorenzo Brown y una España heroica
Está España donde casi nadie la esperaba, heroica entre los ocho mejores de Europa, rompiendo pronósticos y corazones. En una noche para el recuerdo, para los anales de la...
2022-09-10T21:29:58Z
-------------------------
-------------------------
https://www.elmundo.es/deportes/tenis/2023/10/19/65319de0e4d4d8a11f8b45b8.html
Nadal y su regreso: &quot;Mi primera opción sería en enero, en Aus

DEBUG:scrapy.core.engine:Crawled (200) <GET https://www.elmundo.es/deportes/juegos-olimpicos/2022/02/10/62050c8821efa0137b8b45d1.html> (referer: https://www.elmundo.es/deportes/juegos-olimpicos.html)
DEBUG:scrapy.core.engine:Crawled (200) <GET https://www.elmundo.es/deportes/2023/10/19/65315600e9cf4ab3158b459b.html> (referer: https://www.elmundo.es/deportes.html)
DEBUG:scrapy.core.engine:Crawled (200) <GET https://www.elmundo.es/deportes/baloncesto/eurobasket/2022/09/11/631d12cc21efa0026f8b45c9.html> (referer: https://www.elmundo.es/deportes/baloncesto/eurobasket.html)
DEBUG:scrapy.core.engine:Crawled (200) <GET https://www.elmundo.es/deportes/juegos-olimpicos/2022/02/11/6204ee3721efa0173c8b4600.html> (referer: https://www.elmundo.es/deportes/juegos-olimpicos.html)
DEBUG:scrapy.core.engine:Crawled (200) <GET https://www.elmundo.es/deportes/baloncesto/eurobasket/2022/09/10/631c3536fdddff3a178b45c3.html> (referer: https://www.elmundo.es/deportes/baloncesto/eurobasket.html)
DEBUG:scrapy.c

-------------------------
https://www.elmundo.es/deportes/juegos-olimpicos/2022/02/10/62050c8821efa0137b8b45d1.html
Queralt Castellet, medalla de plata en Pekín: &quot;Me queda mucha guerra que dar&quot;
El teléfono le quema. Demasiadas llamadas por WhatsApp. Está en esa tesitura entre silenciar el móvil o aprovechar su subidón mediático. Opta por lo segundo. Porque ha logrado...
2022-02-10T13:09:40Z
-------------------------
-------------------------
https://www.elmundo.es/deportes/2023/10/19/65315600e9cf4ab3158b459b.html
Éric Zemmour vincula a Benzema con el ataque terrorista en el instituto de Arras
Continúa la polémica en torno a Karin Benzema, o contra Karim Benzema. Hace dos días el ministro del Interior francés le acusó de pertenecer a los Hermanos Musulmanes, una...
2023-10-19T16:57:45Z
-------------------------
-------------------------
https://www.elmundo.es/deportes/baloncesto/eurobasket/2022/09/11/631d12cc21efa0026f8b45c9.html
El &quot;cuento de hadas&quot; de España y un r

DEBUG:scrapy.core.engine:Crawled (200) <GET https://www.elmundo.es/deportes/juegos-olimpicos/2022/02/10/61f5769dfc6c835d4c8b457e.html> (referer: https://www.elmundo.es/deportes/juegos-olimpicos.html)
DEBUG:scrapy.core.engine:Crawled (200) <GET https://www.elmundo.es/deportes/baloncesto/eurobasket/2022/09/10/631ca965fc6c836e0c8b45ca.html> (referer: https://www.elmundo.es/deportes/baloncesto/eurobasket.html)
DEBUG:scrapy.core.engine:Crawled (200) <GET https://www.elmundo.es/deportes/juegos-olimpicos/2022/02/12/62075ecee4d4d8b0388b4617.html> (referer: https://www.elmundo.es/deportes/juegos-olimpicos.html)
DEBUG:scrapy.core.engine:Crawled (200) <GET https://www.elmundo.es/deportes/mas-deporte/pag2> (referer: https://www.elmundo.es/deportes/mas-deporte.html)
DEBUG:scrapy.core.engine:Crawled (200) <GET https://www.elmundo.es/deportes/baloncesto/nba/2023/05/09/6459da37e4d4d8ee2e8b4574.html> (referer: https://www.elmundo.es/deportes/baloncesto/nba/pag2)


-------------------------
https://www.elmundo.es/deportes/juegos-olimpicos/2022/02/11/6204ee3721efa0173c8b4600.html
La intrahistoria de una medalla: una gincana para llegar a Pekín y la soledad en la Villa Olímpica
Llegó sola a Pekín. Su entrenador, Danny Kass, legendario rider norteamericano con dos platas olímpicas en snowboard halfpipe, no pudo subirse en el avión que despegó desde...
2022-02-11T01:03:17Z
-------------------------
-------------------------
https://www.elmundo.es/deportes/baloncesto/eurobasket/2022/09/10/631c3536fdddff3a178b45c3.html
Lituania, un muro para España en Berlín con muchas cuentas pendientes
Aguarda Lituania (20.45 h., Cuatro) en el Mercedes Benz Arena, ya las 16 elegidas en Berlín, en el Rubicón para España entre el objetivo de mínimos y lo que sería otra gesta,...
2022-09-10T07:01:04Z
-------------------------
-------------------------
https://www.elmundo.es/deportes/juegos-olimpicos/2022/02/10/61f5769dfc6c835d4c8b457e.html
Adrián Díaz y Olivia Smart, la

DEBUG:scrapy.core.engine:Crawled (200) <GET https://www.elmundo.es/deportes/baloncesto/eurobasket/2022/09/13/6320bf87fc6c83677b8b45bc.html> (referer: https://www.elmundo.es/deportes/baloncesto/eurobasket.html)
DEBUG:scrapy.core.engine:Crawled (200) <GET https://www.elmundo.es/deportes/juegos-olimpicos/2022/02/11/6206cafae4d4d8c8338b459f.html> (referer: https://www.elmundo.es/deportes/juegos-olimpicos.html)


-------------------------
https://www.elmundo.es/deportes/baloncesto/eurobasket/2022/09/10/631ca965fc6c836e0c8b45ca.html
Bélgica exige otro alarde de genialidad (y de sangre fría) de Doncic
Tras un periplo sin tregua en Colonia, una primera fase que podría haber hecho temblar a cualquiera, Eslovenia se plantaba en octavos con pocos rasguños y un rival menos fiero a...
2022-09-10T15:35:52Z
-------------------------
-------------------------
https://www.elmundo.es/deportes/juegos-olimpicos/2022/02/12/62075ecee4d4d8b0388b4617.html
Un entrenador olímpico estadounidense de snowboard, acusado de acoso sexual
El entrenador del equipo estadounidense de snowboard, Peter Foley, presente en los Juegos Olímpicos de Pekín, fue acusado de acoso sexual y de comportamiento inapropiado por una...
2022-02-12T07:16:43Z
-------------------------
-------------------------
https://www.elmundo.es/deportes/baloncesto/nba/2023/05/09/6459da37e4d4d8ee2e8b4574.html
Lonnie Walker IV se pone la corona de LeBron en 

DEBUG:scrapy.core.engine:Crawled (200) <GET https://www.elmundo.es/deportes/resultados/tenis.html> (referer: https://www.elmundo.es/deportes/tenis/2023/10/19/65319de0e4d4d8a11f8b45b8.html)
DEBUG:scrapy.core.engine:Crawled (200) <GET https://www.elmundo.es/deportes/baloncesto/eurobasket/2022/09/01/6310a63321efa0c2458b45a7.html?intcmp=MNOT23801&s_kw=3> (referer: https://www.elmundo.es/deportes/baloncesto/eurobasket/2022/09/10/631cc1b621efa0d45d8b457f.html)
DEBUG:scrapy.core.engine:Crawled (200) <GET https://www.elmundo.es/deportes/baloncesto/eurobasket/2022/09/10/631d07fd21efa0d45d8b4595.html> (referer: https://www.elmundo.es/deportes/baloncesto/eurobasket.html)
DEBUG:scrapy.core.engine:Crawled (200) <GET https://www.elmundo.es/deportes/baloncesto/eurobasket/2022/07/26/62e0159efc6c832f688b45ca.html> (referer: https://www.elmundo.es/deportes/baloncesto/mundial/pag2)
DEBUG:scrapy.core.engine:Crawled (200) <GET https://www.elmundo.es/deportes/baloncesto/eurobasket/2022/09/03/63139711fc6c833

-------------------------
https://www.elmundo.es/deportes/baloncesto/eurobasket/2022/09/13/6320bf87fc6c83677b8b45bc.html
Cuando esta España defiende, todo se vuelve posible
La nueva España ha construido sus victorias con su defensa coral y concentrada. Cuando, además, viene en su auxilio la vieja España bajo forma de un Rudy Fernández, a sus 37...
2022-09-13T17:40:32Z
-------------------------
-------------------------
https://www.elmundo.es/deportes/juegos-olimpicos/2022/02/11/6206cafae4d4d8c8338b459f.html
El oro de la reina versátil, entrenada por un granadino
Aunque vaya contra la lógica informativa, a veces hay que empezar una crónica resaltando una derrota, si es más noticiable que una victoria. Es el caso del eslalon supergigante,...
2022-02-11T20:49:37Z
-------------------------
-------------------------
https://www.elmundo.es/deportes/baloncesto/eurobasket/2022/09/01/6310a63321efa0c2458b45a7.html?intcmp=MNOT23801&s_kw=3
La nueva España amanece con un festival
La nueva España no

DEBUG:scrapy.core.engine:Crawled (200) <GET https://www.elmundo.es/deportes/baloncesto/eurobasket/2022/09/03/63120302fc6c83d5758b4594.html?intcmp=MNOT23801&s_kw=2> (referer: https://www.elmundo.es/deportes/baloncesto/eurobasket/2022/09/10/631cc1b621efa0d45d8b457f.html)
DEBUG:scrapy.core.engine:Crawled (200) <GET https://www.elmundo.es/deportes/futbol/jugadores/karim-benzema.html> (referer: https://www.elmundo.es/deportes/2023/10/19/65315600e9cf4ab3158b459b.html)
DEBUG:scrapy.core.engine:Crawled (200) <GET https://www.elmundo.es/deportes/futbol/francia.html> (referer: https://www.elmundo.es/deportes/2023/10/19/65315600e9cf4ab3158b459b.html)
DEBUG:scrapy.core.engine:Crawled (200) <GET https://www.elmundo.es/deportes/baloncesto/eurobasket/2022/09/09/631b88e6fdddffc9bc8b4572.html?intcmp=MNOT23801&s_kw=1> (referer: https://www.elmundo.es/deportes/baloncesto/eurobasket/2022/09/10/631cc1b621efa0d45d8b457f.html)
DEBUG:scrapy.core.engine:Crawled (200) <GET https://www.elmundo.es/deportes/juegos

-------------------------
https://www.elmundo.es/deportes/baloncesto/eurobasket/2022/09/03/63120302fc6c83d5758b4594.html?intcmp=MNOT23801&s_kw=2
Rudy Fernández, líder de la selección en el nombre del padre: &quot;Lo fácil hubiera sido quedarse en
En 2004, aquel prodigio de pelo rizado, imberbe aún como aquellos que ahora le observan con admiración desde la habitación de al lado, pulsó el contador de lo que iba a devenir...
2022-09-03T00:22:28Z
-------------------------
-------------------------
https://www.elmundo.es/deportes/baloncesto/eurobasket/2022/09/09/631b88e6fdddffc9bc8b4572.html?intcmp=MNOT23801&s_kw=1
Darío Brizuela, el microondas de la selección: &quot;Estoy para dinamitar los partidos&quot;
Darío Brizuela (San Sebastián, 1994) es la dinamita en el escape de gas de la selección, el tipo llamado a ponerlo todo patas arriba desde el banquillo. Meritorio de las...
2022-09-09T18:47:58Z
-------------------------


DEBUG:scrapy.core.engine:Crawled (200) <GET https://www.elmundo.es/deportes/baloncesto/eurobasket/2022/09/11/631d12cc21efa0026f8b45c9.html?intcmp=MNOT23801&s_kw=1> (referer: https://www.elmundo.es/deportes/baloncesto/eurobasket/2022/09/11/631e134dfdddff94528b4596.html)
DEBUG:scrapy.core.engine:Crawled (200) <GET https://www.elmundo.es/deportes/juegos-olimpicos/2022/02/10/61f5769dfc6c835d4c8b457e.html?intcmp=MNOT23801&s_kw=3> (referer: https://www.elmundo.es/deportes/juegos-olimpicos/2022/02/11/6204ee3721efa0173c8b4600.html)
DEBUG:scrapy.core.engine:Crawled (200) <GET https://www.elmundo.es/deportes/juegos-olimpicos/2022/02/10/62050c8821efa0137b8b45d1.html?intcmp=MNOT23801&s_kw=1> (referer: https://www.elmundo.es/deportes/juegos-olimpicos/2022/02/11/6204ee3721efa0173c8b4600.html)
DEBUG:scrapy.core.engine:Crawled (200) <GET https://www.elmundo.es/deportes/juegos-olimpicos/2022/02/04/61fd05cc21efa0b0118b4591.html> (referer: https://www.elmundo.es/deportes/juegos-olimpicos/pag2)


-------------------------
https://www.elmundo.es/deportes/baloncesto/eurobasket/2022/09/01/630f91b3e4d4d866788b45b1.html?intcmp=MNOT23801&s_kw=2
La nueva realidad de España en el Eurobasket de las estrellas: &quot;No tenemos miedo&quot;
Pide Scariolo no mirar al pasado, conscientes todos de que, ahora sí, la selección española, la temida, la doble campeona mundial, la de las medallas olímpicas y los oros...
2022-09-01T00:02:14Z
-------------------------
-------------------------
https://www.elmundo.es/deportes/mas-deporte/2022/02/10/6204ec7ae4d4d8f8278b45c0.html
Queralt Castellet, plata de la mejor ley 50 años después del oro de Paquito
Mejor hubiera sido el oro, claro. Pero la plata fue mucho, muchísimo mejor que el bronce. Y Queralt Castellet se la colgó del orgulloso cuello en snowboard, en la modalidad de...
2022-02-10T10:44:12Z
-------------------------


DEBUG:scrapy.core.engine:Crawled (200) <GET https://www.elmundo.es/deportes/baloncesto/eurobasket/2022/09/03/63120302fc6c83d5758b4594.html?intcmp=MNOT23801&s_kw=1> (referer: https://www.elmundo.es/deportes/baloncesto/eurobasket/2022/09/10/631c3536fdddff3a178b45c3.html)
DEBUG:scrapy.core.engine:Crawled (200) <GET https://www.elmundo.es/deportes/baloncesto/eurobasket/2022/09/08/6319d1bde4d4d81e038b45ba.html> (referer: https://www.elmundo.es/deportes/baloncesto/eurobasket/2022/09/10/631c3536fdddff3a178b45c3.html)
DEBUG:scrapy.core.engine:Crawled (200) <GET https://www.elmundo.es/deportes/baloncesto/eurobasket/2022/09/01/630f91b3e4d4d866788b45b1.html> (referer: https://www.elmundo.es/deportes/baloncesto/eurobasket/2022/09/01/6310a63321efa0c2458b45a7.html?intcmp=MNOT23801&s_kw=3)
DEBUG:scrapy.core.engine:Crawled (200) <GET https://www.elmundo.es/deportes/mas-deporte/2023/08/03/64cbef56e4d4d88e018b45c5.html> (referer: https://www.elmundo.es/deportes/mas-deporte/pag2)
DEBUG:scrapy.core.engine

-------------------------
https://www.elmundo.es/deportes/baloncesto/eurobasket/2022/09/11/631d12cc21efa0026f8b45c9.html?intcmp=MNOT23801&s_kw=1
El &quot;cuento de hadas&quot; de España y un récord de la URSS
Era la euforia de los que lo han vuelto a hacer. En el Mercedes Benz Arena se frotaban los ojos, abrazos aquí y allá, felicidad absoluta de esos niños que lo habían visto...
2022-09-10T23:07:22Z
-------------------------
-------------------------
https://www.elmundo.es/deportes/juegos-olimpicos/2022/02/10/61f5769dfc6c835d4c8b457e.html?intcmp=MNOT23801&s_kw=3
Adrián Díaz y Olivia Smart, la pareja que surgió de dos rupturas: &quot;Hay que llevarse bien, si no se
&amp;quot;Una vez que rompes con una, a ver cómo encuentras a otra...&amp;quot;, bromea Adrián Díaz (Barcelona, 1990) cuando se escucha a sí mismo explicando el rocambolesco génesis...
2022-02-10T17:28:32Z
-------------------------
-------------------------
https://www.elmundo.es/deportes/juegos-olimpicos/2022/02/10/62050c88

DEBUG:scrapy.core.engine:Crawled (200) <GET https://www.elmundo.es/deportes/mas-deporte/2023/07/24/64b0016d21efa08c7e8b4585.html> (referer: https://www.elmundo.es/deportes/mas-deporte/pag2)
DEBUG:scrapy.core.engine:Crawled (200) <GET https://www.elmundo.es/deportes/mas-deporte/2023/07/24/64b01dd6e85eceb4658b459f.html> (referer: https://www.elmundo.es/deportes/mas-deporte/pag2)
DEBUG:scrapy.core.engine:Crawled (200) <GET https://www.elmundo.es/deportes/mas-deporte/2023/07/25/64b01038e4d4d804598b45c0.html> (referer: https://www.elmundo.es/deportes/mas-deporte/pag2)
DEBUG:scrapy.core.engine:Crawled (200) <GET https://www.elmundo.es/deportes/baloncesto/2022/08/18/62fe970121efa03a038b45a9.html?intcmp=MNOT23801&s_kw=3> (referer: https://www.elmundo.es/deportes/baloncesto/eurobasket/2022/09/01/6310a63321efa0c2458b45a7.html?intcmp=MNOT23801&s_kw=3)
DEBUG:scrapy.core.engine:Crawled (200) <GET https://www.elmundo.es/deportes/baloncesto/2022/08/11/62f563e121efa0fb4f8b457a.html?intcmp=MNOT23801&s_

-------------------------
https://www.elmundo.es/deportes/baloncesto/eurobasket/2022/09/03/63120302fc6c83d5758b4594.html?intcmp=MNOT23801&s_kw=1
Rudy Fernández, líder de la selección en el nombre del padre: &quot;Lo fácil hubiera sido quedarse en
En 2004, aquel prodigio de pelo rizado, imberbe aún como aquellos que ahora le observan con admiración desde la habitación de al lado, pulsó el contador de lo que iba a devenir...
2022-09-03T00:22:28Z
-------------------------
-------------------------
https://www.elmundo.es/deportes/baloncesto/eurobasket/2022/09/08/6319d1bde4d4d81e038b45ba.html
Jaime Pradilla, el &quot;Felipe Reyes&quot; que ha derribado la puerta de la selección: &quot;No tiene
El primer día de concentración, a comienzos de agosto, Sergio Scariolo le dijo a Jaime Pradilla: &amp;quot;Tiene pinta de que te vas a quedar mucho tiempo&amp;quot;. Un mes después, el...
2022-09-08T20:44:23Z
-------------------------
-------------------------
https://www.elmundo.es/deportes/baloncest

DEBUG:scrapy.core.engine:Crawled (200) <GET https://www.elmundo.es/deportes/mas-deporte/2023/07/25/64c00974e9cf4a39278b45c1.html> (referer: https://www.elmundo.es/deportes/mas-deporte/pag2)
DEBUG:scrapy.core.engine:Crawled (200) <GET https://www.elmundo.es/deportes/mas-deporte/pag3> (referer: https://www.elmundo.es/deportes/mas-deporte/pag2)
DEBUG:scrapy.core.engine:Crawled (200) <GET https://www.elmundo.es/deportes/mas-deporte/2023/07/25/64bfc902e85ecead7c8b4590.html> (referer: https://www.elmundo.es/deportes/mas-deporte/pag2)


-------------------------
https://www.elmundo.es/deportes/baloncesto/eurobasket/2022/09/09/631b88e6fdddffc9bc8b4572.html
Darío Brizuela, el microondas de la selección: &quot;Estoy para dinamitar los partidos&quot;
Darío Brizuela (San Sebastián, 1994) es la dinamita en el escape de gas de la selección, el tipo llamado a ponerlo todo patas arriba desde el banquillo. Meritorio de las...
2022-09-09T18:47:58Z
-------------------------
-------------------------
https://www.elmundo.es/deportes/baloncesto/eurobasket/2022/09/01/630f89c7fc6c83c3198b4581.html
Willy Hernangómez: &quot;Tampoco éramos los más fuertes en el Mundial&quot;
En esta nueva España, Willy Hernangómez (Madrid, 1994) ha subido, a la fuerza, varios escalones de golpe. En rendimiento (máximo anotador durante la preparación), en galones...
2022-09-01T00:02:16Z
-------------------------


DEBUG:scrapy.core.engine:Crawled (200) <GET https://www.elmundo.es/deportes/futbol/2023/06/23/6495d443fdddff16398b45a1.html> (referer: https://www.elmundo.es/deportes/futbol/jugadores/karim-benzema.html)


-------------------------
https://www.elmundo.es/deportes/juegos-olimpicos/2022/02/04/61fd183a21efa0c7078b458e.html
Tradición, tecnología y mensaje político en la ceremonia de apertura de los JJOO de Pekín
Pekín presentó al mundo sus Juegos Olímpicos de Invierno en la primera noche de la primavera siguiendo el calendario chino. Volvió a brillar aquel escenario triunfal del verano...
2022-02-04T15:06:00Z
-------------------------
-------------------------
https://www.elmundo.es/deportes/mas-deporte/2023/07/24/64b0016d21efa08c7e8b4585.html
Radiografía de David Popovici, la nueva estrella de la natación: &quot;Le costó encontrar el equilibrio entre diversión y disciplina&quot;
David Popovici, un fenómeno, un portento, la nueva estrella de la natación. El verano pasado, con sólo 17 años, batió el récord de todos los récords, los 100 metros libre, y...
2023-07-24T15:32:12Z
-------------------------
-------------------------
https://www.elmundo.es/deportes/mas-deporte/2023/07/24/64b01dd6e85e

DEBUG:scrapy.core.engine:Crawled (200) <GET https://www.elmundo.es/deportes/futbol/primera-division/2023/07/25/64bebd3bfdddff647f8b45a0.html> (referer: https://www.elmundo.es/deportes/futbol/jugadores/karim-benzema.html)


-------------------------
https://www.elmundo.es/deportes/baloncesto/2022/08/18/62fe970121efa03a038b45a9.html?intcmp=MNOT23801&s_kw=3
A España no le llega contra Lituania
La selección española de baloncesto cosechó una nueva derrota ante Lituania (78-76) en la fase de preparación del Eurobasket, en un partido donde, pese a su mal comienzo,...
2022-08-18T19:59:23Z
-------------------------
-------------------------
https://www.elmundo.es/deportes/baloncesto/2022/08/11/62f563e121efa0fb4f8b457a.html?intcmp=MNOT23801&s_kw=3
Willy Hernangómez lidera la primera victoria de España en la preparación
El camino hacia el Eurobasket dobla este año como casting para la selección española. Se trata de buscar sangre joven pero también designar a sus nuevos referentes. A nivel de...
2022-08-11T20:21:53Z
-------------------------
-------------------------
https://www.elmundo.es/deportes/mas-deporte/2023/07/25/64c00974e9cf4a39278b45c1.html
40 años del récord de Jarmila en 800 metros, la marca imbatible


DEBUG:scrapy.core.engine:Crawled (200) <GET https://www.elmundo.es/deportes/baloncesto/nba/2022/10/29/635d5b8b21efa008638b4580.html> (referer: https://www.elmundo.es/deportes/baloncesto/nba/pag3)
DEBUG:scrapy.core.engine:Crawled (200) <GET https://www.elmundo.es/deportes/baloncesto/nba/2022/10/29/635d548221efa0ec208b4571.html> (referer: https://www.elmundo.es/deportes/baloncesto/nba/pag3)
DEBUG:scrapy.core.engine:Crawled (200) <GET https://www.elmundo.es/deportes/baloncesto/nba/2022/10/31/635fc67f21efa0ce708b457c.html> (referer: https://www.elmundo.es/deportes/baloncesto/nba/pag3)
DEBUG:scrapy.core.engine:Crawled (200) <GET https://www.elmundo.es/deportes/baloncesto/nba/2022/11/03/6363e40ffc6c8345368b45fb.html> (referer: https://www.elmundo.es/deportes/baloncesto/nba/pag3)
INFO:scrapy.crawler:Received SIGINT, shutting down gracefully. Send again to force 
DEBUG:scrapy.core.engine:Crawled (200) <GET https://www.elmundo.es/deportes/baloncesto/nba/2022/11/04/6364c3f3fc6c83084c8b45a5.html>

-------------------------
https://www.elmundo.es/deportes/baloncesto/nba/2022/10/29/635d5b8b21efa008638b4580.html
George Mikan, la primera estrella de los Lakers y el primer gran pívot dominador
George Mikan subió a una escalera y empezó a limpiar con un trapo la marquesina del Madison Square Garden. En concreto la &amp;apos;O&amp;apos; de su nombre, porque lo que destacaban los...
2022-10-29T16:57:54Z
-------------------------
-------------------------
https://www.elmundo.es/deportes/baloncesto/nba/2022/10/29/635d548221efa0ec208b4571.html
La peor crisis de los Lakers: sin victorias y más problemas que Westbrook
Los Angeles Lakers ganaron la NBA 2020 arropando a LeBron James y Anthony Davis con veteranos que cubrían las necesidades básicas, tiro y defensa. Nada sugerente, pero efectivo....
2022-10-29T16:31:46Z
-------------------------
-------------------------
https://www.elmundo.es/deportes/baloncesto/nba/2022/10/31/635fc67f21efa0ce708b457c.html
Doncic emula a Michael Jordan y los La

DEBUG:scrapy.core.engine:Crawled (200) <GET https://www.elmundo.es/deportes/ajedrez.html> (referer: https://www.elmundo.es/deportes/mas-deporte/2023/08/03/64cbef56e4d4d88e018b45c5.html)


-------------------------
https://www.elmundo.es/deportes/baloncesto/nba/2022/11/02/63622b8921efa0854a8b45d3.html
Los Nets despiden a Steve Nash tras un mal comienzo de la temporada
Los Brooklyn Nets despidieron este martes al técnico Steve Nash, tras un mal inicio de la temporada de la NBA con dos victorias y cinco derrotas, un balance que empeoró la pasada...
2022-11-02T08:36:49Z
-------------------------
-------------------------
https://www.elmundo.es/deportes/baloncesto/2022/11/10/636d1fc4fc6c8392418b45d8.html
Ryan Turell, un judío ortodoxo a las puertas de la NBA
Ryan Turell sale a pista, se ajusta los pantalones y choca la mano con sus compañeros. Nada lo diferencia de cualquier novato hasta que se da la vuelta y sobre los rizos rubios se...
2022-11-10T18:02:25Z
-------------------------


DEBUG:scrapy.core.engine:Crawled (200) <GET https://www.elmundo.es/deportes/baloncesto/nba/2022/10/30/635d980be4d4d83e148b456e.html> (referer: https://www.elmundo.es/deportes/baloncesto/nba/pag3)
DEBUG:scrapy.core.engine:Crawled (200) <GET https://www.elmundo.es/deportes/futbol/espana.html> (referer: https://www.elmundo.es/deportes/baloncesto/eurobasket/2022/09/08/6319d1bde4d4d81e038b45ba.html)
DEBUG:scrapy.core.engine:Crawled (200) <GET https://www.elmundo.es/deportes/baloncesto/eurobasket/2022/08/02/62e7ee5de4d4d8837f8b4573.html?intcmp=MNOT23801&s_kw=3> (referer: https://www.elmundo.es/deportes/baloncesto/eurobasket/2022/09/01/630f89c7fc6c83c3198b4581.html)
DEBUG:scrapy.core.engine:Crawled (200) <GET https://www.elmundo.es/deportes/baloncesto/nba/2022/11/14/6371ff1bfc6c83dc388b459d.html> (referer: https://www.elmundo.es/deportes/baloncesto/nba/pag3)
DEBUG:scrapy.core.engine:Crawled (200) <GET https://www.elmundo.es/deportes/2023/07/27/64c22a5ffc6c83ef0b8b457b.html> (referer: https://

-------------------------
https://www.elmundo.es/deportes/baloncesto/nba/2022/10/30/635d980be4d4d83e148b456e.html
No es oro todo lo que reluce
No juegan, pero ganan fortunas en la NBA. Eso se dice de los españoles allí. Pues no está tan claro. Veamos sus contratos: Usman Garuba, $2,471,160. Es su único...
2022-10-30T19:10:02Z
-------------------------
-------------------------
https://www.elmundo.es/deportes/baloncesto/eurobasket/2022/08/02/62e7ee5de4d4d8837f8b4573.html?intcmp=MNOT23801&s_kw=3
El camino al Eurobasket más complicado: la transición de España en una cita plagada de estrellas
La selección española de baloncesto inició la concentración para el verano más atípico de este siglo. Después de veinte años de metales preciosos, la realidad desplaza a...
2022-08-02T07:37:48Z
-------------------------


DEBUG:scrapy.core.engine:Crawled (200) <GET https://www.elmundo.es/deportes/mas-deporte/2023/05/17/6464a77521efa09c4d8b4570.html> (referer: https://www.elmundo.es/deportes/mas-deporte/pag3)
DEBUG:scrapy.core.engine:Crawled (200) <GET https://www.elmundo.es/deportes/mas-deporte/2023/05/17/6463bcd1e4d4d830058b45a5.html> (referer: https://www.elmundo.es/deportes/mas-deporte/pag3)


-------------------------
https://www.elmundo.es/deportes/baloncesto/nba/2022/11/14/6371ff1bfc6c83dc388b459d.html
Una noche casi perfecta de Joel Embiid
Con un actuación antológica de 59 puntos, Joel Embiid hizo historia en la NBA este domingo al convertirse en el primer jugador que supera los 50 puntos, 10 rebotes, 5 asistencias...
2022-11-14T08:46:05Z
-------------------------
-------------------------
https://www.elmundo.es/deportes/2023/07/27/64c22a5ffc6c83ef0b8b457b.html
La ajedrecista iraní Sara Khadem que se negó a competir con velo debuta como española en la Copa del Mundo
El domingo 30 empieza en Bakú la Copa del Mundo de Ajedrez, una de las grandes citas del año, que durará casi un mes, hasta el 25 de agosto. El favorito es el número uno,...
2023-07-27T08:47:57Z
-------------------------
-------------------------
https://www.elmundo.es/deportes/baloncesto/eurobasket/2022/09/06/631768bc21efa073088b45a0.html?intcmp=MNOT23801&s_kw=1
El Plan B hace reaccionar a España, que ya est

DEBUG:scrapy.core.engine:Crawled (200) <GET https://www.elmundo.es/deportes/mas-deporte/2023/05/17/6464a038e4d4d8752e8b459a.html> (referer: https://www.elmundo.es/deportes/mas-deporte/pag3)


-------------------------
https://www.elmundo.es/deportes/mas-deporte/2023/05/17/6464a77521efa09c4d8b4570.html
&apos;El hombre del Everest&apos; alcanza las 27 subidas a la montaña más alta del mundo y bate el récord
Kami Rita Sherpa nació en 1970 en Thame, una aldea del Himalaya de donde han salido varios escaladores exitosos, pero ninguno como él. El montañero nepalí alcanzó la cumbre...
2023-05-17T10:07:54Z
-------------------------
-------------------------
https://www.elmundo.es/deportes/mas-deporte/2023/05/17/6463bcd1e4d4d830058b45a5.html
Sara Khadem, la estrella del ajedrez que huyó de Irán: &quot;No pueden detener a todo el mundo&quot;
Sara Khadem (Teherán, 1997) es una joven de su tiempo, feliz y risueña, pero también fuerte y rebelde con causa. Después de una protesta le retiraron el pasaporte y pensó que...
2023-05-17T00:53:11Z
-------------------------
-------------------------
https://www.elmundo.es/deportes/mas-deporte/2023/05/17/6464a038e4d4d8752e8b459a.html
El escalador

DEBUG:scrapy.core.engine:Crawled (200) <GET https://www.elmundo.es/deportes/mas-deporte/pag4> (referer: https://www.elmundo.es/deportes/mas-deporte/pag3)
INFO:scrapy.statscollectors:Dumping Scrapy stats:
{'downloader/request_bytes': 41074,
 'downloader/request_count': 101,
 'downloader/request_method_count/GET': 101,
 'downloader/response_bytes': 6190971,
 'downloader/response_count': 101,
 'downloader/response_status_count/200': 101,
 'dupefilter/filtered': 10249,
 'elapsed_time_seconds': 12.479391,
 'finish_reason': 'shutdown',
 'finish_time': datetime.datetime(2023, 10, 26, 17, 10, 18, 621142, tzinfo=datetime.timezone.utc),
 'httpcompression/response_bytes': 30291467,
 'httpcompression/response_count': 101,
 'log_count/DEBUG': 103,
 'log_count/ERROR': 1,
 'log_count/INFO': 11,
 'memusage/max': 172027904,
 'memusage/startup': 172027904,
 'offsite/filtered': 62,
 'request_depth_max': 6,
 'response_received_count': 101,
 'scheduler/dequeued': 101,
 'scheduler/dequeued/memory': 101,
 's