### **Construyendo la spider**

Vamos a comenzar un nuevo proyecto:

<center><img src="https://i.postimg.cc/1tFZNVMC/ws-242.png"></center>
<center><img src="https://i.postimg.cc/rsCXf6B5/ws-243.png"></center>

Crearemos una nueva spider:

<center><img src="https://i.postimg.cc/rsL2GyP8/ws-244.png"></center>
<center><img src="https://i.postimg.cc/3rgT8pkW/ws-245.png"></center>

El `<tr>` representa las filas y el `<td>` representa las columnas de la fila. Así que tenemos cuatro columnas en un `<tr>` por fila.

<center><img src="https://i.postimg.cc/wjB8QG0s/ws-246.png"></center>
<center><img src="https://i.postimg.cc/9FbHThth/ws-247.png"></center>
<center><img src="https://i.postimg.cc/J4MWGnXx/ws-248.png"></center>

Este es el código que utilizamos en el archivo **`adamchoi.py`**:

In [None]:
import scrapy
from scrapy_splash import SplashRequest

class AdamchoiSpider(scrapy.Spider):
    name = 'adamchoi'
    allowed_domains = ['www.adamchoi.co.uk']
    # start_urls = ['http://www.adamchoi.co.uk/']

    # Copia y pega el código lua escrito en splash dentro de la variable script
    script = '''
        function main(splash, args)
          splash.private_mode_enabled = false
          assert(splash:go(args.url))
          assert(splash:wait(3))
          all_matches = assert(splash:select_all("label.btn.btn-sm.btn-primary"))
          all_matches[2]:mouse_click()
          assert(splash:wait(3))
          splash:set_viewport_full()
          return {splash:png(), splash:html()}
        end
    '''

    # Define una función start_requests para conectar scrapy y splash
    def start_requests(self):
        yield SplashRequest(url='https://www.adamchoi.co.uk/overs/detailed', callback=self.parse,
                            args={'lua_source':self.script})

    # Como de costumbre, utilizamos la función parse para extraer datos con xpaths
    def parse(self, response):
        rows = response.xpath('//tr')

        for row in rows:
            date = row.xpath('./td[1]/text()').get()
            home_team = row.xpath('./td[2]/text()').get()
            score = row.xpath('./td[3]/text()').get()
            away_team = row.xpath('./td[4]/text()').get()
            yield {
                'date':date,
                'home_team':home_team,
                'score':score,
                'away_team':away_team,
            }

Instalamos la libreria **`scrapy_splash`**:

<center><img src="https://i.postimg.cc/pLqHzHvj/ws-249.png"></center>

Modificaremos el archivo **`settings.py`** y agregaremos lo que se encuentra dentro del recuadro:

<center><img src="https://i.postimg.cc/Pq7nVQPr/ws-251.png"></center>

Nos aseguramos de que el contenedor en Docker este corriendo y ejecutamos por medio de la terminal y extraemos la data en un archivo **`JSON`**:

<center><img src="https://i.postimg.cc/Ssc1L69P/ws-253.png"></center>
<center><img src="https://i.postimg.cc/MGH8YFZF/ws-250.png"></center>
<center><img src="https://i.postimg.cc/26BRsLZd/ws-252.png"></center>