# Configurando o notebook e instalando as dependências

In [1]:
#Bibliotecas básicas
import numpy as np
import pandas as pd

#Bibliotecas para vizualização
import plotly.express as px
import plotly.graph_objects as go

#Bibliotecas para Web Scraping
from selenium import webdriver
from selenium.webdriver.common.keys import Keys
from time import sleep
from selenium.common.exceptions import TimeoutException

# Configurações do Selenium
chrome_options = webdriver.ChromeOptions()

# Web Scraping Clima Londres - site Weather Underground

In [10]:
class WebScraping:
    """
    O WebScraping é uma classe utilitária que facilita a extração de dados contidas no site Weather Underground
    """
    def __init__(self, driver=None):
        """
        Construtor
        """
        self.driver = webdriver.Chrome() if not driver else driver
        self.driver.get("https://www.wunderground.com/history/monthly/gb/london/EGLC/date/2015-1")
        self.driver.maximize_window()
        self.lst_temperatura_maxima = []
        self.lst_temperatura_media = []
        self.lst_temperatura_minima = []
        self.lst_dia = []
        self.INTERVALO_ENTRE_PÁGINAS = 5
        
            
    def aceitar_cookies(self):
        """
        Função que tem como objetivo aceitar os cookies da página
        """
        cookies = self.driver.find_element_by_xpath("""//*[@id="truste-consent-button"]""")            #setando o que é o cookies utilizando o Xpath da página HTML
        cookies.click()      #clico no botão para aceitar         

    def extrair_janeiro(self):
        """
        Função que tem como objetivo extrair os dados da página
        """
        for i in range(1, 33):
            xpath_elem_dia = f"""//*[@id="inner-content"]/div[2]/div[1]/div[5]/div[1]/div/lib-city-history-observation/div/div[2]/table/tbody/tr/td[1]/table/tr[{i}]/td"""    #seto o xpath das datas
            numero_dia = self.driver.find_element_by_xpath(xpath_elem_dia)          
            self.lst_dia.append(numero_dia.text)  #utilizo o .text para tirar os dados do site e guardo em uma lista

            xpath_elem_temperatura_maxima = f"""//*[@id="inner-content"]/div[2]/div[1]/div[5]/div[1]/div/lib-city-history-observation/div/div[2]/table/tbody/tr/td[2]/table/tr[{i}]/td[1]"""   #seto o xpath da temperatura máxima
            numero_temperatura_maxima = self.driver.find_element_by_xpath(xpath_elem_temperatura_maxima)           
            self.lst_temperatura_maxima.append(numero_temperatura_maxima.text)          #utilizo o .text para tirar os dados do site e guardo em uma lista  

            xpath_elem_temperatura_media = f"""//*[@id="inner-content"]/div[2]/div[1]/div[5]/div[1]/div/lib-city-history-observation/div/div[2]/table/tbody/tr/td[2]/table/tr[{i}]/td[2]"""   #seto o xpath da temperatura média
            numero_temperatura_media = self.driver.find_element_by_xpath(xpath_elem_temperatura_media)
            self.lst_temperatura_media.append(numero_temperatura_media.text)            #utilizo o .text para tirar os dados do site e guardo em uma lista 

            xpath_elem_temperatura_minima = f"""//*[@id="inner-content"]/div[2]/div[1]/div[5]/div[1]/div/lib-city-history-observation/div/div[2]/table/tbody/tr/td[2]/table/tr[{i}]/td[3]"""   #seto o xpath da temperatura mínima
            numero_temperatura_minima = self.driver.find_element_by_xpath(xpath_elem_temperatura_minima)
            self.lst_temperatura_minima.append(numero_temperatura_minima.text)           #utilizo o .text para tirar os dados do site e guardo em uma lista 

        btn_mes = self.driver.find_element_by_xpath("""//*[@id="monthSelection"]""")  #seto o Xpath do botão da caixa de pesquisa do mês
        btn_mes.click()         #clico no botão setado
        sleep(1)
        btn_escolha_mes = self.driver.find_element_by_xpath(f"""//*[@id="monthSelection"]/option[2]""")       #seto o Xpath do botão de mês da minha escolha
        btn_escolha_mes.click()    #clico no botão setado
        sleep(1)
        btn_pesquisar = self.driver.find_element_by_xpath("""//*[@id="dateSubmit"]""")       #seto o Xpath do botão de pesquisar
        btn_pesquisar.click()    #clico no botão
        sleep(1)
        sleep(self.INTERVALO_ENTRE_PÁGINAS)    #intervalo entre as páginas para o site "respirar"
    
    def extrair_fevereiro(self):
        """
        Função que tem como objetivo extrair os dados da página
        """
        for i in range(1, 30):
            xpath_elem_dia = f"""//*[@id="inner-content"]/div[2]/div[1]/div[5]/div[1]/div/lib-city-history-observation/div/div[2]/table/tbody/tr/td[1]/table/tr[{i}]/td"""    #seto o xpath das datas
            numero_dia = self.driver.find_element_by_xpath(xpath_elem_dia)          
            self.lst_dia.append(numero_dia.text)  #utilizo o .text para tirar os dados do site e guardo em uma lista

            xpath_elem_temperatura_maxima = f"""//*[@id="inner-content"]/div[2]/div[1]/div[5]/div[1]/div/lib-city-history-observation/div/div[2]/table/tbody/tr/td[2]/table/tr[{i}]/td[1]"""   #seto o xpath da temperatura máxima
            numero_temperatura_maxima = self.driver.find_element_by_xpath(xpath_elem_temperatura_maxima)           
            self.lst_temperatura_maxima.append(numero_temperatura_maxima.text)          #utilizo o .text para tirar os dados do site e guardo em uma lista  

            xpath_elem_temperatura_media = f"""//*[@id="inner-content"]/div[2]/div[1]/div[5]/div[1]/div/lib-city-history-observation/div/div[2]/table/tbody/tr/td[2]/table/tr[{i}]/td[2]"""   #seto o xpath da temperatura média
            numero_temperatura_media = self.driver.find_element_by_xpath(xpath_elem_temperatura_media)
            self.lst_temperatura_media.append(numero_temperatura_media.text)            #utilizo o .text para tirar os dados do site e guardo em uma lista 

            xpath_elem_temperatura_minima = f"""//*[@id="inner-content"]/div[2]/div[1]/div[5]/div[1]/div/lib-city-history-observation/div/div[2]/table/tbody/tr/td[2]/table/tr[{i}]/td[3]"""   #seto o xpath da temperatura mínima
            numero_temperatura_minima = self.driver.find_element_by_xpath(xpath_elem_temperatura_minima)
            self.lst_temperatura_minima.append(numero_temperatura_minima.text)           #utilizo o .text para tirar os dados do site e guardo em uma lista 

        btn_mes = self.driver.find_element_by_xpath("""//*[@id="monthSelection"]""")  #seto o Xpath do botão da caixa de pesquisa do mês
        btn_mes.click()         #clico no botão setado
        sleep(1)
        btn_escolha_mes = self.driver.find_element_by_xpath(f"""//*[@id="monthSelection"]/option[3]""")       #seto o Xpath do botão de mês da minha escolha
        btn_escolha_mes.click()    #clico no botão setado
        sleep(1)
        btn_pesquisar = self.driver.find_element_by_xpath("""//*[@id="dateSubmit"]""")       #seto o Xpath do botão de pesquisar
        btn_pesquisar.click()    #clico no botão
        sleep(1)
        sleep(self.INTERVALO_ENTRE_PÁGINAS)    #intervalo entre as páginas para o site "respirar"
    
    def extrair_marco(self):
        """
        Função que tem como objetivo extrair os dados da página
        """
        for i in range(1, 33):
            xpath_elem_dia = f"""//*[@id="inner-content"]/div[2]/div[1]/div[5]/div[1]/div/lib-city-history-observation/div/div[2]/table/tbody/tr/td[1]/table/tr[{i}]/td"""    #seto o xpath das datas
            numero_dia = self.driver.find_element_by_xpath(xpath_elem_dia)          
            self.lst_dia.append(numero_dia.text)  #utilizo o .text para tirar os dados do site e guardo em uma lista

            xpath_elem_temperatura_maxima = f"""//*[@id="inner-content"]/div[2]/div[1]/div[5]/div[1]/div/lib-city-history-observation/div/div[2]/table/tbody/tr/td[2]/table/tr[{i}]/td[1]"""   #seto o xpath da temperatura máxima
            numero_temperatura_maxima = self.driver.find_element_by_xpath(xpath_elem_temperatura_maxima)           
            self.lst_temperatura_maxima.append(numero_temperatura_maxima.text)          #utilizo o .text para tirar os dados do site e guardo em uma lista  

            xpath_elem_temperatura_media = f"""//*[@id="inner-content"]/div[2]/div[1]/div[5]/div[1]/div/lib-city-history-observation/div/div[2]/table/tbody/tr/td[2]/table/tr[{i}]/td[2]"""   #seto o xpath da temperatura média
            numero_temperatura_media = self.driver.find_element_by_xpath(xpath_elem_temperatura_media)
            self.lst_temperatura_media.append(numero_temperatura_media.text)            #utilizo o .text para tirar os dados do site e guardo em uma lista 

            xpath_elem_temperatura_minima = f"""//*[@id="inner-content"]/div[2]/div[1]/div[5]/div[1]/div/lib-city-history-observation/div/div[2]/table/tbody/tr/td[2]/table/tr[{i}]/td[3]"""   #seto o xpath da temperatura mínima
            numero_temperatura_minima = self.driver.find_element_by_xpath(xpath_elem_temperatura_minima)
            self.lst_temperatura_minima.append(numero_temperatura_minima.text)           #utilizo o .text para tirar os dados do site e guardo em uma lista 

        btn_mes = self.driver.find_element_by_xpath("""//*[@id="monthSelection"]""")  #seto o Xpath do botão da caixa de pesquisa do mês
        btn_mes.click()         #clico no botão setado
        sleep(1)
        btn_escolha_mes = self.driver.find_element_by_xpath(f"""//*[@id="monthSelection"]/option[4]""")       #seto o Xpath do botão de mês da minha escolha
        btn_escolha_mes.click()    #clico no botão setado
        sleep(1)
        btn_pesquisar = self.driver.find_element_by_xpath("""//*[@id="dateSubmit"]""")       #seto o Xpath do botão de pesquisar
        btn_pesquisar.click()    #clico no botão
        sleep(1)
        sleep(self.INTERVALO_ENTRE_PÁGINAS)    #intervalo entre as páginas para o site "respirar"     
 
    def extrair_abril(self):
        """
        Função que tem como objetivo extrair os dados da página
        """
        for i in range(1, 32):
            xpath_elem_dia = f"""//*[@id="inner-content"]/div[2]/div[1]/div[5]/div[1]/div/lib-city-history-observation/div/div[2]/table/tbody/tr/td[1]/table/tr[{i}]/td"""    #seto o xpath das datas
            numero_dia = self.driver.find_element_by_xpath(xpath_elem_dia)          
            self.lst_dia.append(numero_dia.text)  #utilizo o .text para tirar os dados do site e guardo em uma lista

            xpath_elem_temperatura_maxima = f"""//*[@id="inner-content"]/div[2]/div[1]/div[5]/div[1]/div/lib-city-history-observation/div/div[2]/table/tbody/tr/td[2]/table/tr[{i}]/td[1]"""   #seto o xpath da temperatura máxima
            numero_temperatura_maxima = self.driver.find_element_by_xpath(xpath_elem_temperatura_maxima)           
            self.lst_temperatura_maxima.append(numero_temperatura_maxima.text)          #utilizo o .text para tirar os dados do site e guardo em uma lista  

            xpath_elem_temperatura_media = f"""//*[@id="inner-content"]/div[2]/div[1]/div[5]/div[1]/div/lib-city-history-observation/div/div[2]/table/tbody/tr/td[2]/table/tr[{i}]/td[2]"""   #seto o xpath da temperatura média
            numero_temperatura_media = self.driver.find_element_by_xpath(xpath_elem_temperatura_media)
            self.lst_temperatura_media.append(numero_temperatura_media.text)            #utilizo o .text para tirar os dados do site e guardo em uma lista 

            xpath_elem_temperatura_minima = f"""//*[@id="inner-content"]/div[2]/div[1]/div[5]/div[1]/div/lib-city-history-observation/div/div[2]/table/tbody/tr/td[2]/table/tr[{i}]/td[3]"""   #seto o xpath da temperatura mínima
            numero_temperatura_minima = self.driver.find_element_by_xpath(xpath_elem_temperatura_minima)
            self.lst_temperatura_minima.append(numero_temperatura_minima.text)           #utilizo o .text para tirar os dados do site e guardo em uma lista 

        btn_mes = self.driver.find_element_by_xpath("""//*[@id="monthSelection"]""")  #seto o Xpath do botão da caixa de pesquisa do mês
        btn_mes.click()         #clico no botão setado
        sleep(1)
        btn_escolha_mes = self.driver.find_element_by_xpath(f"""//*[@id="monthSelection"]/option[5]""")       #seto o Xpath do botão de mês da minha escolha
        btn_escolha_mes.click()    #clico no botão setado
        sleep(1)
        btn_pesquisar = self.driver.find_element_by_xpath("""//*[@id="dateSubmit"]""")       #seto o Xpath do botão de pesquisar
        btn_pesquisar.click()    #clico no botão
        sleep(1)
        sleep(self.INTERVALO_ENTRE_PÁGINAS)    #intervalo entre as páginas para o site "respirar"

    def extrair_maio(self):
        """
        Função que tem como objetivo extrair os dados da página
        """
        for i in range(1, 33):
            xpath_elem_dia = f"""//*[@id="inner-content"]/div[2]/div[1]/div[5]/div[1]/div/lib-city-history-observation/div/div[2]/table/tbody/tr/td[1]/table/tr[{i}]/td"""    #seto o xpath das datas
            numero_dia = self.driver.find_element_by_xpath(xpath_elem_dia)          
            self.lst_dia.append(numero_dia.text)  #utilizo o .text para tirar os dados do site e guardo em uma lista

            xpath_elem_temperatura_maxima = f"""//*[@id="inner-content"]/div[2]/div[1]/div[5]/div[1]/div/lib-city-history-observation/div/div[2]/table/tbody/tr/td[2]/table/tr[{i}]/td[1]"""   #seto o xpath da temperatura máxima
            numero_temperatura_maxima = self.driver.find_element_by_xpath(xpath_elem_temperatura_maxima)           
            self.lst_temperatura_maxima.append(numero_temperatura_maxima.text)          #utilizo o .text para tirar os dados do site e guardo em uma lista  

            xpath_elem_temperatura_media = f"""//*[@id="inner-content"]/div[2]/div[1]/div[5]/div[1]/div/lib-city-history-observation/div/div[2]/table/tbody/tr/td[2]/table/tr[{i}]/td[2]"""   #seto o xpath da temperatura média
            numero_temperatura_media = self.driver.find_element_by_xpath(xpath_elem_temperatura_media)
            self.lst_temperatura_media.append(numero_temperatura_media.text)            #utilizo o .text para tirar os dados do site e guardo em uma lista 

            xpath_elem_temperatura_minima = f"""//*[@id="inner-content"]/div[2]/div[1]/div[5]/div[1]/div/lib-city-history-observation/div/div[2]/table/tbody/tr/td[2]/table/tr[{i}]/td[3]"""   #seto o xpath da temperatura mínima
            numero_temperatura_minima = self.driver.find_element_by_xpath(xpath_elem_temperatura_minima)
            self.lst_temperatura_minima.append(numero_temperatura_minima.text)           #utilizo o .text para tirar os dados do site e guardo em uma lista 

        btn_mes = self.driver.find_element_by_xpath("""//*[@id="monthSelection"]""")  #seto o Xpath do botão da caixa de pesquisa do mês
        btn_mes.click()         #clico no botão setado
        sleep(1)
        btn_escolha_mes = self.driver.find_element_by_xpath(f"""//*[@id="monthSelection"]/option[6]""")       #seto o Xpath do botão de mês da minha escolha
        btn_escolha_mes.click()    #clico no botão setado
        sleep(1)
        btn_pesquisar = self.driver.find_element_by_xpath("""//*[@id="dateSubmit"]""")       #seto o Xpath do botão de pesquisar
        btn_pesquisar.click()    #clico no botão
        sleep(1)
        sleep(self.INTERVALO_ENTRE_PÁGINAS)    #intervalo entre as páginas para o site "respirar"

    def extrair_junho(self):
        """
        Função que tem como objetivo extrair os dados da página
        """
        for i in range(1, 32):
            xpath_elem_dia = f"""//*[@id="inner-content"]/div[2]/div[1]/div[5]/div[1]/div/lib-city-history-observation/div/div[2]/table/tbody/tr/td[1]/table/tr[{i}]/td"""    #seto o xpath das datas
            numero_dia = self.driver.find_element_by_xpath(xpath_elem_dia)          
            self.lst_dia.append(numero_dia.text)  #utilizo o .text para tirar os dados do site e guardo em uma lista

            xpath_elem_temperatura_maxima = f"""//*[@id="inner-content"]/div[2]/div[1]/div[5]/div[1]/div/lib-city-history-observation/div/div[2]/table/tbody/tr/td[2]/table/tr[{i}]/td[1]"""   #seto o xpath da temperatura máxima
            numero_temperatura_maxima = self.driver.find_element_by_xpath(xpath_elem_temperatura_maxima)           
            self.lst_temperatura_maxima.append(numero_temperatura_maxima.text)          #utilizo o .text para tirar os dados do site e guardo em uma lista  

            xpath_elem_temperatura_media = f"""//*[@id="inner-content"]/div[2]/div[1]/div[5]/div[1]/div/lib-city-history-observation/div/div[2]/table/tbody/tr/td[2]/table/tr[{i}]/td[2]"""   #seto o xpath da temperatura média
            numero_temperatura_media = self.driver.find_element_by_xpath(xpath_elem_temperatura_media)
            self.lst_temperatura_media.append(numero_temperatura_media.text)            #utilizo o .text para tirar os dados do site e guardo em uma lista 

            xpath_elem_temperatura_minima = f"""//*[@id="inner-content"]/div[2]/div[1]/div[5]/div[1]/div/lib-city-history-observation/div/div[2]/table/tbody/tr/td[2]/table/tr[{i}]/td[3]"""   #seto o xpath da temperatura mínima
            numero_temperatura_minima = self.driver.find_element_by_xpath(xpath_elem_temperatura_minima)
            self.lst_temperatura_minima.append(numero_temperatura_minima.text)           #utilizo o .text para tirar os dados do site e guardo em uma lista 

        btn_mes = self.driver.find_element_by_xpath("""//*[@id="monthSelection"]""")  #seto o Xpath do botão da caixa de pesquisa do mês
        btn_mes.click()         #clico no botão setado
        sleep(1)
        btn_escolha_mes = self.driver.find_element_by_xpath(f"""//*[@id="monthSelection"]/option[7]""")       #seto o Xpath do botão de mês da minha escolha
        btn_escolha_mes.click()    #clico no botão setado
        sleep(1)
        btn_pesquisar = self.driver.find_element_by_xpath("""//*[@id="dateSubmit"]""")       #seto o Xpath do botão de pesquisar
        btn_pesquisar.click()    #clico no botão
        sleep(1)
        sleep(self.INTERVALO_ENTRE_PÁGINAS)    #intervalo entre as páginas para o site "respirar"

    def extrair_julho(self):
        """
        Função que tem como objetivo extrair os dados da página
        """
        for i in range(1, 33):
            xpath_elem_dia = f"""//*[@id="inner-content"]/div[2]/div[1]/div[5]/div[1]/div/lib-city-history-observation/div/div[2]/table/tbody/tr/td[1]/table/tr[{i}]/td"""    #seto o xpath das datas
            numero_dia = self.driver.find_element_by_xpath(xpath_elem_dia)          
            self.lst_dia.append(numero_dia.text)  #utilizo o .text para tirar os dados do site e guardo em uma lista

            xpath_elem_temperatura_maxima = f"""//*[@id="inner-content"]/div[2]/div[1]/div[5]/div[1]/div/lib-city-history-observation/div/div[2]/table/tbody/tr/td[2]/table/tr[{i}]/td[1]"""   #seto o xpath da temperatura máxima
            numero_temperatura_maxima = self.driver.find_element_by_xpath(xpath_elem_temperatura_maxima)           
            self.lst_temperatura_maxima.append(numero_temperatura_maxima.text)          #utilizo o .text para tirar os dados do site e guardo em uma lista  

            xpath_elem_temperatura_media = f"""//*[@id="inner-content"]/div[2]/div[1]/div[5]/div[1]/div/lib-city-history-observation/div/div[2]/table/tbody/tr/td[2]/table/tr[{i}]/td[2]"""   #seto o xpath da temperatura média
            numero_temperatura_media = self.driver.find_element_by_xpath(xpath_elem_temperatura_media)
            self.lst_temperatura_media.append(numero_temperatura_media.text)            #utilizo o .text para tirar os dados do site e guardo em uma lista 

            xpath_elem_temperatura_minima = f"""//*[@id="inner-content"]/div[2]/div[1]/div[5]/div[1]/div/lib-city-history-observation/div/div[2]/table/tbody/tr/td[2]/table/tr[{i}]/td[3]"""   #seto o xpath da temperatura mínima
            numero_temperatura_minima = self.driver.find_element_by_xpath(xpath_elem_temperatura_minima)
            self.lst_temperatura_minima.append(numero_temperatura_minima.text)           #utilizo o .text para tirar os dados do site e guardo em uma lista 

        btn_mes = self.driver.find_element_by_xpath("""//*[@id="monthSelection"]""")  #seto o Xpath do botão da caixa de pesquisa do mês
        btn_mes.click()         #clico no botão setado
        sleep(1)
        btn_escolha_mes = self.driver.find_element_by_xpath(f"""//*[@id="monthSelection"]/option[8]""")       #seto o Xpath do botão de mês da minha escolha
        btn_escolha_mes.click()    #clico no botão setado
        sleep(1)
        btn_pesquisar = self.driver.find_element_by_xpath("""//*[@id="dateSubmit"]""")       #seto o Xpath do botão de pesquisar
        btn_pesquisar.click()    #clico no botão
        sleep(1)
        sleep(self.INTERVALO_ENTRE_PÁGINAS)    #intervalo entre as páginas para o site "respirar"

    def extrair_agosto(self):
        """
        Função que tem como objetivo extrair os dados da página
        """
        for i in range(1, 33):
            xpath_elem_dia = f"""//*[@id="inner-content"]/div[2]/div[1]/div[5]/div[1]/div/lib-city-history-observation/div/div[2]/table/tbody/tr/td[1]/table/tr[{i}]/td"""    #seto o xpath das datas
            numero_dia = self.driver.find_element_by_xpath(xpath_elem_dia)          
            self.lst_dia.append(numero_dia.text)  #utilizo o .text para tirar os dados do site e guardo em uma lista

            xpath_elem_temperatura_maxima = f"""//*[@id="inner-content"]/div[2]/div[1]/div[5]/div[1]/div/lib-city-history-observation/div/div[2]/table/tbody/tr/td[2]/table/tr[{i}]/td[1]"""   #seto o xpath da temperatura máxima
            numero_temperatura_maxima = self.driver.find_element_by_xpath(xpath_elem_temperatura_maxima)           
            self.lst_temperatura_maxima.append(numero_temperatura_maxima.text)          #utilizo o .text para tirar os dados do site e guardo em uma lista  

            xpath_elem_temperatura_media = f"""//*[@id="inner-content"]/div[2]/div[1]/div[5]/div[1]/div/lib-city-history-observation/div/div[2]/table/tbody/tr/td[2]/table/tr[{i}]/td[2]"""   #seto o xpath da temperatura média
            numero_temperatura_media = self.driver.find_element_by_xpath(xpath_elem_temperatura_media)
            self.lst_temperatura_media.append(numero_temperatura_media.text)            #utilizo o .text para tirar os dados do site e guardo em uma lista 

            xpath_elem_temperatura_minima = f"""//*[@id="inner-content"]/div[2]/div[1]/div[5]/div[1]/div/lib-city-history-observation/div/div[2]/table/tbody/tr/td[2]/table/tr[{i}]/td[3]"""   #seto o xpath da temperatura mínima
            numero_temperatura_minima = self.driver.find_element_by_xpath(xpath_elem_temperatura_minima)
            self.lst_temperatura_minima.append(numero_temperatura_minima.text)           #utilizo o .text para tirar os dados do site e guardo em uma lista 

        btn_mes = self.driver.find_element_by_xpath("""//*[@id="monthSelection"]""")  #seto o Xpath do botão da caixa de pesquisa do mês
        btn_mes.click()         #clico no botão setado
        sleep(1)
        btn_escolha_mes = self.driver.find_element_by_xpath(f"""//*[@id="monthSelection"]/option[9]""")       #seto o Xpath do botão de mês da minha escolha
        btn_escolha_mes.click()    #clico no botão setado
        sleep(1)
        btn_pesquisar = self.driver.find_element_by_xpath("""//*[@id="dateSubmit"]""")       #seto o Xpath do botão de pesquisar
        btn_pesquisar.click()    #clico no botão
        sleep(1)
        sleep(self.INTERVALO_ENTRE_PÁGINAS)    #intervalo entre as páginas para o site "respirar"
        
    def extrair_setembro(self):
        """
        Função que tem como objetivo extrair os dados da página
        """
        for i in range(1, 32):
            xpath_elem_dia = f"""//*[@id="inner-content"]/div[2]/div[1]/div[5]/div[1]/div/lib-city-history-observation/div/div[2]/table/tbody/tr/td[1]/table/tr[{i}]/td"""    #seto o xpath das datas
            numero_dia = self.driver.find_element_by_xpath(xpath_elem_dia)          
            self.lst_dia.append(numero_dia.text)  #utilizo o .text para tirar os dados do site e guardo em uma lista

            xpath_elem_temperatura_maxima = f"""//*[@id="inner-content"]/div[2]/div[1]/div[5]/div[1]/div/lib-city-history-observation/div/div[2]/table/tbody/tr/td[2]/table/tr[{i}]/td[1]"""   #seto o xpath da temperatura máxima
            numero_temperatura_maxima = self.driver.find_element_by_xpath(xpath_elem_temperatura_maxima)           
            self.lst_temperatura_maxima.append(numero_temperatura_maxima.text)          #utilizo o .text para tirar os dados do site e guardo em uma lista  

            xpath_elem_temperatura_media = f"""//*[@id="inner-content"]/div[2]/div[1]/div[5]/div[1]/div/lib-city-history-observation/div/div[2]/table/tbody/tr/td[2]/table/tr[{i}]/td[2]"""   #seto o xpath da temperatura média
            numero_temperatura_media = self.driver.find_element_by_xpath(xpath_elem_temperatura_media)
            self.lst_temperatura_media.append(numero_temperatura_media.text)            #utilizo o .text para tirar os dados do site e guardo em uma lista 

            xpath_elem_temperatura_minima = f"""//*[@id="inner-content"]/div[2]/div[1]/div[5]/div[1]/div/lib-city-history-observation/div/div[2]/table/tbody/tr/td[2]/table/tr[{i}]/td[3]"""   #seto o xpath da temperatura mínima
            numero_temperatura_minima = self.driver.find_element_by_xpath(xpath_elem_temperatura_minima)
            self.lst_temperatura_minima.append(numero_temperatura_minima.text)           #utilizo o .text para tirar os dados do site e guardo em uma lista 

        btn_mes = self.driver.find_element_by_xpath("""//*[@id="monthSelection"]""")  #seto o Xpath do botão da caixa de pesquisa do mês
        btn_mes.click()         #clico no botão setado
        sleep(1)
        btn_escolha_mes = self.driver.find_element_by_xpath(f"""//*[@id="monthSelection"]/option[10]""")       #seto o Xpath do botão de mês da minha escolha
        btn_escolha_mes.click()    #clico no botão setado
        sleep(1)
        btn_pesquisar = self.driver.find_element_by_xpath("""//*[@id="dateSubmit"]""")       #seto o Xpath do botão de pesquisar
        btn_pesquisar.click()    #clico no botão
        sleep(1)
        sleep(self.INTERVALO_ENTRE_PÁGINAS)    #intervalo entre as páginas para o site "respirar"
        
    def extrair_outubro(self):
        """
        Função que tem como objetivo extrair os dados da página
        """
        for i in range(1, 33):
            xpath_elem_dia = f"""//*[@id="inner-content"]/div[2]/div[1]/div[5]/div[1]/div/lib-city-history-observation/div/div[2]/table/tbody/tr/td[1]/table/tr[{i}]/td"""    #seto o xpath das datas
            numero_dia = self.driver.find_element_by_xpath(xpath_elem_dia)          
            self.lst_dia.append(numero_dia.text)  #utilizo o .text para tirar os dados do site e guardo em uma lista

            xpath_elem_temperatura_maxima = f"""//*[@id="inner-content"]/div[2]/div[1]/div[5]/div[1]/div/lib-city-history-observation/div/div[2]/table/tbody/tr/td[2]/table/tr[{i}]/td[1]"""   #seto o xpath da temperatura máxima
            numero_temperatura_maxima = self.driver.find_element_by_xpath(xpath_elem_temperatura_maxima)           
            self.lst_temperatura_maxima.append(numero_temperatura_maxima.text)          #utilizo o .text para tirar os dados do site e guardo em uma lista  

            xpath_elem_temperatura_media = f"""//*[@id="inner-content"]/div[2]/div[1]/div[5]/div[1]/div/lib-city-history-observation/div/div[2]/table/tbody/tr/td[2]/table/tr[{i}]/td[2]"""   #seto o xpath da temperatura média
            numero_temperatura_media = self.driver.find_element_by_xpath(xpath_elem_temperatura_media)
            self.lst_temperatura_media.append(numero_temperatura_media.text)            #utilizo o .text para tirar os dados do site e guardo em uma lista 

            xpath_elem_temperatura_minima = f"""//*[@id="inner-content"]/div[2]/div[1]/div[5]/div[1]/div/lib-city-history-observation/div/div[2]/table/tbody/tr/td[2]/table/tr[{i}]/td[3]"""   #seto o xpath da temperatura mínima
            numero_temperatura_minima = self.driver.find_element_by_xpath(xpath_elem_temperatura_minima)
            self.lst_temperatura_minima.append(numero_temperatura_minima.text)           #utilizo o .text para tirar os dados do site e guardo em uma lista 

        btn_mes = self.driver.find_element_by_xpath("""//*[@id="monthSelection"]""")  #seto o Xpath do botão da caixa de pesquisa do mês
        btn_mes.click()         #clico no botão setado
        sleep(1)
        btn_escolha_mes = self.driver.find_element_by_xpath(f"""//*[@id="monthSelection"]/option[11]""")       #seto o Xpath do botão de mês da minha escolha
        btn_escolha_mes.click()    #clico no botão setado
        sleep(1)
        btn_pesquisar = self.driver.find_element_by_xpath("""//*[@id="dateSubmit"]""")       #seto o Xpath do botão de pesquisar
        btn_pesquisar.click()    #clico no botão
        sleep(1)
        sleep(self.INTERVALO_ENTRE_PÁGINAS)    #intervalo entre as páginas para o site "respirar"
        
    def extrair_novembro(self):
        """
        Função que tem como objetivo extrair os dados da página
        """
        for i in range(1, 32):
            xpath_elem_dia = f"""//*[@id="inner-content"]/div[2]/div[1]/div[5]/div[1]/div/lib-city-history-observation/div/div[2]/table/tbody/tr/td[1]/table/tr[{i}]/td"""    #seto o xpath das datas
            numero_dia = self.driver.find_element_by_xpath(xpath_elem_dia)          
            self.lst_dia.append(numero_dia.text)  #utilizo o .text para tirar os dados do site e guardo em uma lista

            xpath_elem_temperatura_maxima = f"""//*[@id="inner-content"]/div[2]/div[1]/div[5]/div[1]/div/lib-city-history-observation/div/div[2]/table/tbody/tr/td[2]/table/tr[{i}]/td[1]"""   #seto o xpath da temperatura máxima
            numero_temperatura_maxima = self.driver.find_element_by_xpath(xpath_elem_temperatura_maxima)           
            self.lst_temperatura_maxima.append(numero_temperatura_maxima.text)          #utilizo o .text para tirar os dados do site e guardo em uma lista  

            xpath_elem_temperatura_media = f"""//*[@id="inner-content"]/div[2]/div[1]/div[5]/div[1]/div/lib-city-history-observation/div/div[2]/table/tbody/tr/td[2]/table/tr[{i}]/td[2]"""   #seto o xpath da temperatura média
            numero_temperatura_media = self.driver.find_element_by_xpath(xpath_elem_temperatura_media)
            self.lst_temperatura_media.append(numero_temperatura_media.text)            #utilizo o .text para tirar os dados do site e guardo em uma lista 

            xpath_elem_temperatura_minima = f"""//*[@id="inner-content"]/div[2]/div[1]/div[5]/div[1]/div/lib-city-history-observation/div/div[2]/table/tbody/tr/td[2]/table/tr[{i}]/td[3]"""   #seto o xpath da temperatura mínima
            numero_temperatura_minima = self.driver.find_element_by_xpath(xpath_elem_temperatura_minima)
            self.lst_temperatura_minima.append(numero_temperatura_minima.text)           #utilizo o .text para tirar os dados do site e guardo em uma lista 

        btn_mes = self.driver.find_element_by_xpath("""//*[@id="monthSelection"]""")  #seto o Xpath do botão da caixa de pesquisa do mês
        btn_mes.click()         #clico no botão setado
        sleep(1)
        btn_escolha_mes = self.driver.find_element_by_xpath(f"""//*[@id="monthSelection"]/option[12]""")       #seto o Xpath do botão de mês da minha escolha
        btn_escolha_mes.click()    #clico no botão setado
        sleep(1)
        btn_pesquisar = self.driver.find_element_by_xpath("""//*[@id="dateSubmit"]""")       #seto o Xpath do botão de pesquisar
        btn_pesquisar.click()    #clico no botão
        sleep(1)
        sleep(self.INTERVALO_ENTRE_PÁGINAS)    #intervalo entre as páginas para o site "respirar"
        
    def extrair_dezembro(self):
        """
        Função que tem como objetivo extrair os dados da página
        """
        for i in range(1, 33):
            xpath_elem_dia = f"""//*[@id="inner-content"]/div[2]/div[1]/div[5]/div[1]/div/lib-city-history-observation/div/div[2]/table/tbody/tr/td[1]/table/tr[{i}]/td"""    #seto o xpath das datas
            numero_dia = self.driver.find_element_by_xpath(xpath_elem_dia)          
            self.lst_dia.append(numero_dia.text)  #utilizo o .text para tirar os dados do site e guardo em uma lista

            xpath_elem_temperatura_maxima = f"""//*[@id="inner-content"]/div[2]/div[1]/div[5]/div[1]/div/lib-city-history-observation/div/div[2]/table/tbody/tr/td[2]/table/tr[{i}]/td[1]"""   #seto o xpath da temperatura máxima
            numero_temperatura_maxima = self.driver.find_element_by_xpath(xpath_elem_temperatura_maxima)           
            self.lst_temperatura_maxima.append(numero_temperatura_maxima.text)          #utilizo o .text para tirar os dados do site e guardo em uma lista  

            xpath_elem_temperatura_media = f"""//*[@id="inner-content"]/div[2]/div[1]/div[5]/div[1]/div/lib-city-history-observation/div/div[2]/table/tbody/tr/td[2]/table/tr[{i}]/td[2]"""   #seto o xpath da temperatura média
            numero_temperatura_media = self.driver.find_element_by_xpath(xpath_elem_temperatura_media)
            self.lst_temperatura_media.append(numero_temperatura_media.text)            #utilizo o .text para tirar os dados do site e guardo em uma lista 

            xpath_elem_temperatura_minima = f"""//*[@id="inner-content"]/div[2]/div[1]/div[5]/div[1]/div/lib-city-history-observation/div/div[2]/table/tbody/tr/td[2]/table/tr[{i}]/td[3]"""   #seto o xpath da temperatura mínima
            numero_temperatura_minima = self.driver.find_element_by_xpath(xpath_elem_temperatura_minima)
            self.lst_temperatura_minima.append(numero_temperatura_minima.text)           #utilizo o .text para tirar os dados do site e guardo em uma lista 
            
    def list_data(self):
        """
        Função que tem como objetivo listar os dados das páginas
        """
        print(self.lst_dia, end=" ")
        print(self.lst_temperatura_maxima, end=" ")
        print(self.lst_temperatura_media, end=" ")
        print(self.lst_temperatura_minima, end=" ")

    def fechar_navegador(self):
        """
        Função que tem como objetivo fechar a página
        """
        # Fechando o navegador
        chrome.quit()

# Chamando as  funções

In [11]:
ws = WebScraping()
sleep(10)
ws.aceitar_cookies()
sleep(7)
ws.extrair_janeiro()
sleep(5)
ws.extrair_fevereiro()
sleep(5)
ws.extrair_marco()
sleep(5)
ws.extrair_abril()
sleep(5)
ws.extrair_maio()
sleep(5)
ws.extrair_junho()
sleep(5)
ws.extrair_julho()
sleep(5)
ws.extrair_agosto()
sleep(5)
ws.extrair_setembro()
sleep(5)
ws.extrair_outubro()
sleep(5)
ws.extrair_novembro()
sleep(5)
ws.extrair_dezembro()
sleep(3)
ws.list_data()
sleep(1)

['Jan', '1', '2', '3', '4', '5', '6', '7', '8', '9', '10', '11', '12', '13', '14', '15', '16', '17', '18', '19', '20', '21', '22', '23', '24', '25', '26', '27', '28', '29', '30', '31', 'Feb', '1', '2', '3', '4', '5', '6', '7', '8', '9', '10', '11', '12', '13', '14', '15', '16', '17', '18', '19', '20', '21', '22', '23', '24', '25', '26', '27', '28', 'Mar', '1', '2', '3', '4', '5', '6', '7', '8', '9', '10', '11', '12', '13', '14', '15', '16', '17', '18', '19', '20', '21', '22', '23', '24', '25', '26', '27', '28', '29', '30', '31', 'Apr', '1', '2', '3', '4', '5', '6', '7', '8', '9', '10', '11', '12', '13', '14', '15', '16', '17', '18', '19', '20', '21', '22', '23', '24', '25', '26', '27', '28', '29', '30', 'May', '1', '2', '3', '4', '5', '6', '7', '8', '9', '10', '11', '12', '13', '14', '15', '16', '17', '18', '19', '20', '21', '22', '23', '24', '25', '26', '27', '28', '29', '30', '31', 'Jun', '1', '2', '3', '4', '5', '6', '7', '8', '9', '10', '11', '12', '13', '14', '15', '16', '17', '18

In [17]:
WebScraping_df = pd.DataFrame(
    {
        "Data": ws.lst_dia,
        "Temperatura Máxima": ws.lst_temperatura_maxima,
        "Temperatura Média": ws.lst_temperatura_media,
        "Temperatura Mínima": ws.lst_temperatura_minima      
    }
)
WebScraping_df

Unnamed: 0,Data,Temperatura Máxima,Temperatura Média,Temperatura Mínima
0,Jan,Max,Avg,Min
1,1,52,48.0,43
2,2,55,49.6,43
3,3,45,41.8,37
4,4,39,36.4,34
...,...,...,...,...
372,27,59,58.0,55
373,28,57,53.1,50
374,29,55,53.4,50
375,30,57,54.6,50


In [18]:
df = WebScraping_df

In [19]:
# Nomiando as colunas para melhor uso
df.columns = ['Data', 'Temp_Max', 'Temp_Med', 'Temp_Min']

In [20]:
# Checando as colunas
df.isnull().sum()

Data        0
Temp_Max    0
Temp_Med    0
Temp_Min    0
dtype: int64