In [23]:
from selenium import webdriver
from selenium.webdriver.chrome.service import Service
from selenium.webdriver.common.by import By
from selenium.webdriver.common.keys import Keys
import numpy as np
import pandas as pd
from datetime import datetime
from IPython.display import display,HTML
import pandasql as ps
import matplotlib.pyplot as plt

class Web_Scrapper:

    def __init__(self) -> None:
        pass

# crea lista de urls
    def list_maker_attribute(self,repeticion,lista,tag_name,attribute) -> list:
        """Crea una lista de valores de atributos, extrae elementos de otra lista identidicados por TAG_NAME, util para obtener URL. 

        Args:
            repeticion (_int_): Numero de veces que se itera
            lista (_list_): Lista que contiene los elementos html
            tag_name (_str_): Localizador tag (html)
            attribute (_str_): Atributo del que se desea obtener valor

        Returns:
            list: Lista de los valores del atributo deseado
        """
        lista_final=[]
        for i in range(repeticion):
            try:
                lista_final.append(lista[i].find_element(By.TAG_NAME,tag_name).get_attribute(attribute))
            except Exception:
                lista_final.append(np.nan)
        return lista_final

# crea lista de un elemento html especifico indicado por class name
    def list_maker_class(self,repeticion,lista,class_name) -> list:
        """Crea una lista de valores de atributos, extrae elementos de otra lista identidicados por CLASS_NAME, util para obtener contenido de elementos html. 

        Args:
            repeticion (_int_): Numero de veces que se itera
            lista (_list_): Lista que contiene los elementos html
            class_name (_str_): Valor del atributo class (html)

        Returns:
            list: Lista de los valores del atributo deseado (class)
        """
        lista_final=[]
        for i in range(repeticion):
            try:
                lista_final.append(lista[i].find_element(By.CLASS_NAME,class_name).text)
            except Exception:
                lista_final.append(np.nan)
        return lista_final    
    
# crea lista de un elemento html especifico indicado por class name dentro de un class name
    def list_maker_class2(self,repeticion,lista,class_name,class_name2) -> list:
        """Crea una lista de valores de atributos, extrae elementos de otra lista identidicados por CLASS_NAME dos ocasiones, util para obtener contenido de elementos html. 

        Args:
            repeticion (_int_): Numero de veces que se itera
            lista (_list_): Lista que contiene los elementos html
            class_name (_str_): Valor del atributo class (html)
            class_name2 (_str_): Valor del segundo atributo class (html)

        Returns:
            list: Lista de los valores del atributo deseado (class)
        """
        lista_final=[]
        for i in range(repeticion):
            try:
                lista_final.append(lista[i].find_element(By.CLASS_NAME,class_name).find_element(By.CLASS_NAME,class_name2).text)
            except Exception:
                lista_final.append(np.nan)
        return lista_final

    def delete_extra_info(self,lista,caracter) -> list:
        """Extrae substring de un string con metodo split, conserva la particion de interes.

        Args:
            lista (_list_): Lista con elementos que se quiere reducir
            caracter (_str_): Cadena a partir de la cual se haran particiones

        Returns:
            list: Lista con elementos reducidos
        """
        for i in range(len(lista)):
            lista[i]=lista[i].split(caracter)[0]
        return lista

    def to_binary(self,lista,condicion) -> list:
        """A partir de una condicion, sustituye por 1 si la condicion es cierta, 0 en otro caso para los elementos de una lista.

        Args:
            lista (_list_): Lista sin estandarizar
            condicion (_str_): Condicion que se tomara como verdadera (1)

        Returns:
            list: Lista con elementos 1 y 0, segun cumplan la condicion
        """
        for i in range(len(lista)):
            lista[i] = 1 if lista[i]==condicion else 0
        return lista

    def df_to_excel(self,dataframe,tienda,producto): #importa un dt a excel
        """Exporta un dataframe a un archivo .xlsx

        Args:
            dataframe (_dataframe_): Dataframe que se desea exportar
            tienda (_str_): Nombre de la tienda asociada al dataframe
            producto (_str_): Producto asociado al dataframe
        """
        dataframe.to_excel(f"scrapper_{tienda}_{producto}.xlsx")

    def imagen(self,path): #visualiza imagen (con url imagen)
        """"Ayuda a visualizar la URL como imagen.

        Args:
            path (_str_): URL de la imagen

        Returns:
            _str_: Representa elemento html
        """
        return f'<img src="{path}" width="250" >'
    

    def scrapping_walmart(self,producto:str) -> pd:
        """Web scrapper para el sitio de Walmart.

        Args:
            producto (str): producto del que se desea obtener dataframe

        Returns:
            pd: dataframe del producto
        """
        driver = webdriver.Chrome(service=Service("C://Users//basal//Downloads//chromedriver_win32//chromedriver.exe"))
        driver.implicitly_wait(15)
        #producto="the last of us"
        producto=producto.replace(" ","%20")
        driver.get(f"https://www.walmart.com.mx/productos?Ntt={producto}")
        driver.implicitly_wait(15)
        productos=driver.find_elements(By.CLASS_NAME,"product_container__3DSm4")

        lista_nombres=self.list_maker_class(len(productos),productos,"nav-link_navLink__2oJ29.product_name__1YFfY")
        lista_marcas=self.list_maker_class(len(productos),productos,"product_brand__1CsRr")
        lista_url_imagenes=self.list_maker_attribute(len(productos),productos,"img","src")
        lista_urls_productos=self.list_maker_attribute(len(productos),productos,"a","href")
        lista_precios=self.list_maker_class2(len(productos),productos,"product_price__2NBjj","text_text__3oq-D.text_large__K4EIS.text_bold__2Ptj-")

        data={"MARCA":lista_marcas,"PRODUCTO":lista_nombres,"PRECIO":lista_precios,"IMAGEN":lista_url_imagenes,"LINK":lista_urls_productos}
        df_walmart=pd.DataFrame(data)
        df_walmart.insert(0,"FECHA",datetime.now().strftime("%d/%m/%Y"))
        df_walmart.insert(1,"TIENDA","WALMART")
        df_walmart["PRECIO"]=df_walmart["PRECIO"].str.replace("$"," ")

        self.df_to_excel(df_walmart,"walmart",producto)

        display(HTML(df_walmart.to_html(escape=False,formatters=dict(IMAGEN=self.imagen))))



    def scrapping_claro(self,producto:str) -> pd:
        """Web scrapper para el sitio de Claro Shop.

        Args:
            producto (str): producto del que se desea obtener dataframe

        Returns:
            pd: dataframe del producto
        """
        driver = webdriver.Chrome(service=Service("C://Users//basal//Downloads//chromedriver_win32//chromedriver.exe"))
        driver.implicitly_wait(5)
        producto=producto.replace(" ","%20")
        driver.get(f"https://www.claroshop.com/resultados/q={producto}/pagina=1")
        driver.implicitly_wait(5)
        productos=driver.find_elements(By.CLASS_NAME,"cardProduct")

        lista_nombres=self.list_maker_class2(len(productos),productos,"contDataCard","h4")
        lista_urls_productos=self.list_maker_attribute(len(productos),productos,"a","href")
        lista_precios=self.list_maker_class2(len(productos),productos,"contDataCard","precio1")
        lista_precios_limpia=self.delete_extra_info(lista_precios," ") #Eliminamos info extra de la lista

        lista_envios=self.list_maker_class2(len(productos),productos,"expressFreeCont","envioGratis")
        lista_envios_binaria=self.to_binary(lista_envios,"Envío gratis") #Envio gratis = 1

        data={"PRODUCTO":lista_nombres,"PRECIO":lista_precios,"ENVIO":lista_envios_binaria,"LINK":lista_urls_productos}
        df_claro=pd.DataFrame(data)
        df_claro.insert(0,"FECHA",datetime.now().strftime("%d/%m/%Y"))
        df_claro.insert(1,"TIENDA","CLARO SHOP")
        df_claro["PRECIO"]=df_claro["PRECIO"].str.replace("$"," ")

        self.df_to_excel(df_claro,"claro_shop",producto)

        return df_claro


    def scrapping_game_planet(self,producto:str) -> pd:
        """Web scrapper para el sitio de Game Planet.

        Args:
            producto (str): producto del que se desea obtener dataframe

        Returns:
            pd: dataframe del producto
        """
        driver = webdriver.Chrome(service=Service("C://Users//basal//Downloads//chromedriver_win32//chromedriver.exe"))
        driver.implicitly_wait(5)
        producto=producto.replace(" ","%20")
        driver.get(f"https://gameplanet.com/?s={producto}&post_type=product&dgwt_wcas=1")
        driver.implicitly_wait(5)
        productos=driver.find_elements(By.CLASS_NAME,"product-small.box")

        lista_nombres=self.list_maker_class(len(productos),productos,"name.product-title.woocommerce-loop-product__title")
        lista_categorias=self.list_maker_class(len(productos),productos,"category.uppercase.is-smaller.no-text-overflow.product-cat.op-7")
        lista_estados=self.list_maker_class(len(productos),productos,"condicion.uppercase.is-smaller.no-text-overflow.product-condicion")
        lista_url_imagenes=self.list_maker_attribute(len(productos),productos,"img","src")
        lista_urls_productos=self.list_maker_attribute(len(productos),productos,"a","href")

        data={"CATEGORIAS":lista_categorias,"PRODUCTO":lista_nombres,"CONDICION":lista_estados,"IMAGEN":lista_url_imagenes,"LINK":lista_urls_productos}

        df_game_planet=pd.DataFrame(data)
        df_game_planet.insert(0,"FECHA",datetime.now().strftime("%d/%m/%Y"))
        df_game_planet.insert(1,"TIENDA","GAME PLANET")
        
        self.df_to_excel(df_game_planet,"game_planet",producto)

        df_game_planet
        display(HTML(df_game_planet.to_html(escape=False,formatters=dict(IMAGEN=self.imagen))))


In [16]:
WS_prueba1=Web_Scrapper()

WS_prueba1.scrapping_game_planet("mario kart")

Unnamed: 0,FECHA,TIENDA,CATEGORIAS,PRODUCTO,CONDICION,IMAGEN,LINK
0,16/12/2022,GAME PLANET,SOFTWARE,MARIO KART 8 DELUXE,NUEVO,,https://gameplanet.com/producto/mario-kart-8-deluxe-nsw/
1,16/12/2022,GAME PLANET,HARDWARE,CONSOLA NINTENDO SWITCH 32GB MARIO KART 8 DELUXE MAS 3 MESES NINTENDO ONLINE,NUEVO,,https://gameplanet.com/producto/consola-nintendo-switch-32gb-mario-kart-8-deluxe-mas-3-meses-nintendo-online-nsw/
2,16/12/2022,GAME PLANET,SOFTWARE,MARIO KART LIVE HOME CIRCUIT MARIO,NUEVO,,https://gameplanet.com/producto/mario-kart-live-home-circuit-mario-nsw/
3,16/12/2022,GAME PLANET,SOFTWARE,MARIO KART 7,USADO,,https://gameplanet.com/producto/mario-kart-7-3ds-usado/
4,16/12/2022,GAME PLANET,SOFTWARE,MARIO KART 8 DELUXE,USADO,,https://gameplanet.com/producto/mario-kart-8-deluxe-nsw-usado/
5,16/12/2022,GAME PLANET,SOFTWARE,MARIO KART LIVE HOME CIRCUIT LUIGI,NUEVO,,https://gameplanet.com/producto/mario-kart-live-home-circuit-luigi-nsw/
6,16/12/2022,GAME PLANET,OTROS EN HOGAR,IMAN MARIO KART 8,NUEVO,,https://gameplanet.com/producto/iman-mario-kart-8/
7,16/12/2022,GAME PLANET,PLAYERAS,PLAYERA MARIO KART STAR CUP ROJA CHICA,NUEVO,,https://gameplanet.com/producto/playera-mario-kart-star-cup-roja-chica/
8,16/12/2022,GAME PLANET,PLAYERAS,PLAYERA MARIO KART STAR CUP ROJA GRANDE,NUEVO,,https://gameplanet.com/producto/playera-mario-kart-star-cup-roja-grande/
9,16/12/2022,GAME PLANET,PLAYERAS,PLAYERA MARIO KART STAR CUP ROJA MEDIANA,NUEVO,,https://gameplanet.com/producto/playera-mario-kart-star-cup-roja-mediana/


In [19]:
WS_prueba2=Web_Scrapper()

WS_prueba2.scrapping_game_planet("control xbox")

Unnamed: 0,FECHA,TIENDA,CATEGORIAS,PRODUCTO,CONDICION,IMAGEN,LINK
0,16/12/2022,GAME PLANET,ACCESORIOS DE CONSOLAS,CONTROL XBOX INALAMBRICO MINERAL CAMO BLUE PARA XBOX SERIES X Y S,NUEVO,,https://gameplanet.com/producto/control-xbox-inalambrico-mineral-camo-blue-para-xbox-series-x-y-s-360/
1,16/12/2022,GAME PLANET,CONTROLES,CONTROL XBOX INALAMBRICO PULSE RED PARA XBOX ONE SERIES X Y S,NUEVO,,https://gameplanet.com/producto/control-xbox-inalambrico-pulse-red-para-xbox-one-series-x-y-s-xsx/
2,16/12/2022,GAME PLANET,ACCESORIOS DE CONSOLAS,CONTROL XBOX INALAMBRICO lunar shift PARA XBOX ONE SERIES X Y S,NUEVO,,https://gameplanet.com/producto/control-xbox-inalambrico-lunar-shift-para-xbox-one-series-x-y-s-xone/
3,16/12/2022,GAME PLANET,CONTROLES,CONTROL XBOX INALAMBRICO ROBOT WHITE PARA XBOX ONE SERIES X Y S,NUEVO,,https://gameplanet.com/producto/control-xbox-inalambrico-robot-white-para-xbox-one-series-x-y-s-xsx/
4,16/12/2022,GAME PLANET,CONTROLES,CONTROL XBOX INALAMBRICO ELECTRIC VOLT PARA XBOX ONE SERIES X Y S,NUEVO,,https://gameplanet.com/producto/control-xbox-inalambrico-electric-volt-para-xbox-one-series-x-y-s-xsx/
5,16/12/2022,GAME PLANET,CONTROLES,CONTROL XBOX INALAMBRICO CARBON BLACK PARA XBOX ONE SERIES X Y S,NUEVO,,https://gameplanet.com/producto/control-xbox-inalambrico-carbon-black-para-xbox-one-series-x-y-s-xone/
6,16/12/2022,GAME PLANET,CONTROLES,CONTROL XBOX ONE ALAMBRICO POWER A METALLIC RED,NUEVO,,https://gameplanet.com/producto/control-xbox-one-alambrico-power-a-metallic-redxone/
7,16/12/2022,GAME PLANET,CONTROLES,CONTROL XBOX ONE ELITE INALAMBRICO SERIE 2,NUEVO,,https://gameplanet.com/producto/control-xbox-one-elite-inalambrico-serie-2-xone/
8,16/12/2022,GAME PLANET,CONTROLES,CONTROL XBOX ONE ALAMBRICO POWER A METALLIC BLUE,NUEVO,,https://gameplanet.com/producto/control-xbox-one-alambrico-power-a-metallic-blue-xone/
9,16/12/2022,GAME PLANET,CONTROLES,CONTROL XBOX ONE ALAMBRICO POWER A ROJO,NUEVO,,https://gameplanet.com/producto/control-xbox-one-alambrico-power-a-rojo-xone/


In [21]:
WS_prueba3=Web_Scrapper()

dt1=WS_prueba3.scrapping_game_planet("call of duty")



Unnamed: 0,FECHA,TIENDA,CATEGORIAS,PRODUCTO,CONDICION,IMAGEN,LINK
0,16/12/2022,GAME PLANET,SOFTWARE,CALL OF DUTY MODERN WARFARE II,NUEVO,,https://gameplanet.com/producto/call-of-duty-modern-warfare-ii-ps4/
1,16/12/2022,GAME PLANET,SOFTWARE,CALL OF DUTY MODERN WARFARE II,NUEVO,,https://gameplanet.com/producto/call-of-duty-modern-warfare-ii-ps5/
2,16/12/2022,GAME PLANET,SOFTWARE,CALL OF DUTY BLACK OPS IIII,NUEVO,,https://gameplanet.com/producto/call-of-duty-black-ops-iiii-ps4/
3,16/12/2022,GAME PLANET,SOFTWARE,CALL OF DUTY INFINITE WARFARE,NUEVO,,https://gameplanet.com/producto/call-of-duty-infinite-warfare-xone/
4,16/12/2022,GAME PLANET,SOFTWARE,CALL OF DUTY WORLD WAR II,NUEVO,,https://gameplanet.com/producto/call-of-duty-world-war-ii-xone/
5,16/12/2022,GAME PLANET,SOFTWARE,CALL OF DUTY BLACK OPS III ZOMBIES,NUEVO,,https://gameplanet.com/producto/call-of-duty-black-ops-iii-zombies-xone/
6,16/12/2022,GAME PLANET,SOFTWARE,CALL OF DUTY VANGUARD,NUEVO,,https://gameplanet.com/producto/call-of-duty-vanguard-xsx/
7,16/12/2022,GAME PLANET,SOFTWARE,CALL OF DUTY BLACK OPS III ZOMBIES,NUEVO,,https://gameplanet.com/producto/call-of-duty-black-ops-iii-zombies-ps4/
8,16/12/2022,GAME PLANET,SOFTWARE,CALL OF DUTY VANGUARD,NUEVO,,https://gameplanet.com/producto/call-of-duty-vanguard-xone/
9,16/12/2022,GAME PLANET,SOFTWARE,CALL OF DUTY WORLD WAR II INGLES,NUEVO,,https://gameplanet.com/producto/call-of-duty-world-war-ii-ingles-ps4/
