In [53]:
from selenium import webdriver
from selenium.webdriver.chrome.options import Options
from selenium.webdriver.common.keys import Keys
from selenium.webdriver.common.action_chains import ActionChains
from selenium.webdriver.common.by import By
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
from selenium.common.exceptions import NoSuchElementException
from selenium.common.exceptions import TimeoutException
from selenium.common.exceptions import StaleElementReferenceException
from selenium.common.exceptions import WebDriverException
import pandas as pd
from bs4 import BeautifulSoup
import requests

class Navegador:
    def __init__(self):
        # Configurar opções do Chrome
        options = Options()
        options.add_argument("--enable-automation")
        options.add_argument("--start-maximized")
        options.add_argument("--disable-notifications")
        options.add_argument("--disable-popup-blocking")

        # Inicializar o WebDriver do Chrome com as opções configuradas
        #self.driver = webdriver.Remote(command_executor="http://localhost:4444/wd/hub", options=options)
        self.driver = webdriver.Chrome(options=options)
        self.wait = WebDriverWait(self.driver, 10)
        self.by = By
        self.locator = {
            "XPATH": By.XPATH,
            "ID": By.ID,
            "CLASS_NAME": By.CLASS_NAME,
            "LINK_TEXT": By.LINK_TEXT,
            "NAME": By.NAME,
            "PARTIAL_LINK_TEXT": By.PARTIAL_LINK_TEXT,
            "TAG_NAME": By.TAG_NAME
        }

    async def get(self, url):
        # await asyncio.sleep(0)
        self.driver.get(url)
    async def close(self):
    #  await asyncio.sleep(0)
        self.driver.quit()   

    async def close_session(self, session_id):
        grid_url = "http://localhost:4444/wd/hub"
        session_url = f"{grid_url}/session/{session_id}"
        response = requests.delete(session_url)
        if response.status_code == 200:
            print("Sessão fechada com sucesso!")
        else:
            print("Falha ao fechar a sessão.")

        return response    
    # Funcao para digitar no elemento           
    async def sendkeys(self, element, tag, keys):

    #  await asyncio.sleep(0)
        if element in self.locator:
            try:
                self.wait.until(EC.presence_of_element_located((self.locator[element], tag))).send_keys(keys)
            except TimeoutException:
                print("Elemento não encontrado")
                
    # Funcao para clicar no elemento                
    async def click(self, element, tag):
    #  await asyncio.sleep(0)
        if element in self.locator:
            try:
                self.wait.until(EC.visibility_of_element_located((self.locator[element], tag))).click()
            except TimeoutException:    
                print("Elemento não encontrado")

    async def get_table_element(self, element, tag):
        try:
            # Obter o conteúdo HTML da tag <tbody>
            html_content = self.wait.until(EC.visibility_of_element_located((self.locator[element], tag))).get_attribute('innerHTML')
            # Extrair dados da tabela e transforma em dataframe
            data = await self.table_to_dataframe(html_content)
            qtd_linhas = len(data)
            return data, qtd_linhas
        except TimeoutException:
            print("Elemento não encontrado")

    async def table_to_dataframe(self, html_content):

        soup = BeautifulSoup(html_content, 'html.parser')

        # Encontra a tabela desejada (selecionando-a pela classe, id ou outras características)
        table = soup.find('table')

        # Verifica se a tabela foi encontrada
        if table:
            # Inicializa uma lista para armazenar os dados da tabela
            table_data = []
            # Itera sobre as linhas da tabela (<tr>)
            for row in table.find_all('tr'):
                # Inicializa uma lista para armazenar os dados de uma linha
                row_data = []
                # Itera sobre as células da linha (<td>)
                for cell in row.find_all(['td']):
                    # Adiciona o texto da célula à lista de dados da linha
                    value = cell.text.strip()
                    # Verifica se o valor não está vazio
                    if value:
                        row_data.append(value)
                    # Verifica se a célula contém uma tag de âncora (hiperlink)
                    link = cell.find('a')
                    if link:
                        # Se houver uma tag de âncora, adiciona o link (href) à lista de dados da linha
                        row_data.append(link.get('href'))
                # Adiciona os dados da linha à lista de dados da tabela
                if row_data:
                    table_data.append(row_data)
            
            # Imprime os dados da tabela
            
            df = pd.DataFrame(table_data)
            df.to_excel('arquivo.xlsx', index=False)

            return df 

In [54]:
navegador = Navegador()

**Todos as funcoes abaix pertencem ao arquivo bot.py, elas vao utilizar as classes scraper para criar as automacoes.

In [55]:
async def login(user, password):
  await navegador.get('https://www.ciganasdooriente.com.br/gerencial_nfpcBWk2PVYJ/default.php')

  await navegador.sendkeys('ID', 'FLogin', user)
  await navegador.sendkeys('ID', 'FSenha', password)
  
  await navegador.click('XPATH', '/html/body/div/div[2]/form/button')

  await navegador.click('XPATH', '/html/body/table/tbody/tr[2]/th/ul/li[4]')

async def create_data_bubble(json_data):
  import json
  url = 'https://consium.com.br/version-test/api/1.1/obj/esoteric-perfis'
  headers = {
      'Authorization': 'Bearer d523a04a372905b9eb07d90000bee51a',
      'Content-Type': 'application/json'
      }

  
  response = requests.request("POST", url, data=json_data, headers=headers)

  print(response.text)

async def format_profile_table():
  await navegador.click('ID', 'select')
  await navegador.click('XPATH', '/html/body/table/tbody/tr[3]/td/table/tbody/tr/td/table/tbody/tr[3]/th/table/tbody/tr/td[1]/select/option[9]')

  table = await navegador.get_table_element('XPATH', '/html/body/table/tbody/tr[3]/td/table/tbody/tr/td/table/tbody/tr[4]/th')

  df = pd.DataFrame(table[0])

  df = df.rename(columns={
    0: 'ID',
    1: 'Nome',
    2: 'Link',
    3: 'CPF',
    4: 'Creditos',
    5: 'Status',
    6: 'SiteVinculado',
  })

  df = df.drop(df.index[0])

  df = df.iloc[:, :7]
  site = '1713232817453x483766471272943900'
  for index, row in df.iterrows():
    #coloca o id do site na coluna site
    row['SiteVinculado'] = site
    
  
  return df


In [69]:
async def check_profiles(Site=None):
    import json
    
    await login('helioteste', 'helioteste')
    #busca o site no bubble

    table = await format_profile_table()
    url = 'https://consium.com.br/version-test/api/1.1/obj/esoteric-perfis'
    headers = {
    'Authorization': 'Bearer d523a04a372905b9eb07d90000bee51a',
    'Content-Type': 'application/json'
    }

    response = requests.request("GET", url, headers=headers)

    data_from_bubble = response.json()

    profiles_ids = {int(profile['ID']) for profile in data_from_bubble['response']['results']}

    if response.status_code == 200:
        for index, row in table.iterrows():
            print(row['ID'])
            if int(row['ID']) in profiles_ids:
                print('Item ja existe')

            else:
                print('Item nao existe')
                json_row = json.dumps({
                "ID": row['ID'],
                "Nome": row['Nome'],
                "Link": row['Link'],
                "CPF": row['CPF'],
                "SiteVinculado": row['SiteVinculado'],
                #"Site": row['Site'],
                })
                await create_data_bubble(json_row)
    else:
        print('Erro ao buscar os dados')

#caso o usuario nao esteja cadastrado faz o cadastro
#cadastra os dados de cada usuario 
    await navegador.close()
    

  #Campo Creditos deve ser convertido para float
  #Campo de site vinculado deve carregar o ID do site que vai fazer a busca
  #Campo Status pode excluir, provavelmente nao sera utilizado

  #deve ser feito um loop para salvar todos os dados que estao no json para o bubble

  

In [70]:
await check_profiles('a')

250
Item ja existe
223
Item ja existe
247
Item ja existe
99
Item ja existe
273
Item ja existe
231
Item ja existe
54
Item ja existe
279
Item ja existe
194
Item ja existe
264
Item ja existe
284
Item ja existe
266
Item ja existe
190
Item ja existe
182
Item ja existe
43
Item ja existe
165
Item ja existe
114
Item ja existe
208
Item ja existe
228
Item ja existe
283
Item ja existe
33
Item ja existe
218
Item ja existe
22
Item ja existe
285
Item ja existe
191
Item ja existe
97
Item ja existe
158
Item ja existe
221
Item ja existe
10
Item ja existe
281
Item ja existe
187
Item ja existe
110
Item ja existe
254
Item ja existe
195
Item ja existe
287
Item ja existe
58
Item ja existe
233
Item ja existe
280
Item ja existe
207
Item ja existe
278
Item ja existe
265
Item ja existe
253
Item ja existe
180
Item ja existe
256
Item ja existe
246
Item ja existe
274
Item ja existe
72
Item ja existe
137
Item ja existe
48
Item ja existe
199
Item ja existe
210
Item ja existe
150
Item ja existe
239
Item ja existe
176

In [161]:
await create_data_bubble(json_)

ValueError: too many values to unpack (expected 2)

In [95]:

df = pd.DataFrame(table[0])



In [127]:
from flask import jsonify

df = df.drop(df.index[0])
json_dta = df.to_json(orient='records')
print(json_dta)

[{"Codigo":"273","Nome":"Aguida Cigana","Link":"Pg.Edicao.php?Codigo=273","CPF":"239.609.508-02","Creditos":"R$ 44,94","Obs":"Offline","6":"Desconectar\nDeletar\nCr\u00e9ditos\nLog de Acessos\nLog de Status","7":null,"8":null,"9":null,"10":null,"11":null,"12":null,"13":null},{"Codigo":"231","Nome":"Alba","Link":"Pg.Edicao.php?Codigo=231","CPF":"080.373.609-62","Creditos":"R$ 13,44","Obs":"Offline","6":"Desconectar\nDeletar\nCr\u00e9ditos\nLog de Acessos\nLog de Status","7":null,"8":null,"9":null,"10":null,"11":null,"12":null,"13":null},{"Codigo":"54","Nome":"Allano D\u00b4Ogum","Link":"Pg.Edicao.php?Codigo=54","CPF":"478.756.405-63","Creditos":"R$ 93,60","Obs":"Offline","6":"Desconectar\nDeletar\nCr\u00e9ditos\nLog de Acessos\nLog de Status","7":null,"8":null,"9":null,"10":null,"11":null,"12":null,"13":null},{"Codigo":"279","Nome":"Alma","Link":"Pg.Edicao.php?Codigo=279","CPF":"839.062.159-20","Creditos":"R$ 23,94","Obs":"Ocupado","6":"Desconectar\nDeletar\nCr\u00e9ditos\nLog de Acesso

In [99]:
#df = df.drop(df.index[1])
df.to_excel('arquivo.xlsx', index=False)

In [165]:
import json

url = 'https://consium.com.br/version-test/api/1.1/obj/esoteric-perfis'
headers = {
    'Authorization': 'Bearer d523a04a372905b9eb07d90000bee51a',
    'Content-Type': 'application/json'
    }

data = json.dumps ({
   "ID":"99",
   "Nome":"Adna Cigana",
   "Link":"Pg.Edicao.php?Codigo=99",
   "CPF":"022.110.677-43",
   "Creditos":"R$ 58,08",
   "Status":"Offline",
   "SiteVinculado":"Desconectar\nDeletar\nCréditos\nLog de Acessos\nLog de Status"
}
)
response = requests.request("POST", url, data=data, headers=headers)

print(response.text)



{
    "status": "success",
    "id": "1713234324380x771559742436192000"
}
