##### Instalando/atualizando o Selenium

In [2]:
from selenium import webdriver
from selenium.webdriver.chrome.service import Service
from webdriver_manager.chrome import ChromeDriverManager

servico = Service(ChromeDriverManager().install())
driver = webdriver.Chrome(service=servico)

##### Importando as bibliotecas

In [3]:
from selenium.webdriver.common.keys import Keys
from selenium.webdriver.common.by import By
import pandas as pd
import pyautogui as pag
import openpyxl
import time

##### Iniciando o navegador

In [12]:
acoes = [] # Criando uma lista vazia onde serão armazenadas as ações Top 5 com maior ROE (Retorno sobre o patrimônio)

site_statusinvest = r'https://statusinvest.com.br/acoes' # Armazenando o site inicial em uma variável

driver.get (site_statusinvest) # Abrindo o site no navegador

for numero in range(1,7):    
    xpath = f'//*[@id="main-2"]/section[3]/div/div[3]/div[2]/table/tbody/tr[{numero}]/td[1]/a/div[2]/h4/strong' # Armazenando o xpath do elemento HTML onde estão as ações Top 5 com maior ROE
    acao = driver.find_element(By.XPATH, xpath) # Armazenando em uma variável a ação
    acao = acao.text.casefold() # Transformando o texto em letras minúsculas
    acoes.append(acao) # Adicionando a ação a lista de ações
    print(acao)
print(acoes)

acoes_dados = [] # Lista para armazenar os dados das ações

try: 

    for acao in acoes:     
        # Navegando para a página da ação específica
        driver.get(f"{site_statusinvest}/{acao}") 
        
        # Extraindo os dados de indicadores (exemplo de XPaths; esses XPaths devem ser ajustados de acordo com a estrutura da página)
        nome = driver.find_element(By.XPATH, '//*[@id="main-header"]/div[2]/div/div[1]/h1/small').text
        ticker = acao.upper()
        valor_atual = float(driver.find_element(By.XPATH, '//*[@id="main-2"]/div[2]/div/div[1]/div/div[1]/div/div[1]/strong').text.replace('.', '').replace(',', '.'))
        min_52cw = float(driver.find_element(By.XPATH, '//*[@id="main-2"]/div[2]/div/div[1]/div/div[2]/div/div[1]/strong').text.replace('.', '').replace(',', '.'))
        max_52cw = float(driver.find_element(By.XPATH, '//*[@id="main-2"]/div[2]/div/div[1]/div/div[3]/div/div[1]/strong').text.replace('.', '').replace(',', '.'))
        dividend_yield = driver.find_element(By.XPATH, '//*[@id="main-2"]/div[2]/div/div[1]/div/div[4]/div/div[1]/strong').text
        valorizacao_12m = driver.find_element(By.XPATH, '//*[@id="main-2"]/div[2]/div/div[1]/div/div[5]/div/div[1]/strong').text
        pl = driver.find_element(By.XPATH, '//*[@id="indicators-section"]/div[2]/div/div[1]/div/div[2]/div/div/strong').text
        margem_bruta = driver.find_element(By.XPATH, '//*[@id="indicators-section"]/div[2]/div/div[3]/div/div[1]/div/div/strong').text
        margem_liquida = driver.find_element(By.XPATH, '//*[@id="indicators-section"]/div[2]/div/div[3]/div/div[4]/div/div/strong').text
        roe = driver.find_element(By.XPATH, '//*[@id="indicators-section"]/div[2]/div/div[4]/div/div[1]/div/div/strong').text
        roic = driver.find_element(By.XPATH, '//*[@id="indicators-section"]/div[2]/div/div[4]/div/div[3]/div/div/strong').text
        cagr_receitas_5anos = driver.find_element(By.XPATH, '//*[@id="indicators-section"]/div[2]/div/div[5]/div/div[1]/div/div/strong').text
        cagr_lucros_5anos = driver.find_element(By.XPATH, '//*[@id="indicators-section"]/div[2]/div/div[5]/div/div[2]/div/div/strong').text
        patrimonio_liquido = float(driver.find_element(By.XPATH, '//*[@id="company-section"]/div[1]/div/div[2]/div[1]/div/div/strong').text.replace('.', '').replace(',', '.'))
        valor_de_mercado = float(driver.find_element(By.XPATH, '//*[@id="company-section"]/div[1]/div/div[2]/div[7]/div/div/strong').text.replace('.', '').replace(',', '.'))
        setor = driver.find_element(By.XPATH, '//*[@id="company-section"]/div[1]/div/div[3]/div/div[1]/div/div/div/a/strong').text
        subsetor = driver.find_element(By.XPATH, '//*[@id="company-section"]/div[1]/div/div[3]/div/div[2]/div/div/div/a/strong').text
        segmento = driver.find_element(By.XPATH, '//*[@id="company-section"]/div[1]/div/div[3]/div/div[3]/div/div/div/a/strong').text
        
        # Armazenando os dados em um dicionário
        dados_acao = {
            'nome': nome,
            'ticker': ticker,
            'valor_atual': valor_atual,
            'min_52cw': min_52cw,
            'max_52cw': max_52cw,
            'dividend_yield': dividend_yield,
            'valorizacao_12m': valorizacao_12m,
            'p/l': pl,
            'margem_bruta': margem_bruta,
            'margem_liquida': margem_liquida,
            'roe': roe,
            'roic': roic,
            'cagr_receitas_5anos': cagr_receitas_5anos,
            'cagr_lucros_5anos': cagr_lucros_5anos,
            'patrimonio_liquido': patrimonio_liquido,
            'valor_de_mercado': valor_de_mercado,
            'setor': setor,
            'subsetor': subsetor,
            'segmento': segmento
        }
    
        # Adicionando o dicionário à lista
        acoes_dados.append(dados_acao)

    # Criando um DataFrame com os dados extraídos
    df = pd.DataFrame(acoes_dados)

    # Salve o DataFrame em um novo arquivo Excel
    df.to_excel(r'C:\000 - Arquivos\Educação\Habilidades e Treinamentos\Hashtag Treinamentos\Python\Projetos Finais\python_projeto_final_2_web_scraping_selenium\data\acoes_dados.xlsx', index=False)

    print("Base de dados criada com sucesso!")

    pag.alert( # Exibindo uma Msgbox informando que o script foi concluído com sucesso
        title='Extração realizada com sucesso', 
        text='Base de dados criada com sucesso!', 
        button='OK'
    )
    
except Exception as erro:
        
        pag.alert( # Exibindo uma Msgbox informando que o script foi concluído com sucesso
            title='Erro ao extrair os dados', 
            text=f'Erro ao recuperar informações do site.\n\nMensagem de erro: {erro}', 
            button='OK'
        )




bbse3
leve3
cury3
plpl3
odpv3
egie3
['bbse3', 'leve3', 'cury3', 'plpl3', 'odpv3', 'egie3']
Base de dados criada com sucesso!
