In [1]:
from flask import Flask, jsonify
from threading import Thread
import requests
import time
from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.chrome.service import Service
import logging

# Configuração de logging
logging.basicConfig(level=logging.INFO)

# Criar a aplicação Flask
app = Flask(__name__)

@app.route('/scrape', methods=['GET'])
def scrape_and_save():
    try:
        url = 'https://www.spacemoney.com.br/ultimas-noticias'
        driver.get(url)
        news = []
        elements = driver.find_elements(By.XPATH, '//div[@class="linkNoticia crop"]')
        for element in elements[:5]:
            title = element.text
            link = element.find_element(By.TAG_NAME, 'a').get_attribute('href')
            news.append({'title': title, 'link': link})
        return jsonify({'message': 'News scraped and saved successfully', 'news': news}), 200
    except Exception as e:
        logging.error("Erro ao raspar as notícias: %s", e)
        return jsonify({'message': 'Erro ao raspar as notícias'}), 500

def run():
    app.run(host='0.0.0.0', port=5005)  # Mudança para a porta 5005

# Iniciar a API Flask em uma thread separada
t = Thread(target=run)
t.start()

# Configurar o serviço do ChromeDriver
chrome_driver_path = '/usr/bin/chromedriver'  # Substitua pelo caminho do seu ChromeDriver
service = Service(chrome_driver_path)

# Configurar as opções do Chrome
chrome_options = webdriver.ChromeOptions()
chrome_options.add_argument('--headless')
chrome_options.add_argument('--no-sandbox')
chrome_options.add_argument('--disable-dev-shm-usage')

# Inicializar o WebDriver
try:
    driver = webdriver.Chrome(service=service, options=chrome_options)
except Exception as e:
    logging.error("Erro ao iniciar o WebDriver: %s", e)
    raise

# Esperar alguns segundos para garantir que o WebDriver está pronto
time.sleep(5)

# Fazer uma requisição GET para a API
try:
    response = requests.get('http://127.0.0.1:5005/scrape')
    response.raise_for_status()  # Levanta um erro para respostas com status 4xx/5xx
    print(response.json())
except requests.exceptions.RequestException as e:
    logging.error("Erro ao fazer a requisição GET: %s", e)

# Fechar o driver
driver.quit()



 * Serving Flask app '__main__'
 * Debug mode: off


 * Running on all addresses (0.0.0.0)
 * Running on http://127.0.0.1:5005
 * Running on http://192.168.100.8:5005
INFO:werkzeug:[33mPress CTRL+C to quit[0m
INFO:werkzeug:127.0.0.1 - - [10/Jun/2024 12:40:08] "GET /scrape HTTP/1.1" 200 -


{'message': 'News scraped and saved successfully', 'news': [{'link': 'https://www.spacemoney.com.br/investimentos/acoes/oi-oibr3-oibr4-executivos-renunciam-conselho-comites-estrategicos/209416/', 'title': 'Ações\nOi (OIBR3)(OIBR4): 4 executivos renunciam cargos no Conselho de Administração e comitês estratégicos\nEmpresa ainda não divulgou quem substituirá os membros, nem detalhou os motivos das saídas\n12h10 - 10 Jun 2024Por José Chacon'}, {'link': 'https://www.spacemoney.com.br/noticias/recomendacoes/as-acoes-mais-recomendadas-para-a-semana-de-10-a-14-de-junho/209415/', 'title': 'Carteiras recomendadas\nAs ações mais recomendadas para a semana de 10 a 14 de junho\nOs papéis de BB Seguridade (BBSE3), BRF (BRFS3) e Vale (VALE3) foram os mais citados em cinco carteiras de casas, corretoras e plataformas de análise\n12h06 - 10 Jun 2024Por Lucas de Andrade'}, {'link': 'https://www.spacemoney.com.br/investimentos/acoes/altas-e-baixas-do-ibovespa-petrobras-petr3-petr4-prio-prio3/209414/', '