In [1]:
import requests
import re

def verificar_scielo_por_titulo_ano(titulo, ano):
    """
    Verifica se um artigo está indexado na SciELO usando web scraping (busca por título e ano).

    Args:
        titulo (str): O título do artigo.
        ano (int): O ano de publicação do artigo.

    Returns:
        bool: True se o artigo for encontrado na SciELO, False caso contrário.
    """

    # URL de busca da SciELO
    search_url = "https://search.scielo.org/?"
    query_params = {
        "q": titulo,
        # "lang": "pt",  # Para filtrar por linguagem, conforme necessário
        "count": 10,    # Número de resultados a serem buscados (ajuste conforme necessário)
        "from": 0,
        "output": "site"
    }

    # Definir headers e user-agent
    headers = {
        'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3' 
    }

    try:
        # Incluir os headers na requisição
        response = requests.get(search_url, params=query_params, headers=headers)
        response.raise_for_status()  # Lançar exceção se houver erro na requisição

        # Analisar os resultados da busca usando expressões regulares
        resultados = re.findall(r'<div class="result">.*?<a class="doc-title".*?>(.*?)</a>.*?<span class="doc-year">(.*?)</span>', response.text, re.DOTALL)
        for titulo_encontrado, ano_encontrado in resultados:
            if titulo_encontrado.lower().strip() == titulo.lower() and ano_encontrado.strip() == str(ano):
                return True

    except requests.exceptions.RequestException as e:
        print(f"Erro na requisição à SciELO: {e}")

    return False

In [2]:
doi = "https://doi.org/10.1590/S0104-11692008000100023"
titulo = "Aluminum as a risk factor for Alzheimer's disease"
ano = '2008'
verificar_scielo_por_titulo_ano(titulo, ano)

False