In [5]:
import requests
from bs4 import BeautifulSoup

# Função para extrair informações de uma revisão
def extract_review_info(review, order):
    user_name = review.find('div', class_='meta-title').text.strip()
    rating = review.find('span', class_='stareval-note').text.strip()
    review_date = review.find('span', class_='review-card-meta-date light').text.strip()
    review_content = review.find('div', class_='content-txt review-card-content').text.strip()
    return f"Ordem Geral: {order}\nNome do usuário: {user_name}\nNota: {rating}\nData da avaliação: {review_date}\nCrítica: {review_content}\n"

# Função para obter as críticas com base na posição ou trazer todas as críticas
def get_reviews(url, position=None):
    try:
        # Fazer a requisição HTTP para a página
        response = requests.get(url)
        response.raise_for_status()  # Verifica se a resposta HTTP foi bem-sucedida

        # Criar um objeto BeautifulSoup para analisar o HTML da página
        bs = BeautifulSoup(response.text, 'html.parser')

        # Encontrar a div com a classe "pagination-item-holder"
        pagination_div = bs.find('div', class_='pagination-item-holder')

        if pagination_div is None:
            raise Exception("Div de paginação não encontrada")

        # Encontrar todos os spans dentro da div de paginação
        spans = pagination_div.find_all('span')

        # Inicializar uma lista para armazenar os valores numéricos dos spans
        numeric_values = []

        # Examinar os spans e adicionar seus valores numéricos à lista
        for span in spans:
            text = span.text.strip()  # Remove espaços em branco
            if text.isnumeric():
                numeric_values.append(int(text))  # Converte para int e adiciona à lista

        # Se a lista de valores numéricos não estiver vazia
        if numeric_values:
            # Encontre o valor máximo na lista de valores numéricos
            max_value = max(numeric_values)

            # Inicializar uma lista para armazenar as críticas
            reviews = []

            # Inicializar um contador global de críticas
            global_review_count = 0

            # Iterar sobre os links
            for i in range(1, max_value + 1):
                page_url = f"{url}?page={i}"

                # Fazer a requisição HTTP para a página de críticas
                response = requests.get(page_url)
                response.raise_for_status()  # Verifica se a resposta HTTP foi bem-sucedida

                # Criar um objeto BeautifulSoup para analisar o HTML da página de críticas
                page_bs = BeautifulSoup(response.text, 'html.parser')

                # Encontrar todas as divs com a classe "hred review-card cf" na página de críticas
                review_divs = page_bs.find_all('div', class_='hred review-card cf')

                # Iterar sobre as divs de críticas e adicionar as informações de cada revisão à lista de críticas
                for order, review_div in enumerate(review_divs, start=1):
                    global_review_count += 1
                    review_info = extract_review_info(review_div, global_review_count)
                    reviews.append(review_info)

            # Se a posição for especificada, retornar apenas a crítica naquela posição
            if position is not None and position >= 1 and position <= len(reviews):
                return [reviews[position - 1]]

            return reviews

    except requests.exceptions.RequestException as e:
        print(f"Erro na requisição HTTP: {e}")
    except Exception as e:
        print(f"Erro: {e}")


###LINK PARA TESTES

url = 'https://www.adorocinema.com/filmes/filme-232669/criticas/espectadores/'

##REGISTRO ESPECÍFICO
print("\n#########################################################################################\n")
# Exemplo de uso para trazer uma crítica específica (posição 3, por exemplo)
specific_review = get_reviews(url, position=517)
if specific_review:
    for review in specific_review:
        print(review)

print("\n#########################################################################################\n")
# Exemplo de uso para trazer todas as críticas
all_reviews = get_reviews(url)
if all_reviews:
    for review in all_reviews:
        print(review)


#########################################################################################

Ordem Geral: 517
Nome do usuário: Victor R
Nota: 4,5
Data da avaliação: Enviada em 2 de junho de 2019
Crítica: filme perfeito sem defeito algum bem estruturado, ótimo roteiro e excelentes atores um incrível final para os vingadores


#########################################################################################

Ordem Geral: 1
Nome do usuário: Um visitante
Nota: 4,0
Data da avaliação: Enviada em 7 de maio de 2019
Crítica: O que você vai ter quando entrar no cinema será um filme inevitavelmente superexpositivo com informações demais e que se sustenta inteiramente em seus 21 antecessores para ser inteiramente compreendido, e algumas soluções e desculpas que o roteiro dá para justificar uma ou outra coisa realmente testam a fidelidade do público cativo, e quem assiste meio ''de fora'' de tudo, as considera forçadas( a questão da máquina do tempo e o ''sumiço'' e falta de importância da C

In [8]:
# Função para obter as críticas com base na posição ou trazer todas as críticas
def get_reviews(url, position=None):
    try:
        # Fazer a requisição HTTP para a página
        response = requests.get(url)
        response.raise_for_status()  # Verifica se a resposta HTTP foi bem-sucedida

        # Criar um objeto BeautifulSoup para analisar o HTML da página
        bs = BeautifulSoup(response.text, 'html.parser')

        # Encontrar a div com a classe "pagination-item-holder"
        pagination_div = bs.find('div', class_='pagination-item-holder')

        if pagination_div is None:
            raise Exception("Div de paginação não encontrada")

        # Encontrar todos os spans dentro da div de paginação
        spans = pagination_div.find_all('span')

        # Inicializar uma lista para armazenar os valores numéricos dos spans
        numeric_values = []

        # Examinar os spans e adicionar seus valores numéricos à lista
        for span in spans:
            text = span.text.strip()  # Remove espaços em branco
            if text.isnumeric():
                numeric_values.append(int(text))  # Converte para int e adiciona à lista

        # Se a lista de valores numéricos não estiver vazia
        if numeric_values:
            # Encontre o valor máximo na lista de valores numéricos
            max_value = max(numeric_values)

            # Inicializar uma lista para armazenar as críticas
            reviews = []

            # Inicializar um contador global de críticas
            global_review_count = 0

            # Inicializar uma variável para calcular a média das avaliações
            total_ratings = 0

            # Iterar sobre os links
            for i in range(1, max_value + 1):
                page_url = f"{url}?page={i}"

                # Fazer a requisição HTTP para a página de críticas
                response = requests.get(page_url)
                response.raise_for_status()  # Verifica se a resposta HTTP foi bem-sucedida

                # Criar um objeto BeautifulSoup para analisar o HTML da página de críticas
                page_bs = BeautifulSoup(response.text, 'html.parser')

                # Encontrar todas as divs com a classe "hred review-card cf" na página de críticas
                review_divs = page_bs.find_all('div', class_='hred review-card cf')

                # Iterar sobre as divs de críticas e adicionar as informações de cada revisão à lista de críticas
                for order, review_div in enumerate(review_divs, start=1):
                    global_review_count += 1
                    review_info = extract_review_info(review_div, global_review_count)
                    reviews.append(review_info)

                    # Extrair a nota da revisão e adicionar à soma total das avaliações
                    rating = review_div.find('span', class_='stareval-note')
                    if rating:
                        rating_text = rating.text.strip().replace(',', '.')  # Substituir ',' por '.'
                        total_ratings += float(rating_text)  # Converter para float


            # Calcular a média das avaliações
            average_rating = total_ratings / global_review_count

            # Se a posição for especificada, retornar apenas a crítica naquela posição
            if position is not None and position >= 1 and position <= len(reviews):
                return {
                    "Quantidade de Críticas": global_review_count,
                    "Média de Avaliações": average_rating,
                    "Crítica Específica": reviews[position - 1]
                }

            return {
                "Quantidade de Críticas": global_review_count,
                "Média de Avaliações": average_rating,
                "Críticas": reviews
            }

    except requests.exceptions.RequestException as e:
        print(f"Erro na requisição HTTP: {e}")
    except Exception as e:
        print(f"Erro: {e}")


In [9]:

url = 'https://www.adorocinema.com/filmes/filme-232669/criticas/espectadores/'

print("\n#########################################################################################\n")
# Exemplo de uso para trazer uma crítica específica (posição 3, por exemplo)

specific_review = get_reviews(url, position=517)
if specific_review:
    print(f"Quantidade de Críticas: {specific_review['Quantidade de Críticas']}")
    print(f"Média de Avaliações: {specific_review['Média de Avaliações']}")
    print(specific_review["Crítica Específica"])
print("\n#########################################################################################\n")
# Exemplo de uso para trazer todas as críticas
all_reviews = get_reviews(url)
if all_reviews:
    print(f"Quantidade de Críticas: {all_reviews['Quantidade de Críticas']}")
    print(f"Média de Avaliações: {all_reviews['Média de Avaliações']}")
    for review in all_reviews["Críticas"]:
        print(review)


#########################################################################################

Quantidade de Críticas: 519
Média de Avaliações: 4.246628131021194
Ordem Geral: 517
Nome do usuário: Victor R
Nota: 4,5
Data da avaliação: Enviada em 2 de junho de 2019
Crítica: filme perfeito sem defeito algum bem estruturado, ótimo roteiro e excelentes atores um incrível final para os vingadores


#########################################################################################

Quantidade de Críticas: 519
Média de Avaliações: 4.246628131021194
Ordem Geral: 1
Nome do usuário: Um visitante
Nota: 4,0
Data da avaliação: Enviada em 7 de maio de 2019
Crítica: O que você vai ter quando entrar no cinema será um filme inevitavelmente superexpositivo com informações demais e que se sustenta inteiramente em seus 21 antecessores para ser inteiramente compreendido, e algumas soluções e desculpas que o roteiro dá para justificar uma ou outra coisa realmente testam a fidelidade do público cativo, e 