# Web Scraping com Python - Atividade Prática

Nesta atividade, vamos explorar técnicas básicas de web scraping utilizando Python. O objetivo é aprender a extrair dados textuais de uma página web e entender como podemos manipular e melhorar o código para obter melhores resultados.

## Objetivos da Atividade

1. Executar um script de web scraping simples que extrai títulos e parágrafos de uma página web.
2. Analisar os resultados obtidos e identificar possíveis melhorias.
3. Sugerir e implementar modificações no código para melhorar a qualidade dos dados extraídos.

## Passo 1: Executando o Script Simples

In [None]:
import requests
from bs4 import BeautifulSoup

# URL base da página de reviews
base_url = "https://opencritic.com/game/18226/death-stranding-2-on-the-beach/reviews"

# Define o número de páginas que você quer extrair (ajuste conforme necessário)
num_pages_to_scrape = 1000

for page_number in range(1, num_pages_to_scrape + 1):
    # Constrói a URL para a página atual
    if page_number == 1:
        url = base_url
    else:
        url = f"{base_url}?page={page_number}"

    print(f"Raspando a página: {url}")

    try:
        # Faz a requisição HTTP
        response = requests.get(url)
        # Se a requisição falhar (por exemplo, página não encontrada), levanta uma exceção
        response.raise_for_status()

        content = response.content
        soup = BeautifulSoup(content, 'html.parser')

        # Encontra todas as linhas de reviews
        app_review_rows = soup.find_all("app-review-row")

        if not app_review_rows:
            print("Não há mais reviews. Fim da raspagem.")
            break # Sai do loop se não encontrar mais reviews

        # Itera sobre cada linha de review e extrai os dados
        for app_review_row in app_review_rows:
            title_tag = app_review_row.find("div", class_="review-publication-title")
            numbered_score = app_review_row.find(class_="score-number-bold")
            # Para a pontuação com estrela, você precisa contar quantas estrelas a review tem
            starred_score_container = app_review_row.find(class_="score-stars")
            starred_count = 0
            if starred_score_container:
                starred_count = len(starred_score_container.find_all("i", class_="fas fa-star"))

            review = app_review_row.find(class_="mb-0 wspw")
            date = app_review_row.find(class_="text-right date-block")

            print("-" * 20)

            if title_tag:
                print(f"Veículo: {title_tag.get_text(strip=True)}")

            if numbered_score:
                print(f"Nota numérica: {numbered_score.get_text(strip=True)}")

            if starred_count > 0:
                print(f"Nota com estrela: {starred_count} de 5")

            if review:
                print(f"Review: {review.get_text(strip=True)}")

            if date:
                print(f"Data: {date.get_text(strip=True)}")

    except requests.exceptions.RequestException as e:
        print(f"Erro ao acessar a URL {url}: {e}")
        break # Sai do loop em caso de erro

Raspando a página: https://opencritic.com/game/18226/death-stranding-2-on-the-beach/reviews
--------------------
Nota numérica: 8 / 10
Review: Death Stranding 2: On the Beach is a marked improvement over the original game with engaging gameplay and jaw-dropping graphics.
Data: Jun 28, 2025
--------------------
Nota numérica: 9 / 10.0
Review: Death Stranding 2: On the Beach is a triumphant sequel that emphatically delivers on the promise of its original.
Data: Jun 23, 2025
--------------------
Nota numérica: 4 / 5
Review: A busier, louder, and more emotionally resplendent take on this singular hiking sim.
Data: Jun 23, 2025
--------------------
Review: It’s about human connection, losing loved ones, and stepping out into the wild regardless of the horrors that may await. Learning to go on that journey and accept a willingness to grow is half the battle, and after reaching the end of this ordeal, you’ll never be the same again. Keep on keeping on.
Data: Jun 23, 2025
--------------------


## Passo 2: Análise dos Resultados

Após a execução do script, faça uma análise crítica dos resultados obtidos. Considere as seguintes questões:

- **Completude dos dados:** Todos os títulos e parágrafos relevantes foram capturados? Há elementos que não foram extraídos, mas que poderiam ser importantes?
- **Precisão dos dados:** Existe algum conteúdo irrelevante ou que poderia ser filtrado para melhorar a qualidade dos dados? Existem "ruídos"?
- **Estrutura dos dados:** A estrutura dos dados extraídos está adequada para uma análise subsequente?

## Passo 3: Sugestões de Melhoria

Com base na análise dos resultados, proponha melhorias no código. Aqui estão algumas sugestões que podem servir como ponto de partida:

- **Filtragem de conteúdo:** Adicionar condições para excluir elementos que não sejam relevantes (por exemplo, parágrafos com conteúdo inadequado para a análise).
- **Extração de outros elementos:** Se necessário, expandir o script para capturar outros tipos de conteúdo, como listas (`<ul>`, `<ol>`), links (`<a>`), ou imagens (`<img>`).
- **Tratamento de erros:** Implementar verificações para garantir que a página foi carregada corretamente antes de tentar extrair os dados.

Sinta-se à vontade para explorar e modificar o código conforme necessário. A criatividade e a análise crítica são bem-vindas!

## Passo 4: Implementação das Melhorias

Depois de sugerir as melhorias, implemente-as no código. Execute novamente o script e compare os resultados com a versão original. Documente suas alterações e justificativas.


**Documentação da biblioteca disponível em:** https://www.crummy.com/software/BeautifulSoup/bs4/doc/