In [24]:
"""
=============================================================================================================================================================================================================
    Web Scraping de Livros - Books to Scrape
=============================================================================================================================================================================================================

📌 Descrição:
Este projeto demonstra como realizar web scraping em Python utilizando as bibliotecas requests, BeautifulSoup e pandas. O notebook coleta informações do site Books to Scrape, como título e preço dos livros, e organiza os dados em uma tabela estruturada para análise.

👨‍💻 Autor: CLEITON HENTGES
📅 Data: [28/08/2025]
💻 Linguagem: Python 3.x
"""



In [20]:
# bibliotecas necessárias
import requests
from bs4 import BeautifulSoup
import pandas as pd

In [21]:
# Desativar avisos para solicitações HTTPS não verificadas
requests.packages.urllib3.disable_warnings()

# URL para raspar
url = 'https://books.toscrape.com/'

# Envie uma solicitação GET para a URL
requisicao = requests.get(url)

#Obtenha o conteúdo da resposta
site =requisicao.text

# Analise o conteúdo HTML usando BeautifulSoup
extracao = BeautifulSoup(site , features="html.parser")

# Obtenha o conteúdo HTML
caracteres = extracao.prettify()

# imprima os primeiros 2000 caracteres
print(caracteres[:2000])

<!DOCTYPE html>
<!--[if lt IE 7]>      <html lang="en-us" class="no-js lt-ie9 lt-ie8 lt-ie7"> <![endif]-->
<!--[if IE 7]>         <html lang="en-us" class="no-js lt-ie9 lt-ie8"> <![endif]-->
<!--[if IE 8]>         <html lang="en-us" class="no-js lt-ie9"> <![endif]-->
<!--[if gt IE 8]><!-->
<html class="no-js" lang="en-us">
 <!--<![endif]-->
 <head>
  <title>
   All products | Books to Scrape - Sandbox
  </title>
  <meta content="text/html; charset=utf-8" http-equiv="content-type"/>
  <meta content="24th Jun 2016 09:29" name="created"/>
  <meta content="" name="description"/>
  <meta content="width=device-width" name="viewport"/>
  <meta content="NOARCHIVE,NOCACHE" name="robots"/>
  <!-- Le HTML5 shim, for IE6-8 support of HTML elements -->
  <!--[if lt IE 9]>
        <script src="//html5shim.googlecode.com/svn/trunk/html5.js"></script>
        <![endif]-->
  <link href="static/oscar/favicon.ico" rel="shortcut icon"/>
  <link href="static/oscar/css/styles.css" rel="stylesheet" type="tex

In [22]:
# Desativar avisos para solicitações HTTPS não verificadas
requests.packages.urllib3.disable_warnings()

# URL
url = 'https://books.toscrape.com/'

# Envie uma solicitação GET para a URL
requisicao = requests.get(url)

# Defina a codificação para utf-8
requisicao.encoding = 'utf-8'

# Analise o conteúdo HTML usando BeautifulSoup
extracao = BeautifulSoup(requisicao.text, 'html.parser')

# Inicializar variáveis
contar_livros = 0
catalogo = []

# Encontre todas as tags de artigos com a classe 'product_pod'
for artigo in extracao.find_all('article', class_='product_pod'):
   #Crie um dicionário vazio para cada livro
   livro = {}

   # Extraia o título completo do atributo 'title' da tag 'a' dentro da tag 'h3'
   titulo_completo = artigo.find('h3').find('a')['title']
   livro['Título'] = titulo_completo

   # Extraia o preço da tag 'p' com a classe 'price_color
   preco = artigo.find('p', class_='price_color').text
   livro['Preço'] = preco

   # Adicionar o dicionário do livro à lista do catálogo
   catalogo.append(livro)

   # Aumentar a contagem de livros
   contar_livros += 1

In [23]:
# Crie um DataFrame pandas a partir da lista de catálogos
df_catalogo = pd.DataFrame(catalogo)

# Exibir o DataFrame
display(df_catalogo)

Unnamed: 0,Título,Preço
0,A Light in the Attic,£51.77
1,Tipping the Velvet,£53.74
2,Soumission,£50.10
3,Sharp Objects,£47.82
4,Sapiens: A Brief History of Humankind,£54.23
5,The Requiem Red,£22.65
6,The Dirty Little Secrets of Getting Your Dream...,£33.34
7,The Coming Woman: A Novel Based on the Life of...,£17.93
8,The Boys in the Boat: Nine Americans and Their...,£22.60
9,The Black Maria,£52.15
