In [None]:
import requests
from bs4 import BeautifulSoup
import pandas as pd

# URL de base
url = "http://quotes.toscrape.com"

# Étape 1 : Téléchargeons la page
response = requests.get(url)
if response.status_code != 200:
    print("Erreur lors de la récupération de la page")
else:
    print("Page récupérée avec succès")

# Étape 2 : Parser le contenu HTML
soup = BeautifulSoup(response.text, 'html.parser')

# Étape 3 : Extraction des données
citations = []
auteurs = []
tags_liste = []

# Parcour des blocs de citations
for quote_block in soup.find_all('div', class_='quote'):
    # Citation
    citation = quote_block.find('span', class_='text').get_text(strip=True)
    citations.append(citation)

    # Auteur
    auteur = quote_block.find('small', class_='author').get_text(strip=True)
    auteurs.append(auteur)

    # Tags
    tags = [tag.get_text(strip=True) for tag in quote_block.find_all('a', class_='tag')]
    tags_liste.append(", ".join(tags))

# Étape 4 : Stocker les données dans un DataFrame
data = pd.DataFrame({
    "Citation": citations,
    "Auteur": auteurs,
    "Tags": tags_liste
})

# Afficher un aperçu des données
print(data.head())

# Étape 5 : Exporter les données
data.to_csv("quotes.csv", index=False)
print("Données exportées vers 'quotes.csv'")

Page récupérée avec succès
                                            Citation           Auteur  \
0  “The world as we have created it is a process ...  Albert Einstein   
1  “It is our choices, Harry, that show what we t...     J.K. Rowling   
2  “There are only two ways to live your life. On...  Albert Einstein   
3  “The person, be it gentleman or lady, who has ...      Jane Austen   
4  “Imperfection is beauty, madness is genius and...   Marilyn Monroe   

                                           Tags  
0        change, deep-thoughts, thinking, world  
1                            abilities, choices  
2  inspirational, life, live, miracle, miracles  
3              aliteracy, books, classic, humor  
4                    be-yourself, inspirational  
Données exportées vers 'quotes.csv'
