In [20]:
# Import des bibliothèques nécessaires
import requests
from bs4 import BeautifulSoup
import pandas as pd
import os
import shutil

# URL de la page principale qui contient tous les Pokémon
base_url = "https://pokemondb.net"
main_url = f"{base_url}/pokedex/national"

# Création d'un dossier pour stocker les images des Pokémon
os.makedirs("pokemon_images", exist_ok=True)

# Initialiser une liste vide pour stocker les données de chaque Pokémon
pokemon_data = []

# Télécharger et analyser le contenu de la page principale
response = requests.get(main_url)
soup = BeautifulSoup(response.text, 'html.parser')

# Trouver tous les liens vers les pages individuelles des Pokémon
pokemon_links = soup.select('.infocard a.ent-name')

# Limiter le nombre de Pokémon pour tester le script
pokemon_links = pokemon_links[:893]

# Boucle pour traiter chaque lien vers un Pokémon
for link in pokemon_links:
    # Construire l'URL complète de la page du Pokémon
    pokemon_url = base_url + link['href']
    pokemon_name = link.text

    # Télécharger et analyser la page du Pokémon
    response = requests.get(pokemon_url)
    pokemon_soup = BeautifulSoup(response.text, 'html.parser')

    # Trouver tous les tableaux avec des données (classe 'vitals-table')
    tables = pokemon_soup.find_all('table', class_='vitals-table')

    # Dictionnaire pour stocker les données du Pokémon actuel
    data = {"Name": pokemon_name}

    # Vérifier que les 4 tableaux sont présents
    if len(tables) >= 4:
        # 1. Extraire les données du tableau "Pokédex data"
        for row in tables[0].find_all('tr'):
            key = row.th.text.strip()
            value = row.td.text.strip()
            data[key] = value

        # 2. Extraire les données du tableau "Training"
        for row in tables[1].find_all('tr'):
            key = row.th.text.strip()
            value = row.td.text.strip()
            data[key] = value

        # 3. Extraire les données du tableau "Breeding"
        for row in tables[2].find_all('tr'):
            key = row.th.text.strip()
            value = row.td.text.strip()
            data[key] = value

        # 4. Extraire les données du tableau "Base stats"
        for row in tables[3].find_all('tr'):
            if row.th:
                key = row.th.text.strip()
                value = row.td.text.strip()
                data[key] = value

    # Ajouter les données du Pokémon actuel à la liste principale
    pokemon_data.append(data)

    # Télécharger l'image du Pokémon
    image = pokemon_soup.find('img', class_='img-fixed')
    if image:
        image_url = image['src']
        image_response = requests.get(image_url, stream=True)
        image_path = f"pokemon_images/{pokemon_name}.png"
        with open(image_path, 'wb') as file:
            shutil.copyfileobj(image_response.raw, file)
        print(f"Image téléchargée pour {pokemon_name}")

# Convertir les données en un DataFrame Pandas
df = pd.DataFrame(pokemon_data)

# Sauvegarder les données dans un fichier CSV
df.to_csv('pokemon_data.csv', index=False)
print("Données sauvegardées dans 'pokemon_data.csv'")


Image téléchargée pour Bulbasaur
Image téléchargée pour Ivysaur
Image téléchargée pour Venusaur
Image téléchargée pour Charmander
Image téléchargée pour Charmeleon
Image téléchargée pour Charizard
Image téléchargée pour Squirtle
Image téléchargée pour Wartortle
Image téléchargée pour Blastoise
Image téléchargée pour Caterpie
Image téléchargée pour Metapod
Image téléchargée pour Butterfree
Image téléchargée pour Weedle
Image téléchargée pour Kakuna
Image téléchargée pour Beedrill
Image téléchargée pour Pidgey
Image téléchargée pour Pidgeotto
Image téléchargée pour Pidgeot
Image téléchargée pour Rattata
Image téléchargée pour Raticate
Image téléchargée pour Spearow
Image téléchargée pour Fearow
Image téléchargée pour Ekans
Image téléchargée pour Arbok
Image téléchargée pour Pikachu
Image téléchargée pour Raichu
Image téléchargée pour Sandshrew
Image téléchargée pour Sandslash
Image téléchargée pour Nidoran♀
Image téléchargée pour Nidorina
Image téléchargée pour Nidoqueen
Image téléchargé