In [11]:
import requests
from bs4 import BeautifulSoup
import json

# URL de la página de Steam
url = "https://store.steampowered.com/search/?sort_by=_ASC&supportedlang=latam&os=win&filter=globaltopsellers"

# Realizar la solicitud HTTP a la página
response = requests.get(url)
soup = BeautifulSoup(response.text, 'html.parser')

# Encontrar todos los enlaces de los juegos
game_links = []

# Los enlaces están dentro de los elementos 'a' con clase 'search_result_row'
games = soup.find_all('a', class_='search_result_row')

for game in games:
    link = game.get('href')
    if link.startswith('https://store.steampowered.com/app/'):
        game_links.append(link)

# Guardar los enlaces en un archivo JSON
output_file = 'steam_game_links.json'
with open(output_file, 'w') as f:
    json.dump(game_links, f, indent=4)

print(f'Se han guardado {len(game_links)} enlaces de juegos en {output_file}')


Se han guardado 50 enlaces de juegos en steam_game_links.json


In [13]:
import requests
from bs4 import BeautifulSoup
import json
import time  # Para pausas entre solicitudes

# Función para extraer datos de un juego dado su URL
def extract_game_data(url):
    response = requests.get(url)
    soup = BeautifulSoup(response.text, 'html.parser')

    # Inicializar variables para almacenar los datos
    game_name = ""
    developer_name = ""
    publisher_name = ""
    reviews_count = ""
    release_date = ""
    price = ""

    # Extraer los datos del juego
    # Nombre del juego
    game_name_elem = soup.find('div', class_='apphub_AppName')
    if game_name_elem:
        game_name = game_name_elem.text.strip()

    # Desarrollador y Editor
    developer_elem = soup.find('div', class_='dev_row')
    if developer_elem:
        # Intentamos encontrar el desarrollador
        developer_link = developer_elem.find('a')
        if developer_link:
            developer_name = developer_link.text.strip()

        # Intentamos encontrar el editor
        publisher_link = developer_elem.find_next_sibling('div').find('a')
        if publisher_link:
            publisher_name = publisher_link.text.strip()

    # Cantidad de reseñas generales
    reviews_elem = soup.find('span', class_='responsive_hidden')
    if reviews_elem:
        reviews_count = reviews_elem.text.strip()

    # Fecha de lanzamiento
    release_date_elem = soup.find('div', class_='date')
    if release_date_elem:
        release_date = release_date_elem.text.strip()

    # Precio
    price_elem = soup.find('div', class_='game_purchase_price')
    if price_elem:
        price = price_elem.text.strip()

    # Crear un diccionario con los datos del juego
    game_data = {
        'Nombre del juego': game_name,
        'Desarrollador': developer_name,
        'Editor': publisher_name,
        'Cantidad de reseñas': reviews_count,
        'Fecha de lanzamiento': release_date,
        'Precio': price
    }

    return game_data

# Leer los enlaces de juegos desde el archivo JSON
with open('steam_game_links.json', 'r') as f:
    game_links = json.load(f)

# Lista para almacenar todos los datos de los juegos
all_game_data = []

# Iterar sobre cada enlace y extraer los datos del juego
for link in game_links:
    print(f'Extrayendo datos de: {link}')
    game_data = extract_game_data(link)
    all_game_data.append(game_data)
    time.sleep(2)  # Pausa de 2 segundos entre solicitudes para ser considerado un buen ciudadano web

# Guardar los datos en un archivo JSON
output_file = 'steam_game_data.json'
with open(output_file, 'w') as f:
    json.dump(all_game_data, f, indent=4)

print(f'Se han extraído los datos de {len(all_game_data)} juegos y se han guardado en {output_file}')


Extrayendo datos de: https://store.steampowered.com/app/1245620/ELDEN_RING/?snr=1_7_7_globaltopsellers_150_1
Extrayendo datos de: https://store.steampowered.com/app/2778580/ELDEN_RING_Shadow_of_the_Erdtree/?snr=1_7_7_globaltopsellers_150_1
Extrayendo datos de: https://store.steampowered.com/app/730/CounterStrike_2/?snr=1_7_7_globaltopsellers_150_1
Extrayendo datos de: https://store.steampowered.com/app/1675200/Steam_Deck/?snr=1_7_7_globaltopsellers_150_1
Extrayendo datos de: https://store.steampowered.com/app/1085660/Destiny_2/?snr=1_7_7_globaltopsellers_150_1
Extrayendo datos de: https://store.steampowered.com/app/570/Dota_2/?snr=1_7_7_globaltopsellers_150_1
Extrayendo datos de: https://store.steampowered.com/app/1551360/Forza_Horizon_5/?snr=1_7_7_globaltopsellers_150_1
Extrayendo datos de: https://store.steampowered.com/app/1086940/Baldurs_Gate_3/?snr=1_7_7_globaltopsellers_150_1
Extrayendo datos de: https://store.steampowered.com/app/553850/HELLDIVERS_2/?snr=1_7_7_globaltopsellers_1