# Descarga de datos desde APIs públicas
---
## Consigna

Buscar información en APIs públicas (i.e Twitter, NewsAPI, Spotify, Google Apis, etc).

Extraer datos e importarlos a un dataframe realizando una exploración simple (i.e filas, columnas, tipos de datos). Se sugiere que estos datos complementen el dataset elegido en el Desafio “Elección de potenciales Datasets e importe con la librería Pandas”

---



## API a utilizar: RAWG

RAWG es la base de datos más grande de videojuegos que existe en la actualidad, además de ser un servicio de descubrimiento y recomendaciones de videojuegos. Comparten más de 500.000 datos sobre videojuegos, además de proveer recomendaciones basadas en machine learning.

Esta API puede servir de mucho para el proyecto de data science que se viene desarrollando en entregas anteriores, incluso podría servir para reemplazar la base de datos actual y enriquecerla con nueva data.

A continuación, se presenta una exploración de dicha API y la obtención de la data respectiva.

In [None]:
# Llibrerías a utilizar
import requests
import pandas as pd

In [None]:
# Clave de API de Rawg
api_key = "API"

# Número máximo de páginas a consultar
max_pages = 500

# Número máximo de juegos a obtener
max_games = 10000

# Lista vacía para almacenar los datos de los juegos
game_data = []

# Ciclo para obtener los datos de los juegos de cada página
for page in range(1, max_pages+1):
    # Si ya se han obtenido max_games juegos, salir del ciclo
    if len(game_data) >= max_games:
        break
    
    # URL de la API de Rawg para obtener los juegos de la página actual
    url = f"https://api.rawg.io/api/games?key={api_key}&page={page}"
    
    # Solicitud GET a la API de Rawg
    response = requests.get(url)
    
    # Convertir la respuesta JSON en un diccionario de Python
    data = response.json()

In [None]:
    # Obtener los datos de cada juego de la página actual y añadirlos a la lista
    for result in data["results"]:
        game_data.append({
            "Nombre": result.get("name", ""),
            "Fecha_Lanzamiento": result.get("released", ""),
            "Plataformas": ", ".join([platform["platform"]["name"] for platform in result.get("platforms", [])]),
            "Generos": ", ".join([genre["name"] for genre in result.get("genres", [])]),
            "Desarrolladores": ", ".join([developer["name"] for developer in result.get("developers", [])]),
            "Editores": ", ".join([publisher["name"] for publisher in result.get("publishers", [])]),
            "Puntuacion": result.get("rating", ""),
            "Puntuacion_Top": result.get("rating_top", ""),
            "Descripcion": result.get("description", ""),
            "URL_Imagen": result.get("background_image", ""),
            "Sitio_Web": result.get("website", ""),
            "Metracritic": result.get("metacritic", ""),
            "Rating_ESRB": result.get("esrb_rating")["name"] if result.get("esrb_rating") is not None else "",
            "Rating_PEGI": result.get("pegi_rating", {}).get("name", ""),
            "Tags": ", ".join([tag["name"] for tag in result.get("tags", [])]),
            "Comentarios": result.get("comments_count", ""),
            "Reviews": result.get("reviews_count", ""),
            "Playtime": result.get("playtime", ""),
            "Playtime_Completionist": result.get("playtime_completionist", ""),
            "Median_PLaytime": result.get("playtime_median", ""),
        })

    # Si no hay más páginas, salir del bucle
        if data["next"] is None:
          break

# Crear dataframe
df = pd.DataFrame(game_data)

# Mostrar el dataframe
df