# Experimentación para desarrollar funciones API necesarias
En esta Notebook se desarrollan y prueban las funciones que son solicitadas para la API. Al desplegarlas, podrían ajustarse por requisitos de FastAPI o Render.

## Importaciones

In [8]:
import pandas as pd
import json
%load_ext autoreload
%autoreload 2
import warnings
warnings.filterwarnings("ignore")


The autoreload extension is already loaded. To reload it, use:
  %reload_ext autoreload


## Carga de los dataset necesarios

In [9]:
# Cargar el archivo Parquet en un DataFrame
max_playtime_by_genre_year = pd.read_parquet('../Datasets/max_playtime_by_genre_year.parquet')
max_playtime_per_genre = pd.read_parquet('../Datasets/max_playtime_per_genre.parquet')
summary_playtime_per_year = pd.read_parquet('../Datasets/summary_playtime_per_year.parquet')


## Función PlayTimeGenre(genero:str)
La función PlayTimeGenre tiene por parametro 'genero', filtrará los datos por el género proporcionado y calculará el año con más horas jugadas para ese género.<br>
Ejemplo de retorno: {"Año de lanzamiento con más horas jugadas para Género X" : 2013}


In [10]:
def PlayTimeGenre(genero: str):
    # La función PlayTimeGenre tiene por parametro 'genero', filtrará los datos por el género proporcionado
    # y calculará el año con más horas jugadas para ese género..

    # Convertir el género a minúsculas para hacer la comparación sin ser sensible a mayúsculas
    genero = genero.lower()

    # Verificar si el género está presente en el DataFrame
    if genero not in max_playtime_by_genre_year['genres'].str.lower().unique():
        return {"Error": f"El género '{genero}' no se encuentra en el conjunto de datos."}

    # Filtrar el DataFrame por el género proporcionado
    genre_data = max_playtime_by_genre_year[max_playtime_by_genre_year['genres'].str.lower() == genero]

    # Obtener el año con más horas jugadas para el género dado
    max_playtime_year = genre_data['release_year'].values[0] if not genre_data.empty else None



    # Crear el diccionario para el formato JSON
    result = {f'Año de lanzamiento con más horas jugadas para {genero.capitalize()}': str(max_playtime_year)}

    return result

In [12]:
# Ejemplo de uso de la función con un género específico, por ejemplo, 'Shooter'
genre_result = PlayTimeGenre('rpg')

# Convertir el resultado a formato JSON
json_result = json.dumps(genre_result, ensure_ascii=False)
print(json_result)


{"Año de lanzamiento con más horas jugadas para Rpg": "2011"}


## Función UserForGenre(genero:str)
Esta función tiene por parametro 'genero', debe devolver el usuario que acumula más horas jugadas para el género dado y una lista de la acumulación de horas jugadas por año.<br>
Ejemplo de retorno: {"Usuario con más horas jugadas para Género X" : us213ndjss09sdf, "Horas jugadas":[{Año: 2013, Horas: 203}, {Año: 2012, Horas: 100}, {Año: 2011, Horas: 23}]}

In [16]:
def UserForGenre(genre: str):
    # Esta función tiene por parametro 'genero', debe devolver el usuario que acumula más horas jugadas 
    # para el género dado y una lista de la acumulación de horas jugadas por año.

    genre = genre.lower()  # Convertir el género a minúsculas para ser insensible a mayúsculas/minúsculas

    # Filtrar por el género deseado en el dataframe max_playtime_per_genre
    genre_data = max_playtime_per_genre[max_playtime_per_genre['genres'].str.lower() == genre]

    if len(genre_data) == 0:
        return "Género no encontrado"

    # Obtener el usuario con más horas jugadas para el género dado
    max_playtime_user = genre_data.loc[genre_data['playtime_forever'].idxmax()]['user_id']

    # Filtrar por el género deseado en el dataframe summary_playtime_per_year
    genre_year_data = summary_playtime_per_year[summary_playtime_per_year['user_id'].isin(genre_data['user_id'])]

    # Agrupar y sumar las horas jugadas por año, excluyendo los años con 0 horas jugadas
    yearly_hours = genre_year_data.groupby('release_year')['playtime_total_hours'].sum().reset_index()
    yearly_hours = yearly_hours[yearly_hours['playtime_total_hours'] > 1]

    # Crear un diccionario con el formato solicitado
    hours_by_year = [
        {'Año': int(year), 'Horas': int(hours)}
        for year, hours in zip(yearly_hours['release_year'], yearly_hours['playtime_total_hours'])
    ]

    # Formato de salida en JSON
    output = {
        f'Usuario con más horas jugadas para Género {genre.capitalize()}': max_playtime_user,
        'Horas jugadas': hours_by_year
    }

    return json.dumps(output, ensure_ascii=False, indent=4)

In [17]:
# Ejemplo de uso de la función
genero_deseado = 'action'  # Reemplaza 'Género X' con el género específico que desees buscar
resultado_json = UserForGenre(genero_deseado)
print(resultado_json)  # Imprimir el resultado en formato JSON

{
    "Usuario con más horas jugadas para Género Action": "Sp3ctre",
    "Horas jugadas": [
        {
            "Año": 1995,
            "Horas": 10
        },
        {
            "Año": 1997,
            "Horas": 4
        },
        {
            "Año": 1999,
            "Horas": 10
        },
        {
            "Año": 2000,
            "Horas": 1177
        },
        {
            "Año": 2001,
            "Horas": 4
        },
        {
            "Año": 2002,
            "Horas": 7
        },
        {
            "Año": 2003,
            "Horas": 129
        },
        {
            "Año": 2004,
            "Horas": 2134
        },
        {
            "Año": 2005,
            "Horas": 355
        },
        {
            "Año": 2006,
            "Horas": 3040
        },
        {
            "Año": 2007,
            "Horas": 1932
        },
        {
            "Año": 2008,
            "Horas": 149
        },
        {
            "Año": 2009,
            "Horas": 1902