In [2]:
import numpy as np
import pandas as pd

In [3]:
items_games = pd.read_parquet('items_games_util.parquet')
items_games

Unnamed: 0,genres,year_release,playtime_forever,user_id
0,Action,2000,6,76561197970982479
1,Action,2000,0,js41637
2,Action,2000,0,Riot-Punch
3,Action,2000,93,doctr
4,Action,2000,108,corrupted_soul
...,...,...,...,...
7461478,Indie,2016,46,76561198071808318
7461479,Action,2016,164,76561198107283457
7461480,Casual,2016,164,76561198107283457
7461481,Indie,2016,164,76561198107283457


In [4]:
generos = items_games['genres'].unique()
generos

array(['Action', 'RPG', 'Strategy', 'Casual', 'Simulation', 'Indie',
       'Racing', 'Sports', 'Adventure', 'Early Access', 'Free to Play',
       'Massively Multiplayer', 'Utilities', 'Animation &amp; Modeling',
       'Video Production', 'Design &amp; Illustration', 'Web Publishing',
       'Education', 'Software Training', 'Photo Editing',
       'Audio Production'], dtype=object)

In [19]:
def PlayTimeGenre(genero: str):
    '''
    devuelve el año con mas horas jugadas para dicho género

    Args: 
        genero (str): género del juego

    return:
        dict: diccionario con el género X y el año de lanzamiento con más horas jugadas
    
    '''
    diccionario = {'Action': 2012,
                   'RPG': 2011,
                   'Strategy': 2015,
                   'Casual': 2017,
                   'Simulation': 2006,
                   'Indie': 2013,
                   'Racing': 2016,
                   'Sports': 2013,
                   'Adventure': 2011,
                   'Early Access': 2013,
                   'Free to Play': 2017,
                   'Massively Multiplayer': 2013,
                   'Utilities': 2014,
                   'Animation &amp; Modeling': 2015,
                   'Video Production': 2015,
                   'Design &amp; Illustration': 2012,
                   'Web Publishing': 2012,
                   'Education': 2015,
                   'Software Training': 2015,
                   'Photo Editing': 2015,
                   'Audio Production': 2014}
    
    if genero in diccionario:
        return {f'Año de lanzamiento con más horas jugadas para el género {genero}' : diccionario[genero]}
    else:
        return "No se encontró un género similar al ingresado, ingrese otro tipo de género"

In [34]:
PlayTimeGenre('Indie')

{'Año de lanzamiento con más horas jugadas para el género Indie': 2013}

In [19]:
def UserForGenre(genero: str):
    '''
    devuelve el usuario con mas minutos jugados para dicho género

    Args: 
        genero (str): género del juego

    return:
        dict: diccionario con el género X y el usuario con más minutos jugados
    
    '''
    # Filtramos el dataframe 'items_games_util' respecto al parámetro genero
    df_util = items_games[items_games['genres']== genero]

    # Agrupamos el dataframe anterior por usuario, suma de minutos de juego y ordenamos en forma descendente
    agrupado = df_util.groupby('user_id')['playtime_forever'].sum().sort_values(ascending=False)

    # El valor máximo tendrá índice [0]
    user = agrupado.index[0]

    # tomamos las filas del dataframe util que contengan su repsectivo usuario (user)
    df_genero_user = df_util[df_util['user_id']==user]

    # agrupamos respecto a los años y suma de minutos de juego
    minutos_jugados = round(df_genero_user.groupby('year_release')['playtime_forever'].sum(), 3)

    # Guardamos la serie 'minutos_jugados' en una lista
    lista_minutos_jugados = [{f'Año': int(anio), 'Minutos': minutos} for anio, minutos in minutos_jugados.items()]

    return {f"Usuario con más minutos jugados para género {genero}": user, "Minutos jugados": lista_minutos_jugados}

In [20]:
UserForGenre('Web Publishing')

{'Usuario con más minutos jugados para género Web Publishing': 'H-Alo',
 'Minutos jugados': [{'Año': 2005, 'Minutos': 11},
  {'Año': 2012, 'Minutos': 5128},
  {'Año': 2015, 'Minutos': 5414}]}