In [1]:
import pandas as pd
from sklearn.metrics.pairwise import cosine_similarity

### Archivos a utilizar

In [2]:
m = pd.read_csv('merged_df.csv')

In [3]:
u = pd.read_csv('merged_df_2.csv')

In [4]:
ml = pd.read_csv('ml_df.csv')

### Funciones

In [5]:
def PlayTimeGenre(genero : str):
    
    genero = genero.capitalize()
            
    # Filtro segun genero
    df_gen = m[m.genres == genero]
    
    # Mensaje si el genero de entrada no esta en la colunma 'genres'
    if df_gen.empty:
        return f"No se encontraron juegos del género {genero}"
    
    # Agrupamiento por anio, sumo los tiempos 
    df_agrupado = df_gen.groupby('year')['playtime_forever'].sum().reset_index()
    
    #Anio con mas tiempo de juego
    anio_max_tiempo = df_agrupado[df_agrupado['playtime_forever'] == df_agrupado['playtime_forever'].max()]
    
    #Resultado
    res = {
        f"El año con más horas de juego para el género '{genero}' es {anio_max_tiempo.iloc[0]['year'].astype(int)}" 
        }
    return res

val = PlayTimeGenre('Action')
val

{"El año con más horas de juego para el género 'Action' es 2012"}

In [7]:
def UserForGenre(genero: str):
       
    genero = genero.capitalize()
    
    # Filtro segun genero
    df_gen = m[m.genres == genero]
    
    # Mensaje si el genero de entrada no esta en la colunma 'genres'
    if df_gen.empty:
        return f"No se encontraron juegos del género {genero}"
     
    # Encuentra al usuario con más horas jugadas   
    # DF 'Genres' + 'item_id'
    df_id_titles = df_gen['item_id'].drop_duplicates()
    # Filtro de DF 'u' segun el genero, en este filtro aparecen los titulos de dicho genero
    u_filt = u[u['item_id'].isin(df_id_titles)]
    
    # horas por jugador
    time_df = u_filt.groupby('user_id')['playtime_forever'].sum().reset_index()
    user = time_df.sort_values(by='playtime_forever', ascending=False).head(1) 
    user_max = user.iloc[0,0]
    
    #Calculo de horas jugadas segun el anio('year')
    acum_year = df_gen.groupby('year')['playtime_forever'].sum().reset_index()
    acum_year.rename(columns={'year': 'Año', 'playtime_forever': 'Horas'}, inplace=True)
    
    # Convierte los resultados en una lista de diccionarios
    lista = acum_year.to_dict(orient='records')
    
    # Resultado
    res = {
        f"Usuario con más horas jugadas para el género {genero}": user_max,
        "Horas jugadas por año": lista
    }
    
    return res

val = UserForGenre('Action')
val

{'Usuario con más horas jugadas para el género Action': 'shinomegami',
 'Horas jugadas por año': [{'Año': 1983, 'Horas': 3473.0},
  {'Año': 1984, 'Horas': 384.0},
  {'Año': 1988, 'Horas': 29963.0},
  {'Año': 1989, 'Horas': 607.0},
  {'Año': 1990, 'Horas': 18335.0},
  {'Año': 1991, 'Horas': 2502.0},
  {'Año': 1992, 'Horas': 1925.0},
  {'Año': 1993, 'Horas': 207486.0},
  {'Año': 1994, 'Horas': 120177.0},
  {'Año': 1995, 'Horas': 220444.0},
  {'Año': 1996, 'Horas': 67844.0},
  {'Año': 1997, 'Horas': 679534.0},
  {'Año': 1998, 'Horas': 3051101.0},
  {'Año': 1999, 'Horas': 3015967.0},
  {'Año': 2000, 'Horas': 18375563.0},
  {'Año': 2001, 'Horas': 1466293.0},
  {'Año': 2002, 'Horas': 2657516.0},
  {'Año': 2003, 'Horas': 14949771.0},
  {'Año': 2004, 'Horas': 132715006.0},
  {'Año': 2005, 'Horas': 15477918.0},
  {'Año': 2006, 'Horas': 464333329.0},
  {'Año': 2007, 'Horas': 24243244.0},
  {'Año': 2008, 'Horas': 49385120.0},
  {'Año': 2009, 'Horas': 215547883.0},
  {'Año': 2010, 'Horas': 2169257

In [8]:
def UsersRecommend(año : str):
    # Filtra el DataFrame para el año específico
    df_filtered = u[u['year'] == año]

    # Ordena el DataFrame por la columna 'sentiment_analysis' en orden descendente
    df_sorted = df_filtered.sort_values(by='sentiment_analysis', ascending=False)

    # Filtra los juegos que tienen un valor de 'recommend' igual a True
    df_top_recommendations = df_sorted[df_sorted['recommend']]

    # Obtiene los 3 juegos más recomendados
    top_3_recommended_games = df_top_recommendations.head(3)

    # El item_id de los 3 juegos recomendados
    items = top_3_recommended_games['item_id']
    
    # Titulo
    titulo = m[['item_id', 'title']].drop_duplicates()
    
    # Puestos
    puesto = []
    for i in items:
        c = titulo[titulo['item_id'] == i]
        if not c.empty:
            puesto.append(c.iloc[0]['title'])
    # Resultado    
    res = {
        f"Puesto 1": puesto[0],
        "Puesto 2": puesto[1] ,
        "Puesto 3": puesto[2]
    }
    return res

val = UsersRecommend(2011)
val


{'Puesto 1': 'Killing Floor',
 'Puesto 2': 'Prince of Persia®: The Sands of Time',
 'Puesto 3': 'Super Meat Boy'}

In [9]:
def UsersNotRecommend(año : str):
    # Filtra el DataFrame para el año específico
    df_filtered = u[u['year'] == año]

    # Ordena el DataFrame por la columna 'sentiment_analysis' en orden ascendente
    df_sorted = df_filtered.sort_values(by='sentiment_analysis', ascending=True)

    # Filtra los juegos que tienen un valor de 'recommend' igual a False
    df_top_recommendations = df_sorted[df_sorted['recommend'] == False]

    # Obtiene los 3 juegos menos recomendados
    top_3_recommended_games = df_top_recommendations.head(3)

    # El item_id de los 3 juegos recomendados
    items = top_3_recommended_games['item_id']
    
    # Titulo
    titulo = m[['item_id', 'title']].drop_duplicates()
    
    # Puestos
    puesto = []
    for i in items:
        c = titulo[titulo['item_id'] == i]
        if not c.empty:
            puesto.append(c.iloc[0]['title'])
            
    # Resultado    
    res = {}
    
    if len(puesto) > 0:
        res["Puesto 1"] = puesto[0]
    if len(puesto) > 1:
        res["Puesto 2"] = puesto[1]
    if len(puesto) > 2:
        res["Puesto 3"] = puesto[2]
    return res

val = UsersRecommend(2011)
val

{'Puesto 1': 'Killing Floor',
 'Puesto 2': 'Prince of Persia®: The Sands of Time',
 'Puesto 3': 'Super Meat Boy'}

In [10]:
def sentiment_analysis(año : int):
    
    # Filtra el DataFrame para el año específico
    df_filtered = u[u['year'] == año]
    
    # Resultado
    res = {}
    
    if not df_filtered.empty:
        sentiment_counts = df_filtered['sentiment_analysis'].value_counts()
        
        if 2 in sentiment_counts:
            res["Positivos"] = sentiment_counts[2]
        if 1 in sentiment_counts:
            res["Neutro"] = sentiment_counts[1]
        if 0 in sentiment_counts:
            res["Negativo"] = sentiment_counts[0]
    
    return res

val = sentiment_analysis(2011)
val


{'Positivos': 240, 'Neutro': 41, 'Negativo': 65}

In [11]:
def recommend_games(title : str):
    
    # Busca el índice del juego de entrada
    try:
        game_idx = ml[ml['title'] == title].index[0]
    except IndexError:
        return "El juego no se encuentra en la base de datos"

    # Excluimos la columna 'titulo_juego' antes de calcular la similitud
    X = ml.drop(columns=['title'])

    # Calcula la similitud del coseno entre los juegos
    similarities = cosine_similarity(X)

    # Ordena los juegos por similitud (excluyendo el juego de entrada)
    similar_games_indices = similarities[game_idx].argsort()[::-1][1:]

    # Recomienda los juegos más similares
    recommended_games_indices = similar_games_indices[:5]
    recommended_games = ml.loc[recommended_games_indices, 'title'].tolist()
    
    

    puestos = [1 , 2 , 3 , 4 , 5]

    diccionario_combinado = {p: j for p, j in zip(puestos, recommended_games)}

   # Mostrar el diccionario resultante
    return diccionario_combinado

# Ejemplo de uso
val = recommend_games( "Killing Floor")
val

{1: 'Left 4 Dead 2',
 2: 'Saints Row IV',
 3: 'Just Cause 2',
 4: 'METAL GEAR SOLID V: THE PHANTOM PAIN',
 5: 'Killing Floor'}