In [1]:
import pandas as pd
from sklearn.feature_extraction.text import TfidfVectorizer
from sklearn.metrics.pairwise import cosine_similarity
import random


def read_recomendacion_juego(id_juego_conocido):
    
    '''
    Recibe el id de un juego y devuelve los 5 juegos recomendados, esto se determina a traves de similitud del coseno
    '''
    
    df = pd.read_parquet("Dataset/steam_games_clean.parquet")

    # Obtener el género del juego conocido
    genero_a_comparar = df[df['item_id'] == id_juego_conocido]['genres'].values[0]

    # Filtrar el DataFrame para juegos con el mismo género (excluyendo el juego conocido)
    df_filtrado = df[df['item_id'] != id_juego_conocido]

    # Inicializar el vectorizador TF-IDF y aplicarlo a los géneros de los juegos
    tfidf_vectorizer = TfidfVectorizer()
    tfidf_matrix = tfidf_vectorizer.fit_transform(df_filtrado['genres'])

    # Vectorizar el género conocido
    vector_genero_conocido = tfidf_vectorizer.transform([genero_a_comparar])

    # Calcular la similitud del coseno entre el género conocido y los géneros de los demás juegos
    similarity_scores = cosine_similarity(vector_genero_conocido, tfidf_matrix)

    # Obtener los índices de los 5 juegos más similares
    indices_juegos_similares = similarity_scores.argsort()[0][-5:][::-1]

    # Obtener los nombres de los 5 juegos más similares en el formato deseado
    juegos_similares = [{"juego": df_filtrado.iloc[idx]['app_name']} for idx in indices_juegos_similares]

    return juegos_similares

read_recomendacion_juego(670290)


[{'juego': "Malzbie's Pinball Collection"},
 {'juego': 'Snooker-online multiplayer snooker game!'},
 {'juego': 'Zaccaria Pinball - Strike Table'},
 {'juego': 'Zaccaria Pinball - Shooting The Rapids Table'},
 {'juego': 'Zaccaria Pinball - Farfalla Table'}]