In [2]:
import pandas as pd

In [3]:
review=pd.read_csv('columna_resenia.csv').drop('Unnamed: 0', axis=1) #Abrimos las reseñas

In [4]:
juego=pd.read_csv('juego_ejercicio.csv').drop('Unnamed: 0', axis=1) #Abrimos los juegos

In [5]:
item=pd.read_csv('item_ejercicio.csv') #Abrimos los juegos por usuario

In [10]:
def UsersNotRecommend(año_deseado):
    df_filtrado = review[review['posted'].str.contains(str(año_deseado))] # Filtra las reseñas por el año deseado
    conteo_por_item_id = df_filtrado[df_filtrado['recommend'] == True].groupby('item_id')['recommend'].count() # Cuenta las reseñas recomendadas por juego
    conteo_ordenado = conteo_por_item_id.sort_values(ascending=True)  # Ordena los juegos por cantidad de reseñas recomendadas de menor a mayor
    bottom_3_item_id = conteo_ordenado.head(3)# Selecciona los 3 juegos con las menores cantidades de reseñas recomendadas
    bottom_3_item_id = bottom_3_item_id.reset_index()# Reinicia el índice del DataFrame resultante
    bottom_3_item_id = bottom_3_item_id.rename(columns={'recommend': 'count'}) # Renombra la columna 'recommend' a 'count'
    resultado_final = bottom_3_item_id.merge(juego, left_on='item_id', right_on='id', how='inner')[['item_id', 'title', 'count']] # Combina los datos de juegos peor recomendados con información del juego (nombre y otros detalles)
    return print(resultado_final.drop_duplicates().to_string(index=False)) # Imprime el resultado final sin duplicados y sin mostrar el índice

In [11]:
UsersNotRecommend(2014)


 item_id                              title  count
  339350                   Choice of Robots      1
   99700                           NightSky      1
  261110 Killer is Dead - Nightmare Edition      1


In [12]:
def UsersRecommend(año_deseado):
    df_filtrado = review[review['posted'].str.contains(str(año_deseado))]   # Filtra las reseñas por el año deseado
    conteo_por_item_id = df_filtrado[df_filtrado['recommend'] == True].groupby('item_id')['recommend'].count() # Cuenta las reseñas recomendadas por juego
    conteo_ordenado = conteo_por_item_id.sort_values(ascending=False) # Ordena los juegos por cantidad de reseñas recomendadas (de mayor a menor)
    top_3_item_id = conteo_ordenado.head(3) # Selecciona los 3 juegos con las mayores cantidades de reseñas recomendadas
    top_3_item_id = top_3_item_id.reset_index() # Reinicia el índice del DataFrame resultante
    top_3_item_id = top_3_item_id.rename(columns={'recommend': 'count'}) # Renombra la columna 'recommend' a 'count'
    resultado_final = top_3_item_id.merge(juego, left_on='item_id', right_on='id', how='inner')[['item_id', 'title', 'count']] # Combina los datos de los juegos mejor recomendados con información del juego (nombre y otros detalles)
    return print(resultado_final.drop_duplicates().to_string(index=False))  # Imprime el resultado final sin duplicados y sin mostrar el índice

In [13]:
UsersRecommend(2014)

 item_id                            title  count
     440                  Team Fortress 2   1563
     730 Counter-Strike: Global Offensive   1078
    4000                      Garry's Mod    764


In [14]:
import nltk #Importo las cosas que necesito para el analisis de sentimiento
from nltk.sentiment.vader import SentimentIntensityAnalyzer
nltk.download('vader_lexicon')

[nltk_data] Downloading package vader_lexicon to
[nltk_data]     C:\Users\Andy\AppData\Roaming\nltk_data...
[nltk_data]   Package vader_lexicon is already up-to-date!


True

In [15]:
def sentiment_analysis(anio):
    analyzer = SentimentIntensityAnalyzer() # Crea un objeto SentimentIntensityAnalyzer para análisis de sentimiento
    df_filtrado = review[review['posted'].str.contains(str(anio))]  # Filtra las reseñas por el año deseado
    df_filtrado['sentiment'] = df_filtrado['review'].apply(lambda x: analyzer.polarity_scores(x)['compound']) # Calcula el puntaje de sentimiento (compound) para cada reseña
    # Inicializa contadores para reseñas positivas, negativas y neutrales
    positivos = 0
    negativos = 0
    neutrales = 0
    for compound_score in df_filtrado['sentiment']: # Clasifica las reseñas en positivas, negativas o neutrales
        if compound_score >= 0.05:
            positivos += 1
        elif compound_score <= -0.05:
            negativos += 1
        else:
            neutrales += 1
    # Devuelve un diccionario con la cantidad de reseñas positivas, negativas y neutrales
    return {
        'Positivos': positivos,
        'Negativos': negativos,
        'Neutrales': neutrales
    }


In [17]:
sentiment_analysis(2013)

A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  df_filtrado['sentiment'] = df_filtrado['review'].apply(lambda x: analyzer.polarity_scores(x)['compound'])


{'Positivos': 4679, 'Negativos': 763, 'Neutrales': 1344}

In [18]:
def PlayTimeGenre(genero_deseado):
    juegos_genero = juego[juego['genres'] == genero_deseado] # Filtra los juegos por el género deseado
    if juegos_genero.empty:  # Verifica si no hay juegos en el género deseado
        return None
    tabla_completa = juegos_genero.merge(item, left_on='id', right_on='item_id', how='inner') # Combina los datos de los juegos con los datos de los ítems
    tabla_completa['año'] = pd.to_datetime(tabla_completa['release_date']).dt.year# Convierte la columna 'release_date' en formato de fecha y extrae el año
    resumen_por_año = tabla_completa.groupby('año')['playtime_forever'].sum().reset_index() # Resumen: suma las horas jugadas por año
    año_mas_horas_jugadas = resumen_por_año[resumen_por_año['playtime_forever'] == resumen_por_año['playtime_forever'].max()] # Encuentra el año con más horas jugadas
    return int(año_mas_horas_jugadas['año'].values[0])  # Devuelve el año con más horas jugadas como entero

In [19]:
PlayTimeGenre('Free to Play')

2013

In [20]:
def UserForGenre(genero_buscado):
    juegos_genero = juego[juego['genres'] == genero_buscado] # Filtra los juegos por el género buscad
    merge_df = juegos_genero.merge(item, left_on='id', right_on='item_id', how='inner')  # Combina los datos de los juegos con los datos de los ítems
    grouped = merge_df.groupby(['user_id', 'release_date', 'genres'])['playtime_forever'].sum().reset_index() # Agrupa por usuario, fecha de lanzamiento y género, sumando las horas jugadas
    max_playtime_users = grouped.loc[grouped.groupby(['release_date', 'genres'])['playtime_forever'].idxmax()] # Encuentra al usuario con más horas jugadas por fecha de lanzamiento y género
    result = {} # Crea un diccionario para almacenar el resultado por año 
    # Itera a través de los usuarios con más horas jugadas
    for _, row in max_playtime_users.iterrows():
        year = pd.to_datetime(row['release_date']).year
        if year not in result:
            result[year] = {'Año': year, 'Horas': row['playtime_forever']}
        else:
            result[year]['Horas'] += row['playtime_forever']
    max_user = max_playtime_users.iloc[0]['user_id']  # Encuentra al usuario con más horas jugadas en general
    # Formatea el resultado final
    formatted_result = {
        "Usuario con más horas jugadas para " + genero_buscado: max_user,
        "Horas jugadas": list(result.values())
    }
    
    return formatted_result #Devuelve en diccionario el jugador que mas jugo el genero y las horas jugadas por año

In [21]:
UserForGenre('RPG')

{'Usuario con más horas jugadas para RPG': 'theultimatedan',
 'Horas jugadas': [{'Año': 1988, 'Horas': 372},
  {'Año': 1991, 'Horas': 0},
  {'Año': 1992, 'Horas': 31},
  {'Año': 1994, 'Horas': 973},
  {'Año': 1996, 'Horas': 927},
  {'Año': 1997, 'Horas': 5311},
  {'Año': 1998, 'Horas': 12534},
  {'Año': 1999, 'Horas': 5406},
  {'Año': 2000, 'Horas': 2441},
  {'Año': 2001, 'Horas': 19968},
  {'Año': 2002, 'Horas': 35885},
  {'Año': 2003, 'Horas': 323503},
  {'Año': 2004, 'Horas': 3684},
  {'Año': 2005, 'Horas': 67073},
  {'Año': 2006, 'Horas': 22184},
  {'Año': 2007, 'Horas': 93693},
  {'Año': 2008, 'Horas': 102967},
  {'Año': 2009, 'Horas': 402127},
  {'Año': 2010, 'Horas': 705674},
  {'Año': 2011, 'Horas': 1148724},
  {'Año': 2012, 'Horas': 1521947},
  {'Año': 2013, 'Horas': 1394052},
  {'Año': 2014, 'Horas': 1629223},
  {'Año': 2015, 'Horas': 1808690},
  {'Año': 2016, 'Horas': 733547},
  {'Año': 2017, 'Horas': 329959},
  {'Año': 2018, 'Horas': 249}]}