# Cargamos los datasets con los que vamos a trabajar

In [128]:
import pandas as pd
# Especifica la ruta del archivo CSV que deseas leer
file_path = 'Data/Datos_csv/reviews_nlp.csv'

# Lee el archivo CSV y crea un DataFrame
reviews = pd.read_csv(file_path, parse_dates=['posted'])

# Ahora puedes trabajar con el DataFrame 'reviews'
print(reviews)

                 user_id     posted  item_id  recommend  \
0      76561197970982479 2011-11-05     1250       True   
1      76561197970982479 2011-07-15    22200       True   
2      76561197970982479 2011-04-21    43110       True   
3                js41637 2014-06-24   251610       True   
4                js41637 2013-09-08   227300       True   
...                  ...        ...      ...        ...   
49181            wayfeng 2015-10-14      730       True   
49182  76561198251004808 2015-10-10   253980       True   
49183        72947282842 2015-10-31      730       True   
49184          ApxLGhost 2015-12-14      730       True   
49185  76561198267374962 2015-12-29   369200       True   

                                                  review  sentiment_score  \
0      Simple yet with great replayability. In my opi...           0.8481   
1                   It's unique and worth a playthrough.           0.2263   
2      Great atmosphere. The gunplay can be a bit chu...    

In [129]:
import pandas as pd
# Especifica la ruta del archivo CSV que deseas leer
file_path = 'Data/Datos_csv/games.csv'

# Lee el archivo CSV y crea un DataFrame
games = pd.read_csv(file_path, parse_dates= ['release_date'])

# Ahora puedes trabajar con el DataFrame 'df'
print(games)

                 publisher                                             genres  \
0                Kotoshiro  ['Action', 'Casual', 'Indie', 'Simulation', 'S...   
1         Making Fun, Inc.       ['Free to Play', 'Indie', 'RPG', 'Strategy']   
2             Poolians.com  ['Casual', 'Free to Play', 'Indie', 'Simulatio...   
3                     彼岸领域                  ['Action', 'Adventure', 'Casual']   
4      Trickjump Games Ltd              ['Action', 'Adventure', 'Simulation']   
...                    ...                                                ...   
22491      Bidoniera Games         ['Action', 'Adventure', 'Casual', 'Indie']   
22492      Ghost_RUS Games      ['Casual', 'Indie', 'Simulation', 'Strategy']   
22493               Sacada                    ['Casual', 'Indie', 'Strategy']   
22494         Laush Studio                  ['Indie', 'Racing', 'Simulation']   
22495             SIXNAILS                                ['Casual', 'Indie']   

                       app_

# Se crean las funciones para las consultas

def UsersRecommend( año : int ): Devuelve el top 3 de juegos MÁS recomendados por usuarios para el año dado. (reviews.recommend = True y comentarios positivos/neutrales)

Ejemplo de retorno: [{"Puesto 1 : X"}, {"Puesto 2 : Y"},{"Puesto 3 : Z"}]

In [130]:
def UsersRecommend1(año: int):
    # Filtrar reseñas por año, recomendación y comentarios positivos/neutrales
    filtered_reviews = reviews[(reviews['posted'].dt.year == año) &
                                  (reviews['recommend'] == True) &
                                  (reviews['sentiment_analysis'].isin([1, 2]))]
    
    # Contar la cantidad de reseñas para cada juego
    game_counts = filtered_reviews['item_id'].value_counts()
    
    # Filtrar los item_id que están en el DataFrame games
    filtered_game_counts = game_counts[game_counts.index.isin(games['item_id'])]

    # Obtener los top 3 juegos menos recomendados
    top_3_games = filtered_game_counts.head(3)

    # Crear una lista de diccionarios con los juegos y sus puestos
    result = [{"Puesto {}: {}".format(i+1, games.loc[item_id]['app_name'])}
              for i, item_id in enumerate(top_3_games)]
    
    return result

In [131]:
UsersRecommend1(2014)

[{'Puesto 1: Borderlands 2: Commando Devilish Good Looks Pack'},
 {'Puesto 2: To the Moon Soundtrack'},
 {'Puesto 3: Airline Tycoon 2'}]

def UsersNotRecommend( año : int ): Devuelve el top 3 de juegos MENOS recomendados por usuarios para el año dado. (reviews.recommend = False y comentarios negativos)

Ejemplo de retorno: [{"Puesto 1 : X"}, {"Puesto 2 : Y"},{"Puesto 3 : Z"}]

In [132]:
def UsersNotRecommend1(año: int):
    # Filtrar reseñas por año, no recomendación y sentimiento negativo
    filtered_reviews = reviews[(reviews['posted'].dt.year == año) &
                                  (reviews['recommend'] == False) &
                                  (reviews['sentiment_analysis'] == 0)]
    
    # Contar la cantidad de reseñas negativas para cada juego
    game_counts = filtered_reviews['item_id'].value_counts()
       
    # Filtrar los item_id que están en el DataFrame games
    filtered_game_counts = game_counts[game_counts.index.isin(games['item_id'])]

    # Obtener los top 3 juegos menos recomendados
    top_3_games = filtered_game_counts.head(3)

    # Crear una lista de diccionarios con los juegos y sus puestos
    result = [{"Puesto {}: {}".format(i+1, games.loc[item_id]['app_name'])}
              for i, item_id in enumerate(top_3_games)]
    
    return result

In [133]:
UsersNotRecommend1(2015)

[{'Puesto 1: X-COM: Terror From the Deep'},
 {"Puesto 2: Garry's Mod"},
 {'Puesto 3: TAROTICA VOO DOO'}]

def sentiment_analysis( año : int ): Según el año de lanzamiento, se devuelve una lista con la cantidad de registros de reseñas de usuarios que se encuentren categorizados con un análisis de sentimiento.

Ejemplo de retorno: {'Negative' = 182, 'Neutral' = 120, 'Positive' = 278}

In [140]:
def sentiment_analysis1(Año: int):
    # Filtra las reseñas que coincidan con el año objetivo
    filtered_reviews = reviews[reviews['posted'].dt.year == Año]

    # Realiza el conteo de las categorías de sentimiento
    sentiment_counts = filtered_reviews['sentiment_analysis'].value_counts()

    # Convierte los valores del diccionario a tipos nativos de Python
    result_dict = {'Negative': int(sentiment_counts.get(0, 0)),
                   'Neutral': int(sentiment_counts.get(1, 0)),
                   'Positive': int(sentiment_counts.get(2, 0))}

    return result_dict

In [141]:
sentiment_analysis1(2011)

{'Negative': 61, 'Neutral': 73, 'Positive': 398}