In [57]:
import pandas as pd


ruta_archivo_csv = 'dataset/dataset_f1.csv'
data = pd.read_csv(ruta_archivo_csv)


def PlayTimeGenre(data, genero):
    # Verificar si el tipo de dato de 'genero' es una cadena (string)
    if not isinstance(genero, str):
        return "El género debe ser una cadena de texto."

    filtro_genero = data[data['genres'] == genero]
    
    if filtro_genero.empty:
        return f"No se encontraron datos para el género {genero}"
    
    max_horas_jugadas = filtro_genero['sum_playtime_forever'].max()
    ano_max_horas_jugadas = filtro_genero[filtro_genero['sum_playtime_forever'] == max_horas_jugadas]['anio_release'].values[0]
    
    return f"Año de lanzamiento con más horas jugadas para Género {genero} : {ano_max_horas_jugadas}"

In [58]:
genero = 'Strategy'  # Género para el cual deseas encontrar el año de lanzamiento con más horas jugadas

resultado = PlayTimeGenre(data, genero)

print(resultado)

Año de lanzamiento con más horas jugadas para Género Strategy : 2010


In [59]:

import pandas as pd

# Carga el dataset
data_2 = pd.read_csv('dataset/dataset_f2.csv')  # Asegúrate de proporcionar la ubicación correcta del archivo

def UserForGenre(data_2, genero):
    # Filtra el DataFrame por el género deseado
    df_genero = data_2[data_2['genres'] == genero]

    if df_genero.empty:
        return "No se encontraron datos para el género especificado."

    # Calcula la acumulación de horas jugadas por año
    horas_por_anio = df_genero.groupby('anio_posted')['sum_playtime_forever'].sum().reset_index()
    horas_por_anio = horas_por_anio.rename(columns={'anio_posted': 'Año', 'sum_playtime_forever': 'Horas'})
    lista_horas_por_anio = horas_por_anio.to_dict(orient='records')

    # Encuentra al usuario con más horas jugadas para el género dado
    usuario_max_horas = df_genero.groupby('user_id')['sum_playtime_forever'].sum().idxmax()

    # Crea el diccionario de retorno directamente en el formato requerido
    resultado = {
        "Usuario con más horas jugadas para " + genero: usuario_max_horas,
        "Horas jugadas": lista_horas_por_anio
    }

    return resultado

# Ejemplo de uso
if __name__ == "__main__":
    genero_deseado = 'Adventure'  # Reemplaza con el género que deseas consultar
    resultado = UserForGenre(data_2, genero_deseado)
    print(resultado)

{'Usuario con más horas jugadas para Adventure': '76561198027488037', 'Horas jugadas': [{'Año': 2010, 'Horas': 9556457.0}, {'Año': 2011, 'Horas': 4745784976.0}, {'Año': 2012, 'Horas': 8140798749.0}, {'Año': 2013, 'Horas': 37310158633.0}, {'Año': 2014, 'Horas': 123687214303.0}, {'Año': 2015, 'Horas': 150352190114.0}]}


In [60]:
import pandas as pd

# Supongamos que tienes el dataset en un archivo CSV llamado 'dataset_f3.csv'
# Puedes cargar el dataset de la siguiente manera:
dataset_f3 = pd.read_csv('dataset/dataset_f34.csv')


def UsersRecommend(year: int):
    # Verificar si el año es igual a -1 y mostrar un mensaje personalizado
    if year == -1:
        return "El año ingresado es -1, lo cual no es válido."

    # Verificar que el año sea un número entero
    if not isinstance(year, int):
        return "El año debe ser un número entero."

    # Verificar que el año ingresado esté en la columna 'anio_posted'
    if year not in dataset_f3['anio_posted'].unique():
        return "El año no se encuentra en la columna 'anio_posted'."

    # Filtrar el dataset para obtener solo las filas correspondientes al año dado
    juegos_del_año = dataset_f3[dataset_f3['anio_posted'] == year]

    # Calcular la cantidad de recomendaciones para cada juego
    recomendaciones_por_juego = juegos_del_año.groupby('app_name')['recommend'].sum().reset_index()

    # Ordenar los juegos por la cantidad de recomendaciones en orden descendente
    juegos_ordenados = recomendaciones_por_juego.sort_values(by='recommend', ascending=False)

    # Tomar los tres juegos más recomendados
    top_3_juegos = juegos_ordenados.head(3)

    # Crear la lista de resultados en el formato deseado
    resultados = [{"Puesto 1": top_3_juegos.iloc[0]['app_name']},
                 {"Puesto 2": top_3_juegos.iloc[1]['app_name']},
                 {"Puesto 3": top_3_juegos.iloc[2]['app_name']}]

    return resultados

# Ejemplo de uso:
año = 2015  # Cambia esto al año que desees
resultado = UsersRecommend(año)
print(resultado)

[{'Puesto 1': 'Counter-Strike: Global Offensive'}, {'Puesto 2': 'Unturned'}, {'Puesto 3': 'Rust'}]


In [61]:
import pandas as pd

# Supongamos que tienes el dataset en un archivo CSV llamado 'dataset_f3.csv'
# Puedes cargar el dataset de la siguiente manera:
dataset_f3 = pd.read_csv('dataset/dataset_f34.csv')

def UsersNotRecommend(year: int):
    # Verificar si el año es igual a -1 y mostrar un mensaje personalizado
    if year == -1:
        return "El año ingresado es -1, lo cual no es válido."

    # Verificar que el año sea un número entero
    if not isinstance(year, int):
        return "El año debe ser un número entero."

    # Verificar que el año ingresado esté en la columna 'anio_posted'
    if year not in dataset_f3['anio_posted'].unique():
        return "El año no se encuentra en la columna 'anio_posted'."

    # Filtrar el dataset para obtener solo las filas correspondientes al año dado
    juegos_del_año = dataset_f3[dataset_f3['anio_posted'] == year]

    # Filtrar los juegos menos recomendados (reviews.recommend = False)
    juegos_no_recomendados = juegos_del_año[juegos_del_año['recommend'] == False]

    # Contar la cantidad de veces que cada juego recibió recomendaciones negativas
    juegos_contados = juegos_no_recomendados['app_name'].value_counts().reset_index()
    juegos_contados.columns = ['app_name', 'count']

    # Ordenar los juegos por la cantidad de recomendaciones negativas en orden descendente
    juegos_ordenados = juegos_contados.sort_values(by='count', ascending=False)

    # Tomar los tres juegos menos recomendados
    top_3_juegos = juegos_ordenados.head(3)

    # Crear la lista de resultados en el formato deseado
    resultados = [{"Puesto 1": top_3_juegos.iloc[0]['app_name']},
                 {"Puesto 2": top_3_juegos.iloc[1]['app_name']},
                 {"Puesto 3": top_3_juegos.iloc[2]['app_name']}]

    return resultados

# Llamar a la función con un año específico (por ejemplo, 2023)
resultados = UsersNotRecommend(2015)

# Imprimir los resultados
print(resultados)

[{'Puesto 1': 'Rust'}, {'Puesto 2': 'Robocraft'}, {'Puesto 3': 'DayZ'}]


In [62]:

# Carga el archivo CSV en un DataFrame
df = pd.read_csv('dataset/dataset_f5.csv')


def sentiment_analysis(año):
    # Verifica si el año es un entero positivo
    if not isinstance(año, int) or año < 0:
        raise ValueError("El año debe ser un entero positivo")

    # Verifica si el año se encuentra en la columna 'anio_release'
    if año not in df['anio_release'].unique():
        raise ValueError(f"No se encontraron registros para el año {año}")

    # Filtra las filas del DataFrame para el año dado
    df_filtered = df[df['anio_release'] == año]

    # Cuenta la cantidad de registros para cada categoría de sentimiento
    sentiment_counts = df_filtered['sentiment_analysis'].value_counts()

    # Convierte el resultado en un diccionario
    result = {
        'Negative': sentiment_counts.get(0, 0),
        'Neutral': sentiment_counts.get(1, 0),
        'Positive': sentiment_counts.get(2, 0)
    }

    return result

# Ejemplo de uso:
try:
    año_deseado = 2015  # Reemplaza con el año que desees analizar
    resultado = sentiment_analysis(año_deseado)
    print(resultado)
except ValueError as e:
    print(str(e))

{'Negative': 3472, 'Neutral': 3671, 'Positive': 11289}
