# **Desarrollo API**

---


### Crearemos 6 funciones para las consultas (Para este Proceso no sera necesario un ETL)

* **Genero:** def genero( Año: str ): Se ingresa un año y devuelve una lista con los 5 géneros más ofrecidos en el orden correspondiente.

* **Juegos:** def juegos( Año: str ): Se ingresa un año y devuelve una lista con todos los juegos que fueron lanzados ese año.

* **Especificaciones:** def specs( Año: str ): Se ingresa un año y devuelve una lista con los 5 specs que más se repiten en ese año en el orden correspondiente.

* **Acceso Temprano**: def earlyacces( Año: str ): Cantidad de juegos lanzados en un año con early access.

* **Sentimiento:** def sentiment( Año: str ): Según el año de lanzamiento, se devuelve una lista con la cantidad de registros que se encuentren categorizados con un análisis de sentimiento.

* **Puntaje:** def metascore( Año: str ): Top 5 juegos según año con mayor metascore.

In [12]:
#Importamos las librerias necesarias para el desarrollo de las consultas
import numpy as np
import pandas as pd
import ast

In [13]:
# Inicializamos una lista vacía para almacenar los diccionarios
rows = []

# Abrimos el archivo "steam_games.json" en modo lectura
with open("steam_games.json") as f:
    # Iteramos sobre cada línea del archivo
    for line in f.readlines():
        # Utilizamos ast.literal_eval para convertir la línea en un diccionario
        rows.append(ast.literal_eval(line))

# Creamos el DataFrame a partir de la lista de diccionarios
df = pd.DataFrame(rows)

# Mostramos los primeros 5 registros del DataFrame
df.head(5)

Unnamed: 0,publisher,genres,app_name,title,url,release_date,tags,discount_price,reviews_url,specs,price,early_access,id,developer,sentiment,metascore
0,Kotoshiro,"[Action, Casual, Indie, Simulation, Strategy]",Lost Summoner Kitty,Lost Summoner Kitty,http://store.steampowered.com/app/761140/Lost_...,2018-01-04,"[Strategy, Action, Indie, Casual, Simulation]",4.49,http://steamcommunity.com/app/761140/reviews/?...,[Single-player],4.99,False,761140,Kotoshiro,,
1,"Making Fun, Inc.","[Free to Play, Indie, RPG, Strategy]",Ironbound,Ironbound,http://store.steampowered.com/app/643980/Ironb...,2018-01-04,"[Free to Play, Strategy, Indie, RPG, Card Game...",,http://steamcommunity.com/app/643980/reviews/?...,"[Single-player, Multi-player, Online Multi-Pla...",Free To Play,False,643980,Secret Level SRL,Mostly Positive,
2,Poolians.com,"[Casual, Free to Play, Indie, Simulation, Sports]",Real Pool 3D - Poolians,Real Pool 3D - Poolians,http://store.steampowered.com/app/670290/Real_...,2017-07-24,"[Free to Play, Simulation, Sports, Casual, Ind...",,http://steamcommunity.com/app/670290/reviews/?...,"[Single-player, Multi-player, Online Multi-Pla...",Free to Play,False,670290,Poolians.com,Mostly Positive,
3,彼岸领域,"[Action, Adventure, Casual]",弹炸人2222,弹炸人2222,http://store.steampowered.com/app/767400/2222/,2017-12-07,"[Action, Adventure, Casual]",0.83,http://steamcommunity.com/app/767400/reviews/?...,[Single-player],0.99,False,767400,彼岸领域,,
4,,,Log Challenge,,http://store.steampowered.com/app/773570/Log_C...,,"[Action, Indie, Casual, Sports]",1.79,http://steamcommunity.com/app/773570/reviews/?...,"[Single-player, Full controller support, HTC V...",2.99,False,773570,,,


In [15]:
# Filtramos por los que tienen un formato de fecha correcto y creamos una nueva columna con los años de release_date
df_filtrado = df_filtrado[df_filtrado['release_date'].str.contains(r'\d{4}-\d{2}-\d{2}', na=False)]
df['anio'] = df['release_date'].str.extract(r'(\d{4})')

In [16]:
# Convertimos las columnas año y metascore a entero, si hay un valor que no se puede transformar a entero se le asigna un valor Nulo
df['metascore'] = pd.to_numeric(df['metascore'], errors='coerce')
df['anio'] = pd.to_numeric(df['anio'], errors='coerce')

* **Genero:** def genero( Año: str ): Se ingresa un año y devuelve una lista con los 5 géneros más ofrecidos en el orden correspondiente.

In [17]:
def genero(año: str):
    # Filtrar el DataFrame por el año proporcionado
    df_filtered = df[df['anio'] == int(año)]

    # Unir todas las listas de géneros en una sola lista y eliminar valores nulos
    all_genres = [genre for sublist in df_filtered['genres'].dropna() for genre in sublist]

    # Contar la cantidad de veces que aparece cada género, incluyendo los nulos
    genre_counts = pd.Series(all_genres).value_counts()

    # Obtener los 5 géneros más lanzan a la venta
    top_5_genres = genre_counts.index[:5].tolist()

    return top_5_genres

* **Juegos:** def juegos( Año: str ): Se ingresa un año y devuelve una lista con todos los juegos que fueron lanzados ese año.


In [18]:
def juegos(Año: str):

    # Filtrar el DataFrame por el año proporcionado
    df_filtered = df[df['anio'] == int(Año)]

    # Obtener la lista de nombres de los juegos lanzados en el año
    juegos_lanzados = df_filtered['app_name'].tolist()

    return juegos_lanzados

* **Especificaciones:** def specs( Año: str ): Se ingresa un año y devuelve una lista con los 5 specs que más se repiten en ese año en el orden correspondiente.

In [19]:
def specs(Año: str):
    # Filtrar el DataFrame por el año proporcionado
    df_filtered = df[df['anio'] == int(Año)]

    # Unir todas las listas de specs en una sola lista y eliminar valores nulos
    all_specs = [specs for sublist in df_filtered['specs'].dropna() for specs in sublist]

    # Contar la cantidad de veces que aparece cada specs, incluyendo los nulos
    specs_counts = pd.Series(all_specs).value_counts()

    # Obtener los 5 specs que mas lanzan a la venta
    top_5_specs = specs_counts.index[:5].tolist()

    return top_5_specs

* **Acceso Temprano**: def earlyacces( Año: str ): Cantidad de juegos lanzados en un año con early access.

In [20]:
def earlyacces(Año: str):
    # Filtrar el DataFrame por el año proporcionado y que tenga "early access"
    df_filtered = df[(df['anio'] == int(Año)) & (df['early_access'] == True)]

    # Contar la cantidad de juegos con "early access" lanzados en el año
    cantidad_early_access = len(df_filtered)

    return cantidad_early_access

* **Sentimiento:** def sentiment( Año: str ): Según el año de lanzamiento, se devuelve una lista con la cantidad de registros que se encuentren categorizados con un análisis de sentimiento.


In [21]:
def sentiment(Año: str):
    # Filtrar el DataFrame por el año proporcionado
    df_filtered = df[df['anio'] == int(Año)]

    # Contar la cantidad de registros con cada análisis de sentimiento para el año
    sentiment_counts = df_filtered['sentiment'].value_counts().to_dict()

    # Modificar el diccionario para quitar "user reviews"
    modified_sentiment_counts = {}
    for clave, valor in sentiment_counts.items():
        if 'user reviews' not in clave:
            modified_sentiment_counts[clave] = valor

    return modified_sentiment_counts

* **Puntaje:** def metascore( Año: str ): Top 5 juegos según año con mayor metascore.

In [22]:
def metascore(Año: str):
    # Filtrar el DataFrame por el año proporcionado y eliminar filas con valores nulos en 'metascore'
    df_filtered = df[(df['anio'] == int(Año)) & ~df['metascore'].isnull()]

    # Ordenar el DataFrame filtrado por Metascore de manera descendente
    df_sorted = df_filtered.sort_values(by='metascore', ascending=False)

    # Obtener los nombres de los 5 juegos con el mayor Metascore
    top_5_juegos = df_sorted['app_name'].head(5).tolist()

    return top_5_juegos
