## Consulta 01

Esta consulta devuelve una tabla que indica la cantidad de items y porcentaje de contenido Free por año según la empresa desarrolladora.

Endpoint: def developer( desarrollador : str )

*Importamos la librería y módulo necesarios para el procesamiento de los datos*

In [1]:
import pandas as pd
import csv


*Importamos el archivo con el que vamos a trabajar la consulta*

In [2]:
df = pd.read_parquet(r'C:\Users\Sofi\Desktop\Henry\LABS\Proyecto_STEAM\Data_Clean\games_clean.parquet')

*Realizamos una copia para trabajar sobre ella y mantener los datos intactos en el archivo original.*

In [3]:
df_games_copy = df.copy()

*(Opcional). Podemos hacer una visualización previa del dataset para hacer cualquier análsis previo.*

In [4]:
df_games_copy

Unnamed: 0,id,app_name,developer,genres,price,release_date
0,761140,Lost Summoner Kitty,Kotoshiro,Action,4.99,2018
1,643980,Ironbound,Secret Level SRL,Indie,0.00,2018
2,670290,Real Pool 3D - Poolians,Poolians.com,Casual,0.00,2017
3,767400,弹炸人2222,彼岸领域,Action,0.99,2017
4,773570,Log Challenge,,Action,2.99,
...,...,...,...,...,...,...
32130,773640,Colony On Mars,"Nikita ""Ghost_RUS""",Casual,1.99,2018
32131,733530,LOGistICAL: South Africa,Sacada,Casual,4.99,2018
32132,610660,Russian Roads,Laush Dmitriy Sergeevich,Indie,1.99,2018
32133,658870,EXIT 2 - Directions,"xropi,stev3ns",Casual,4.99,2017


*Desarrollamos la función correspondiente para hacer la consulta que necesitamos*

In [7]:
def developer(desarrollador: str, df: pd.DataFrame):
    # Convertir la columna 'release_date' a formato de fecha si no lo está
    df['release_date'] = pd.to_datetime(df['release_date'], errors='coerce')

    # Filtrar el DataFrame por el desarrollador dado
    developer_df = df[df['developer'] == desarrollador]

    # Agrupar por año y contar la cantidad de elementos en cada grupo
    items_por_año = developer_df.groupby(df['release_date'].dt.year).size().reset_index(name='Cantidad de Items')

    # Calcular el porcentaje de contenido gratuito para cada año
    free_por_año = developer_df[developer_df['price'] == 0].groupby(df['release_date'].dt.year).size().reset_index(name='Contenido Free')

    # Combinar los resultados en un DataFrame final
    result_df = items_por_año.merge(free_por_año, on='release_date', how='left')
    result_df['Contenido Free'] = (result_df['Contenido Free'] / result_df['Cantidad de Items'] * 100).fillna(0).astype(int).astype(str) + '%'

    # Renombrar la columna de años
    result_df.rename(columns={'release_date': 'Año'}, inplace=True)

    return result_df



*Aplicamos la función y corroboramos que funcione correctamente*

In [8]:
# Llamada a la función con el desarrollador "Poppermost Productions" y el DataFrame df_games_clean
desarrolladorr = input("cargue el desarrollador: ")
consulta = developer(desarrolladorr, df_games_copy)
print(consulta)

      Año  Cantidad de Items Contenido Free
0  2013.0                  1           100%
1  2018.0                  5             0%
