## Consulta 01

Esta consulta devuelve una tabla que indica la cantidad de items y porcentaje de contenido Free por año según la empresa desarrolladora.

Endpoint: def developer( desarrollador : str )

*Importar las librerías necesarias para el procesamiento de los datos*

In [4]:
import pandas as pd



*Importamos el archivo con el que vamos a trabajar la consulta*

In [5]:
df = pd.read_parquet(r'C:\Users\Owner\Desktop\LABS\Proyecto_STEAM\datos_STEAM\parquet\games_clean.parquet')

*Realizamos una copia para trabajar sobre ella y mantener los datos intactos en el archivo original.*

In [6]:
df_games_copy = df.copy()

*(Opcional). Podemos hacer una visualización previa del dataset para hacer cualquier análsis previo.*

In [7]:
df_games_copy

Unnamed: 0,id,app_name,developer,genres,price,release_date,tags
0,761140,Lost Summoner Kitty,Kotoshiro,Action,4.99,2018-01-04,"[Strategy, Action, Indie, Casual, Simulation]"
1,643980,Ironbound,Secret Level SRL,Indie,,2018-01-04,"[Free to Play, Strategy, Indie, RPG, Card Game..."
2,670290,Real Pool 3D - Poolians,Poolians.com,Casual,,2017-07-24,"[Free to Play, Simulation, Sports, Casual, Ind..."
3,767400,弹炸人2222,彼岸领域,Action,0.99,2017-12-07,"[Action, Adventure, Casual]"
4,773570,Log Challenge,,Action,2.99,,"[Action, Indie, Casual, Sports]"
...,...,...,...,...,...,...,...
32130,773640,Colony On Mars,"Nikita ""Ghost_RUS""",Casual,1.99,2018-01-04,"[Strategy, Indie, Casual, Simulation]"
32131,733530,LOGistICAL: South Africa,Sacada,Casual,4.99,2018-01-04,"[Strategy, Indie, Casual]"
32132,610660,Russian Roads,Laush Dmitriy Sergeevich,Indie,1.99,2018-01-04,"[Indie, Simulation, Racing]"
32133,658870,EXIT 2 - Directions,"xropi,stev3ns",Casual,4.99,2017-09-02,"[Indie, Casual, Puzzle, Singleplayer, Atmosphe..."


*Realizamos las siguientes operaciones:*
1. Conviertir la columna 'release_date' del DataFrame a formato de fecha si aún no lo está.
2. Filtrar el DataFrame por el desarrollador especificado.
3. Agrupar los datos por año de lanzamiento y cuenta la cantidad de juegos en cada grupo.
4. Calcular el porcentaje de contenido gratuito para cada año de lanzamiento.
5. Combinar los resultados en un DataFrame final, mostrando la cantidad de juegos y el porcentaje de contenido gratuito para cada año.
6. Renombrar la columna 'release_date' a 'Año'.
7. Devolver el DataFrame resultante.

In [8]:
def developer(desarrollador: str, df_games_copy: pd.DataFrame):
    # Convertir la columna 'release_date' a formato de fecha si no lo está
    df['release_date'] = pd.to_datetime(df['release_date'], errors='coerce')

    # Filtrar el DataFrame por el desarrollador dado
    developer_df = df[df['developer'] == desarrollador]

    # Agrupar por año y contar la cantidad de elementos en cada grupo
    items_por_año = developer_df.groupby(df['release_date'].dt.year).size().reset_index(name='Cantidad de Items')

    # Calcular el porcentaje de contenido gratuito para cada año
    free_por_año = developer_df[developer_df['price'] == 'Free'].groupby(df['release_date'].dt.year).size().reset_index(name='Contenido Free')

    # Combinar los resultados en un DataFrame final
    result_df = items_por_año.merge(free_por_año, on='release_date', how='left')
    result_df['Contenido Free'] = (result_df['Contenido Free'] / result_df['Cantidad de Items'] * 100).fillna(0).astype(int).astype(str) + '%'

    # Renombrar la columna de años
    result_df.rename(columns={'release_date': 'Año'}, inplace=True)

    return result_df

*Aplicamos la función y corroboramos que funcione correctamente*

In [9]:
# Solicitar al usuario que ingrese el nombre del desarrollador
desarrolladorr = input("Ingrese el nombre del desarrollador: ")

# Llamar a la función developer con el nombre del desarrollador proporcionado por el usuario
consulta = developer(desarrolladorr, df_games_copy)
print(consulta)

       Año  Cantidad de Items Contenido Free
0   1998.0                  1             0%
1   1999.0                  1             0%
2   2000.0                  2             0%
3   2001.0                  1             0%
4   2003.0                  1             0%
5   2004.0                  5             0%
6   2005.0                  1             0%
7   2006.0                  2             0%
8   2007.0                  3             0%
9   2008.0                  1             0%
10  2009.0                  1             0%
11  2010.0                  2             0%
12  2011.0                  1             0%
13  2012.0                  2             0%
14  2014.0                  7             0%
15  2016.0                  1             0%
16  2017.0                  2             0%
