In [1]:
import pandas as pd

<h1>sentiment_analysis</h1>

def sentiment_analysis( empresa desarrolladora : str ): Según la empresa desarrolladora, se devuelve un diccionario con el nombre de la desarrolladora como llave y una lista con la cantidad total de registros de reseñas de usuarios que se encuentren categorizados con un análisis de sentimiento como valor.
Ejemplo de retorno: {'Valve' : [Negative = 182, Neutral = 120, Positive = 278]}

In [2]:
# Cargamos los archivos CSV a utilizar:
games_df = pd.read_csv(r"..\Archivos Producidos\games.csv")
reviews_df = pd.read_csv(r"..\Archivos Producidos\reviews.csv")

# Convertimos algunos tipos de columna que no se cargaron correctamente:
reviews_df["item_id"] = reviews_df["item_id"].astype("Int64")
reviews_df["year"] = reviews_df["year"].astype("Int64")

In [3]:
games_df.dtypes

app_name                     object
release_year                  int64
item_id                       int64
developer                    object
Action                        int64
Adventure                     int64
Animation &amp; Modeling      int64
Audio Production              int64
Casual                        int64
Design &amp; Illustration     int64
Early Access                  int64
Education                     int64
Free to Play                  int64
Indie                         int64
Massively Multiplayer         int64
Photo Editing                 int64
RPG                           int64
Racing                        int64
Simulation                    int64
Software Training             int64
Sports                        int64
Strategy                      int64
Utilities                     int64
Video Production              int64
Web Publishing                int64
dtype: object

In [4]:
reviews_df.dtypes

user_id               object
item_id                Int64
recommend               bool
review                object
year                   Int64
sentiment_analysis     int64
dtype: object

Ya cargados los archivos, comenzamos con las transformaciones:

In [5]:
# Unimos las columnas que nos serán de utilidad:
df_sentiment_analysis = pd.merge(games_df[["developer", "item_id"]], reviews_df[["item_id", "sentiment_analysis"]], on="item_id")
df_sentiment_analysis.head()

Unnamed: 0,developer,item_id,sentiment_analysis
0,Stainless games ltd,282010,1
1,Valve,70,1
2,Valve,70,1
3,Valve,70,1
4,Valve,70,2


In [6]:
# Capitalizamos las empresas desarrolladoras:
df_sentiment_analysis["developer"] = df_sentiment_analysis["developer"].apply(lambda x: x.strip().title())

In [7]:
# Eliminamos la columna "item_id" la cual ya no utilizaremos:
df_sentiment_analysis.drop(columns=["item_id"], inplace=True)
df_sentiment_analysis.head()

Unnamed: 0,developer,sentiment_analysis
0,Stainless Games Ltd,1
1,Valve,1
2,Valve,1
3,Valve,1
4,Valve,2


Desarrollamos la función:

In [8]:
# Creamos la función sentiment_analysis:
def sentiment_analysis(developer):

    # Verificamos si la variable introducida es una cadena de texto:
    if type(developer) != str: return f"La empresa '{developer}' no existe."
    else:

        # Capitalizamos la cadena de texto:
        developer = developer.strip().title()
    
        # Comprobamos si la empresa desarrolladora existe en el DataFrame:
        if developer not in df_sentiment_analysis["developer"].tolist():
            return f"La empresa '{developer}' no existe o no tiene reseñas."

        # En caso de que la empresa introducida exista en el DataFrame:
        else:

            # Filtramos por empresa desarrolladora:
            df_developer = df_sentiment_analysis[df_sentiment_analysis["developer"] == developer]

            # Contamos los registros para cada caso:
            positive = len(df_developer[df_developer["sentiment_analysis"] == 2]) # Sentimientos positivos
            neutral = len(df_developer[df_developer["sentiment_analysis"] == 1]) # Sentimientos neutrales
            negative = len(df_developer[df_developer["sentiment_analysis"] == 0]) # Sentimientos negativos

            # Devolvemos la respuesta final:
            return {developer: [f"Negative = {negative}, Neutral = {neutral}, Positive = {positive}"]}

In [9]:

# Probamos la función
print(sentiment_analysis("StainLess gameS ltd  "))
print(sentiment_analysis("acTion"))
print(sentiment_analysis("Valve"))
print(sentiment_analysis(123))
print(sentiment_analysis("Epic Games, INC."))
print(sentiment_analysis(" Outerlight LTD.    "))

{'Stainless Games Ltd': ['Negative = 0, Neutral = 1, Positive = 2']}
La empresa 'Action' no existe o no tiene reseñas.
{'Valve': ['Negative = 1056, Neutral = 3981, Positive = 4520']}
La empresa '123' no existe.
{'Epic Games, Inc.': ['Negative = 2, Neutral = 1, Positive = 8']}
{'Outerlight Ltd.': ['Negative = 4, Neutral = 17, Positive = 9']}


Guardamos el DataFrame utilizado:

In [10]:
# Guardamos el dataframe "df_sentiment_analysis":
df_sentiment_analysis.to_csv(r"..\Archivos Producidos\Data para Endpoints\df_sentiment_analysis.csv", index=False)