# KPIs 

## Objetivos Asociados:

1. Tendencia de Opiniones Bancarias:
KPI: Número total de reseñas a lo largo del tiempo.
Objetivo: Identificar patrones y tendencias en la cantidad de reseñas bancarias para comprender la dinámica de la retroalimentación del cliente.

2. Puntuación Promedio de Locales Bancarios:
KPI: Puntuación promedio de todos los locales bancarios.
Objetivo: Evaluar la satisfacción general de los clientes con los servicios bancarios y monitorear cualquier cambio significativo en la puntuación.

3. Sentimiento Promedio de Reseñas Bancarias:
KPI: Puntuación de sentimiento promedio de todas las reseñas.
Objetivo: Medir la percepción general del cliente hacia los servicios bancarios, identificando si las reseñas son en su mayoría positivas, neutrales o negativas.

## Métodos y Resultados Esperados:
1. Tendencia de Opiniones Bancarias:
Método: Visualizar un gráfico interactivo de líneas con Plotly Express:
Resultado Esperado: Gráfico que muestra la evolución de las reseñas bancarias a lo largo del tiempo.

2. Puntuación Promedio de Locales Bancarios:
Método: Calcular la media de la puntuación de todos los locales.
Resultado Esperado: Valor numérico que representa la puntuación promedio.

3. Sentimiento Promedio de Reseñas Bancarias:
Método: Analizar el texto de las reseñas para determinar el sentimiento y calcular la puntuación promedio.
Resultado Esperado: Valor numérico que indica el sentimiento promedio de todas las reseñas.

In [67]:
# Importar biblioteca necesaria
import pandas as pd
import matplotlib.pyplot as plt
import plotly.express as px
from tabulate import tabulate
import seaborn as sns
from textblob import TextBlob
import utils

In [68]:
# Cargar el DataFrame de reseñas
df_reviews_google = pd.read_csv("../data/Cloud_Upload/Google_Maps/reviews/reviews.csv")
df_reviews_google.head(1)

Unnamed: 0,user_id,name,time,rating,text,gmap_id,date,hour
0,1.030135e+20,Jarrod Jeffreys,22:10:00.705000,1,Terrible branch. Went in to make some simple u...,0x888e85137ff1c169:0xe7eafb5c7701aa2c,2021-07-21,22


In [69]:
# Eliminamos columnas innecesarias
df_reviews_google = df_reviews_google.drop(columns=['name','time','hour'])
# Renombramos gmap_id a busines_id
df_reviews_google = df_reviews_google.rename(columns={'gmap_id':'business_id'})
# Reordenamos columnas
df_reviews_google = df_reviews_google[['user_id','business_id','date','rating','text']]

In [70]:
# Cargar el DataFrame de reseñas
df_reviews_yelp = pd.read_csv("../data/Cloud_Upload/Yelp/review/review.csv")
df_reviews_yelp.head(1)

Unnamed: 0,review_id,user_id,business_id,stars,useful,funny,cool,text,date,hour,time
0,OiiUQHpUPSIw592zKebnTg,Wshkpj8aHWuzIeca1QxWTA,R-HCwu9UbasUudG1yTM1Ow,1,13,19,6,I am positively LIVID.\n\nI went to check my a...,2009-10-15,0,00:08:18


In [71]:
# Eliminamos columnas innecesarias
df_reviews_yelp = df_reviews_yelp.drop(columns=['review_id','useful','funny','cool','hour','time'])
# Renombramos stars a rating
df_reviews_yelp = df_reviews_yelp.rename(columns={'stars':'rating'})
# Reordenamos columnas
df_reviews_yelp = df_reviews_yelp[['user_id','business_id','date','rating','text']]

In [72]:
# Creamos el dataframe df_revies que concatene las reseñas de Google y Yelp
df_reviews = pd.concat([df_reviews_google, df_reviews_yelp], ignore_index=True)
df_reviews.head(1)

Unnamed: 0,user_id,business_id,date,rating,text
0,1.0301349870631173e+20,0x888e85137ff1c169:0xe7eafb5c7701aa2c,2021-07-21,1,Terrible branch. Went in to make some simple u...


In [73]:
# Pasamos user_id a string
df_reviews['user_id'] = df_reviews['user_id'].astype(str)
# Pasamos la columna date a formato de fecha
df_reviews['date'] = pd.to_datetime(df_reviews['date'], format='%Y-%m-%d', errors='coerce')
df_reviews['date'] = df_reviews['date'].dt.date

In [74]:
utils.dataType(df_reviews)

Unnamed: 0,name,data_type,not_null_%,null_%,not_null,null
0,user_id,[<class 'str'>],100.0,0.0,70791,0
1,business_id,[<class 'str'>],100.0,0.0,70791,0
2,date,[<class 'datetime.date'>],100.0,0.0,70791,0
3,rating,[<class 'int'>],100.0,0.0,70791,0
4,text,[<class 'str'>],100.0,0.0,70791,0


# KPI´s Tendencia de Opiniones Bancarias
    Método:
    Visualizar un gráfico interactivo de líneas con Plotly Express:

In [75]:
# Agrupar por fecha y contar el número de reseñas
trend_reviews = df_reviews.groupby('date').size().reset_index(name='review_count')

In [76]:
# Imprimir una tabla formateada
print(tabulate(trend_reviews, headers='keys', tablefmt='pipe'))

|      | date       |   review_count |
|-----:|:-----------|---------------:|
|    0 | 2006-03-11 |              1 |
|    1 | 2006-05-28 |              1 |
|    2 | 2006-07-17 |              1 |
|    3 | 2006-09-01 |              1 |
|    4 | 2006-10-18 |              1 |
|    5 | 2006-11-27 |              1 |
|    6 | 2007-01-18 |              1 |
|    7 | 2007-02-07 |              1 |
|    8 | 2007-02-08 |              1 |
|    9 | 2007-02-28 |              1 |
|   10 | 2007-03-02 |              1 |
|   11 | 2007-03-16 |              1 |
|   12 | 2007-04-07 |              1 |
|   13 | 2007-04-26 |              1 |
|   14 | 2007-05-02 |              1 |
|   15 | 2007-06-09 |              1 |
|   16 | 2007-06-10 |              1 |
|   17 | 2007-07-01 |              1 |
|   18 | 2007-07-02 |              1 |
|   19 | 2007-07-03 |              1 |
|   20 | 2007-07-30 |              1 |
|   21 | 2007-08-31 |              1 |
|   22 | 2007-09-07 |              1 |
|   23 | 2007-09-09 |    

In [77]:
# Crear un gráfico de líneas utilizando Plotly Express
fig = px.line(trend_reviews, x='date', y='review_count', title='Tendencia de Opiniones Bancarias')

# Mostrar el gráfico
fig.show()

    Esto nos proporcionará una visualización más interactiva de la tendencia de opiniones.

# KPI´s  Puntuación Promedio de Locales Bancarios
    Método:
    Calcular la media de la puntuación de todos los locales.

In [78]:
# Calcular la puntuación promedio
average_rating = df_reviews['rating'].mean()

print(f"Puntuación Promedio de Locales Bancarios: {average_rating}")

Puntuación Promedio de Locales Bancarios: 3.0490034043875633


# KPI´s Sentimiento Promedio de Reseñas Bancarias
    Método:
    Calcular la puntuación promedio de sentimiento.

In [79]:
# Analizar el sentimiento de cada reseña
df_reviews['sentiment'] = df_reviews['text'].apply(lambda x: TextBlob(x).sentiment.polarity)

# Revisar algunas reseñas específicas y su puntuación de sentimiento
sample_reviews = df_reviews[['text', 'sentiment']].sample(5)
print("Reseñas y puntuación de sentimiento:")
print(sample_reviews)

Reseñas y puntuación de sentimiento:
                                                    text  sentiment
64386  I have no idea why this location only has two ...   0.294375
16308  (Translated by Google) In the afternoon it get...   0.303704
64721  I've been a FirstIB customer for about 10 year...   0.175000
65210  I've been with this credit union off and on, s...   0.001786
23423                   Waited in drive thru for awhile.   0.000000


In [80]:

# Añadir categorías de sentimiento
df_reviews['sentiment_category'] = df_reviews['sentiment'].apply(lambda x: 'Positivo' if x > 0 else ('Neutral' if x == 0 else 'Negativo'))

# Calcular la puntuación promedio de sentimiento
average_sentiment = df_reviews['sentiment'].mean()

In [81]:

# Imprimir el resultado mejorado
print(f"Sentimiento Promedio de Reseñas Bancarias: {average_sentiment}")
print("Categorías de Sentimiento:")
print(df_reviews['sentiment_category'].value_counts())

Sentimiento Promedio de Reseñas Bancarias: 0.08571917264470172
Categorías de Sentimiento:
sentiment_category
Positivo    31553
Neutral     21109
Negativo    18129
Name: count, dtype: int64


In [82]:
df_reviews

Unnamed: 0,user_id,business_id,date,rating,text,sentiment,sentiment_category
0,1.0301349870631173e+20,0x888e85137ff1c169:0xe7eafb5c7701aa2c,2021-07-21,1,Terrible branch. Went in to make some simple u...,-0.185714,Negativo
1,1.0147251913048646e+20,0x888e85137ff1c169:0xe7eafb5c7701aa2c,2021-06-14,1,Terrible bank! Horrible customer service! Incr...,-0.521875,Negativo
2,1.1410503259472916e+20,0x888e85137ff1c169:0xe7eafb5c7701aa2c,2021-02-26,1,This bank and the workers in this bank are LAZ...,-0.226562,Negativo
3,1.0594133580154872e+20,0x888e85137ff1c169:0xe7eafb5c7701aa2c,2019-12-17,5,I've been a Wells Fargo customer for over 10 y...,0.900000,Positivo
4,1.1076034736010066e+20,0x888e85137ff1c169:0xe7eafb5c7701aa2c,2020-06-03,1,This is absolutely the most infuriating Bank t...,-0.121484,Negativo
...,...,...,...,...,...,...,...
70786,LHiAufFEvRGy-5XJp_qRGg,HSdyCEYwjfJ_5v9poO4QAw,2022-01-13,1,I don't know how Servus is still in business. ...,-0.296759,Negativo
70787,_I5yBAm4IAayT3kqX1qURg,n2N7ABWAX3nmCAIQV_V7mg,2016-09-21,4,4 stars because Danielle made my visit a littl...,0.263365,Positivo
70788,eNtU9lv7gCb-qNy7nQCQIw,KubXxIiHWbCbIiZ4Ax9LaA,2015-09-12,4,I usually just use the drive through whenever ...,0.096065,Positivo
70789,cd3e6sQ2rvip-8vAQaxJCg,HSdyCEYwjfJ_5v9poO4QAw,2019-12-13,1,If I could pick ZERO ...I'd want to choose a n...,-0.099248,Negativo


In [83]:
df_reviews.to_csv('../data/Cloud_Upload/Sentiment/sentiment/sentiment.csv', encoding='utf-8',index=False)