# Análise de Reviews no Google Maps - C6 Bank

O objetivo desse notebook é utilizar Large Language Models (LLMs) para executar algumas tarefas sobre os dados de reviews do C6 Bank coletados do Google Maps usando o serpAPI. Tais tarefas serão:

* Identificação de idiomas;
* Classificação de sentimentos;
* Categorização de tópicos.

**OBSERVAÇÃO:** Esse notebook foi construído em vários dias diferentes, por isso, sempre que o output de um determinado modelo era gerado, uma nova base de dados era salva para posterior uso. Dessa forma, esse notebook ficará dividido em checkpoints, que representarão os momentos onde essas novas bases de dados geradas estão sendo salvas. 

In [1]:
#import das bibliotecas necessárias 
import pandas as pd
from transformers import pipeline
import openai

In [None]:
#carregando os dados de review coletados no google maps usando a serpapi
data = pd.read_csv("./c6bank_reviews.csv")
data.head(3)

### Primeiro modelo: Identificação de idiomas

O primeiro LLM utilizado será para identificação de idiomas, pois nosso case aqui construído se limitará aos reviews em português.

In [None]:
#para aplicar o modelo sobre os reviews, precisamos colocá-los em formato de lista
rev_list = list(data["review"].values)

In [None]:
#carregando o pipeline de transformação e predição do modelo de identificação de idioma
#usamos o prametro "truncation=True" porque esse modelo foi treinado para ser executado em tamanhos pre determinados de input
#nesse caso, se nosso review for maior que o que o modelo aceita em termos de número de palavras, precisamos avisar ao modelo
#que execute um truncamento através desse parâmetro.
lang_pipe = pipeline("text-classification", model="papluca/xlm-roberta-base-language-detection", truncation=True)

In [None]:
#aqui geramos as predições diretamente sobre a lista de reviews
language_preds = lang_pipe(rev_list)

In [None]:
#o resultado das predições é armazenado em um dicinário com alguns itens. Nesse caso, vamos filtrar somente o que queremos
#que é a classificação do idioma ao qual o review pertence e armazenar isso em uma lista.
results = []
for i in range(0, len(language_preds)):
    d = language_preds[i]
    r = d["label"]
    results.append(r)

In [None]:
#vamos criar uma nova coluna no nosso dataframe para armazenar o output do modelo
data["language"] = results

In [None]:
data.head(3)

In [None]:
#aqui filtramos os reviews que queremos: aqueles que estão em português.
df_pt = data[data["language"] == "pt"]
df_pt.shape

In [None]:
#outro filtro que faremos é selecionar apenas reviews com rating abaixo de 3:
#para identificar problemas a serem resolvidos, vamos olhar para o que os clientes estão reclamando.
df_pt = df_pt[df_pt["rating"] <= 3]

### Checkpoint 1: Salvando a base com os idiomas identificados

In [None]:
df_pt.to_csv("./pt_c6_reviews.csv", index=False)

### Segundo Modelo: Classificação de sentimentos

Apesar de termos filtrado os reviews com rating menor ou igual a 3, vamos utilizar um LLM de classificação de sentimento para termos garantia de que estaremos analisando apenas aqueles em que os clientes pontuam algum ponto de má experiência com nosso serviço.

In [None]:
#armazenando os reviews em lista para servir de input ao pipeline do modelo de sentimentos
pt_reviews = list(df_pt["review"].values)

In [None]:
#carregando o pipeline do modelo de análise de sentimentos
sentiment_clf = pipeline("sentiment-analysis", truncation=True)

In [None]:
#gerando as classificações
sentiment_prediction = sentiment_clf(pt_reviews)

In [None]:
#o resultado das predições é armazenado em um dicinário com alguns itens. Nesse caso, vamos filtrar somente o que queremos
#que é a classificação do sentimento ao qual o review pertence e armazenar isso em uma lista.
sentiments = []
for i in range(0, len(sentiment_prediction)):
    d = sentiment_prediction[i]
    s = d["label"]
    sentiments.append(s)

In [None]:
#vamos criar uma nova coluna no nosso dataframe para armazenar o output do modelo
df_pt["sentiment"] = sentiments

In [None]:
#aqui vamos avaliar a quantidade de reviews que foram classificados como sentimento negativo
total_shape = df_pt.shape
negative_shape = df_pt[df_pt["sentiment"]=="NEGATIVE"].shape

print(f"shape dos dados totais: {total_shape}")
print(f"shape dos dados negativos: {negative_shape}")

In [None]:
#filtramos aqui apenas os modelos com classificação negativa
df_pt = df_pt[df_pt["sentiment"] == "NEGATIVE"]

### Checkpoint 2: Salvando base com a classificação de sentimentos

In [None]:
df_pt.to_csv("./pt_c6_reviews.csv", index=False)

### Modelo 3: ChatGPT para identificar sobre o que os clientes estão reclamando

A nossa base tem muitos reviews, o suficiente para dificultar a vida de um ser humano na tarefa de analisar o que cada cliente está reclamando e identificar possíveis pontos de melhoria. Então, vamos usar o modelo gpt-3.5-turbo para ler nossos reviews e categorizá-los em uma determinada lista de possíveis problemas do cliente com o banco. Para isso, vamos solicitar ao gpt que categorize o review em algumas das seguintes classes de problema:

1. Suporte ao cliente;
2. Cobrança indevida;
3. Negação de crédito;
4. Fraudes;
5. Experiência do usuário.

In [13]:
#carregando a base de dados
data = pd.read_csv("./pt_c6_reviews.csv")
data.head(3)

Unnamed: 0,name,review,rating,language,sentiment
0,Michael Capela,"Não recomendo o C6 Bank para ninguém, simplesm...",1.0,pt,NEGATIVE
1,Edson Pereira,Tenho conta ha tempos. Boa movimentação no car...,2.0,pt,NEGATIVE
2,JOÃO BAND,"pior empresa pra se ter conta, meu deus... blo...",1.0,pt,NEGATIVE


In [14]:
#armazenando os reviews em uma lista, pois vamos iterar sobre ela
rev_list = list(data["review"].values)

In [20]:
#lista vazia para armazenar os outputs do gpt
classifications = []

# nossa api da openAI para utilizarmos o gpt
#OBS: Os serviços de API da openAI são pagos
api_key = "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"
openai.api_key = api_key

# Nossa lista de problemas 
categories = ["Customer Support",
              "Improper Billing", 
              "Credit Refusal",
              "Fraud", 
              "User Experience"]

#esse trecho de código deu alguns problemas de timeout. Como solução, descobri que iterar mais de uma vez sobre o input
#pode ser uma forma de contornar. Nesse caso, vamos iterar max_retries vezes.
max_retries = 5

# Contruindo o loop em cima da nossa lista de reviews 
for review in rev_list:
    #variavel que irá armazenar a quantidade de vezes que tentaremos ler um input nos casos em que acontecer timeout
    retry_count = 0
    
    #prompt que será utilizado como input para o GPT
    prompt = f"Categorize the following review {review} in one of the following categories: {categories}. Limit your answer to the choosen category, no more text than that"
    
    while retry_count < max_retries:
        try:
            response = openai.ChatCompletion.create(
                model="gpt-3.5-turbo-16k",  # Escolha do modelo que será utilizado
                messages=[{"role": "system", "content": "You are a helpful assistant that categorizes reviews."}, {"role": "user", "content": prompt}],
                max_tokens=5  # Maximo de tokens que o modelo irá gerar
            )
    
            # Dada a resposta do modelo, vamos extrair apenas a parte onde temos a categoria escolhida
            generated_category = response["choices"][0]["message"]["content"].strip()

            # colocamos o output do modelo na lista que armazena as classificações
            classifications.append(generated_category)
            
            break 
        
        except:
            retry_count += 1
            print(f"Request timed out, retrying ({retry_count}/{max_retries})")
            continue

Request timed out, retrying (1/5)
Request timed out, retrying (1/5)


In [21]:
#visualizando as classificações geradas
classifications

['Customer Support',
 'Credit Refusal',
 'Customer Support',
 'User Experience',
 'Category: User Experience',
 'Customer Support',
 'Improper Billing',
 'Credit Refusal',
 'User Experience',
 'User Experience',
 'Customer Support',
 'User Experience',
 'Customer Support',
 'User Experience',
 'Customer Support',
 'Category: User Experience',
 'Category: Customer Support',
 'Customer Support',
 'Category: Customer Support',
 'Improper Billing',
 'Category: Customer Support',
 'Improper Billing',
 'Category: Customer Support',
 'Category: User Experience',
 'Customer Support',
 'Improper Billing',
 'Category: Customer Support',
 'Customer Support',
 'Customer Support',
 'User Experience',
 'Category: User Experience',
 'Improper Billing',
 'Customer Support',
 'User Experience',
 'User Experience',
 'Category: User Experience',
 'Category: Customer Support',
 'Customer Support',
 'Improper Billing',
 'Credit Refusal',
 'Category: Credit Refusal',
 'Credit Refusal',
 'Customer Support',


In [24]:
#criando uma coluna no dataframe que contém a categorização gerada pelo modelo
data["issue"] = classifications

In [25]:
#salvando a base de dados gerada
data.to_csv("./gpt35turbo_generated_issues.csv", index=False)

# Pontos de melhoria

Alguns desenvolvimentos realizados nesse case poderiam passar por experimentos para descobrir formas mais eficientes de analisar os nossos reviews usando o poder dos LLMs. Os que considero com mais potencial de resultado seriam:

1. Melhorar a engenharia de prompt passada o modelo gpt;
2. Deixar o próprio gpt criar as categorias de problema a partir do que ele encontra no review;
3. Usar conhecimento de negócio de pessoas especialistas no setor de bancos para criar categorias mais específicas de problemas dos quais os clientes podem estar insatisfeitos.