# Data Labeling using GPT-3 for Portuguese

This study aims to labeling data in portuguese for sentiment analysis task. We use the e-commerce review dataset

### Install packages

In [1]:
!pip install openai

You should consider upgrading via the '/Users/bot/.pyenv/versions/3.7.4/bin/python3 -m pip install --upgrade pip' command.[0m


### Download dataset
E-commerce product review dataset

In [None]:
!wget https://raw.githubusercontent.com/b2wdigital/b2w-reviews01/main/B2W-Reviews01.csv -P data

In [3]:
import os
os.environ["OPENAI_API_KEY"] = "YOUR_OPENAI_API_KEY_HERE"

### Import packages 

In [4]:
import pandas as pd
from AutoLabeling import AutoLabeling

In [5]:
random_state = 21

### Load dataset

In [7]:
df = pd.read_csv("data/B2W-Reviews01.csv", usecols=["review_text","recommend_to_a_friend"])

Unnamed: 0,recommend_to_a_friend,review_text
0,Yes,Estou contente com a compra entrega rápida o ú...
1,Yes,"Por apenas R$1994.20,eu consegui comprar esse ..."
2,Yes,SUPERA EM AGILIDADE E PRATICIDADE OUTRAS PANEL...
3,Yes,MEU FILHO AMOU! PARECE DE VERDADE COM TANTOS D...
4,Yes,"A entrega foi no prazo, as americanas estão de..."


### Define the label

In [None]:
no_df = df[df["recommend_to_a_friend"] == "No"].sample(n=500, random_state=random_state)
yes_df = df[df["recommend_to_a_friend"] == "Yes"].sample(n=500, random_state=random_state)

label_df = pd.concat([no_df, yes_df])

label_df["sentiment"] = label_df["recommend_to_a_friend"].apply(lambda x: "positivo" if str(x).lower() == "yes" else "negativo")

cols = ["sentiment",  "review_text"]
label_df[cols].head()

### Init the AutoLabeling class with few examples

In [9]:
few_shot_df = label_df.sample(n=10)

labeling = AutoLabeling(label_df, text_col="review_text", label_col="sentiment")

### Examples

In [None]:
labeling.execute("nao gostei da qualidade do produto")

In [21]:
labeling.execute("adorei a qualidade do produto")

'positivo'

### Apply to dataset

In [11]:
label_df["labeling"] = label_df["review_text"].apply(labeling.execute)

In [12]:
label_df

Unnamed: 0,recommend_to_a_friend,review_text,sentiment,labeling
113141,No,Entrega estava prevista para 7 dias e chegou e...,negativo,negativo
99572,No,o produto era pra ter chegado a dois dias send...,negativo,negativo
38618,No,"Recebi o produto dentro do prazo estabelecido,...",negativo,negativo
87421,No,"Nao gostei da qualidade do produto, veio falta...",negativo,negativo
123565,No,Comprei e nao recebi produlto ainda adiarao a ...,negativo,negativo
...,...,...,...,...
88774,Yes,"adorei a minha compra,chegou na data certa, fo...",positivo,positivo
88869,Yes,Só não comprei pois tenho que esperar de 11 a ...,positivo,negativo
57841,Yes,"gostei muito do aspirador,assim que recebi o p...",positivo,positivo
18590,Yes,"Produto bom atendeu minhas expectativas, fone ...",positivo,negativo


### Evaluate labeling performance

In [13]:
from sklearn.metrics import accuracy_score, classification_report, roc_auc_score, average_precision_score

In [14]:
mapping = {'negativo': 0, 'positivo': 1}

In [15]:
label_df["true"] = label_df["sentiment"].map(mapping)
label_df["pred"] = label_df["labeling"].map(mapping)

In [16]:
roc_auc_score(label_df["true"].values, label_df["pred"].values)

0.837

In [17]:
average_precision_score(label_df["true"].values, label_df["pred"].values)

0.8223875338753387

In [18]:
print(
    classification_report(label_df["true"].values, label_df["pred"].values)
)

              precision    recall  f1-score   support

           0       0.77      0.97      0.86       500
           1       0.96      0.71      0.81       500

    accuracy                           0.84      1000
   macro avg       0.86      0.84      0.83      1000
weighted avg       0.86      0.84      0.83      1000



### Error analysis

In [23]:
label_df[label_df["true"] != label_df["pred"]].shape

(163, 6)

In [37]:
for idx, row in label_df[label_df["true"] != label_df["pred"]].sample(n=10).iterrows():
    print(f"""{idx} | text: {row["review_text"]}\nLabel: {row["sentiment"]} | labeling: {row["labeling"]} | recommend: {row["recommend_to_a_friend"]}""")
    print()

113308 | text: O antiaderente cerâmico é muito superior ao teflon.
Label: negativo | labeling: positivo | recommend: No

32207 | text: Eu recomendo vale a pena , pois mantém o café quente sem precisar por na garrafa térmica.
Label: positivo | labeling: negativo | recommend: Yes

101232 | text: Ainda não recebi o produto , fiz a compra a quase um mês e não foi entregue ainda pela  transportadora. Esperando receber para avaliar.
Label: positivo | labeling: negativo | recommend: Yes

89237 | text: O produto  muito bom , meu filho adorou  Oi preta também vou vai gostar Eu recomendo,material bom , e bem grande o espaço
Label: positivo | labeling: negativo | recommend: Yes

24187 | text: Recomendo o produto e também o site para a compra, o mesmo foi entregue antes do prazo previsto, muito bom.
Label: negativo | labeling: positivo | recommend: No

21070 | text: Bom rapidez na entrega..,............mas na entrega o entregador não solicitou nenhum documento tá pessoa que recebeu só perguntou o 

In [77]:
from sklearn.feature_extraction.text import TfidfVectorizer
from lightgbm import LGBMClassifier
from sklearn.ensemble import RandomForestClassifier
from sklearn.pipeline import Pipeline
from sklearn.model_selection import train_test_split

In [78]:
word_vectorizer = TfidfVectorizer(sublinear_tf=True,
                                  strip_accents='unicode',
                                  analyzer='word',
                                  max_features=10000)

classifier = RandomForestClassifier()
     
pipeline = Pipeline([
    ('vect', word_vectorizer),
    ('clf', classifier),
])

### Train on original label

In [79]:
label_df_ = label_df.dropna(subset=["review_text"])
X_train, X_test, y_train, y_test = train_test_split(label_df_["review_text"].values, label_df_["sentiment"].values, test_size=0.2)

print(X_train.shape, y_train.shape, X_test.shape, y_test.shape)

pipeline.fit(X_train, y_train)

y_pred = pipeline.predict(X_test)

print(
    classification_report(y_test, y_pred)
)

(768,) (768,) (192,) (192,)
              precision    recall  f1-score   support

    negativo       0.83      0.79      0.81        96
    positivo       0.80      0.83      0.82        96

    accuracy                           0.81       192
   macro avg       0.81      0.81      0.81       192
weighted avg       0.81      0.81      0.81       192



### Train on generated label

In [80]:
label_df_ = label_df.dropna(subset=["review_text"])
X_train, X_test, y_train, y_test = train_test_split(label_df_["review_text"].values, label_df_["labeling"].values, test_size=0.2)

print(X_train.shape, y_train.shape, X_test.shape, y_test.shape)

pipeline.fit(X_train, y_train)

y_pred = pipeline.predict(X_test)

print(
    classification_report(y_test, y_pred)
)

(768,) (768,) (192,) (192,)
                                   precision    recall  f1-score   support

aticamente resolver o problema. n       0.00      0.00      0.00         1
                         negativo       0.75      0.90      0.82       107
                         positivo       0.83      0.63      0.72        84

                         accuracy                           0.78       192
                        macro avg       0.53      0.51      0.51       192
                     weighted avg       0.78      0.78      0.77       192



  _warn_prf(average, modifier, msg_start, len(result))
  _warn_prf(average, modifier, msg_start, len(result))
  _warn_prf(average, modifier, msg_start, len(result))
