In [1]:
import numpy as np
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt

import torch
import torch.nn as nn

from transformers import AutoTokenizer, AutoModelForSequenceClassification, BertConfig

from captum.attr import visualization as viz
from captum.attr import LayerIntegratedGradients

import re

In [2]:
# load model
device='cuda'
model = AutoModelForSequenceClassification.from_pretrained("vinai/phobert-base",num_labels=3)
model.to(device)
model.eval()
model.zero_grad()

# load tokenizer
tokenizer = AutoTokenizer.from_pretrained("vinai/phobert-base")

def tokenize_function(examples):
    return tokenizer(examples["text"], padding="max_length", truncation=True)
def oh(examples):
    return tokenizer(examples["text"], padding="max_length", truncation=True)

Some weights of the model checkpoint at vinai/phobert-base were not used when initializing RobertaForSequenceClassification: ['lm_head.layer_norm.weight', 'roberta.pooler.dense.weight', 'lm_head.layer_norm.bias', 'lm_head.dense.bias', 'lm_head.dense.weight', 'lm_head.decoder.bias', 'lm_head.decoder.weight', 'lm_head.bias', 'roberta.pooler.dense.bias']
- This IS expected if you are initializing RobertaForSequenceClassification from the checkpoint of a model trained on another task or with another architecture (e.g. initializing a BertForSequenceClassification model from a BertForPreTraining model).
- This IS NOT expected if you are initializing RobertaForSequenceClassification from the checkpoint of a model that you expect to be exactly identical (initializing a BertForSequenceClassification model from a BertForSequenceClassification model).
Some weights of RobertaForSequenceClassification were not initialized from the model checkpoint at vinai/phobert-base and are newly initialized: ['

In [3]:
def process(obj):
    return re.sub(r"[!@#$'\n]", '', " ".join([str(i) for i in obj]))


In [4]:
ENTUBE = 'entube.parquet'
entube = pd.read_parquet(ENTUBE)
entube['tags'] = entube['tags'].map(process)
entube['title'] = entube['title'] + " split " + entube['tags']
entube['title'].iloc[1213]

'Lời Nguyền trên Bến Sông Full HD | Phim Việt Nam 2017 Mới Hay Nhất split lời nguyền trên bến sông phim viet nam 2017 phim việt nam 2017 phim viet nam moi nhat phim việt nam mới nhất phim việt nam phim viet nam phim việt nam hay nhất phim việt nam mới nhất 2017 phim hay 2017 phim hay phim hay chiếu rạp phim phim vn phim online phim moi 2017 phim mới lời nguyền full hd loi nguyen tren ben song Phim PhimHay'

In [5]:
entube=entube[["title","label_2"]].rename({'title': 'text', 'label_2': 'label'}, axis=1)

In [6]:
from datasets import Dataset
dataset=Dataset.from_pandas(entube)
dataset=dataset.shuffle(seed=42)
dataset[0]

{'text': '[ Bình Luận CF ] Khi thay cận chiến bằng 6 Nòng VIP - Tiền Zombie v4 split crossfire crossfire 2.0 đột kích crossfire vietnam zombie v4 hunter zombie v4 [ Bình Luận CF ] Khi thay cận chiến bằng 6 Nòng VIP - Tiền Zombie v4 Tiền Zombie v4 [ Bình Luận CF ] Khi thay cận chiến bằng 6 Nòng VIP 6 Nòng VIP - Tiền Zombie v4 thay cận chiến bằng 6 Nòng VIP cận chiến bằng 6 Nòng VIP - Tiền Zombie v4',
 'label': 2}

In [7]:
tokenized_datasets = dataset.map(tokenize_function, batched=True)
tokenized_datasets=tokenized_datasets.train_test_split(test_size=0.1,seed=123)
tokenized_datasets

Map:   0%|          | 0/26236 [00:00<?, ? examples/s]

DatasetDict({
    train: Dataset({
        features: ['text', 'label', 'input_ids', 'token_type_ids', 'attention_mask'],
        num_rows: 23612
    })
    test: Dataset({
        features: ['text', 'label', 'input_ids', 'token_type_ids', 'attention_mask'],
        num_rows: 2624
    })
})

In [8]:
small_train_dataset = tokenized_datasets['train']
small_eval_dataset  = tokenized_datasets['test']

In [9]:
from transformers import DataCollatorWithPadding

data_collator = DataCollatorWithPadding(tokenizer=tokenizer)

In [10]:
import evaluate
metric = evaluate.load("f1", average='micro')

In [11]:
def compute_metrics(eval_pred):
    predictions, labels = eval_pred
    predictions = predictions[:, 0]
    return metric.compute(predictions=predictions, references=labels , average='micro')

In [12]:
from transformers import TrainingArguments, Trainer


training_args = TrainingArguments(
    output_dir='test_trainer',
    do_predict= True, 
    num_train_epochs=3,#3
    evaluation_strategy="steps",
    eval_steps = 1000,
    save_steps = 1000,
    save_total_limit = 2,
    load_best_model_at_end=True,)

In [13]:
trainer = Trainer(
    model=model,
    args=training_args,
    train_dataset = small_train_dataset,
    eval_dataset = small_eval_dataset,
    compute_metrics=compute_metrics,
)

In [14]:
trainer.train()



  0%|          | 0/8856 [00:00<?, ?it/s]

{'loss': 0.8937, 'learning_rate': 4.717705510388438e-05, 'epoch': 0.17}
{'loss': 0.7963, 'learning_rate': 4.435411020776874e-05, 'epoch': 0.34}


  0%|          | 0/328 [00:00<?, ?it/s]

{'eval_loss': 0.8159347176551819, 'eval_f1': 0.20922256097560976, 'eval_runtime': 67.028, 'eval_samples_per_second': 39.148, 'eval_steps_per_second': 4.893, 'epoch': 0.34}
{'loss': 0.7991, 'learning_rate': 4.153116531165312e-05, 'epoch': 0.51}
{'loss': 0.776, 'learning_rate': 3.870822041553749e-05, 'epoch': 0.68}


  0%|          | 0/328 [00:00<?, ?it/s]

{'eval_loss': 0.817158043384552, 'eval_f1': 0.1798780487804878, 'eval_runtime': 66.1943, 'eval_samples_per_second': 39.641, 'eval_steps_per_second': 4.955, 'epoch': 0.68}
{'loss': 0.7658, 'learning_rate': 3.5885275519421866e-05, 'epoch': 0.85}
{'loss': 0.7505, 'learning_rate': 3.3062330623306235e-05, 'epoch': 1.02}


  0%|          | 0/328 [00:00<?, ?it/s]

{'eval_loss': 0.8345897197723389, 'eval_f1': 0.15358231707317074, 'eval_runtime': 66.6526, 'eval_samples_per_second': 39.368, 'eval_steps_per_second': 4.921, 'epoch': 1.02}
{'loss': 0.6987, 'learning_rate': 3.0239385727190605e-05, 'epoch': 1.19}
{'loss': 0.6923, 'learning_rate': 2.741644083107498e-05, 'epoch': 1.36}


  0%|          | 0/328 [00:00<?, ?it/s]

{'eval_loss': 0.7190908193588257, 'eval_f1': 0.1775914634146341, 'eval_runtime': 66.409, 'eval_samples_per_second': 39.513, 'eval_steps_per_second': 4.939, 'epoch': 1.36}
{'loss': 0.719, 'learning_rate': 2.4593495934959352e-05, 'epoch': 1.52}
{'loss': 0.7282, 'learning_rate': 2.1770551038843722e-05, 'epoch': 1.69}


  0%|          | 0/328 [00:00<?, ?it/s]

{'eval_loss': 0.7525172233581543, 'eval_f1': 0.1814024390243902, 'eval_runtime': 66.1195, 'eval_samples_per_second': 39.686, 'eval_steps_per_second': 4.961, 'epoch': 1.69}
{'loss': 0.7027, 'learning_rate': 1.8947606142728095e-05, 'epoch': 1.86}
{'loss': 0.6837, 'learning_rate': 1.6124661246612465e-05, 'epoch': 2.03}


  0%|          | 0/328 [00:00<?, ?it/s]

{'eval_loss': 0.7783710956573486, 'eval_f1': 0.13719512195121952, 'eval_runtime': 66.2475, 'eval_samples_per_second': 39.609, 'eval_steps_per_second': 4.951, 'epoch': 2.03}
{'loss': 0.6258, 'learning_rate': 1.330171635049684e-05, 'epoch': 2.2}
{'loss': 0.6131, 'learning_rate': 1.0478771454381212e-05, 'epoch': 2.37}


  0%|          | 0/328 [00:00<?, ?it/s]

{'eval_loss': 0.7958177924156189, 'eval_f1': 0.14596036585365854, 'eval_runtime': 66.1554, 'eval_samples_per_second': 39.664, 'eval_steps_per_second': 4.958, 'epoch': 2.37}
{'loss': 0.6113, 'learning_rate': 7.655826558265583e-06, 'epoch': 2.54}
{'loss': 0.5956, 'learning_rate': 4.832881662149955e-06, 'epoch': 2.71}


  0%|          | 0/328 [00:00<?, ?it/s]

{'eval_loss': 0.7647254467010498, 'eval_f1': 0.15015243902439024, 'eval_runtime': 66.0687, 'eval_samples_per_second': 39.716, 'eval_steps_per_second': 4.965, 'epoch': 2.71}
{'loss': 0.6117, 'learning_rate': 2.009936766034327e-06, 'epoch': 2.88}
{'train_runtime': 4751.2111, 'train_samples_per_second': 14.909, 'train_steps_per_second': 1.864, 'train_loss': 0.7059136177896915, 'epoch': 3.0}


TrainOutput(global_step=8856, training_loss=0.7059136177896915, metrics={'train_runtime': 4751.2111, 'train_samples_per_second': 14.909, 'train_steps_per_second': 1.864, 'train_loss': 0.7059136177896915, 'epoch': 3.0})

In [15]:
a=trainer.predict(small_eval_dataset)

  0%|          | 0/328 [00:00<?, ?it/s]

In [16]:
predict=np.argmax(a[0], axis=1)
labels=a[1]

In [17]:
from sklearn.metrics import classification_report
print(classification_report(labels, predict))

              precision    recall  f1-score   support

           0       0.68      0.79      0.73       940
           1       0.53      0.42      0.47       768
           2       0.78      0.78      0.78       916

    accuracy                           0.68      2624
   macro avg       0.66      0.66      0.66      2624
weighted avg       0.67      0.68      0.67      2624



In [18]:
from transformers import AutoTokenizer, AutoModelForSequenceClassification, BertConfig
from captum.attr import visualization as viz
from captum.attr import IntegratedGradients, LayerConductance, LayerIntegratedGradients
from captum.attr import configure_interpretable_embedding_layer, remove_interpretable_embedding_layer
import torch
import matplotlib.pyplot as plt
device = torch.device("cuda:0" if torch.cuda.is_available() else "cpu")

In [20]:
# load model
model = AutoModelForSequenceClassification.from_pretrained('test_trainer/checkpoint-4000')
model.to(device)
model.eval()
model.zero_grad()

# load tokenizer
tokenizer = AutoTokenizer.from_pretrained('vinai/phobert-base')

Special tokens have been added in the vocabulary, make sure the associated word embeddings are fine-tuned or trained.


In [21]:
model

RobertaForSequenceClassification(
  (roberta): RobertaModel(
    (embeddings): RobertaEmbeddings(
      (word_embeddings): Embedding(64001, 768, padding_idx=1)
      (position_embeddings): Embedding(258, 768, padding_idx=1)
      (token_type_embeddings): Embedding(1, 768)
      (LayerNorm): LayerNorm((768,), eps=1e-05, elementwise_affine=True)
      (dropout): Dropout(p=0.1, inplace=False)
    )
    (encoder): RobertaEncoder(
      (layer): ModuleList(
        (0-11): 12 x RobertaLayer(
          (attention): RobertaAttention(
            (self): RobertaSelfAttention(
              (query): Linear(in_features=768, out_features=768, bias=True)
              (key): Linear(in_features=768, out_features=768, bias=True)
              (value): Linear(in_features=768, out_features=768, bias=True)
              (dropout): Dropout(p=0.1, inplace=False)
            )
            (output): RobertaSelfOutput(
              (dense): Linear(in_features=768, out_features=768, bias=True)
             

In [22]:
def predict(inputs):
    return model(inputs)[0]

In [23]:
ref_token_id = tokenizer.pad_token_id # A token used for generating token reference
sep_token_id = tokenizer.sep_token_id # A token used as a separator between question and text and it is also added to the end of the text.
cls_token_id = tokenizer.cls_token_id # A token used for prepending to the concatenated question-text word sequence

In [24]:
def construct_input_ref_pair(text, ref_token_id, sep_token_id, cls_token_id):

    text_ids = tokenizer.encode(text, add_special_tokens=False)
    # construct input token ids
    input_ids = [cls_token_id] + text_ids + [sep_token_id]
    # construct reference token ids 
    ref_input_ids = [cls_token_id] + [ref_token_id] * len(text_ids) + [sep_token_id]

    return torch.tensor([input_ids], device=device), torch.tensor([ref_input_ids], device=device), len(text_ids)

def construct_input_ref_token_type_pair(input_ids, sep_ind=0):
    seq_len = input_ids.size(1)
    token_type_ids = torch.tensor([[0 if i <= sep_ind else 1 for i in range(seq_len)]], device=device)
    ref_token_type_ids = torch.zeros_like(token_type_ids, device=device)# * -1
    return token_type_ids, ref_token_type_ids

def construct_input_ref_pos_id_pair(input_ids):
    seq_length = input_ids.size(1)
    position_ids = torch.arange(seq_length, dtype=torch.long, device=device)
    # we could potentially also use random permutation with `torch.randperm(seq_length, device=device)`
    ref_position_ids = torch.zeros(seq_length, dtype=torch.long, device=device)

    position_ids = position_ids.unsqueeze(0).expand_as(input_ids)
    ref_position_ids = ref_position_ids.unsqueeze(0).expand_as(input_ids)
    return position_ids, ref_position_ids
    
def construct_attention_mask(input_ids):
    return torch.ones_like(input_ids)

In [25]:
def custom_forward(inputs):
    preds = predict(inputs)
    return torch.softmax(preds, dim = 1)[0]

In [26]:
lig = LayerIntegratedGradients(custom_forward, model.roberta.embeddings)

In [48]:
text = small_eval_dataset[0]['text']
p=text.find("split")
text=text[p+6:]
text

'Vật vờ vatvo vat vo vinh vat vo điện thoại giá rẻ video công nghệ đánh giá trên tay review smartphone giá rẻ điện thoại trung quốc điện thoại hàn quốc smartphone trung quốc giá bán giá rẻ mở hộp giá bán điện thoại huawei mate 30 pro cài google cho huawei cách cài google cho huawei cài google cho mate 30 pro huawei mate 30 pro camera huawei mate 30 pro review đánh giá huawei mate 30 pro huawei mate 30 pro vat vo huawei mate 30 pro vật vờ'

In [60]:
def explain(i,tag=False):
    p = small_eval_dataset[i]['text'].find("split")
    text = small_eval_dataset[i]['text'][p+6:] if tag else small_eval_dataset[i]['text'][:p-1]
    label = small_eval_dataset[i]['label']
    input_ids, ref_input_ids, sep_id = construct_input_ref_pair(text, ref_token_id, sep_token_id, cls_token_id)
    token_type_ids, ref_token_type_ids = construct_input_ref_token_type_pair(input_ids, sep_id)
    position_ids, ref_position_ids = construct_input_ref_pos_id_pair(input_ids)
    attention_mask = construct_attention_mask(input_ids)

    indices = input_ids[0].detach().tolist()
    all_tokens = tokenizer.convert_ids_to_tokens(indices)
    attributions, delta = lig.attribute(inputs=input_ids,
                                        baselines=ref_input_ids,
                                        n_steps=700,
                                        internal_batch_size=3,
                                        return_convergence_delta=True)
    score = predict(input_ids)
    def summarize_attributions(attributions):
        attributions = attributions.sum(dim=-1).squeeze(0)
        attributions = attributions / torch.norm(attributions)
        return attributions
    attributions_sum = np.abs(summarize_attributions(attributions).cpu())
    attributions_sum[-1]=0
    # storing couple samples in an array for visualization purposes
    score_vis = viz.VisualizationDataRecord(attributions_sum,
                                            torch.softmax(score, dim = 1)[0][torch.argmax(torch.softmax(score, dim = 1)[0])],
                                            torch.argmax(torch.softmax(score, dim = 1)[0]),
                                            label,
                                            text,
                                            attributions_sum.sum(),       
                                            all_tokens,
                                            delta)
    print('\033[1m', 'Visualization For Score', '\033[0m')
    print(viz.visualize_text([score_vis]))

In [61]:
for i in range(30):
    explain(i,tag=False)

[1m Visualization For Score [0m


True Label,Predicted Label,Attribution Label,Attribution Score,Word Importance
2.0,1 (0.49),Mate 30 Pro KHÔNG CÓ GOOGLE: đừng lo,2.61,#s Mate 30 Pro KHÔNG C@@ Ó G@@ OO@@ G@@ LE@@ : đừng lo #/s
,,,,


<IPython.core.display.HTML object>
[1m Visualization For Score [0m


True Label,Predicted Label,Attribution Label,Attribution Score,Word Importance
0.0,0 (0.95),"Hài Vượng Râu Hay Nhất | Nhà Khoa Học và Cộng Sự | Phim Hài Hay Nhất Vượng Râu, Quang Tèo, Giang Còi",3.96,"#s Hài Vượng Râu Hay Nhất | Nhà Khoa Học và Cộng Sự | Phim Hài Hay Nhất Vượng R@@ â@@ u@@ , Quang T@@ è@@ o@@ , Giang Còi #/s"
,,,,


<IPython.core.display.HTML object>
[1m Visualization For Score [0m


True Label,Predicted Label,Attribution Label,Attribution Score,Word Importance
1.0,1 (0.46),"Tập 1, Cho Heo Ăn Cơm, Ôm Ngủ Cùng, Chỉ Có Dì Nga Ở Thủ Đức, Nuôi Heo Làm Thú Cưng Coi Như Con",2.52,"#s Tập 1@@ , Cho Heo Ăn Cơ@@ m@@ , Ôm Ngủ Cù@@ ng@@ , Chỉ Có Dì Nga Ở Thủ Đứ@@ c@@ , Nuôi Heo Làm Thú Cưng Coi Như Con #/s"
,,,,


<IPython.core.display.HTML object>
[1m Visualization For Score [0m


True Label,Predicted Label,Attribution Label,Attribution Score,Word Importance
2.0,2 (0.57),Măng Rừng Khô Thượng Hạng Hiếm Có Trên Thị Trường,2.43,#s Măng Rừng Khô Thượng Hạng Hiếm Có Trên Thị Trường #/s
,,,,


<IPython.core.display.HTML object>
[1m Visualization For Score [0m


True Label,Predicted Label,Attribution Label,Attribution Score,Word Importance
1.0,1 (0.38),Thủ thuật CH-Play : cài giả lập android trên máy tính với Windroy,0.5,#s Thủ thuật CH-@@ Play : cài giả lập andro@@ id trên máy tính với Win@@ dro@@ y #/s
,,,,


<IPython.core.display.HTML object>
[1m Visualization For Score [0m


True Label,Predicted Label,Attribution Label,Attribution Score,Word Importance
2.0,0 (0.59),So sánh Samsung Galaxy A71 và Xiaomi Mi Note 10 Pro,0.51,#s So sánh Samsung Galaxy A@@ 71 và Xiaomi Mi Note 10 Pro #/s
,,,,


<IPython.core.display.HTML object>
[1m Visualization For Score [0m


True Label,Predicted Label,Attribution Label,Attribution Score,Word Importance
0.0,1 (0.72),Thánh Gióng | Vannie In Wonderland | Fairy Tales,0.43,#s Thánh Gióng | Van@@ nie In Won@@ derland | Fair@@ y Tal@@ es #/s
,,,,


<IPython.core.display.HTML object>
[1m Visualization For Score [0m


True Label,Predicted Label,Attribution Label,Attribution Score,Word Importance
1.0,1 (0.47),"(Đã bán) Loa Bose 301 seri 5 - madein Mexico - gãy chốt gài đã làm lại, giá tốt",0.32,"#s (@@ Đã bá@@ n@@ ) Loa Bos@@ e 301 seri 5 - mad@@ ein Mexico - gãy chốt gài đã làm lạ@@ i@@ , giá tốt #/s"
,,,,


<IPython.core.display.HTML object>
[1m Visualization For Score [0m


True Label,Predicted Label,Attribution Label,Attribution Score,Word Importance
0.0,0 (0.79),Xuân Hinh Thanh Ngoan | Vợ Chồng Quán | Xuân Hinh Hat Chèo Hay Nhất,3.75,#s Xuân Hinh Thanh Ngoan | V@@ ơ@@ ̣ Ch@@ ô@@ ̀@@ ng Qu@@ a@@ ́@@ n | Xuân Hinh H@@ at Che@@ ̀@@ o Hay Nh@@ â@@ ́@@ t #/s
,,,,


<IPython.core.display.HTML object>
[1m Visualization For Score [0m


True Label,Predicted Label,Attribution Label,Attribution Score,Word Importance
0.0,0 (0.95),Cười Lộn Ruột Khi Xem Hài Bảo Chung Xưa Hay Nhất,2.99,#s Cười L@@ ộn R@@ uột Khi Xem Hài Bảo Chung Xưa Hay Nhất #/s
,,,,


<IPython.core.display.HTML object>
[1m Visualization For Score [0m


True Label,Predicted Label,Attribution Label,Attribution Score,Word Importance
0.0,2 (0.61),Thiền Tông Tân Diệu - Ta Là Người Hay Ta Là Thần? | Phạm Thị Yến (Tâm Chiếu Hoàn Quán),0.28,#s Thiền Tông Tân Diệu - Ta Là Người Hay Ta Là Thầ@@ n@@ ? | Phạm Thị Yến (@@ Tâm Chiếu Hoàn Quá@@ n@@ ) #/s
,,,,


<IPython.core.display.HTML object>
[1m Visualization For Score [0m


True Label,Predicted Label,Attribution Label,Attribution Score,Word Importance
0.0,0 (0.47),(MWC 2015) So sánh nhanh Galaxy S6 và Galaxy S6 edge,1.77,#s (@@ MWC 201@@ 5) So sánh nhanh Galaxy S6 và Galaxy S6 edge #/s
,,,,


<IPython.core.display.HTML object>
[1m Visualization For Score [0m


True Label,Predicted Label,Attribution Label,Attribution Score,Word Importance
0.0,0 (0.52),Đừng mua S8 nếu bạn không thích những lí do sau đây | H Channel,0.92,#s Đừng mua S8 nếu bạn không thích những lí do sau đây | H Channel #/s
,,,,


<IPython.core.display.HTML object>
[1m Visualization For Score [0m


True Label,Predicted Label,Attribution Label,Attribution Score,Word Importance
2.0,2 (0.83),FAPtv Cơm Nguội: Tập 147 - Đám Cưới Hương Và Đăng,1.27,#s F@@ AP@@ tv Cơm Ng@@ uộ@@ i@@ : Tập 147 - Đám Cưới Hương Và Đăng #/s
,,,,


<IPython.core.display.HTML object>
[1m Visualization For Score [0m


True Label,Predicted Label,Attribution Label,Attribution Score,Word Importance
1.0,0 (0.54),Khui hộp Samsung Galaxy Tab 2 7.0 P3100 - www.mainguyen.vn,0.68,#s Khu@@ i hộp Samsung Galaxy Tab 2 7.0 P@@ 3@@ 100 - www.@@ mai@@ nguyen@@ .vn #/s
,,,,


<IPython.core.display.HTML object>
[1m Visualization For Score [0m


True Label,Predicted Label,Attribution Label,Attribution Score,Word Importance
2.0,2 (0.75),GIÃN CÁCH MỘT MÌNH CÓ GÌ VUI?🤨,1.96,#s GI@@ Ã@@ N CÁ@@ CH M@@ Ộ@@ T M@@ ÌNH C@@ Ó G@@ Ì V@@ U@@ I@@ ?@@ #unk #/s
,,,,


<IPython.core.display.HTML object>
[1m Visualization For Score [0m


True Label,Predicted Label,Attribution Label,Attribution Score,Word Importance
2.0,2 (0.65),#TỔNGĐÀIVV: Bạn gái mới của Vinh Xô tư vấn,0.65,#s #@@ T@@ Ổ@@ NG@@ ĐÀ@@ I@@ V@@ V@@ : Bạn gái mới của Vinh Xô tư vấn #/s
,,,,


<IPython.core.display.HTML object>
[1m Visualization For Score [0m


True Label,Predicted Label,Attribution Label,Attribution Score,Word Importance
2.0,2 (0.56),RƯỢU TẾT • Cơm Đường Cháo Chợ | Tập 2,2.5,#s R@@ ƯỢ@@ U T@@ ẾT • Cơm Đường Cháo Chợ | Tập 2 #/s
,,,,


<IPython.core.display.HTML object>
[1m Visualization For Score [0m


True Label,Predicted Label,Attribution Label,Attribution Score,Word Importance
1.0,1 (0.63),Ảo ảnh thị giác | 3D Illusion | Vannie in Wonderland | THẾ GIỚI MA THUẬT,0.71,#s Ả@@ o ảnh thị giác | 3D Illu@@ sion | Van@@ nie in Won@@ derland | TH@@ Ế GI@@ ỚI MA THU@@ ẬT #/s
,,,,


<IPython.core.display.HTML object>
[1m Visualization For Score [0m


True Label,Predicted Label,Attribution Label,Attribution Score,Word Importance
2.0,1 (0.47),7 mẫu smartphone THẤT BẠI của năm 2020: có cả iPhone!,0.39,#s 7 mẫu smartphone TH@@ ẤT B@@ ẠI của năm 20@@ 20@@ : có cả i@@ Phone@@ ! #/s
,,,,


<IPython.core.display.HTML object>
[1m Visualization For Score [0m


True Label,Predicted Label,Attribution Label,Attribution Score,Word Importance
1.0,0 (0.51),(Đã bán) Amply xem phim Kenwood KA V6000 - cs 240w - ghép vang karaoke tốt,0.44,#s (@@ Đã bá@@ n@@ ) Am@@ p@@ ly xem phim Ken@@ wood KA V@@ 6000 - cs 240@@ w - ghép vang karaoke tốt #/s
,,,,


<IPython.core.display.HTML object>
[1m Visualization For Score [0m


True Label,Predicted Label,Attribution Label,Attribution Score,Word Importance
0.0,0 (0.72),"(Đã bán) Cục dàn mini Onkyo FR X7 - CD MD hát tốt, giải mã không mồi",2.92,"#s (@@ Đã bá@@ n@@ ) Cục dàn mini On@@ kyo FR X7 - CD MD hát tố@@ t@@ , giải mã không mồi #/s"
,,,,


<IPython.core.display.HTML object>
[1m Visualization For Score [0m


True Label,Predicted Label,Attribution Label,Attribution Score,Word Importance
2.0,2 (0.55),Ăn sáng trên mây tại Chợ cao nhất Miền Tây | DU LỊCH NÚI CẤM AN GIANG,1.53,#s Ăn sáng trên mây tại Chợ cao nhất Miền Tây | D@@ U L@@ Ị@@ CH N@@ Ú@@ I C@@ Ấ@@ M AN GI@@ ANG #/s
,,,,


<IPython.core.display.HTML object>
[1m Visualization For Score [0m


True Label,Predicted Label,Attribution Label,Attribution Score,Word Importance
0.0,0 (0.95),Cải Lương Vũ Linh - Tài Linh - Diệp Lang - Hồng Nga Hay Nhất - Cải Lương Xã Hội Việt Nam,3.26,#s Cải Lương Vũ Linh - Tài Linh - Diệp Lang - Hồng Nga Hay Nhất - Cải Lương Xã Hội Việt Nam #/s
,,,,


<IPython.core.display.HTML object>
[1m Visualization For Score [0m


True Label,Predicted Label,Attribution Label,Attribution Score,Word Importance
2.0,2 (0.63),TẬP 1 : Game Kinh Dị Outlast - Khám Phá - Tiền Zombie v4,1.88,#s T@@ Ậ@@ P 1 : Game Kinh Dị Out@@ last - Khám Phá - Tiền Zom@@ bie v@@ 4 #/s
,,,,


<IPython.core.display.HTML object>
[1m Visualization For Score [0m


True Label,Predicted Label,Attribution Label,Attribution Score,Word Importance
0.0,0 (0.71),Cách làm hồ cá mini đẹp nuôi cá | Hồ cá mini đẹp để bàn,3.18,#s Cách làm hồ cá mini đẹp nuôi cá | Hồ cá mini đẹp để bàn #/s
,,,,


<IPython.core.display.HTML object>
[1m Visualization For Score [0m


True Label,Predicted Label,Attribution Label,Attribution Score,Word Importance
0.0,1 (0.49),Bài 8: ICFix thay màn hình iPhone 5c lỗi màn hình,0.52,#s Bài 8@@ : IC@@ Fi@@ x thay màn hình iPhone 5@@ c lỗi màn hình #/s
,,,,


<IPython.core.display.HTML object>
[1m Visualization For Score [0m


True Label,Predicted Label,Attribution Label,Attribution Score,Word Importance
0.0,1 (0.45),Smartphone chính hãng tầm trung GIÁ SỐC đáng mua nhất,0.48,#s Smartphone chính hãng tầm trung GI@@ Á S@@ Ố@@ C đáng mua nhất #/s
,,,,


<IPython.core.display.HTML object>
[1m Visualization For Score [0m


True Label,Predicted Label,Attribution Label,Attribution Score,Word Importance
0.0,0 (0.94),"Hài Xuân | Xuất Hành Giờ Linh | Hài Kịch Tấn Beo, Thanh Nam, Hồng Nga Hay Nhất",3.23,"#s Hài Xuân | Xuất Hành Giờ Linh | Hài Kịch Tấn Be@@ o@@ , Thanh Nam@@ , Hồng Nga Hay Nhất #/s"
,,,,


<IPython.core.display.HTML object>
[1m Visualization For Score [0m


True Label,Predicted Label,Attribution Label,Attribution Score,Word Importance
0.0,0 (0.70),Bác sĩ gia đình | Một ngày làm bác sĩ của Mimi | Nhạc thiếu nhi vui nhộn | BabyBus,3.38,#s Bác sĩ gia đình | Một ngày làm bác sĩ của Mim@@ i | Nhạc thiếu nhi vui nhộn | Baby@@ Bus #/s
,,,,


<IPython.core.display.HTML object>


In [62]:
for i in range(30):
    explain(i,tag=True)

[1m Visualization For Score [0m


True Label,Predicted Label,Attribution Label,Attribution Score,Word Importance
2.0,2 (0.95),Vật vờ vatvo vat vo vinh vat vo điện thoại giá rẻ video công nghệ đánh giá trên tay review smartphone giá rẻ điện thoại trung quốc điện thoại hàn quốc smartphone trung quốc giá bán giá rẻ mở hộp giá bán điện thoại huawei mate 30 pro cài google cho huawei cách cài google cho huawei cài google cho mate 30 pro huawei mate 30 pro camera huawei mate 30 pro review đánh giá huawei mate 30 pro huawei mate 30 pro vat vo huawei mate 30 pro vật vờ,5.07,#s Vật vờ vat@@ vo vat vo vinh vat vo điện thoại giá rẻ video công nghệ đánh giá trên tay review smartphone giá rẻ điện thoại trung quốc điện thoại hàn quốc smartphone trung quốc giá bán giá rẻ mở hộp giá bán điện thoại hu@@ awe@@ i m@@ ate 30 pro cài google cho hu@@ awe@@ i cách cài google cho hu@@ awe@@ i cài google cho m@@ ate 30 pro hu@@ awe@@ i m@@ ate 30 pro camera hu@@ awe@@ i m@@ ate 30 pro review đánh giá hu@@ awe@@ i m@@ ate 30 pro hu@@ awe@@ i m@@ ate 30 pro vat vo hu@@ awe@@ i m@@ ate 30 pro vật vờ #/s
,,,,


<IPython.core.display.HTML object>
[1m Visualization For Score [0m


True Label,Predicted Label,Attribution Label,Attribution Score,Word Importance
0.0,0 (0.95),hài vượng râu hai vuong rau hài vượng râu hay nhất phim hài vượng râu phim hai vuong rau phim hài vượng râu hay vượng râu vuong rau phim hài mới phim hài phim hài hay phim hai hay phim hai moi hài hay nhất hai hay nhat phim hai hài hay hài hài giang còi hài quang tèo nhà khoa học và cộng sự nha khoa hoc va cong su quang tèo quang teo giang còi giang coi nụ cười vàng tv,0.67,#s hài vượng râu hai vu@@ ong rau hài vượng râu hay nhất phim hài vượng râu phim hai vu@@ ong rau phim hài vượng râu hay vượng râu vu@@ ong rau phim hài mới phim hài phim hài hay phim hai hay phim hai moi hài hay nhất hai hay nh@@ at phim hai hài hay hài hài giang còi hài quang t@@ èo nhà khoa học và cộng sự nha khoa hoc va cong su quang t@@ èo quang teo giang còi giang coi nụ cười vàng tv #/s
,,,,


<IPython.core.display.HTML object>
[1m Visualization For Score [0m


True Label,Predicted Label,Attribution Label,Attribution Score,Word Importance
1.0,0 (0.94),lifeinvietnam VietnamStreetFood streetfood nuôi heo thú nuôi con heo di nga nuoi heo nuôi heo làm thú cưng nuoi heo lam thu cung nuôi heo 100kg nuoi heo 100 kg thu cung con lợn kiểng mini pig micro pig baby pig baby pigs cute pigs micro pigs cute pig piglets cute piglets miniature pig inipig teacup pigs nuôi heo 1 tạ thủ đức heo ở thủ đức dì nga nuôi heo trong nhà ngủ với heo heo hót nhất heo hót nhất mxh dì nga nuôi heo heo dì nga,8.33,#s li@@ fe@@ in@@ vietnam Vietnam@@ Stre@@ et@@ Food street@@ food nuôi heo thú nuôi con heo di nga nu@@ oi heo nuôi heo làm thú cưng nu@@ oi heo lam thu cung nuôi heo 100kg nu@@ oi heo 100 kg thu cung con lợn kiểng mini pi@@ g micro pi@@ g baby pi@@ g baby pi@@ gs cu@@ te pi@@ gs micro pi@@ gs cu@@ te pi@@ g pi@@ g@@ let@@ s cu@@ te pi@@ g@@ let@@ s mini@@ a@@ ture pi@@ g ini@@ pi@@ g te@@ ac@@ up pi@@ gs nuôi heo 1 tạ thủ đức heo ở thủ đức dì nga nuôi heo trong nhà ngủ với heo heo hót nhất heo hót nhất m@@ x@@ h dì nga nuôi heo heo dì nga #/s
,,,,


<IPython.core.display.HTML object>
[1m Visualization For Score [0m


True Label,Predicted Label,Attribution Label,Attribution Score,Word Importance
2.0,2 (0.52),măng khô măng rừng măng nứa măng phơi măng đi rừng sinh tồn người rừng,0.73,#s măng khô măng rừng măng nứa măng phơi măng đi rừng sinh tồn người rừng #/s
,,,,


<IPython.core.display.HTML object>
[1m Visualization For Score [0m


True Label,Predicted Label,Attribution Label,Attribution Score,Word Importance
1.0,0 (0.48),cài giả lập android phần mềm giả lập android giả lập android trên máy tính giả lập android trên pc chơi game android trên máy tính chương trình Windroy gia lap dien thoai android phan mem gia lap android tren pc giả lập android trên pc để chơi game Android (Operating System),0.22,#s cài giả lập andro@@ id phần mềm giả lập andro@@ id giả lập andro@@ id trên máy tính giả lập andro@@ id trên p@@ c chơi game andro@@ id trên máy tính chương trình Win@@ dro@@ y gia la@@ p di@@ en tho@@ ai andro@@ id phan m@@ em gia la@@ p andro@@ id tr@@ en p@@ c giả lập andro@@ id trên p@@ c để chơi game Android (@@ Oper@@ ating Syste@@ m@@ ) #/s
,,,,


<IPython.core.display.HTML object>
[1m Visualization For Score [0m


True Label,Predicted Label,Attribution Label,Attribution Score,Word Importance
2.0,2 (0.95),Vật vờ vatvo vat vo vinh vat vo điện thoại giá rẻ video công nghệ đánh giá trên tay review smartphone giá rẻ điện thoại trung quốc điện thoại hàn quốc smartphone trung quốc giá bán giá rẻ mở hộp giá bán điện thoại mi note 10 pro đánh giá mi note 10 pro mi note 10 mi note 10 vat vo mi note 10 review mi note 10 pro vs galaxy a71 galaxy a71 vs mi note 10 galaxy a71 đánh giá galaxy a71 trên tay galaxy a71 galaxy a71 vat vo galaxy a71 đánh giá,5.47,#s Vật vờ vat@@ vo vat vo vinh vat vo điện thoại giá rẻ video công nghệ đánh giá trên tay review smartphone giá rẻ điện thoại trung quốc điện thoại hàn quốc smartphone trung quốc giá bán giá rẻ mở hộp giá bán điện thoại mi note 10 pro đánh giá mi note 10 pro mi note 10 mi note 10 vat vo mi note 10 review mi note 10 pro vs g@@ alaxy a@@ 71 g@@ alaxy a@@ 71 vs mi note 10 g@@ alaxy a@@ 71 đánh giá g@@ alaxy a@@ 71 trên tay g@@ alaxy a@@ 71 g@@ alaxy a@@ 71 vat vo g@@ alaxy a@@ 71 đánh giá #/s
,,,,


<IPython.core.display.HTML object>
[1m Visualization For Score [0m


True Label,Predicted Label,Attribution Label,Attribution Score,Word Importance
0.0,0 (0.72),MC Vannie Kids Children Child Toys Game Story Fairy Tales Wonderland Handmade Challenge Food Vannie And Kids Vannie And Toys Vannie Handmade Vannie Experement Đồ chơi Trẻ em Trẻ con Con nít Búp bê Xe đồ chơi Tô màu Tranh vẽ Truyện cổ tích Bedtime Story Kể chuyện khoa học DIY Education Giáo dục ngựa sắt áo giáp sắt gậy sắt bụi tre Hùng Vương làng Gióng Phù Đổng Thiên Vương,3.0,#s MC Van@@ nie Kids Children Child To@@ ys Game Story Fair@@ y Tal@@ es Won@@ derland Hand@@ made Challenge Food Van@@ nie An@@ d Kids Van@@ nie An@@ d To@@ ys Van@@ nie Hand@@ made Van@@ nie Exper@@ ement Đồ chơi Trẻ em Trẻ con Con nít Búp bê Xe đồ chơi Tô màu Tranh vẽ Truyện cổ tích Bed@@ time Story Kể chuyện khoa học DI@@ Y Education Giáo dục ngựa sắt áo giáp sắt gậy sắt bụi tre Hùng Vương làng Gióng Phù Đ@@ ổng Thiên Vương #/s
,,,,


<IPython.core.display.HTML object>
[1m Visualization For Score [0m


True Label,Predicted Label,Attribution Label,Attribution Score,Word Importance
1.0,1 (0.43),Loa Bose Bose 301 seri 5 loa bose 301 loa bose cao cấp loa bose chính hãng madein Mexico gãy chốt gài đã làm lại giá tốt,0.82,#s Loa Bos@@ e Bos@@ e 301 seri 5 loa bos@@ e 301 loa bos@@ e cao cấp loa bos@@ e chính hãng mad@@ ein Mexico gãy chốt gài đã làm lại giá tốt #/s
,,,,


<IPython.core.display.HTML object>
[1m Visualization For Score [0m


True Label,Predicted Label,Attribution Label,Attribution Score,Word Importance
0.0,0 (0.77),vợ chồng quán xuan hinh xuân hinh xuanhinh xuân hinh thanh ngoan xuân hinh chèo xuân hinh hát văn xuân hinh hay xuân hinh hát chèo xuân hinh cũ xuân hinh hài xuân hinh hay nhất XuânHinh,5.26,#s vơ@@ ̣ ch@@ ô@@ ̀@@ ng qua@@ ́@@ n xu@@ an h@@ inh xuân h@@ inh xu@@ anh@@ inh xuân h@@ inh thanh ngoan xuân h@@ inh che@@ ̀@@ o xuân h@@ inh ha@@ ́@@ t văn xuân h@@ inh hay xuân h@@ inh ha@@ ́@@ t che@@ ̀@@ o xuân h@@ inh cu@@ #unk xuân h@@ inh ha@@ ̀@@ i xuân h@@ inh hay nhâ@@ ́@@ t Xu@@ ân@@ Hinh #/s
,,,,


<IPython.core.display.HTML object>
[1m Visualization For Score [0m


True Label,Predicted Label,Attribution Label,Attribution Score,Word Importance
0.0,0 (0.95),Cười Lộn Ruột Khi Xem Hài Bảo Chung Xưa Hay Nhất cười lộn ruột xem hài bảo chung hai bao chung hài bảo chung hài bảo chung xưa hai xua hài hài xưa bảo chung hài xưa hay nhất bảo chung bao chung hài kịch bảo chung hài việt nam,3.52,#s Cười L@@ ộn R@@ uột Khi Xem Hài Bảo Chung Xưa Hay Nhất cười lộn ruột xem hài bảo chung hai bao chung hài bảo chung hài bảo chung xưa hai xua hài hài xưa bảo chung hài xưa hay nhất bảo chung bao chung hài kịch bảo chung hài việt nam #/s
,,,,


<IPython.core.display.HTML object>
[1m Visualization For Score [0m


True Label,Predicted Label,Attribution Label,Attribution Score,Word Importance
0.0,0 (0.69),thiền tông tân diệu huyền ký của đức phật thiền tông tân diệu là gì huyền ký thiền tông huyền ký của đức phật và những vị ngộ thiền huyền ký thiền tông pdf huyền ký đức phật pdf huyền ký của đức phật pdf huyền ký đức phật thiền tông tân diệu mới nhất thiền tông tân diệu thích nhật từ thiền tông tân diệu 2018 thiền tông tân diệu lừa đảo huyền ký của đức phật tập 1 huyền ký thiền tông tân diệu huyền ký là gì huyền ký như lai clb cúc vàng huyền ký,5.15,#s thiền tông tân diệu huyền ký của đức phật thiền tông tân diệu là gì huyền ký thiền tông huyền ký của đức phật và những vị ngộ thiền huyền ký thiền tông p@@ d@@ f huyền ký đức phật p@@ d@@ f huyền ký của đức phật p@@ d@@ f huyền ký đức phật thiền tông tân diệu mới nhất thiền tông tân diệu thích nhật từ thiền tông tân diệu 2018 thiền tông tân diệu lừa đảo huyền ký của đức phật tập 1 huyền ký thiền tông tân diệu huyền ký là gì huyền ký như lai c@@ lb cúc vàng huyền ký #/s
,,,,


<IPython.core.display.HTML object>
[1m Visualization For Score [0m


True Label,Predicted Label,Attribution Label,Attribution Score,Word Importance
0.0,0 (0.69),galaxy s6 galaxy s6 edge galaxy s6 vs galaxy s6 edge s6 vs s6 edge samsung,0.26,#s g@@ alaxy s@@ 6 g@@ alaxy s@@ 6 edge g@@ alaxy s@@ 6 vs g@@ alaxy s@@ 6 edge s@@ 6 vs s@@ 6 edge sam@@ sung #/s
,,,,


<IPython.core.display.HTML object>
[1m Visualization For Score [0m


True Label,Predicted Label,Attribution Label,Attribution Score,Word Importance
0.0,0 (0.70),hnammobile hoanghamobile điện thoại máy tính bảng iphone samsung galaxy oppo sony asus zenfone trên tay điện thoại trên máy tính bảng trên tay laptop review review máy tính review điện thoại review iphone review macbook video công nghệ đánh giá điện thoại đánh giá máy tính trải nghiệm dùng thử tinh tế diễn đàn công nghệ,5.2,#s h@@ nam@@ mobile hoa@@ ngh@@ amo@@ bile điện thoại máy tính bảng iphone sam@@ sung g@@ alaxy o@@ ppo son@@ y as@@ us zen@@ fone trên tay điện thoại trên máy tính bảng trên tay laptop review review máy tính review điện thoại review iphone review mac@@ book video công nghệ đánh giá điện thoại đánh giá máy tính trải nghiệm dùng thử tinh tế diễn đàn công nghệ #/s
,,,,


<IPython.core.display.HTML object>
[1m Visualization For Score [0m


True Label,Predicted Label,Attribution Label,Attribution Score,Word Importance
2.0,2 (0.84),phim hai FAPtv FAPtivi cơm nguội Ribi Sachi Thai Vu vinh rau phim hai hay phim hai moi nhat phim hai viet nam hai huoc hai moi hai moi nhat hai moi 2015 là anh tập phim hoc duong,2.69,#s phim hai F@@ AP@@ tv F@@ AP@@ tivi cơm nguội Ri@@ bi Sa@@ chi Thai Vu vinh rau phim hai hay phim hai moi nh@@ at phim hai viet nam hai hu@@ oc hai moi hai moi nh@@ at hai moi 2015 là anh tập phim hoc du@@ ong #/s
,,,,


<IPython.core.display.HTML object>
[1m Visualization For Score [0m


True Label,Predicted Label,Attribution Label,Attribution Score,Word Importance
1.0,0 (0.61),Galaxy Tab 2 7.0 P3100 Tab 2 7.0 Tab 2,1.51,#s Galaxy Tab 2 7.0 P@@ 3@@ 100 Tab 2 7.0 Tab 2 #/s
,,,,


<IPython.core.display.HTML object>
[1m Visualization For Score [0m


True Label,Predicted Label,Attribution Label,Attribution Score,Word Importance
2.0,2 (0.95),Song thu channel Song Thư LOVE YOU Song Thư vlog Giãn cách xã hội Dịch covid Phòng dịch Vui vẻ mùa dịch,3.37,#s Song thu chan@@ nel Song Thư LO@@ VE YO@@ U Song Thư v@@ log Gi@@ ãn cách xã hội Dịch co@@ vi@@ d Phòng dịch Vui vẻ mùa dịch #/s
,,,,


<IPython.core.display.HTML object>
[1m Visualization For Score [0m


True Label,Predicted Label,Attribution Label,Attribution Score,Word Importance
2.0,2 (0.95),Vật vờ vatvo vat vo vinh vat vo điện thoại giá rẻ video công nghệ đánh giá trên tay review giá bán giá rẻ mở hộp giá bán điện thoại galaxy tab s6 giá galaxy tab s6 price galaxy tab s6 cũ galaxy tab s6 review galaxy tab s6 tinhte galaxy tab s6 ra mắt galaxy tab s6 đánh giá galaxy tab s6 mở hộp galaxy tab s6 vat vo galaxy tab s6 vật vờ galaxy tab s6 pubg,5.97,#s Vật vờ vat@@ vo vat vo vinh vat vo điện thoại giá rẻ video công nghệ đánh giá trên tay review giá bán giá rẻ mở hộp giá bán điện thoại g@@ alaxy tab s@@ 6 giá g@@ alaxy tab s@@ 6 pri@@ ce g@@ alaxy tab s@@ 6 cũ g@@ alaxy tab s@@ 6 review g@@ alaxy tab s@@ 6 ti@@ nh@@ te g@@ alaxy tab s@@ 6 ra mắt g@@ alaxy tab s@@ 6 đánh giá g@@ alaxy tab s@@ 6 mở hộp g@@ alaxy tab s@@ 6 vat vo g@@ alaxy tab s@@ 6 vật vờ g@@ alaxy tab s@@ 6 pub@@ g #/s
,,,,


<IPython.core.display.HTML object>
[1m Visualization For Score [0m


True Label,Predicted Label,Attribution Label,Attribution Score,Word Importance
2.0,2 (0.77),du xuân tây bắc chơi tết tết ăn tết hoa ban food hoa ban camp,0.83,#s du xuân tây bắc chơi tết tết ăn tết hoa ban food hoa ban cam@@ p #/s
,,,,


<IPython.core.display.HTML object>
[1m Visualization For Score [0m


True Label,Predicted Label,Attribution Label,Attribution Score,Word Importance
1.0,0 (0.71),MC Vannie Kids Children Child Toys Game Story Fairy Tales Wonderland Handmade Challenge Food Vannie And Kids Vannie And Toys Vannie Handmade Vannie Experement Đồ chơi Trẻ em Trẻ con Con nít Búp bê Xe đồ chơi Tô màu Tranh vẽ Truyện cổ tích Bedtime Story Kể chuyện khoa học DIY Education Giáo dục 3d ảo ảnh thị giác,0.22,#s MC Van@@ nie Kids Children Child To@@ ys Game Story Fair@@ y Tal@@ es Won@@ derland Hand@@ made Challenge Food Van@@ nie An@@ d Kids Van@@ nie An@@ d To@@ ys Van@@ nie Hand@@ made Van@@ nie Exper@@ ement Đồ chơi Trẻ em Trẻ con Con nít Búp bê Xe đồ chơi Tô màu Tranh vẽ Truyện cổ tích Bed@@ time Story Kể chuyện khoa học DI@@ Y Education Giáo dục 3@@ d ảo ảnh thị giác #/s
,,,,


<IPython.core.display.HTML object>
[1m Visualization For Score [0m


True Label,Predicted Label,Attribution Label,Attribution Score,Word Importance
2.0,2 (0.95),Vật vờ vatvo vat vo vinh vat vo điện thoại giá rẻ video công nghệ đánh giá trên tay review smartphone giá rẻ điện thoại xách tay điện thoại trung quốc điện thoại hàn quốc smartphone trung quốc giá bán giá rẻ mở hộp giá bán điện thoại smartphone thất bại smartphone thất bại 2020 bphone b86 iphone 12 mini iphone 12 oneplus nord n10 5g sony xperia 10 mark 2,1.95,#s Vật vờ vat@@ vo vat vo vinh vat vo điện thoại giá rẻ video công nghệ đánh giá trên tay review smartphone giá rẻ điện thoại xách tay điện thoại trung quốc điện thoại hàn quốc smartphone trung quốc giá bán giá rẻ mở hộp giá bán điện thoại smartphone thất bại smartphone thất bại 2020 b@@ phone b@@ 86 iphone 12 mini iphone 12 on@@ ep@@ lus nor@@ d n@@ 10 5g son@@ y x@@ per@@ ia 10 mark 2 #/s
,,,,


<IPython.core.display.HTML object>
[1m Visualization For Score [0m


True Label,Predicted Label,Attribution Label,Attribution Score,Word Importance
1.0,0 (0.71),Amply xem phim Amply xem phim Kenwood KA V6000 ghép vang karaoke tốt amply xem phim,0.37,#s Am@@ p@@ ly xem phim Am@@ p@@ ly xem phim Ken@@ wood KA V@@ 6000 ghép vang karaoke tốt amp@@ ly xem phim #/s
,,,,


<IPython.core.display.HTML object>
[1m Visualization For Score [0m


True Label,Predicted Label,Attribution Label,Attribution Score,Word Importance
0.0,0 (0.75),Cục dàn mini dàn mini Onkyo FR X7 giải mã không mồi,2.49,#s Cục dàn mini dàn mini On@@ kyo FR X7 giải mã không mồi #/s
,,,,


<IPython.core.display.HTML object>
[1m Visualization For Score [0m


True Label,Predicted Label,Attribution Label,Attribution Score,Word Importance
2.0,2 (0.75),du lịch núi cấm du lich nui cam chợ mây du lịch núi cấm an giang núi cấm khám phá an giang nui cam châu đốc du lịch miền tây miền tây cáp treo núi cấm nui cam an giang du lich an giang chau doc mien tay ẩm thực thiên cấm sơn người miền tây tung tăng tv tung tang tv du lich du lich mien tay du lịch tự túc vlog du lịch ẩm thực việt nam du lịch an giang khám phá núi cấm huyền bí núi cấm Du lịch châu đốc,2.94,#s du lịch núi cấm du lich nu@@ i cam chợ mây du lịch núi cấm an giang núi cấm khám phá an giang nu@@ i cam châu đốc du lịch miền tây miền tây cáp treo núi cấm nu@@ i cam an giang du lich an giang chau do@@ c mi@@ en tay ẩm thực thiên cấm sơn người miền tây tung tăng tv tung tang tv du lich du lich mi@@ en tay du lịch tự túc v@@ log du lịch ẩm thực việt nam du lịch an giang khám phá núi cấm huyền bí núi cấm Du lịch châu đốc #/s
,,,,


<IPython.core.display.HTML object>
[1m Visualization For Score [0m


True Label,Predicted Label,Attribution Label,Attribution Score,Word Importance
0.0,0 (0.95),cải lương vũ linh tài linh cai luong vu linh tai linh cải lương vũ linh vũ linh tài linh vu linh tai linh vu linh vũ linh cai luong xa hoi vu linh cải lương vũ linh ngọc huyền cai luong vu linh cải lương tài linh tài linh cải lương diệp lang diệp lang cải lương hồng nga hồng nga cai luong hay cai luong viet nam,0.36,#s cải lương vũ linh tài linh cai lu@@ ong vu linh tai linh cải lương vũ linh vũ linh tài linh vu linh tai linh vu linh vũ linh cai lu@@ ong xa hoi vu linh cải lương vũ linh ngọc huyền cai lu@@ ong vu linh cải lương tài linh tài linh cải lương diệp lang diệp lang cải lương hồng nga hồng nga cai lu@@ ong hay cai lu@@ ong viet nam #/s
,,,,


<IPython.core.display.HTML object>
[1m Visualization For Score [0m


True Label,Predicted Label,Attribution Label,Attribution Score,Word Importance
2.0,2 (0.95),TẬP 1 : Game Kinh Dị Outlast - Khám Phá - Tiền Zombie v4 Outlast Tiền Zombie v4 Game Kinh Dị Outlast Tiền Zombie v4 Outlast Game Kinh Dị TẬP 1 : Game Kinh Dị Outlast,1.55,#s T@@ Ậ@@ P 1 : Game Kinh Dị Out@@ last - Khám Phá - Tiền Zom@@ bie v@@ 4 Out@@ last Tiền Zom@@ bie v@@ 4 Game Kinh Dị Out@@ last Tiền Zom@@ bie v@@ 4 Out@@ last Game Kinh Dị T@@ Ậ@@ P 1 : Game Kinh Dị Out@@ last #/s
,,,,


<IPython.core.display.HTML object>
[1m Visualization For Score [0m


True Label,Predicted Label,Attribution Label,Attribution Score,Word Importance
0.0,0 (0.79),cách làm hồ cá mini làm hồ thủy sinh mini hồ thủy sinh mini bể thủy sinh bán cạn bể cá thủy sinh thủy sinh bán cạn hồ cá mini bể cá mini setup hồ cá bán cạn setup hồ bán cạn cách làm hồ cá bán cạn cách làm hồ thủy sinh mini cách làm hồ thủy sinh cách setup bể thủy sinh cdhay cdhay studio,0.83,#s cách làm hồ cá mini làm hồ thủ@@ y sinh mini hồ thủ@@ y sinh mini bể thủ@@ y sinh bán cạn bể cá thủ@@ y sinh thủ@@ y sinh bán cạn hồ cá mini bể cá mini se@@ tup hồ cá bán cạn se@@ tup hồ bán cạn cách làm hồ cá bán cạn cách làm hồ thủ@@ y sinh mini cách làm hồ thủ@@ y sinh cách se@@ tup bể thủ@@ y sinh c@@ d@@ hay c@@ d@@ hay studio #/s
,,,,


<IPython.core.display.HTML object>
[1m Visualization For Score [0m


True Label,Predicted Label,Attribution Label,Attribution Score,Word Importance
0.0,2 (0.65),icfix thay màn hình iphone 5c iphone 5c hư màn hình iphone 5c sọc màn hình iphone 5c sửa iphone 5c ifixit,3.49,#s ic@@ fi@@ x thay màn hình iphone 5@@ c iphone 5@@ c hư màn hình iphone 5@@ c sọc màn hình iphone 5@@ c sửa iphone 5@@ c i@@ fi@@ xit #/s
,,,,


<IPython.core.display.HTML object>
[1m Visualization For Score [0m


True Label,Predicted Label,Attribution Label,Attribution Score,Word Importance
0.0,0 (0.62),msmobile mschannel review Xperia XA1 Sony Xperia XA1 giá sony xa1 sony xa1 ultra sony xperia xa1 ultra sony xperia xa1 giá bao nhiêu sony xa1 giá bao nhiêu gia sony xa1 giá sony xa1 ultra sony xa1 fpt những smartphone giảm giá mạnh nhất dien thoai giam gia nhieu nhat hien nay điện thoại giảm giá sốc 2016 điện thoại giảm giá cuối năm điện thoại giảm giá mạnh nhất điện thoại nào đang giảm giá smartphone giảm giá sốc dien thoai giam gia khuyen mai,5.75,#s ms@@ mobile m@@ sch@@ an@@ nel review Xperia X@@ A1 Sony Xperia X@@ A1 giá son@@ y xa@@ 1 son@@ y xa@@ 1 ul@@ tra son@@ y x@@ per@@ ia xa@@ 1 ul@@ tra son@@ y x@@ per@@ ia xa@@ 1 giá bao nhiêu son@@ y xa@@ 1 giá bao nhiêu gia son@@ y xa@@ 1 giá son@@ y xa@@ 1 ul@@ tra son@@ y xa@@ 1 f@@ pt những smartphone giảm giá mạnh nhất di@@ en tho@@ ai giam gia nhi@@ eu nh@@ at hi@@ en nay điện thoại giảm giá sốc 2016 điện thoại giảm giá cuối năm điện thoại giảm giá mạnh nhất điện thoại nào đang giảm giá smartphone giảm giá sốc di@@ en tho@@ ai giam gia khuy@@ en mai #/s
,,,,


<IPython.core.display.HTML object>
[1m Visualization For Score [0m


True Label,Predicted Label,Attribution Label,Attribution Score,Word Importance
0.0,0 (0.95),xuất hành giờ linh hài xuân hai kich hài kịch xuan hanh gio linh hài kịch tấn beo hai tan beo hài tấn beo tan beo hài hay hài thanh nam thanh nam hài kịch thanh nam hồng nga hài hồng nga hài kịch hồng nga hài hai lúa hai hai lua hai lua hài việt,0.34,#s xuất hành giờ linh hài xuân hai ki@@ ch hài kịch xu@@ an hanh gio linh hài kịch tấn b@@ eo hai tan b@@ eo hài tấn b@@ eo tan b@@ eo hài hay hài thanh nam thanh nam hài kịch thanh nam hồng nga hài hồng nga hài kịch hồng nga hài hai lúa hai hai lu@@ a hai lu@@ a hài việt #/s
,,,,


<IPython.core.display.HTML object>
[1m Visualization For Score [0m


True Label,Predicted Label,Attribution Label,Attribution Score,Word Importance
0.0,0 (0.95),babybus vietnamese babybus vietnamese kids song nhạc thiếu nhi vui nhộn nhạc thiếu nhi hay nhac thieu nhi soi dong bai hat thieu nhi bài hát bác sĩ bác sĩ mimi bác sĩ panda mèo con làm bác sĩ doctor song kiki miumiu bác sĩ mèo nhạc hoạt hình hoạt hình hay hoạt hình gấu trúc mèo mimi timi mèo mimi khám bệnh kids song nhạc thiếu nhi babybus thieu nhi hoạt hình mèo con Bác sĩ gia đình Một ngày làm bác sĩ của Mimi nhac thieu nhi babybus tieng viet,9.6,#s bab@@ y@@ bus vietnam@@ ese bab@@ y@@ bus vietnam@@ ese kids song nhạc thiếu nhi vui nhộn nhạc thiếu nhi hay nh@@ ac thi@@ eu nhi soi dong bai hat thi@@ eu nhi bài hát bác sĩ bác sĩ m@@ imi bác sĩ panda mèo con làm bác sĩ doc@@ tor song ki@@ ki mi@@ um@@ iu bác sĩ mèo nhạc hoạt hình hoạt hình hay hoạt hình gấu trúc mèo m@@ imi ti@@ mi mèo m@@ imi khám bệnh kids song nhạc thiếu nhi bab@@ y@@ bus thi@@ eu nhi hoạt hình mèo con Bác sĩ gia đình Một ngày làm bác sĩ của Mim@@ i nh@@ ac thi@@ eu nhi bab@@ y@@ bus ti@@ eng viet #/s
,,,,


<IPython.core.display.HTML object>


In [64]:
def explain(i,text=""):
    #text = small_eval_dataset[i]['text']
    label = small_eval_dataset[i]['label']
    input_ids, ref_input_ids, sep_id = construct_input_ref_pair(text, ref_token_id, sep_token_id, cls_token_id)
    token_type_ids, ref_token_type_ids = construct_input_ref_token_type_pair(input_ids, sep_id)
    position_ids, ref_position_ids = construct_input_ref_pos_id_pair(input_ids)
    attention_mask = construct_attention_mask(input_ids)

    indices = input_ids[0].detach().tolist()
    all_tokens = tokenizer.convert_ids_to_tokens(indices)
    attributions, delta = lig.attribute(inputs=input_ids,
                                        baselines=ref_input_ids,
                                        n_steps=700,
                                        internal_batch_size=3,
                                        return_convergence_delta=True)
    score = predict(input_ids)
    def summarize_attributions(attributions):
        attributions = attributions.sum(dim=-1).squeeze(0)
        attributions = attributions / torch.norm(attributions)
        return attributions
    attributions_sum = np.abs(summarize_attributions(attributions).cpu())
    # storing couple samples in an array for visualization purposes
    score_vis = viz.VisualizationDataRecord(attributions_sum,
                                            torch.softmax(score, dim = 1)[0][torch.argmax(torch.softmax(score, dim = 1)[0])],
                                            torch.argmax(torch.softmax(score, dim = 1)[0]),
                                            label,
                                            text,
                                            attributions_sum.sum(),       
                                            all_tokens,
                                            delta)
    print('\033[1m', 'Visualization For Score', '\033[0m')
    print(viz.visualize_text([score_vis]))

In [30]:
explain(1,text="Tập 147 - Đám Cưới Hương Và Đăng")

[1m Visualization For Score [0m


True Label,Predicted Label,Attribution Label,Attribution Score,Word Importance
0.0,1 (0.53),Tập 147 - Đám Cưới Hương Và Đăng,2.2,#s Tập 147 - Đám Cưới Hương Và Đăng #/s
,,,,


<IPython.core.display.HTML object>


In [31]:
explain(1,text="FAPtv Cơm Nguội: Tập 147 - Đám Cưới Hương Và Đăng")

[1m Visualization For Score [0m


True Label,Predicted Label,Attribution Label,Attribution Score,Word Importance
0.0,2 (0.83),FAPtv Cơm Nguội: Tập 147 - Đám Cưới Hương Và Đăng,2.16,#s F@@ AP@@ tv Cơm Ng@@ uộ@@ i@@ : Tập 147 - Đám Cưới Hương Và Đăng #/s
,,,,


<IPython.core.display.HTML object>


In [32]:
explain(1,text="Xuân Hinh")

[1m Visualization For Score [0m


True Label,Predicted Label,Attribution Label,Attribution Score,Word Importance
0.0,0 (0.64),Xuân Hinh,1.34,#s Xuân Hinh #/s
,,,,


<IPython.core.display.HTML object>


In [33]:
explain(1,text="Vượng Râu")

[1m Visualization For Score [0m


True Label,Predicted Label,Attribution Label,Attribution Score,Word Importance
0.0,0 (0.70),Vượng Râu,1.58,#s Vượng Râu #/s
,,,,


<IPython.core.display.HTML object>


In [34]:
explain(1,text="Hài Học Đường")

[1m Visualization For Score [0m


True Label,Predicted Label,Attribution Label,Attribution Score,Word Importance
0.0,2 (0.52),Hài Học Đường,1.92,#s Hài Học Đường #/s
,,,,


<IPython.core.display.HTML object>


In [35]:
explain(1,text="Hài")    

[1m Visualization For Score [0m


True Label,Predicted Label,Attribution Label,Attribution Score,Word Importance
0.0,0 (0.68),Hài,1.29,#s Hài #/s
,,,,


<IPython.core.display.HTML object>


In [36]:
explain(1,text="Vợ Ơi! Anh Muốn Làm Chồng - PHIM HÀI TẾT 2023")

[1m Visualization For Score [0m


True Label,Predicted Label,Attribution Label,Attribution Score,Word Importance
0.0,0 (0.80),Vợ Ơi! Anh Muốn Làm Chồng - PHIM HÀI TẾT 2023,2.4,#s Vợ Ơ@@ i@@ ! Anh Muốn Làm Chồng - PH@@ IM H@@ ÀI T@@ ẾT 2023 #/s
,,,,


<IPython.core.display.HTML object>


In [37]:
explain(1,text="FAPtv Cơm Nguội 285: Vợ Ơi! Anh Muốn Làm Chồng - PHIM HÀI TẾT 2023")

[1m Visualization For Score [0m


True Label,Predicted Label,Attribution Label,Attribution Score,Word Importance
0.0,2 (0.62),FAPtv Cơm Nguội 285: Vợ Ơi! Anh Muốn Làm Chồng - PHIM HÀI TẾT 2023,3.06,#s F@@ AP@@ tv Cơm Ng@@ uộ@@ i 28@@ 5@@ : Vợ Ơ@@ i@@ ! Anh Muốn Làm Chồng - PH@@ IM H@@ ÀI T@@ ẾT 2023 #/s
,,,,


<IPython.core.display.HTML object>


In [65]:
explain(0,text="Để mị nói cho mà nghe")

[1m Visualization For Score [0m


True Label,Predicted Label,Attribution Label,Attribution Score,Word Importance
2.0,0 (0.41),Để mị nói cho mà nghe,2.03,#s Để mị nói cho mà nghe #/s
,,,,


<IPython.core.display.HTML object>
