In [1]:
import sys
sys.path.append('../')

In [96]:
import os
import pandas as pd
import numpy as np
from transformers import AutoTokenizer, AutoModelForSequenceClassification, AutoModel
pd.set_option('display.max_colwidth', 150)

In [3]:
from evaluation import evaluation, metrics

## Reading input dataset and results of model inference

In [81]:
df = pd.read_csv('../../data/input/test.tsv', sep='\t')

pred_file = max(os.listdir('../checkpoints/'))
with open(f'../checkpoints/{pred_file}', 'r') as file:
    preds = file.readlines()
preds = [sentence.strip() for sentence in preds]

df['preds_1'] = preds
df['preds_1'] = df['preds_1'].str.lower().str.replace('[?|"]', '', regex=True)
# df['preds_1'] = df.apply(lambda x: post_process(x.toxic_comment, x.preds_1), axis=1)


with open(f'../../data/output/rubertconv_toxic_1.txt', 'r') as file:
    preds = file.readlines()
preds = [sentence.strip() for sentence in preds]

df['preds_2'] = preds


In [82]:
df

Unnamed: 0,toxic_comment,preds_1,preds_2
0,какой дебил эту придумывает,кто эту придумывает,кто эту придумывает
1,В такой ситуации виноваты пидарасы из Ростелек...,"в такой ситуации виноваты люди из ростелекома,...",В такой ситуации виноваты люди из Ростелекома ...
2,"актёр может и не плохой,но как человек - хуйло...","актёр может и не плохой,но как человек-плохой.","актёр может и не плохой, но как человек не очень"
3,мочите всех кто нарушает общественный порядок,"ругайте всех, кто нарушает общественный порядок",наказывайте всех кто нарушает общественный пор...
4,такие же твари и привели этих тварей,такие же люди и привели этих людей,такие же люди и привели этих людей
...,...,...,...
870,это наш местный дурачок из фага,это наш местный дурачок из фага,это наш местный парень из фаги
871,лживая хамелеонша судить ее надо за такое голо...,судить ее надо за такое голосования,судить ее надо за такое голосования
872,2)Это что стих про них что-ли? Это они диванны...,это что стих про них что-ли это они диванные б...,2 ) Это что стих про них что - ли? Это они див...
873,дааааа......муж моей знакомой говорит......мне...,даааа... муж моей знакомой говорит......мне то...,дааааа. . муж моей знакомой говорит...... мне ...


## Style Transfer Accuracy (STA)

In [6]:
style_model, style_tokenizer = evaluation.load_model('SkolkovoInstitute/russian_toxicity_classifier', use_cuda=True)
meaning_model, meaning_tokenizer = evaluation.load_model('cointegrated/LaBSE-en-ru', use_cuda=True, model_class=AutoModel)
cola_model, cola_tolenizer = evaluation.load_model('SkolkovoInstitute/rubert-base-corruption-detector', use_cuda=True)

Some weights of the model checkpoint at cointegrated/LaBSE-en-ru were not used when initializing BertModel: ['cls.predictions.bias', 'cls.predictions.decoder.bias', 'cls.predictions.transform.LayerNorm.weight', 'cls.predictions.transform.dense.bias', 'cls.predictions.decoder.weight', 'cls.seq_relationship.weight', 'cls.predictions.transform.dense.weight', 'cls.seq_relationship.bias', 'cls.predictions.transform.LayerNorm.bias']
- This IS expected if you are initializing BertModel from the checkpoint of a model trained on another task or with another architecture (e.g. initializing a BertForSequenceClassification model from a BertForPreTraining model).
- This IS NOT expected if you are initializing BertModel from the checkpoint of a model that you expect to be exactly identical (initializing a BertForSequenceClassification model from a BertForSequenceClassification model).


In [35]:
def score_all(toxic_inputs, preds):
    accuracy = metrics.evaluate_style(
        model = style_model,
        tokenizer = style_tokenizer,
        texts = preds,
        target_label=0,  # 1 is toxic, 0 is neutral
        batch_size=32, 
        verbose=True
    )
    
    similarity = metrics.evaluate_cosine_similarity(
        model = meaning_model,
        tokenizer = meaning_tokenizer,
        original_texts = toxic_inputs,
        rewritten_texts = preds,
        batch_size=32,
        verbose=False,
    )
    
    fluency = metrics.evaluate_cola_relative(
    model = cola_model,
        tokenizer = cola_tolenizer,
        original_texts = toxic_inputs,
        rewritten_texts = preds,
        target_label=1,
        batch_size=32,
        verbose=False
    )
    
    joint = accuracy * similarity * fluency
    
    return accuracy, similarity, fluency, joint

In [83]:
accuracy, similarity, fluency, joint = score_all(df['toxic_comment'].tolist(), df['preds_1'].tolist())

df['ACC_1'] = accuracy
df['SIM_1'] = similarity
df['FL_1'] = fluency
df['J_1'] = joint

accuracy, similarity, fluency, joint = score_all(df['toxic_comment'].tolist(), df['preds_2'].tolist())

df['ACC_2'] = accuracy
df['SIM_2'] = similarity
df['FL_2'] = fluency
df['J_2'] = joint

  0%|          | 0/28 [00:00<?, ?it/s]

  0%|          | 0/28 [00:00<?, ?it/s]

In [99]:
df

Unnamed: 0,toxic_comment,preds_1,preds_2,ACC_1,SIM_1,FL_1,J_1,ACC_2,SIM_2,FL_2,J_2,preds_best,ACC_best,SIM_best,FL_best,J_best
0,какой дебил эту придумывает,кто эту придумывает,кто эту придумывает,0.998971,0.631474,0.683803,0.431360,0.998971,0.631474,0.683803,0.431359,кто эту придумывает,0.998971,0.631474,0.683803,0.431360
1,В такой ситуации виноваты пидарасы из Ростелекома у которых даже кошка может купить фильм с пульта. Дебилы блять.,"в такой ситуации виноваты люди из ростелекома, у которых даже кошка может купить фильм с пульта.",В такой ситуации виноваты люди из Ростелекома у которых даже кошка может купить фильм с пульта.,0.999496,0.874093,0.792818,0.692647,0.995977,0.913145,0.924662,0.840953,В такой ситуации виноваты люди из Ростелекома у которых даже кошка может купить фильм с пульта.,0.995977,0.913145,0.924662,0.840953
2,"актёр может и не плохой,но как человек - хуйло конченное.","актёр может и не плохой,но как человек-плохой.","актёр может и не плохой, но как человек не очень",0.998329,0.881795,0.774883,0.682146,0.999534,0.843044,0.621035,0.523316,"актёр может и не плохой,но как человек-плохой.",0.998329,0.881795,0.774883,0.682146
3,мочите всех кто нарушает общественный порядок,"ругайте всех, кто нарушает общественный порядок",наказывайте всех кто нарушает общественный порядок,0.998845,0.935085,0.890076,0.831335,0.997884,0.912460,0.915290,0.833398,наказывайте всех кто нарушает общественный порядок,0.997884,0.912460,0.915290,0.833398
4,такие же твари и привели этих тварей,такие же люди и привели этих людей,такие же люди и привели этих людей,0.997959,0.780496,0.797149,0.620902,0.997959,0.780496,0.797149,0.620902,такие же люди и привели этих людей,0.997959,0.780496,0.797149,0.620902
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
870,это наш местный дурачок из фага,это наш местный дурачок из фага,это наш местный парень из фаги,0.328206,1.000000,1.000000,0.328206,0.998344,0.896931,0.917674,0.821727,это наш местный парень из фаги,0.998344,0.896931,0.917674,0.821727
871,лживая хамелеонша судить ее надо за такое голосования,судить ее надо за такое голосования,судить ее надо за такое голосования,0.979471,0.575524,0.881261,0.496775,0.979471,0.575524,0.881262,0.496775,судить ее надо за такое голосования,0.979471,0.575524,0.881262,0.496775
872,"2)Это что стих про них что-ли? Это они диванные бойцы,которые в интернете пишут?Вы там кукухой поехали?","это что стих про них что-ли это они диванные бойцы, которые в интернете пишутвы там с ума сошли","2 ) Это что стих про них что - ли? Это они диванные бойцы, которые в интернете пишут? Вы с ума сошли ?",0.991989,0.753823,0.661024,0.494303,0.445237,0.981342,1.000000,0.436930,"это что стих про них что-ли это они диванные бойцы, которые в интернете пишутвы там с ума сошли",0.991989,0.753823,0.661024,0.494303
873,дааааа......муж моей знакомой говорит......мне только 40....а жене уже 408oiтак знакомая выглядит просто отлично.....а он как жопа из кустов,даааа... муж моей знакомой говорит......мне только 40....а жене уже 408oiтак знакомая выглядит,дааааа. . муж моей знакомой говорит...... мне только 40.... а жене уже 408oiтак знакомая выглядит просто отлично.. .. а он как попа из кустов,0.999117,0.959192,0.936307,0.897304,0.995135,0.980890,0.972936,0.949700,дааааа. . муж моей знакомой говорит...... мне только 40.... а жене уже 408oiтак знакомая выглядит просто отлично.. .. а он как попа из кустов,0.995135,0.980890,0.972936,0.949700


In [85]:
df.select_dtypes('number').mean()

ACC_1    0.919051
SIM_1    0.826204
FL_1     0.895053
J_1      0.680471
ACC_2    0.931153
SIM_2    0.799326
FL_2     0.885088
J_2      0.659880
dtype: float32

In [86]:
def choose_best(joint_1, joint_2, preds_1, preds_2):
    if joint_1 > joint_2:
        return preds_1
    else:
        return preds_2
    
df['preds_best'] = df.apply(lambda x: choose_best(x.J_1, x.J_2, x.preds_1, x.preds_2), axis=1)

accuracy, similarity, fluency, joint = score_all(df['toxic_comment'].tolist(), df['preds_best'].tolist())

df['ACC_best'] = accuracy
df['SIM_best'] = similarity
df['FL_best'] = fluency
df['J_best'] = joint

  0%|          | 0/28 [00:00<?, ?it/s]

In [87]:
df.select_dtypes('number').mean()

ACC_1       0.919051
SIM_1       0.826204
FL_1        0.895053
J_1         0.680471
ACC_2       0.931153
SIM_2       0.799326
FL_2        0.885088
J_2         0.659880
ACC_best    0.967637
SIM_best    0.832490
FL_best     0.922854
J_best      0.748374
dtype: float32

In [107]:
df.drop(columns=['ACC_1', 'SIM_1', 'FL_1','ACC_2', 'SIM_2', 'FL_2','ACC_best', 'SIM_best', 'FL_best',]).sample(10)

Unnamed: 0,toxic_comment,preds_1,preds_2,J_1,J_2,preds_best,J_best
646,Охренеть. Они совсем в правительстве ебанулись,они совсем в правительстве запутались,Они совсем в правительстве с ума сошли,0.492721,0.546637,Они совсем в правительстве с ума сошли,0.546637
334,"О, пришла весна, начались обострения у шизы.","о, пришла весна, начались обострения у шизы.","О, пришла весна, начались обострения у них .",0.826332,0.763344,"о, пришла весна, начались обострения у шизы.",0.826333
830,Все мои аргументы были заглушены поросячьим визгом,все мои аргументы были заглушены поросячьим визгом,Все мои аргументы были заглушены порочным визгом,0.976772,0.518711,все мои аргументы были заглушены поросячьим визгом,0.976772
12,а судью пидора бог накажет. все возвращается бумерангом.,судью бог накажет. все возвращается бумерангом.,а судью бог накажет. все возвращается бумерангом.,0.742221,0.876466,а судью бог накажет. все возвращается бумерангом.,0.876466
669,ну это же дибелоиды трамподауны зделали,ну это же люди трамподауны зделали,ну это же нехорошие люди,0.607582,0.150205,ну это же люди трамподауны зделали,0.607582
505,ты чего людям пиздишь животное,ты чего людям говоришь,ты что людям говоришь?,0.53443,0.579243,ты что людям говоришь?,0.579243
435,"Был о якутах лучшего мнение, а оказалось это какие-то дикие чурки. Возможно, тюрская кровь культура играет свою роль. Буряты якуты.","был о якутах лучшего мнения, а оказалось это какие-то нехорошие люди. возможно, тюрская кровь играет свою роль.","Был о якутах лучшего мнение, а оказалось это какие - то люди . Возможно, тюрская кровь культура играет свою роль. Буряты якуты.",0.828762,0.48209,"был о якутах лучшего мнения, а оказалось это какие-то нехорошие люди. возможно, тюрская кровь играет свою роль.",0.828762
352,"всё заебись,леса валом,черти 95% нелегально добытого и всем по..","всё хорошо,леса валом,черти 95% нелегально добытого и всем по..","всё хорошо, леса валом, 95 % нелегально добытого и всем все равно",0.877419,0.805515,"всё хорошо,леса валом,черти 95% нелегально добытого и всем по..",0.877419
466,админ ну ты и пидор гнойный кто тебя за порядкком то поставил следить уебище петушинное,админ ну ты и кто тебя за порядком то поставил следить,"админ, кто тебя за порядком то поставил следить",0.606847,0.477454,админ ну ты и кто тебя за порядком то поставил следить,0.606847
748,И хули в золотом альбоме нет трека блек фуфела? Незаслуженно забытый трек.,и почему в золотом альбоме нет трека блек фуфла незаслуженно забытый трек.,почему в золотом альбоме нет трека блек фуфелла ? Незаслуженно забытый трек.,0.836208,0.754928,и почему в золотом альбоме нет трека блек фуфла незаслуженно забытый трек.,0.836208


In [89]:
df.to_csv('../../data/output/best.txt', columns=['preds_best'], header=None, index=False)

In [103]:
inds = [329, 612, 120, 433, 464]

In [104]:
df.sort_values(by=['J_best']).loc[inds, ['toxic_comment', 'preds_best', 'ACC_best', 'SIM_best', 'FL_best', 'J_best']]

Unnamed: 0,toxic_comment,preds_best,ACC_best,SIM_best,FL_best,J_best
329,руки ноги оторвать гадам за такое.,наказать надо за такое,0.989391,0.140743,0.811097,0.112945
612,"Тебе не похуй, пидорас ебучий?",Тебе не все равно ?,0.689929,0.331244,0.518265,0.118442
120,вот кому руки то отрубить то надо,вот кому руки то отрубить то надо,0.104469,1.0,1.0,0.104469
433,"Та иди нахуй, очеидно что ты твердолобый жЫрняга",похоже что ты упрямый человек,0.993809,0.154772,1.0,0.153814
464,"кошмар, руки бы оторвать. придурки .:o","кошмар, руки бы оторвать",0.105732,0.83072,0.735392,0.064592
