In [1]:
import pandas as pd

We have created a 20% overlap for the samples to be labeled to assess the inter-rated agreement. Since annotator vary for each label duplicate pair, we can't use the sklearn's solution as it assumes that raters are the same in each case. Averaging the sklearn's  cohen_kappa_score along the pairs is not a viable solution since if you only have one data point per rater pair, the Cohen's kappa score calculation will result in a warning because it expects more variation in the data (or will return 0 if values are different).

We have calculated the Cohen's kappa for the dataset with the (wrong) assumption that there are only two annotators.
Further we improved the calculation with averaging the pairs, for that we have used this [solution](https://towardsdatascience.com/inter-annotator-agreement-2f46c6d37bf3) instead.

In [2]:
# https://towardsdatascience.com/inter-annotator-agreement-2f46c6d37bf3
def cohen_kappa(ann1, ann2):
    """Computes Cohen kappa for pair-wise annotators.
    :param ann1: annotations provided by first annotator
    :type ann1: list
    :param ann2: annotations provided by second annotator
    :type ann2: list
    :rtype: float
    :return: Cohen kappa statistic
    """
    count = 0
    for an1, an2 in zip(ann1, ann2):
        if an1 == an2:
            count += 1
    A = count / len(ann1)  # observed agreement A (Po)

    uniq = set(ann1 + ann2)
    E = 0  # expected agreement E (Pe)
    for item in uniq:
        cnt1 = ann1.count(item)
        cnt2 = ann2.count(item)
        count = ((cnt1 / len(ann1)) * (cnt2 / len(ann2)))
        E += count

    return round((A - E) / (1 - E), 4)

# Loading and preprocessing the data

In [191]:
df_labels = pd.read_json('/Users/katerynaburovova/PycharmProjects/dehumanization/annotation/labels_ready.json')

In [202]:
def extract_emotion(info):
    for classification in info['classifications']:
        if classification['title'] == 'Чи присутня в тексті емоційна оцінка українців?':
            return classification['answer']['title']
    return 'ні, оцінка не присутня'

In [None]:
def extract_emotion(info):
    for classification in info['classifications']:
        if classification['title'] == 'Чи присутня в тексті емоційна оцінка українців?':
            return classification['answer']['title']
    return 'ні, оцінка не присутня'

In [207]:
def extract_dehumanization(info):
    for classification in info['classifications']:
        if classification['title'] == 'Чи прирівнюються українці до неістот, тварин чи людей, позбавлених людських рис (частково або повністю)?':
            return classification['answer']['title']
    return 'ні'

In [210]:
def extract_mention(info):
    for classification in info['classifications']:
        if classification['title'] == 'Чи згадуються в тексті українці або щось українське?':
            return classification['answer']['title']
    return None

In [208]:
df_labels["Dehumanization"] = df_labels.Label.apply(lambda x: extract_dehumanization(x))

In [205]:
df_labels["Emotion"] = df_labels.Label.apply(lambda x: extract_emotion(x))

In [212]:
df_labels["Mention"] = df_labels.Label.apply(lambda x: extract_mention(x))

In [219]:
#some Labels are empty, dropping those
df_labels[df_labels["Mention"].isna()]['Label'][369]

{'objects': [], 'classifications': [], 'relationships': []}

In [220]:
df_labels = df_labels[~df_labels["Mention"].isna()]

In [222]:
len(df_labels)

4250

In [192]:
# import json
# def extract_class_pairs(json_lst):
#     pairs = []
#     for json_str in json_lst:
#         question_title = json_str['title']
#         answer_title = json_str['answer']['title']
#         pairs.append([question_title,answer_title])
#     return pairs

In [72]:
# df_labels['pairs'] = df_labels['Label'].apply(lambda x: extract_class_pairs(x['classifications']))

In [227]:
df = df_labels[['Created By', 'Mention', 'Dehumanization', 'Emotion', 'External ID']]

In [228]:
value_counts = df['External ID'].value_counts()
unique_rows = df[df['External ID'].isin(value_counts[value_counts == 1].index)]
df.drop(unique_rows.index, inplace=True)
df.reset_index(inplace=True, drop=True)

A value is trying to be set on a copy of a slice from a DataFrame

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  df.drop(unique_rows.index, inplace=True)


In [226]:
# for i in range(3):
#     col_name = 'pair{}'.format(i+1)
#     df[col_name] = df['pairs'].apply(lambda x: x[i] if len(x) > i else None)

In [52]:
# df = df[~df['pair1'].isna()]
# df.reset_index(inplace=True, drop=True)

In [109]:
# # text2 = df['pair2'].iloc[9]
# text2 = "['Чи прирівнюються українці до неістот, тварин чи людей, позбавлених людських рис (частково або повністю)?', 'ні']"

In [162]:
# # text3 = df['pair3'].iloc[24]
# text3 = "['Чи присутня в тексті емоційна оцінка українців?', 'ні, оцінка не присутня']"

In [164]:
# # text5 = df['pair3'].iloc[23]
# text5 = "['Чи присутня в тексті емоційна оцінка українців?', 'не можу визначитись з правильною відповіддю']"

In [229]:
df

Unnamed: 0,Created By,Mention,Dehumanization,Emotion,External ID
0,snizannabotvin@gmail.com,так,так,"так, присутня негативна",row_3637.txt
1,snizannabotvin@gmail.com,так,так,"так, присутня негативна",row_3626.txt
2,snizannabotvin@gmail.com,ні,ні,"ні, оцінка не присутня",row_3625.txt
3,snizannabotvin@gmail.com,ні,ні,"ні, оцінка не присутня",row_3468.txt
4,snizannabotvin@gmail.com,ні,ні,"ні, оцінка не присутня",row_3467.txt
...,...,...,...,...,...
1403,eugene.1martynyuk@gmail.com,так,так,"так, присутня негативна",row_9.txt
1404,eugene.1martynyuk@gmail.com,ні,ні,"ні, оцінка не присутня",row_666.txt
1405,eugene.1martynyuk@gmail.com,так,так,"так, присутня негативна",row_21.txt
1406,eugene.1martynyuk@gmail.com,так,так,"так, присутня негативна",row_660.txt


In [184]:
# def replace_with(cell, replace_list):
#     if cell is None:
#         return replace_list
#     else:
#         return cell

In [59]:
# df["Dehumanization"] = df.pair2.apply(lambda x: replace_with(x, text2)[1])

In [60]:
# df["Emotion"] = df.pair3.apply(lambda x: replace_with(x, text3)[1])

In [61]:
# df["Mention"] = df['pair1'].apply(lambda x: x[1])

In [230]:
df = df.sort_values(by='External ID')
df.reset_index(inplace=True, drop=True)

# First attempt to calculate with the assumption that annotators are same

In [231]:
df['Rater'] = ['Rater1' if i % 2 == 0 else 'Rater2' for i in range(len(df))]

In [232]:
from sklearn.metrics import cohen_kappa_score

# define a function to calculate Cohen's kappa for a given column
def calculate_kappa(column_name):
    rater1_labels = df[column_name].loc[df['Rater'] == 'Rater1'].tolist()
    rater2_labels = df[column_name].loc[df['Rater'] == 'Rater2'].tolist()
    kappa = cohen_kappa_score(rater1_labels, rater2_labels)
    return kappa

In [233]:
# calculate Cohen's kappa for the 'Dehumanization' column
dehumanization_kappa = calculate_kappa('Dehumanization')
print("Cohen's kappa for Dehumanization: {:.2f}".format(dehumanization_kappa))

# repeat the above for the 'Emotion' and 'Mention' columns
emotion_kappa = calculate_kappa('Emotion')
print("Cohen's kappa for Emotion: {:.2f}".format(emotion_kappa))

mention_kappa = calculate_kappa('Mention')
print("Cohen's kappa for Mention: {:.2f}".format(mention_kappa))

Cohen's kappa for Dehumanization: 0.69
Cohen's kappa for Emotion: 0.70
Cohen's kappa for Mention: 0.92


# Correct calculation under the real conditions of different annotators

In [234]:
def calculate_cohens_kappa(df, col_name):
    # creating the data for question
    df_column = df[['External ID', 'Created By', col_name]]

    # identifying the overlapping samples and raters who labeled them
    overlapping_samples = df_column.groupby('External ID').filter(lambda x: len(x) > 1)
    unique_sample_ids = overlapping_samples['External ID'].unique()
    rater_pairs = []
    for sample_id in unique_sample_ids:
        raters = overlapping_samples[overlapping_samples['External ID'] == sample_id]['Created By'].tolist()
        rater_pairs.append(raters)

    # averaging the kappa scores for pairs
    kappa_scores = []
    for sample_id, rater_pair in zip(unique_sample_ids, rater_pairs):
        sample_data = overlapping_samples[overlapping_samples['External ID'] == sample_id]
        rater1_labels = sample_data[sample_data['Created By'] == rater_pair[0]][col_name].tolist()[0]
        rater2_labels = sample_data[sample_data['Created By'] == rater_pair[1]][col_name].tolist()[0]
        kappa = cohen_kappa(rater1_labels, rater2_labels)
        kappa_scores.append(kappa)
    mean_kappa_score = sum(kappa_scores) / len(kappa_scores)

    return mean_kappa_score

In [235]:
calculate_cohens_kappa(df, 'Dehumanization')

0.8462920454545458

In [236]:
calculate_cohens_kappa(df, 'Mention')

0.968306818181818

In [237]:
calculate_cohens_kappa(df, 'Emotion')

0.8560982954545455

# Labels export

In [238]:
import os
import pandas as pd

directory_path = "/Users/katerynaburovova/PycharmProjects/dehumanization/annotation/dataset_shuffled"
file_list = []
for filename in os.listdir(directory_path):
    if filename.endswith(".txt"):
        with open(os.path.join(directory_path, filename), "r") as file:
            file_content = file.read()
        file_list.append({"text": file_content, "file_name": filename})

df_datarows = pd.DataFrame(file_list)

In [239]:
df_datarows.rename(columns={'file_name':'External ID'}, inplace=True)
df_datarows

Unnamed: 0,text,External ID
0,"Как известно, свинья везде грязь найдет, и укр...",row_1281.txt
1,"Тогда как многие украинцы, наоборот, слепо вер...",row_2950.txt
2,"О таком щедром и мирном соседе, как Россия, мо...",row_3496.txt
3,🇺🇦❌Денацификация по-винницки Тивривский сельс...,row_2788.txt
4,Укронацисты объявили войну Пушкину.,row_2944.txt
...,...,...
3638,"«Я вас, бл@дей, на этот корабль три года собир...",row_2791.txt
3639,Награжден орденом Мужества за отвагу и самоотв...,row_474.txt
3640,🇷🇺В районе населенного пункта Часов Яр уничтож...,row_2949.txt
3641,Участники конкурса американской армии на замен...,row_1298.txt


In [240]:
df_datarows[df_datarows['External ID'] == 'row_3210.txt']

Unnamed: 0,text,External ID
2016,"""Бандеровцы на Украине сегодня взяли все худше...",row_3210.txt


In [185]:
# df_labels = pd.read_json('/Users/katerynaburovova/PycharmProjects/dehumanization/annotation/labels_ready.json')
# df_labels['pairs'] = df_labels['Label'].apply(lambda x: extract_class_pairs(x['classifications']))
# df_final = df_labels.copy()

In [243]:
df_final=df_labels[['Emotion','Dehumanization', 'Mention', 'External ID', 'Created By']]

In [244]:
df_final

Unnamed: 0,Emotion,Dehumanization,Mention,External ID,Created By
0,"ні, оцінка не присутня",ні,ні,row_3642.txt,kateryna.burovova@ucu.edu.ua
1,"ні, оцінка не присутня",ні,ні,row_3641.txt,kateryna.burovova@ucu.edu.ua
2,"так, присутня негативна",так,так,row_3640.txt,kateryna.burovova@ucu.edu.ua
3,"так, присутня негативна",так,так,row_3639.txt,kateryna.burovova@ucu.edu.ua
4,"так, присутня негативна",так,так,row_3637.txt,snizannabotvin@gmail.com
...,...,...,...,...,...
4279,"так, присутня негативна",так,так,row_9.txt,eugene.1martynyuk@gmail.com
4280,"ні, оцінка не присутня",ні,ні,row_666.txt,eugene.1martynyuk@gmail.com
4281,"так, присутня негативна",так,так,row_21.txt,eugene.1martynyuk@gmail.com
4282,"так, присутня негативна",так,так,row_660.txt,eugene.1martynyuk@gmail.com


In [245]:
df_final["Emotion"].unique()

array(['ні, оцінка не присутня', 'так, присутня негативна',
       'не можу визначитись з правильною відповіддю',
       'так, присутня позитивна'], dtype=object)

In [247]:
df_final["Mention"].unique()


array(['ні', 'так', 'не можу визначитись із відповіддю'], dtype=object)

In [248]:
df_merged = pd.merge(df_final, df_datarows, on='External ID', how='left')

In [249]:
#bs check
df_merged[df_merged['Mention']=='ні']['Dehumanization'].unique()


array(['ні'], dtype=object)

In [250]:
#bs check
df_merged[df_merged['Mention']=='ні']['Emotion'].unique()

array(['ні, оцінка не присутня'], dtype=object)

In [251]:
df_merged

Unnamed: 0,Emotion,Dehumanization,Mention,External ID,Created By,text
0,"ні, оцінка не присутня",ні,ні,row_3642.txt,kateryna.burovova@ucu.edu.ua,"❗️Один из протестующих погиб, заявили в МВД Бе..."
1,"ні, оцінка не присутня",ні,ні,row_3641.txt,kateryna.burovova@ucu.edu.ua,Предлагаем немного отвлечься и поиграть в игру...
2,"так, присутня негативна",так,так,row_3640.txt,kateryna.burovova@ucu.edu.ua,⚡️🇺🇦🇷🇺В Запорожской области ВСУ скапливают вой...
3,"так, присутня негативна",так,так,row_3639.txt,kateryna.burovova@ucu.edu.ua,"Украина открыла глаза Далмерсу, и он начал рас..."
4,"так, присутня негативна",так,так,row_3637.txt,snizannabotvin@gmail.com,Корчинский - дешёвая проститутка неоконовского...
...,...,...,...,...,...,...
4245,"так, присутня негативна",так,так,row_9.txt,eugene.1martynyuk@gmail.com,🇺🇦12 000 укронацистов готовят атаку на Мелитоп...
4246,"ні, оцінка не присутня",ні,ні,row_666.txt,eugene.1martynyuk@gmail.com,Наш фильм неожиданно для нас самих попал в топ...
4247,"так, присутня негативна",так,так,row_21.txt,eugene.1martynyuk@gmail.com,P.S. Укрорейх не спим. @rosich_rus
4248,"так, присутня негативна",так,так,row_660.txt,eugene.1martynyuk@gmail.com,"Наша с вами задача не скатываться в режим ""зра..."


At this stage we should choose whose labels should remain in the final dataset for those samples labeled by 2 labelers.

We have investigated a random portion of disagreements manually as only manual investigation can provide insights into potential biases and/or misunderstanding of guidelines.
We have also considered the annotator expertise and background that we were informed of.

In [252]:
df_labels['Created By'].unique()

array(['kateryna.burovova@ucu.edu.ua', 'snizannabotvin@gmail.com',
       'nazariy.melnychuk9@gmail.com', 'chennnakal@gmail.com',
       's.sterpul@icloud.com', 'mariana.scorp@gmail.com',
       'tutovadesign@gmail.com', 'yevhen.marchenko91@gmail.com',
       'eugene.1martynyuk@gmail.com'], dtype=object)

In [253]:
authors = df_labels['Created By'].unique().tolist()
rating = [1, 4, 7, 6, 8, 2, 5, 3, 9]

In [254]:
data = {'Created By': authors, 'rating': rating}
df_rating = pd.DataFrame(data)

In [255]:
df_rating

Unnamed: 0,Created By,rating
0,kateryna.burovova@ucu.edu.ua,1
1,snizannabotvin@gmail.com,4
2,nazariy.melnychuk9@gmail.com,7
3,chennnakal@gmail.com,6
4,s.sterpul@icloud.com,8
5,mariana.scorp@gmail.com,2
6,tutovadesign@gmail.com,5
7,yevhen.marchenko91@gmail.com,3
8,eugene.1martynyuk@gmail.com,9


In [256]:
df_combined = df_merged.merge(df_rating, on='Created By')

In [257]:
df_combined = df_combined.sort_values(['External ID', 'rating'], ascending=True)

In [258]:
df_combined

Unnamed: 0,Emotion,Dehumanization,Mention,External ID,Created By,text,rating
1219,"так, присутня негативна",так,так,row_0.txt,snizannabotvin@gmail.com,"Всвязи с этим немного поправлю коллег ⤵️ ""Они...",4
1218,"ні, оцінка не присутня",ні,ні,row_1.txt,snizannabotvin@gmail.com,Литературный критик Галина Юзефович о новом ро...,4
1591,"так, присутня негативна",так,так,row_10.txt,snizannabotvin@gmail.com,Почему на базах неонацистов стоят языческие ис...,4
1198,"так, присутня негативна",так,так,row_100.txt,snizannabotvin@gmail.com,Группа добровольцев-медиков из Чеченской Респу...,4
3247,"ні, оцінка не присутня",ні,так,row_1000.txt,tutovadesign@gmail.com,"ВСУшники, переходите на сторону добра, у нас т...",5
...,...,...,...,...,...,...,...
3612,"так, присутня негативна",ні,так,row_996.txt,tutovadesign@gmail.com,И понеслась мазепинщино-петлюровщино-бандеровщ...,5
4121,"так, присутня негативна",ні,так,row_997.txt,yevhen.marchenko91@gmail.com,Наш соратник по русскому движению Алексей Сели...,3
4120,"ні, оцінка не присутня",так,так,row_998.txt,yevhen.marchenko91@gmail.com,Хорошее видео от 4 бригады НМ ЛНР https://t.me...,3
3249,"так, присутня негативна",так,так,row_998.txt,tutovadesign@gmail.com,Хорошее видео от 4 бригады НМ ЛНР https://t.me...,5


In [259]:
df_cleaned = df_combined.drop_duplicates(subset='External ID', keep='first')

In [260]:
df_cleaned

Unnamed: 0,Emotion,Dehumanization,Mention,External ID,Created By,text,rating
1219,"так, присутня негативна",так,так,row_0.txt,snizannabotvin@gmail.com,"Всвязи с этим немного поправлю коллег ⤵️ ""Они...",4
1218,"ні, оцінка не присутня",ні,ні,row_1.txt,snizannabotvin@gmail.com,Литературный критик Галина Юзефович о новом ро...,4
1591,"так, присутня негативна",так,так,row_10.txt,snizannabotvin@gmail.com,Почему на базах неонацистов стоят языческие ис...,4
1198,"так, присутня негативна",так,так,row_100.txt,snizannabotvin@gmail.com,Группа добровольцев-медиков из Чеченской Респу...,4
3247,"ні, оцінка не присутня",ні,так,row_1000.txt,tutovadesign@gmail.com,"ВСУшники, переходите на сторону добра, у нас т...",5
...,...,...,...,...,...,...,...
3613,"ні, оцінка не присутня",ні,так,row_995.txt,tutovadesign@gmail.com,Утренний брифинг Минобороны России: ▪️ россий...,5
3612,"так, присутня негативна",ні,так,row_996.txt,tutovadesign@gmail.com,И понеслась мазепинщино-петлюровщино-бандеровщ...,5
4121,"так, присутня негативна",ні,так,row_997.txt,yevhen.marchenko91@gmail.com,Наш соратник по русскому движению Алексей Сели...,3
4120,"ні, оцінка не присутня",так,так,row_998.txt,yevhen.marchenko91@gmail.com,Хорошее видео от 4 бригады НМ ЛНР https://t.me...,3


Double-checking since it's crucial for our task

In [261]:
value_counts = df_combined['External ID'].value_counts()
unique_rows = df_combined[df_combined['External ID'].isin(value_counts[value_counts == 1].index)]
df_bs_check = df_combined.drop(unique_rows.index)

In [262]:
df_bs_check.sort_values(['External ID'])

Unnamed: 0,Emotion,Dehumanization,Mention,External ID,Created By,text,rating
4119,"так, присутня негативна",так,так,row_1005.txt,yevhen.marchenko91@gmail.com,"Оно провалилось, но укровояки хвалились тем, ч...",3
3242,"так, присутня негативна",ні,так,row_1005.txt,tutovadesign@gmail.com,"Оно провалилось, но укровояки хвалились тем, ч...",5
4118,"так, присутня негативна",так,так,row_1006.txt,yevhen.marchenko91@gmail.com,Западный мем о степени правдивости пропаганды ...,3
3241,"так, присутня негативна",так,так,row_1006.txt,tutovadesign@gmail.com,Западный мем о степени правдивости пропаганды ...,5
4117,"так, присутня негативна",так,так,row_1008.txt,yevhen.marchenko91@gmail.com,Война до последнего украинца – это вовсе не вы...,3
...,...,...,...,...,...,...,...
2384,"так, присутня негативна",так,так,row_98.txt,nazariy.melnychuk9@gmail.com,Благодаря такому единству можно уверенно гаран...,7
126,"ні, оцінка не присутня",ні,ні,row_984.txt,kateryna.burovova@ucu.edu.ua,Этапы Китайской компартии по пути к мировой ге...,1
3673,"ні, оцінка не присутня",ні,ні,row_984.txt,tutovadesign@gmail.com,Этапы Китайской компартии по пути к мировой ге...,5
4120,"ні, оцінка не присутня",так,так,row_998.txt,yevhen.marchenko91@gmail.com,Хорошее видео от 4 бригады НМ ЛНР https://t.me...,3


In [263]:
df_cleaned[df_cleaned['External ID']=='row_1128.txt']

Unnamed: 0,Emotion,Dehumanization,Mention,External ID,Created By,text,rating
507,"так, присутня негативна",так,так,row_1128.txt,snizannabotvin@gmail.com,По виртуальным планам укрорейха они уже взяли ...,4


In [264]:
df_cleaned.to_csv('/Users/katerynaburovova/PycharmProjects/dehumanization/annotation/final_labels.csv')