In [447]:
#!pip install simpledorff
import simpledorff as sf
import pandas as pd
import json
import numpy as np
from glom import glom
pd.__version__
pd.set_option("display.max_rows", None, "display.max_columns", None)

In [384]:
def create_dataframe(json_path, annotator_int):
    # load data using Python JSON module
    with open(json_path,'r') as f:
        data = json.loads(f.read())
    # Flatten data, keep entry ID and person who completed the data
    df_base_list = pd.json_normalize(data, record_path =['annotations', 'result'], meta = [
        'id',
        ['annotations', 'completed_by'],
        ['annotations', 'id'],
    ], record_prefix = '_',
        errors = 'ignore'
                                      )

    # load original data separately
    with open(json_path,'r') as f:
        data = json.loads(f.read())
    # Flatten data, keep entry ID and person who completed the data
    df_original_data = pd.json_normalize(data, max_level=1, meta = ['id'], record_prefix = '_',
        errors = 'ignore'
                                      )

    # Only keep relevant columns from df_original_data
    series_id = df_original_data['id']
    series_data = df_original_data['data.text']
    df_original_data = pd.concat([series_id, series_data], axis=1)


    # Add original data to dataframe
    df_base_list = pd.merge(df_base_list, df_original_data, how='inner', left_on=['id'], right_on=['id'])

    # Only keep relevant columns from df_base_list
    series_datatype = df_base_list['_from_name']
    series_start = df_base_list['_value.start']
    series_end = df_base_list['_value.end']
    series_text = df_base_list['_value.text']
    series_label = df_base_list['_value.labels']
    series_speakerid = df_base_list['_meta.text']
    series_annotator = df_base_list['annotations.completed_by']
    series_id = df_base_list['annotations.id']
    series_original = df_base_list['data.text']
    df_base_list = pd.concat([series_datatype, series_start, series_end, series_text, series_label, 
                              series_speakerid, series_annotator, series_id, series_original], axis=1)

    # Rename remaining columns
    df_base_list.columns = ['data_type', 'start', 'end', 'text', 'label', 'speaker_id', 'annotator', 'id', 'original_data']

    # Anonymise annotator by giving them a number
    df_base_list['annotator'] = annotator_int

    # Remove useless lists in labels and convert to string
    df_base_list['label'] = df_base_list['label'].str[0]
    df_base_list['label'] = df_base_list['label'].astype(str)

    # Separate speakers and speeches
    df_speakers = df_base_list[df_base_list['label'] == "Speaker"]
    df_speeches = df_base_list[df_base_list['label'] != "Speaker"]

    #Clean speakers dataframe by removing unused columns
    df_speakers = df_speakers.drop(['data_type', 'start', 'end', 'label', 'annotator', 'id', 'original_data'], axis=1)
    # Remove useless list in speaker_id
    df_speakers['speaker_id'] = df_speakers['speaker_id'].str[0]

    # Replace NaN values with -1 values, so we can convert the columns to int
    df_speeches['id'] = df_speeches['id'].fillna(-1)
    df_speakers['speaker_id'] = df_speakers['speaker_id'].fillna(-1)

    # Convert both columns to integer so we can merge later
    df_speeches['id'] = df_speeches['id'].astype(int)
    df_speakers['speaker_id'] = df_speakers['speaker_id'].astype(int)

    # Merge speakers and speeches dataframes based on matching IDs
    df_final = pd.merge(df_speeches, df_speakers, how='inner', left_on=['id'], right_on=['speaker_id'])

    # Delete unused columns and rename new ones
    df_final = df_final.drop(['speaker_id_x', 'speaker_id_y'], axis=1)
    df_final.columns = ['data_type', 'start', 'end', 'text', 'label', 'annotator', 'id', 'original_data', 'speaker']

    # Remove speech lines and only keep those with emotions
    df_final = df_final[df_final['data_type'] == 'emotion']

    return df_final

In [476]:
def merge_dataframes(json_path_list):
    dataframes = []
    # Create the dataframes from json_path_list
    for idx, file in enumerate(json_path_list):
        df = create_dataframe(file, idx)
        dataframes.append(df)

    # Concatenate all dataframes into one
    df = pd.concat(dataframes)

    # Turn emotions into numerical value
    codes, unique = pd.factorize(df['label'])
    df['label'] = codes
    
    # Create rounded length of text to use as a margin of error when grouping
    df['rounded_length'] = (df['end'] - df['start']).round(-1)
    
    # Calculate Krippendorff's alpha
    kripp = sf.calculate_krippendorffs_alpha_for_df(df,experiment_col='rounded_length', annotator_col='annotator', class_col='label')
    print(kripp)
    
    # Group rows by original_data and length of text
    df = df.groupby(['original_data', 'rounded_length'])
    print(unique)

    return df

In [487]:
json_list_1 = ['Jsonfiles/ch1_1.json', 'Jsonfiles/ch1_2.json', 'Jsonfiles/ch1_3.json']
json_list_16 = ['Jsonfiles/ch16_1.json', 'Jsonfiles/ch16_2.json', 'Jsonfiles/ch16_3.json']
json_list_17 = ['Jsonfiles/ch17_1.json', 'Jsonfiles/ch17_3.json', 'Jsonfiles/ch17_4.json']
json_list_18 = ['Jsonfiles/ch18_1.json', 'Jsonfiles/ch18_2.json']
json_list_19 = ['Jsonfiles/ch19_1.json', 'Jsonfiles/ch19_2.json', 'Jsonfiles/ch19_3.json', 'Jsonfiles/ch19_4.json']
json_list_20 = ['Jsonfiles/ch20_1.json', 'Jsonfiles/ch20_2.json', 'Jsonfiles/ch20_3.json']
json_list_21 = ['Jsonfiles/ch21_1.json', 'Jsonfiles/ch21_2.json', 'Jsonfiles/ch21_3.json', 'Jsonfiles/ch21_3.json']
json_list_22 = ['Jsonfiles/ch22_1.json', 'Jsonfiles/ch22_2.json', 'Jsonfiles/ch22_3.json']
json_list_23 = ['Jsonfiles/ch23_1.json', 'Jsonfiles/ch23_2.json', 'Jsonfiles/ch23_3.json', 'Jsonfiles/ch23_4.json']
json_list_24 = ['Jsonfiles/ch24_1.json', 'Jsonfiles/ch24_2.json', 'Jsonfiles/ch24_3.json']

chapter_1 = merge_dataframes(json_list_1)
chapter_16 = merge_dataframes(json_list_16)
chapter_17 = merge_dataframes(json_list_17)
chapter_18 = merge_dataframes(json_list_18)
chapter_19 = merge_dataframes(json_list_19)
chapter_20 = merge_dataframes(json_list_20)
#chapter_21 = merge_dataframes(json_list_21)
chapter_22 = merge_dataframes(json_list_22)
chapter_23 = merge_dataframes(json_list_23)
chapter_24 = merge_dataframes(json_list_24)

# use this line to display dataframe   
chapter_17.apply(lambda a: a[:])

A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy


0.13510140405616222
Index(['DÃ©goÃ»t', 'ColÃ¨re', 'Peur', 'Tristesse', 'Joie', 'Calme', 'Ardeur',
       'Plaisir'],
      dtype='object')
0.14919852034525272
Index(['ColÃ¨re', 'Tristesse', 'Calme', 'Ardeur', 'Joie', 'Peur', 'Plaisir',
       'DÃ©goÃ»t'],
      dtype='object')
0.09013785790031814
Index(['Tristesse', 'Peur', 'ColÃ¨re', 'Ardeur', 'Calme', 'DÃ©goÃ»t', 'Joie',
       'Plaisir'],
      dtype='object')
0.4722222222222222
Index(['Calme', 'Tristesse', 'Joie', 'Ardeur', 'ColÃ¨re', 'Plaisir', 'Peur'], dtype='object')
0.32815890502420286
Index(['ColÃ¨re', 'Calme', 'Ardeur', 'Tristesse', 'Joie', 'Peur'], dtype='object')
0.291497975708502
Index(['ColÃ¨re', 'Ardeur', 'DÃ©goÃ»t', 'Plaisir', 'Peur', 'Tristesse',
       'Calme'],
      dtype='object')
0.1682926829268293
Index(['Ardeur', 'Calme', 'DÃ©goÃ»t', 'Peur', 'Tristesse', 'ColÃ¨re',
       'Plaisir', 'Joie'],
      dtype='object')
0.20194884287454318
Index(['ColÃ¨re', 'Tristesse', 'Calme', 'Ardeur', 'Joie', 'Peur', 'Plaisir',
   

Unnamed: 0_level_0,Unnamed: 1_level_0,Unnamed: 2_level_0,data_type,start,end,text,label,annotator,id,original_data,speaker,rounded_length
original_data,rounded_length,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1,Unnamed: 12_level_1
"â€” Ah ! malheureux ! pourquoi vous avons-nous donnÃ©s au roi PÃ¨leus qui est mortel , vous qui ne connaÃ®trez point la vieillesse et qui Ãªtes immortels ? Ã‰tait-ce pour que vous subissiez aussi les douleurs humaines ? Car l'homme est le plus malheureux de tous les Ãªtres qui respirent , ou qui rampent sur la terre . Mais le Priamide HektÃ´r ne vous conduira jamais , ni vous , ni vos chars splendides . N'esthYpppHeNce pas assez qu'il possÃ¨de les armes et qu'il s'en glorifie ? Je remplirai vos genoux et votre Ã¢me de vigueur , afin que vous rameniez AutomÃ©dÃ´n de la mÃªlÃ©e , vers les nefs creuses ; car je donnerai la victoire aux Troiens , jusqu'Ã ce qu'ils touchent aux nefs bien construites , jusqu'Ã ce que HÃ©lios tombe et que l'ombre sacrÃ©e arrive .",160,57,emotion,312,472,Mais le Priamide HektÃ´r ne vous conduira jama...,2,0,36,â€” Ah ! malheureux ! pourquoi vous avons-nous...,Zeus,160
"â€” Ah ! malheureux ! pourquoi vous avons-nous donnÃ©s au roi PÃ¨leus qui est mortel , vous qui ne connaÃ®trez point la vieillesse et qui Ãªtes immortels ? Ã‰tait-ce pour que vous subissiez aussi les douleurs humaines ? Car l'homme est le plus malheureux de tous les Ãªtres qui respirent , ou qui rampent sur la terre . Mais le Priamide HektÃ´r ne vous conduira jamais , ni vous , ni vos chars splendides . N'esthYpppHeNce pas assez qu'il possÃ¨de les armes et qu'il s'en glorifie ? Je remplirai vos genoux et votre Ã¢me de vigueur , afin que vous rameniez AutomÃ©dÃ´n de la mÃªlÃ©e , vers les nefs creuses ; car je donnerai la victoire aux Troiens , jusqu'Ã ce qu'ils touchent aux nefs bien construites , jusqu'Ã ce que HÃ©lios tombe et que l'ombre sacrÃ©e arrive .",280,58,emotion,473,749,Je remplirai vos genoux et votre Ã¢me de vigue...,3,0,36,â€” Ah ! malheureux ! pourquoi vous avons-nous...,Zeus,280
"â€” Ah ! malheureux ! pourquoi vous avons-nous donnÃ©s au roi PÃ¨leus qui est mortel , vous qui ne connaÃ®trez point la vieillesse et qui Ãªtes immortels ? Ã‰tait-ce pour que vous subissiez aussi les douleurs humaines ? Car l'homme est le plus malheureux de tous les Ãªtres qui respirent , ou qui rampent sur la terre . Mais le Priamide HektÃ´r ne vous conduira jamais , ni vous , ni vos chars splendides . N'esthYpppHeNce pas assez qu'il possÃ¨de les armes et qu'il s'en glorifie ? Je remplirai vos genoux et votre Ã¢me de vigueur , afin que vous rameniez AutomÃ©dÃ´n de la mÃªlÃ©e , vers les nefs creuses ; car je donnerai la victoire aux Troiens , jusqu'Ã ce qu'ils touchent aux nefs bien construites , jusqu'Ã ce que HÃ©lios tombe et que l'ombre sacrÃ©e arrive .",750,56,emotion,2,749,Ah ! malheureux ! pourquoi vous avons-nous don...,0,0,36,â€” Ah ! malheureux ! pourquoi vous avons-nous...,Zeus,750
"â€” Ah ! malheureux ! pourquoi vous avons-nous donnÃ©s au roi PÃ¨leus qui est mortel , vous qui ne connaÃ®trez point la vieillesse et qui Ãªtes immortels ? Ã‰tait-ce pour que vous subissiez aussi les douleurs humaines ? Car l'homme est le plus malheureux de tous les Ãªtres qui respirent , ou qui rampent sur la terre . Mais le Priamide HektÃ´r ne vous conduira jamais , ni vous , ni vos chars splendides . N'esthYpppHeNce pas assez qu'il possÃ¨de les armes et qu'il s'en glorifie ? Je remplirai vos genoux et votre Ã¢me de vigueur , afin que vous rameniez AutomÃ©dÃ´n de la mÃªlÃ©e , vers les nefs creuses ; car je donnerai la victoire aux Troiens , jusqu'Ã ce qu'ils touchent aux nefs bien construites , jusqu'Ã ce que HÃ©lios tombe et que l'ombre sacrÃ©e arrive .",750,29,emotion,2,749,Ah ! malheureux ! pourquoi vous avons-nous don...,0,1,52,â€” Ah ! malheureux ! pourquoi vous avons-nous...,le KroniÃ´n,750
"â€” Ah ! malheureux ! pourquoi vous avons-nous donnÃ©s au roi PÃ¨leus qui est mortel , vous qui ne connaÃ®trez point la vieillesse et qui Ãªtes immortels ? Ã‰tait-ce pour que vous subissiez aussi les douleurs humaines ? Car l'homme est le plus malheureux de tous les Ãªtres qui respirent , ou qui rampent sur la terre . Mais le Priamide HektÃ´r ne vous conduira jamais , ni vous , ni vos chars splendides . N'esthYpppHeNce pas assez qu'il possÃ¨de les armes et qu'il s'en glorifie ? Je remplirai vos genoux et votre Ã¢me de vigueur , afin que vous rameniez AutomÃ©dÃ´n de la mÃªlÃ©e , vers les nefs creuses ; car je donnerai la victoire aux Troiens , jusqu'Ã ce qu'ils touchent aux nefs bien construites , jusqu'Ã ce que HÃ©lios tombe et que l'ombre sacrÃ©e arrive .",750,38,emotion,2,749,Ah ! malheureux ! pourquoi vous avons-nous don...,2,2,33,â€” Ah ! malheureux ! pourquoi vous avons-nous...,KroniÃ´n,750
"â€” Aias , chefs des Argiens , et toi , MÃ¨rionÃ¨s , souvenez-vous de la douceur du malheureux Patroklos ! Pendant sa vie , il Ã©tait plein de douceur pour tous ; et , maintenant , la mort et la moire l'ont saisi !",100,24,emotion,2,102,"Aias , chefs des Argiens , et toi , MÃ¨rionÃ¨s...",3,0,62,"â€” Aias , chefs des Argiens , et toi , MÃ¨rio...",MÃ©nÃ©laos,100
"â€” Aias , chefs des Argiens , et toi , MÃ¨rionÃ¨s , souvenez-vous de la douceur du malheureux Patroklos ! Pendant sa vie , il Ã©tait plein de douceur pour tous ; et , maintenant , la mort et la moire l'ont saisi !",100,2,emotion,2,102,"Aias , chefs des Argiens , et toi , MÃ¨rionÃ¨s...",2,1,81,"â€” Aias , chefs des Argiens , et toi , MÃ¨rio...",MÃ©nÃ©laos,100
"â€” Aias , chefs des Argiens , et toi , MÃ¨rionÃ¨s , souvenez-vous de la douceur du malheureux Patroklos ! Pendant sa vie , il Ã©tait plein de douceur pour tous ; et , maintenant , la mort et la moire l'ont saisi !",110,1,emotion,103,209,"Pendant sa vie , il Ã©tait plein de douceur po...",5,1,81,"â€” Aias , chefs des Argiens , et toi , MÃ¨rio...",MÃ©nÃ©laos,110
"â€” Aias , chefs des Argiens , et toi , MÃ¨rionÃ¨s , souvenez-vous de la douceur du malheureux Patroklos ! Pendant sa vie , il Ã©tait plein de douceur pour tous ; et , maintenant , la mort et la moire l'ont saisi !",210,23,emotion,2,209,"Aias , chefs des Argiens , et toi , MÃ¨rionÃ¨s...",0,0,62,"â€” Aias , chefs des Argiens , et toi , MÃ¨rio...",MÃ©nÃ©laos,210
"â€” Aias , chefs des Argiens , et toi , MÃ¨rionÃ¨s , souvenez-vous de la douceur du malheureux Patroklos ! Pendant sa vie , il Ã©tait plein de douceur pour tous ; et , maintenant , la mort et la moire l'ont saisi !",210,15,emotion,2,209,"Aias , chefs des Argiens , et toi , MÃ¨rionÃ¨s...",0,2,58,"â€” Aias , chefs des Argiens , et toi , MÃ¨rio...",MÃ©nÃ©laos,210
