In [4]:
import pandas as pd
import os

Download the data from:
- [submissions and scripts to reproduce the results published in the metrics task paper](http://ufallab.ms.mff.cuni.cz/~bojar/wmt18-metrics-task-package.tgz)

Download this file and put it in the input folder:
- [wmt18-submitted-data-v1.0.1.tgz](http://data.statmt.org/wmt18/translation-task/wmt18-submitted-data-v1.0.1.tgz)

In [5]:
SRC_PREFIX = 'wmt18-metrics-task-package/input/wmt18-submitted-data/txt/sources/'
REF_PREFIX = 'wmt18-metrics-task-package/input/wmt18-submitted-data/txt/references/'
SYS_PREFIX = 'wmt18-metrics-task-package/input/wmt18-submitted-data/txt/system-outputs/newstest2018/'

### EN-DE corpus:

In [6]:
sources = [line.strip() for line in open(SRC_PREFIX+'newstest2018-ende-src.en')]

In [7]:
references = [line.strip() for line in open(REF_PREFIX+'newstest2018-ende-ref.de')]

### Systems

In [8]:
sys_outputs_files = os.listdir(SYS_PREFIX+'en-de/')
systems = ['.'.join(submission_name.split('.')[1:-1]) for submission_name in sys_outputs_files]

In [9]:
systems

['RWTH-UNSUPER.5484',
 'online-G.0',
 'LMU-unsup.5651',
 'online-F.0',
 'Microsoft-Marian.5691',
 'online-Z.0',
 'LMU-nmt.5741',
 'online-Y.0',
 'MMT-production-system.5594',
 'uedin.5770',
 'JHU.5703',
 'online-A.0',
 'UCAM.5585',
 'NTT.5667',
 'online-B.0',
 'KIT.5486']

In [10]:
def get_system_outputs(lp):
    sys_outputs_files = os.listdir(SYS_PREFIX+f'{lp}/')
    systems = ['.'.join(submission_name.split('.')[1:-1]) for submission_name in sys_outputs_files]
    system_outputs = {}
    for system in sys_outputs_files:
        system_name = '.'.join(system.split('.')[1:-1])
        system_outputs[system_name] = [
            line.strip() for line in open(SYS_PREFIX+f'{lp}/'+system)
        ]
    return system_outputs

In [11]:
en_de_data = pd.DataFrame({'src': sources, 'ref': references, **get_system_outputs('en-de')})

In [12]:
en_de_data.head()

Unnamed: 0,src,ref,RWTH-UNSUPER.5484,online-G.0,LMU-unsup.5651,online-F.0,Microsoft-Marian.5691,online-Z.0,LMU-nmt.5741,online-Y.0,MMT-production-system.5594,uedin.5770,JHU.5703,online-A.0,UCAM.5585,NTT.5667,online-B.0,KIT.5486
0,Munich 1856: Four maps that will change your v...,"München 1856: Vier Karten, die Ihren Blick auf...","München 1856: four maps, dass sich deine Sicht...","München 1856: Vier Karten, dass wird sich ände...",München 1856: Vier Landschaftspunkte zufolge w...,"München 1856: Vier Karten, die Ihre Ansicht de...","München 1856: Vier Karten, die Ihren Blick auf...","München 1856: Vier Karten, die den Blick auf d...","München 1856: Vier Karten, die Ihre Sicht der ...","München 1856: Vier Karten, die Ihren Blick auf...","München 1856: Vier Karten, die Ihren Blick auf...","München 1856: Vier Karten, die Ihre Sicht auf ...","München 1856: Vier Karten, die Ihren Blick auf...","München 1856: vier Karten, die ihren Blick auf...","München 1856: Vier Karten, die Ihren Blick auf...","München 1856: Vier Karten, die Ihren Blick auf...","München 1856: Vier Karten, die Ihren Blick auf...","München 1856: Vier Karten, die Ihre Sicht auf ..."
1,"A mental asylum, where today young people are ...","Eine Irren-Anstalt, wo sich heute Jugendliche ...","Eine seelische Asyl, wo heute junge Menschen z...","Eine Irrenanstalt, wo heute junge Menschen sin...","Ein Ressort Asyl, wo heute junge Menschen zu g...","Ein Geistesasyl, in dem heute junge Leute gesa...","Ein psychisches Asyl, in dem sich heute Jugend...","Ein psychisches Asyl, in dem sich heute Jugend...","Ein mentales Asyl, wo heute Jugendliche zusamm...","Ein psychisches Asyl, in dem heute junge Mensc...","Ein Irrenhaus, wo sich heute junge Menschen tr...","Ein psychisches Asyl, in dem sich heute junge ...","Ein psychisches Asyl, in dem sich heute junge ...","Ein mentales Asyl, wo sich heute junge Mensche...","Ein psychisches Asyl, in dem sich heute Jugend...","Ein psychisches Asyl, wo sich heute junge Mens...","Eine Irrenanstalt, in der sich heute Jugendlic...","Ein psychisches Asyl, wo sich heute Jugendlich..."
2,"A crypt chapel, where they are now digging tun...","Eine Gruftkapelle, wo nun für den S-Bahn-Tunne...","Eine Gruft Kapelle, wo Sie nun Tunnel für die ...","Eine Krypta, die Kapelle, wo Sie heute sind, d...","Eine Krypt-Kapelle, wo sie Tunnelröhren Tunnel...","Eine Kryptakapelle, in der sie jetzt Tunnels f...","Eine Krypta-Kapelle, wo sie jetzt Tunnel für d...","Eine Krypta-Kapelle, in der sie jetzt Tunnel f...","Eine Krypt-Kapelle, in der sie nun Tunnel für ...","Eine Krypta-Kapelle, wo sie nun Tunnel für die...","Eine Krypta-Kapelle, wo sie jetzt Tunnel für d...","Eine Krypta-Kapelle, wo sie jetzt Tunnel für d...","Eine Kryptokapelle, in der sie jetzt Tunnel fü...","Eine Krypta Kapelle, wo Sie jetzt Graben Tunne...","Eine Krypta-Kapelle, in der sie jetzt Tunnel f...","Eine Krypta-Kapelle, wo sie jetzt Tunnel für d...","Eine Kryptenkapelle, in der jetzt Tunnel für d...","Eine Krypta-Kapelle, in der sie jetzt Tunnel f..."
3,Allotment holders cultivate the soil of former...,Kleingärtner bewirtschaften den einstigen Grun...,Parzelle Rück pflegen den Boden der ehemaligen...,Zuteilung die Inhaber pflegen den Boden des eh...,Allotungsvolle Versicherten pflegen die Pflanz...,Zuteilungshalter kultivieren den Boden von ehe...,Zuteilungsbesitzer pflegen den Boden ehemalige...,Kleingärtner bewirtschaften den Boden ehemalig...,Kleinaktionäre pflegen den Boden der ehemalige...,Allotmentinhaber kultivieren den Boden ehemali...,Die Zuteilungsinhaber bewirtschaften den Boden...,Almosenhalter pflegen den Boden früherer Bauern.,Anlieger pflegen den Boden ehemaliger Bauern.,Zuteilungs Inhaber kultivieren den Boden der e...,Zuteilungsbesitzer bewirtschaften den Boden eh...,Zuweisungsberechtigte bewirtschaften den Boden...,Kleingärtner kultivieren den Boden ehemaliger ...,Zuteilungsinhaber bewirtschaften den Boden ehe...
4,The oldest official map of Munich brings capti...,Die älteste offizielle Karte Münchens fördert ...,Die älteste offizielle Landkarte des Münchner ...,"Das älteste offizielle Stadtplan von München, ...",Die älteste offizielle Landkarte von München b...,Die älteste offizielle Karte von München holt ...,Die älteste offizielle Karte Münchens bringt f...,Die älteste offizielle Karte Münchens bringt f...,Die älteste offizielle Landkarte von München b...,Die älteste offizielle Karte Münchens bringt s...,Die älteste offizielle Münchner Landkarte brin...,Die älteste offizielle Karte Münchens bringt f...,Die älteste offizielle Karte Münchens bringt f...,Die älteste Offizielle Karte von München bring...,Die älteste offizielle Karte Münchens bringt f...,Die älteste offizielle Karte Münchens bringt f...,Die älteste offizielle Karte Münchens bringt f...,Die älteste offizielle Karte Münchens bringt f...


## DA scores:

In [13]:
DA_DATA = 'humaneval-seg-da/ad-seg-scores-{}.csv'

In [14]:
def segment_level_da(path, lp):
    with open(path, "r") as fp:
        fp.readline()
        lines = [l.strip() for l in fp.readlines()]
    data = []
    for line in lines:
        sys, sid, raw_score, z, n = line.split()
        data.append({"system": sys, "SID": sid, "raw_score": raw_score, "z_score": z, "annotators": n, "lp": lp})
    return pd.DataFrame(data)

In [15]:
en_de_da_data = segment_level_da(DA_DATA.format('en-de'), "en-de")

In [16]:
en_de_da_data.head()

Unnamed: 0,system,SID,raw_score,z_score,annotators,lp
0,uedin.5770,2710,99,0.706857265714831,1,en-de
1,uedin.5770,2121,84,-0.0835874173853562,1,en-de
2,uedin.5770,540,99,0.706857265714831,1,en-de
3,uedin.5770,1897,57,-1.50638784696569,1,en-de
4,uedin.5770,1564,94,1.05707678225646,2,en-de


In [24]:
from tqdm.notebook import tqdm 

def merge_submissions_with_human_scores(submissions, human_scores):
    
    def system_in_submissions(system):
        for col in submissions.columns:
            if system in col:
                return True
            if col in system:
                return True
        return False
    
    lp, data, src, ref, hyp, raw_score, z_score, annotators = [], [], [], [], [], [], [], []
    for i, row in tqdm(human_scores.iterrows(), total=len(human_scores), desc=list(human_scores.lp)[0]):
        sub_row = submissions.iloc[int(row['SID'])-1] # segments have ids from 1 to 1997
        
        # Not all systems belong to the newstranslation shared task. Some belong
        # to other shared tasks such as unsupervied MT.
        
        if system_in_submissions(row['system']):
            system = row['system']
            hyp.append(sub_row[system])
            lp.append(row['lp'])
            data.append('newstest2019')
            src.append(sub_row['src'])
            ref.append(sub_row['ref'])
            raw_score.append(float(row['raw_score']))
            z_score.append(float(row['z_score']))
            annotators.append(int(row['annotators']))
    
    data = {
        "lp": lp,
        "src": src,
        "mt": hyp,
        "ref": ref,
        "score": z_score,
        "raw_score": raw_score,
        "annotators": annotators
    }
    return pd.DataFrame(data)


In [18]:
en_de_scores_merged = merge_submissions_with_human_scores(en_de_data, en_de_da_data)

HBox(children=(FloatProgress(value=0.0, description='en-de', max=12383.0, style=ProgressStyle(description_widt…




In [19]:
en_de_scores_merged.head()

Unnamed: 0,lp,src,mt,ref,score,raw_score,annotators
0,en-de,"He has teamed up with Dr Geoff Watson, a consu...","Er hat sich mit Dr. Geoff Watson, einem Berate...","Er hat sich mit Dr. Geoff Watson, einem berate...",0.706857,99.0,1
1,en-de,"In my opinion, it would be better to support a...","Meiner Meinung nach wäre es besser, anstelle d...","Meiner Ansicht nach wäre es besser gewesen, ma...",-0.083587,84.0,1
2,en-de,Town authorities and the trade association are...,Stadtverwaltung und Gewerbeverein kooperieren ...,Stadtverwaltung und Gewerbeverein kooperieren ...,0.706857,99.0,1
3,en-de,"""In Mexico you die because they want to shut y...","""In Mexiko stirbt man, weil sie dich verschlie...","""In Mexiko stirbst du, weil sie möchten, dass ...",-1.506388,57.0,1
4,en-de,Well that does sound like a good approach.,"Nun, das klingt nach einem guten Ansatz.",Das hört sich schon mal nach einem guten Ansat...,1.057077,94.0,2


In [20]:
nd_en_de_scores_merged = en_de_scores_merged[~en_de_scores_merged.duplicated(['src', 'ref', 'mt', 'score'])]
len(en_de_scores_merged), len(nd_en_de_scores_merged)

(11982, 10208)

## All Language Pairs:

In [21]:
language_pairs = [
    'zh-en', 'en-zh', 'cs-en',  
    'fi-en', 'ru-en', 'tr-en', 
    'de-en', 'en-cs', 'en-de', 
    'en-et', 'en-fi', 'en-ru', 
    'en-tr', 'et-en'
]

In [25]:
for language_pair in language_pairs:
    try:
        os.makedirs(language_pair)
    except FileExistsError:
        pass
    src, trg = language_pair.split('-')
    lp, lp1 = src + '-' + trg, src + trg
    
    sources = [line.strip() for line in open(SRC_PREFIX+f'newstest2018-{lp1}-src.{src}')]
    references = [line.strip() for line in open(REF_PREFIX+f'newstest2018-{lp1}-ref.{trg}')]
    
    sys_outputs_files = os.listdir(SYS_PREFIX+f'{lp}/')
    systems = ['.'.join(submission_name.split('.')[1:-1]) for submission_name in sys_outputs_files]
    
    lp_data = pd.DataFrame({'src': sources, 'ref': references, **get_system_outputs(lp)})
    
    da_data = segment_level_da(DA_DATA.format(language_pair), language_pair)
    
    merged = merge_submissions_with_human_scores(lp_data, da_data)
    merged = merged[~merged.duplicated(['src', 'ref', 'mt', 'score'])]
    print ("LP {} - scores data size: {}".format(language_pair, len(merged)))
    merged.to_csv(f'{lp}/scores.csv', index=False)

HBox(children=(FloatProgress(value=0.0, description='zh-en', max=30800.0, style=ProgressStyle(description_widt…


LP zh-en - scores data size: 25352


HBox(children=(FloatProgress(value=0.0, description='en-zh', max=27575.0, style=ProgressStyle(description_widt…


LP en-zh - scores data size: 22128


HBox(children=(FloatProgress(value=0.0, description='cs-en', max=10122.0, style=ProgressStyle(description_widt…


LP cs-en - scores data size: 8732


HBox(children=(FloatProgress(value=0.0, description='fi-en', max=17606.0, style=ProgressStyle(description_widt…


LP fi-en - scores data size: 14965


HBox(children=(FloatProgress(value=0.0, description='ru-en', max=15720.0, style=ProgressStyle(description_widt…


LP ru-en - scores data size: 13157


HBox(children=(FloatProgress(value=0.0, description='tr-en', max=14926.0, style=ProgressStyle(description_widt…


LP tr-en - scores data size: 12851


HBox(children=(FloatProgress(value=0.0, description='de-en', max=36330.0, style=ProgressStyle(description_widt…


LP de-en - scores data size: 28404


HBox(children=(FloatProgress(value=0.0, description='en-cs', max=8244.0, style=ProgressStyle(description_width…


LP en-cs - scores data size: 7629


HBox(children=(FloatProgress(value=0.0, description='en-de', max=12383.0, style=ProgressStyle(description_widt…


LP en-de - scores data size: 10208


HBox(children=(FloatProgress(value=0.0, description='en-et', max=14269.0, style=ProgressStyle(description_widt…


LP en-et - scores data size: 13376


HBox(children=(FloatProgress(value=0.0, description='en-fi', max=9013.0, style=ProgressStyle(description_width…


LP en-fi - scores data size: 8097


HBox(children=(FloatProgress(value=0.0, description='en-ru', max=19803.0, style=ProgressStyle(description_widt…


LP en-ru - scores data size: 16748


HBox(children=(FloatProgress(value=0.0, description='en-tr', max=3548.0, style=ProgressStyle(description_width…


LP en-tr - scores data size: 3132


HBox(children=(FloatProgress(value=0.0, description='et-en', max=23998.0, style=ProgressStyle(description_widt…


LP et-en - scores data size: 20496


## Relative Ranks:

The relative-ranks file is not correctly formatted. Please correct the file by replacing the first line by `LP DATA SID BETTER WORSE`.

In [36]:
rr_data = pd.read_csv('wmt18-metrics-task-package/manual-evaluation/RR-seglevel.csv', delimiter=' ')

In [37]:
rr_data

Unnamed: 0,LP,DATA,SID,BETTER,WORSE
0,cs-en,newstest2018,593,CUNI-Transformer.5560,online-B.0
1,cs-en,newstest2018,344,CUNI-Transformer.5560,online-B.0
2,cs-en,newstest2018,345,online-G.0,CUNI-Transformer.5560
3,cs-en,newstest2018,346,uedin.5561,online-A.0
4,cs-en,newstest2018,342,online-B.0,CUNI-Transformer.5560
...,...,...,...,...,...
326847,en-zh,newstest2018,1369,UMD.5680,online-F.0
326848,en-zh,newstest2018,1369,Alibaba-ensemble-system-with-reranking.5738,online-F.0
326849,en-zh,newstest2018,1369,Alibaba-ensemble-system-with-reranking.5738,Tencent-ensemble-system.5760
326850,en-zh,newstest2018,1369,Alibaba-ensemble-system-with-reranking.5738,Alibaba-General-System.5743


In [38]:
en_de_rr_data = rr_data[rr_data['LP'] == 'en-de']
en_de_rr_data.head()

Unnamed: 0,LP,DATA,SID,BETTER,WORSE
212989,en-de,newstest2018,593,MMT-production-system.5594,RWTH-UNSUPER.5484
212990,en-de,newstest2018,593,online-Y.0,RWTH-UNSUPER.5484
212991,en-de,newstest2018,592,KIT.5486,JHU.5703
212992,en-de,newstest2018,592,JHU.5703,LMU-unsup.5651
212993,en-de,newstest2018,592,KIT.5486,LMU-unsup.5651


In [39]:
from tqdm.notebook import tqdm 

def merge_submissions_with_RR(submissions, rr_data):
    
    def system_in_submissions(system):
        for col in submissions.columns:
            if system in col:
                return True
            if col in system:
                return True
        return False
    
    lp, data, model1, model2, src, ref, hyp1, hyp2, bestmodel = [], [], [], [], [], [], [], [], []
    for i, row in tqdm(rr_data.iterrows(), total=len(rr_data), desc=list(rr_data.LP)[0]):
        sub_row = submissions.iloc[row['SID']-1] # segments have ids from 1 to 1997
        
        # Not all systems belong to the newstranslation shared task. Some belong
        # to other shared tasks such as unsupervied MT.
        if system_in_submissions(row['BETTER']) and system_in_submissions(row['WORSE']):
            better_sys = row['BETTER']
            worse_sys = row['WORSE']
            
            hyp1.append(sub_row[better_sys])
            hyp2.append(sub_row[worse_sys])
            lp.append(row['LP'])
            data.append('newstest2019')
            src.append(sub_row['src'])
            ref.append(sub_row['ref'])
            model1.append(better_sys)
            model2.append(worse_sys)
            bestmodel.append(better_sys)
    
    data = {
        "data": data,
        "lp": lp,
        "src": src,
        "ref": ref,
        "pos": hyp1,
        "neg": hyp2,
        "pos.model": model1,
        "neg.model": model2,
        "bestmodel": bestmodel
    }
    return pd.DataFrame(data)

In [40]:
merged = merge_submissions_with_RR(en_de_data, en_de_rr_data)

HBox(children=(FloatProgress(value=0.0, description='en-de', max=19711.0, style=ProgressStyle(description_widt…




In [41]:
merged.head()

Unnamed: 0,data,lp,src,ref,pos,neg,pos.model,neg.model,bestmodel
0,newstest2019,en-de,"In April 1946, a Supreme Court ruling enabled ...",Im April 1946 ermöglichte eine Entscheidung de...,Im April 1946 ermöglichte ein Urteil des Obers...,Im April 1946 ermöglichte eine oberste Gericht...,MMT-production-system.5594,RWTH-UNSUPER.5484,MMT-production-system.5594
1,newstest2019,en-de,"In April 1946, a Supreme Court ruling enabled ...",Im April 1946 ermöglichte eine Entscheidung de...,Im April 1946 ermöglichte ein Urteil des Obers...,Im April 1946 ermöglichte eine oberste Gericht...,online-Y.0,RWTH-UNSUPER.5484,online-Y.0
2,newstest2019,en-de,Though the suspects have remained at large for...,Obwohl die Verdächtigen seit Jahrzehnten auf f...,Obwohl die Verdächtigen jahrzehntelang auf fre...,Obwohl die Verdächtigen über Jahrzehnte auf fr...,KIT.5486,JHU.5703,KIT.5486
3,newstest2019,en-de,Though the suspects have remained at large for...,Obwohl die Verdächtigen seit Jahrzehnten auf f...,Obwohl die Verdächtigen über Jahrzehnte auf fr...,Obwohl die Verdächtigen am Beteiligung für Jah...,JHU.5703,LMU-unsup.5651,JHU.5703
4,newstest2019,en-de,Though the suspects have remained at large for...,Obwohl die Verdächtigen seit Jahrzehnten auf f...,Obwohl die Verdächtigen jahrzehntelang auf fre...,Obwohl die Verdächtigen am Beteiligung für Jah...,KIT.5486,LMU-unsup.5651,KIT.5486


## All Languages:

In [42]:
language_pairs = [
    'zh-en', 'en-zh', 'cs-en',  
    'fi-en', 'ru-en', 'tr-en', 
    'de-en', 'en-cs', 'en-de', 
    'en-et', 'en-fi', 'en-ru', 
    'en-tr', 'et-en'
]

In [43]:
rr_data = pd.read_csv('wmt18-metrics-task-package/manual-evaluation/RR-seglevel.csv', delimiter=' ')

for language_pair in language_pairs:
    try:
        os.makedirs(language_pair)
    except FileExistsError:
        pass
    src, trg = language_pair.split('-')
    lp, lp1 = src + '-' + trg, src + trg
    
    sources = [line.strip() for line in open(SRC_PREFIX+f'newstest2018-{lp1}-src.{src}')]
    references = [line.strip() for line in open(REF_PREFIX+f'newstest2018-{lp1}-ref.{trg}')]
    
    sys_outputs_files = os.listdir(SYS_PREFIX+f'{lp}/')
    systems = ['.'.join(submission_name.split('.')[1:-1]) for submission_name in sys_outputs_files]
    
    lp_data = pd.DataFrame({'src': sources, 'ref': references, **get_system_outputs(lp)})
    lp_rr_data = rr_data[rr_data['LP'] == lp]
    
    merged = merge_submissions_with_RR(lp_data, lp_rr_data)
    # print ("LP {} - daRR size: {}".format(list(lp_rr_data.LP)[0], len(merged)))
    merged.to_csv(f'{lp}/relative-ranks.csv', index=False)

HBox(children=(FloatProgress(value=0.0, description='zh-en', max=33357.0, style=ProgressStyle(description_widt…




HBox(children=(FloatProgress(value=0.0, description='en-zh', max=28602.0, style=ProgressStyle(description_widt…




HBox(children=(FloatProgress(value=0.0, description='cs-en', max=5110.0, style=ProgressStyle(description_width…




HBox(children=(FloatProgress(value=0.0, description='fi-en', max=15648.0, style=ProgressStyle(description_widt…




HBox(children=(FloatProgress(value=0.0, description='ru-en', max=10404.0, style=ProgressStyle(description_widt…




HBox(children=(FloatProgress(value=0.0, description='tr-en', max=8525.0, style=ProgressStyle(description_width…




HBox(children=(FloatProgress(value=0.0, description='de-en', max=77811.0, style=ProgressStyle(description_widt…




HBox(children=(FloatProgress(value=0.0, description='en-cs', max=5413.0, style=ProgressStyle(description_width…




HBox(children=(FloatProgress(value=0.0, description='en-de', max=19711.0, style=ProgressStyle(description_widt…




HBox(children=(FloatProgress(value=0.0, description='en-et', max=32202.0, style=ProgressStyle(description_widt…




HBox(children=(FloatProgress(value=0.0, description='en-fi', max=9809.0, style=ProgressStyle(description_width…




HBox(children=(FloatProgress(value=0.0, description='en-ru', max=22181.0, style=ProgressStyle(description_widt…




HBox(children=(FloatProgress(value=0.0, description='en-tr', max=1358.0, style=ProgressStyle(description_width…




HBox(children=(FloatProgress(value=0.0, description='et-en', max=56721.0, style=ProgressStyle(description_widt…




## Multilingual Corpus:

In [47]:
from sklearn.model_selection import train_test_split

all_scores_train, all_scores_test = [], []
all_rr_train, all_rr_test = [], []

all_rr, all_scores = [], []
for lp in tqdm(language_pairs):
    # Relative Ranks
    rr_data = pd.read_csv(f'{lp}/relative-ranks.csv')
    all_rr.append(rr_data)
    
    train_rr, test_rr = train_test_split(rr_data, test_size=0.2, random_state=42, shuffle=True)
    all_rr_train.append(train_rr)
    all_rr_test.append(test_rr)
    
    # DA scores
    scores_data = pd.read_csv(f'{lp}/scores.csv')
    all_scores.append(scores_data)
    
    train_scores, test_scores = train_test_split(scores_data, test_size=1000, random_state=42, shuffle=True)
    all_scores_train.append(train_scores)
    all_scores_test.append(test_scores)

# Relative-Ranks 
all_rr = pd.concat(all_rr, ignore_index=True)
rr_train = pd.concat(all_rr_train, ignore_index=True)
rr_test = pd.concat(all_rr_test, ignore_index=True)

# Scores 
all_scores = pd.concat(all_scores, ignore_index=True)
scores_train = pd.concat(all_scores_train, ignore_index=True)
scores_test = pd.concat(all_scores_test, ignore_index=True)

HBox(children=(FloatProgress(value=0.0, max=14.0), HTML(value='')))




In [48]:
all_rr.to_csv('relative-ranks.csv', index=False)
rr_train.to_csv('train-relative-ranks.csv', index=False)
rr_test.to_csv('test-relative-ranks.csv', index=False)

In [49]:
all_scores.to_csv('scores.csv', index=False)
scores_train.to_csv('train_scores.csv', index=False)
scores_test.to_csv('test_scores.csv', index=False)